校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁(yè) > 知識(shí)庫(kù) > 使用Spark進(jìn)行實(shí)時(shí)流計(jì)算的方法

使用Spark進(jìn)行實(shí)時(shí)流計(jì)算的方法

熱門(mén)標(biāo)簽:廊坊地圖標(biāo)注申請(qǐng)入口 怎么去掉地圖標(biāo)注文字 高德地圖標(biāo)注公司位置需要錢(qián)嗎 慶陽(yáng)外呼系統(tǒng)定制開(kāi)發(fā) 地圖標(biāo)注資源分享注冊(cè) 襄陽(yáng)外呼增值業(yè)務(wù)線(xiàn)路解決方案 北京外呼系統(tǒng)咨詢(xún)電話(huà) 合肥阿里辦理400電話(huà)號(hào) 海南人工外呼系統(tǒng)哪家好

Spark Streaming VS Structured Streaming

Spark Streaming是Spark最初的流處理框架,使用了微批的形式來(lái)進(jìn)行流處理。

提供了基于RDDs的Dstream API,每個(gè)時(shí)間間隔內(nèi)的數(shù)據(jù)為一個(gè)RDD,源源不斷對(duì)RDD進(jìn)行處理來(lái)實(shí)現(xiàn)流計(jì)算

Apache Spark 在 2016 年的時(shí)候啟動(dòng)了 Structured Streaming 項(xiàng)目,一個(gè)基于 Spark SQL 的全新流計(jì)算引擎 Structured Streaming,讓用戶(hù)像編寫(xiě)批處理程序一樣簡(jiǎn)單地編寫(xiě)高性能的流處理程序。

Structured Streaming是Spark2.0版本提出的新的實(shí)時(shí)流框架(2.0和2.1是實(shí)驗(yàn)版本,從Spark2.2開(kāi)始為穩(wěn)定版本)

從Spark-2.X版本后,Spark Streaming就進(jìn)入維護(hù)模式,看見(jiàn)Spark已經(jīng)將大部分精力投入到了全新的Structured Streaming中,而一些新特性也只有Structured Streaming才有,這樣Spark才有了與Flink一戰(zhàn)的能力。

1、Spark Streaming 不足

Processing Time 而不是 Event Time

首先解釋一下,Processing Time 是數(shù)據(jù)到達(dá) Spark 被處理的時(shí)間,而 Event Time 是數(shù)據(jù)自帶的屬性,一般表示數(shù)據(jù)產(chǎn)生于數(shù)據(jù)源的時(shí)間。比如 IoT 中,傳感器在 12:00:00 產(chǎn)生一條數(shù)據(jù),然后在 12:00:05 數(shù)據(jù)傳送到 Spark,那么 Event Time 就是 12:00:00,而 Processing Time 就是 12:00:05。我們知道 Spark Streaming 是基于 DStream 模型的 micro-batch 模式,簡(jiǎn)單來(lái)說(shuō)就是將一個(gè)微小時(shí)間段,比如說(shuō) 1s,的流數(shù)據(jù)當(dāng)前批數(shù)據(jù)來(lái)處理。如果我們要統(tǒng)計(jì)某個(gè)時(shí)間段的一些數(shù)據(jù)統(tǒng)計(jì),毫無(wú)疑問(wèn)應(yīng)該使用 Event Time,但是因?yàn)?Spark Streaming 的數(shù)據(jù)切割是基于 Processing Time,這樣就導(dǎo)致使用 Event Time 特別的困難。

Complex, low-level api

這點(diǎn)比較好理解,DStream (Spark Streaming 的數(shù)據(jù)模型)提供的 API 類(lèi)似 RDD 的 API 的,非常的 low level。當(dāng)我們編寫(xiě) Spark Streaming 程序的時(shí)候,本質(zhì)上就是要去構(gòu)造 RDD 的 DAG 執(zhí)行圖,然后通過(guò) Spark Engine 運(yùn)行。這樣導(dǎo)致一個(gè)問(wèn)題是,DAG 可能會(huì)因?yàn)殚_(kāi)發(fā)者的水平參差不齊而導(dǎo)致執(zhí)行效率上的天壤之別。這樣導(dǎo)致開(kāi)發(fā)者的體驗(yàn)非常不好,也是任何一個(gè)基礎(chǔ)框架不想看到的(基礎(chǔ)框架的口號(hào)一般都是:你們專(zhuān)注于自己的業(yè)務(wù)邏輯就好,其他的交給我)。這也是很多基礎(chǔ)系統(tǒng)強(qiáng)調(diào) Declarative 的一個(gè)原因。

reason about end-to-end application

這里的 end-to-end 指的是直接 input 到 out,比如 Kafka 接入 Spark Streaming 然后再導(dǎo)出到 HDFS 中。DStream 只能保證自己的一致性語(yǔ)義是 exactly-once 的,而 input 接入 Spark Streaming 和 Spark Straming 輸出到外部存儲(chǔ)的語(yǔ)義往往需要用戶(hù)自己來(lái)保證。而這個(gè)語(yǔ)義保證寫(xiě)起來(lái)也是非常有挑戰(zhàn)性,比如為了保證 output 的語(yǔ)義是 exactly-once 語(yǔ)義需要 output 的存儲(chǔ)系統(tǒng)具有冪等的特性,或者支持事務(wù)性寫(xiě)入,這個(gè)對(duì)于開(kāi)發(fā)者來(lái)說(shuō)都不是一件容易的事情。

批流代碼不統(tǒng)一

盡管批流本是兩套系統(tǒng),但是這兩套系統(tǒng)統(tǒng)一起來(lái)確實(shí)很有必要,我們有時(shí)候確實(shí)需要將我們的流處理邏輯運(yùn)行到批數(shù)據(jù)上面。關(guān)于這一點(diǎn),最早在 2014 年 Google 提出 Dataflow 計(jì)算服務(wù)的時(shí)候就批判了 streaming/batch 這種叫法,而是提出了 unbounded/bounded data 的說(shuō)法。DStream 盡管是對(duì) RDD 的封裝,但是我們要將 DStream 代碼完全轉(zhuǎn)換成 RDD 還是有一點(diǎn)工作量的,更何況現(xiàn)在 Spark 的批處理都用 DataSet/DataFrame API 了。

2.、Structured Streaming 優(yōu)勢(shì)

相對(duì)的,來(lái)看下Structured Streaming優(yōu)勢(shì):

  • 簡(jiǎn)潔的模型。Structured Streaming 的模型很簡(jiǎn)潔,易于理解。用戶(hù)可以直接把一個(gè)流想象成是無(wú)限增長(zhǎng)的表格。
  • 一致的 API。由于和 Spark SQL 共用大部分 API,對(duì) Spaprk SQL 熟悉的用戶(hù)很容易上手,代碼也十分簡(jiǎn)潔。同時(shí)批處理和流處理程序還可以共用代碼,不需要開(kāi)發(fā)兩套不同的代碼,顯著提高了開(kāi)發(fā)效率。
  • 卓越的性能。Structured Streaming 在與 Spark SQL 共用 API 的同時(shí),也直接使用了 Spark SQL 的 Catalyst 優(yōu)化器和 Tungsten,數(shù)據(jù)處理性能十分出色。此外,Structured Streaming 還可以直接從未來(lái) Spark SQL 的各種性能優(yōu)化中受益。
  • 多語(yǔ)言支持。Structured Streaming 直接支持目前 Spark SQL 支持的語(yǔ)言,包括 Scala,Java,Python,R 和 SQL。用戶(hù)可以選擇自己喜歡的語(yǔ)言進(jìn)行開(kāi)發(fā)。
  • 同樣能支持多種數(shù)據(jù)源的輸入和輸出,Kafka、flume、Socket、Json。
  • 基于Event-Time,相比于Spark Streaming的Processing-Time更精確,更符合業(yè)務(wù)場(chǎng)景。
  • Event time 事件時(shí)間: 就是數(shù)據(jù)真正發(fā)生的時(shí)間,比如用戶(hù)瀏覽了一個(gè)頁(yè)面可能會(huì)產(chǎn)生一條用戶(hù)的該時(shí)間點(diǎn)的瀏覽日志。
  • Process time 處理時(shí)間: 則是這條日志數(shù)據(jù)真正到達(dá)計(jì)算框架中被處理的時(shí)間點(diǎn),簡(jiǎn)單的說(shuō),就是你的Spark程序是什么時(shí)候讀到這條日志的。
  • 事件時(shí)間是嵌入在數(shù)據(jù)本身中的時(shí)間。對(duì)于許多應(yīng)用程序,用戶(hù)可能希望在此事件時(shí)間操作。例如,如果要獲取IoT設(shè)備每分鐘生成的事件數(shù),則可能需要使用生成數(shù)據(jù)的時(shí)間(即數(shù)據(jù)中的事件時(shí)間),而不是Spark接收他們的時(shí)間。事件時(shí)間在此模型中非常自然地表示 - 來(lái)自設(shè)備的每個(gè)事件都是表中的一行,事件時(shí)間是該行中的一個(gè)列值。
  • 支持spark2的dataframe處理。
  • 解決了Spark Streaming存在的代碼升級(jí),DAG圖變化引起的任務(wù)失敗,無(wú)法斷點(diǎn)續(xù)傳的問(wèn)題。
  • 基于SparkSQL構(gòu)建的可擴(kuò)展和容錯(cuò)的流式數(shù)據(jù)處理引擎,使得實(shí)時(shí)流式數(shù)據(jù)計(jì)算可以和離線(xiàn)計(jì)算采用相同的處理方式(DataFrameSQL)。
  • 可以使用與靜態(tài)數(shù)據(jù)批處理計(jì)算相同的方式來(lái)表達(dá)流計(jì)算。

底層原理完全不同

Spark Streaming采用微批的處理方法。每一個(gè)批處理間隔的為一個(gè)批,也就是一個(gè)RDD,我們對(duì)RDD進(jìn)行操作就可以源源不斷的接收、處理數(shù)據(jù)。

Structured Streaming將實(shí)時(shí)數(shù)據(jù)當(dāng)做被連續(xù)追加的表。流上的每一條數(shù)據(jù)都類(lèi)似于將一行新數(shù)據(jù)添加到表中。

Spark 3.0.0發(fā)布以后 全新的Structured Streaming UI誕生,可見(jiàn)未來(lái)的Structured Streaming將不斷迎來(lái)進(jìn)步。

總結(jié)

到此這篇關(guān)于使用Spark進(jìn)行實(shí)時(shí)流計(jì)算的方法的文章就介紹到這了,更多相關(guān)Spark實(shí)時(shí)流計(jì)算內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • SparkGraphx計(jì)算指定節(jié)點(diǎn)的N度關(guān)系節(jié)點(diǎn)源碼

標(biāo)簽:商丘 綿陽(yáng) 鎮(zhèn)江 鶴崗 平頂山 臺(tái)州 株洲 哈密

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《使用Spark進(jìn)行實(shí)時(shí)流計(jì)算的方法》,本文關(guān)鍵詞  使用,Spark,進(jìn)行,實(shí)時(shí),流,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《使用Spark進(jìn)行實(shí)時(shí)流計(jì)算的方法》相關(guān)的同類(lèi)信息!
  • 本頁(yè)收集關(guān)于使用Spark進(jìn)行實(shí)時(shí)流計(jì)算的方法的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    91蜜桃在线观看| 欧美日韩国产中文| 亚洲风情在线资源站| 久久免费美女视频| 欧美日韩精品一区二区在线播放| 国产精品中文字幕欧美| 亚洲成人第一页| 国产精品你懂的在线| 91精品视频网| 精品视频色一区| 99久久久久久| 国产成人在线观看免费网站| 蜜桃精品视频在线| 午夜在线电影亚洲一区| 亚洲欧美日韩综合aⅴ视频| 久久久综合精品| 91精品中文字幕一区二区三区| 在线中文字幕一区二区| av中文字幕亚洲| 成人免费看片app下载| 国产老妇另类xxxxx| 美腿丝袜亚洲一区| 天天色综合成人网| 午夜精品视频在线观看| 一区二区日韩av| 亚洲免费观看高清在线观看| 中文字幕一区av| 国产精品欧美精品| 国产精品久久毛片av大全日韩| 久久一二三国产| 久久色.com| 久久一日本道色综合| 精品国产a毛片| 久久久午夜精品| 久久精品欧美一区二区三区麻豆| 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 久久久久免费观看| 欧美一级高清大全免费观看| 91精品在线免费观看| 911精品国产一区二区在线| 精品视频一区三区九区| 4hu四虎永久在线影院成人| 日韩一级高清毛片| 日韩精品一区二区三区在线| 日韩精品一区二区三区swag| 日韩亚洲电影在线| 精品国产1区二区| 久久久精品免费观看| 久久精品欧美日韩精品| 国产精品午夜久久| 亚洲欧美一区二区三区极速播放 | 国产在线精品一区二区| 国产精品一区二区三区网站| 成人精品免费视频| 日本乱人伦一区| 欧美一区二区三区在线看| 精品国产免费一区二区三区四区| 久久久久久一级片| 亚洲人成网站在线| 日韩高清国产一区在线| 国产一区二区日韩精品| 91香蕉视频在线| 欧美老女人在线| 久久网站最新地址| 综合久久国产九一剧情麻豆| 午夜久久电影网| 国产在线视频一区二区三区| 不卡欧美aaaaa| 在线成人高清不卡| 国产亚洲婷婷免费| 亚洲妇女屁股眼交7| 久久99精品国产麻豆不卡| 99v久久综合狠狠综合久久| 欧美高清视频不卡网| 日本一区二区综合亚洲| 亚洲精品国产视频| 韩国一区二区视频| 色综合视频一区二区三区高清| 337p亚洲精品色噜噜| 国产日本欧美一区二区| 亚洲在线免费播放| 国产乱码精品一区二区三区忘忧草| 91丝袜高跟美女视频| 日韩欧美一二三四区| 国产精品美女久久久久久久 | 成人avav在线| 欧美精品久久一区| √…a在线天堂一区| 久久99精品视频| 欧美少妇性性性| 国产精品系列在线| 免费在线视频一区| 欧美中文字幕亚洲一区二区va在线| 精品久久久久一区二区国产| 一级精品视频在线观看宜春院 | 91麻豆精品国产91久久久久久久久 | 国产精品一二一区| 欧美三区在线观看| 中文字幕成人av| 蜜臀久久久久久久| 欧美在线小视频| 国产精品久久看| 国精产品一区一区三区mba视频| 欧美日本韩国一区二区三区视频| 成人欧美一区二区三区1314| 国产露脸91国语对白| 91精品麻豆日日躁夜夜躁| 亚洲精品国产a| 成人激情动漫在线观看| 久久综合久久99| 久久精品国产99国产| 欧美高清www午色夜在线视频| 一区二区在线观看不卡| 99久久久国产精品| 国产精品久久久久久久久搜平片 | 亚洲国产精品高清| 久久成人精品无人区| 欧美精品自拍偷拍动漫精品| 亚洲精品一二三四区| 97国产一区二区| 中文字幕日本不卡| 成人av在线播放网站| 中文字幕第一页久久| 福利一区福利二区| 中文字幕精品在线不卡| 成人性视频网站| 亚洲国产精品高清| 成人av在线影院| 综合分类小说区另类春色亚洲小说欧美| 国产a区久久久| 国产午夜一区二区三区| 精品在线一区二区三区| 亚洲精品在线电影| 国产一区二区在线看| 久久久精品免费网站| 高清beeg欧美| 日韩美女精品在线| 一本久久精品一区二区| 一区二区三区久久久| 欧美日韩欧美一区二区| 奇米精品一区二区三区在线观看| 日韩你懂的在线观看| 蜜桃av一区二区| 久久老女人爱爱| 成人av电影在线| 亚洲免费视频成人| 欧美三区在线视频| 蜜桃精品在线观看| 日本一区二区三区免费乱视频| 成年人国产精品| 亚洲另类在线视频| 7777精品伊人久久久大香线蕉经典版下载 | 亚洲天堂久久久久久久| 91福利视频网站| 日本午夜一本久久久综合| 久久先锋影音av鲁色资源网| www.亚洲精品| 亚洲成av人片在www色猫咪| 日韩视频一区二区三区在线播放 | 日韩视频国产视频| 国产激情一区二区三区四区| 中文字幕一区二区5566日韩| 欧美性猛片aaaaaaa做受| 青青国产91久久久久久| 久久综合色天天久久综合图片| 成人app网站| 性久久久久久久| 国产日韩欧美在线一区| 色欧美片视频在线观看在线视频| 日韩极品在线观看| 国产日产欧产精品推荐色| 欧美系列亚洲系列| 国产呦萝稀缺另类资源| 怡红院av一区二区三区| 日韩欧美123| 91在线丨porny丨国产| 奇米一区二区三区| 亚洲欧洲精品成人久久奇米网| 欧美日韩国产首页在线观看| 国产精品一区二区91| 亚洲成人激情综合网| 国产视频一区不卡| 欧美伦理电影网| www.性欧美| 青草av.久久免费一区| 国产精品短视频| 欧美成人乱码一区二区三区| 91在线视频播放| 国产一区91精品张津瑜| 亚洲成av人**亚洲成av**| 国产欧美一区二区三区网站| 制服丝袜在线91| 色狠狠色噜噜噜综合网| 国产精品888| 美腿丝袜在线亚洲一区| 亚洲综合一区二区三区| 国产精品久久久久久亚洲伦| 欧美sm极限捆绑bd| 欧美男生操女生| 91丝袜国产在线播放|