日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

以Lambda為例參考,分析該如何做好一個大數(shù)據(jù)平臺架構(gòu)?

如意 ? 來源:今日頭條 ? 作者:CRM研究社 ? 2020-09-16 16:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、Lambda架構(gòu)需求

Lambda架構(gòu)背后的需求是由于MR架構(gòu)的延遲問題。MR雖然實現(xiàn)了分布式、可擴展數(shù)據(jù)處理系統(tǒng)的目的,但是在處理數(shù)據(jù)時延遲比較嚴重。實際上如果內(nèi)存和CPU足夠強大,MR也可以實現(xiàn)近實時運算,但實際業(yè)務環(huán)境并非如此,因此我們需要權(quán)衡,選擇實時處理和批處理所需要數(shù)據(jù)量和恰當?shù)馁Y源。

2012年Storm的作者Nathan Marz提出的Lambda數(shù)據(jù)處理框架。Lambda架構(gòu)的目標是設計出一個能滿足實時大數(shù)據(jù)系統(tǒng)關(guān)鍵特性的架構(gòu),包括有:高容錯、低延時和可擴展等。Lambda架構(gòu)整合離線計算和實時計算,融合不可變性(Immunability),讀寫分離和復雜性隔離等一系列架構(gòu)原則,可集成Hadoop,Kafka,Storm,Spark,Hbase等各類大數(shù)據(jù)組件。

二、Lambda架構(gòu)的關(guān)鍵

橫向擴容

可擴展性意味著為滿足日益增長的用戶服務需求,同時不用對底層架構(gòu)或者代碼,可以通過現(xiàn)有機器添加內(nèi)存或者磁盤資源來實現(xiàn)(垂直擴展),或者可以通過在集群中添加機器實現(xiàn)(水平擴展)。無論是實時或者批處理,都應該能夠不停服務的情況下,可以實施水平擴展。

故障容錯

系統(tǒng)需要妥善處理故障,確保系統(tǒng)在某些組件發(fā)生故障的情況下,整個系統(tǒng)服務的可用性??赡懿糠纸M件故障會導致集群中部分節(jié)點宕機,影響了整理的SLA,但是系統(tǒng)還是可以相應的,系統(tǒng)不能有單點故障。

低延遲

很多應用對于讀和寫操作的延時要求非常高,要求對更新和查詢的響應是低延時的。

可擴展

系統(tǒng)需要足夠靈活,能夠?qū)崿F(xiàn)新增和修改需求,又不需要重構(gòu)整個系統(tǒng)。實時處理和批處理隔離開,能夠靈活修改需求。

易維護

開發(fā)部署不能夠太復雜。

三、Lambda架構(gòu)的分層

以Lambda為例參考,分析該如何做好一個大數(shù)據(jù)平臺架構(gòu)?

在Lambda架構(gòu)中新數(shù)據(jù)到達時,會被同時分派到批處理層和快速處理層。一旦數(shù)據(jù)到達批處理層,按照常規(guī)批處理時間間隔,每次都從頭開始重新計算并生成批處理視圖。類似地,只要新數(shù)據(jù)到達快速處理層,快速處理層就會使用新數(shù)據(jù)生成快速視圖。在查詢到達服務層時,它會合并快速視圖和批處理視圖來生成適當?shù)牟樵兘Y(jié)果。生成批處理視圖后,快速視圖將被丟棄,除非有新數(shù)據(jù)抵達,否則只需要查詢批處理視圖,因為此時批處理層中擁有所有的數(shù)據(jù)。

Lambda架構(gòu)定義主要層以及每個組件之間的集成。注意分為以下層:

數(shù)據(jù)源

數(shù)據(jù)源指外部的數(shù)據(jù)庫、消息隊列、文件等,可以開發(fā)數(shù)據(jù)消費層,隱藏來自不同訪問數(shù)據(jù)的復雜性,定義好數(shù)據(jù)格式。

數(shù)據(jù)消費層

負責封裝不能數(shù)據(jù)源獲取數(shù)據(jù)的復雜性,將其轉(zhuǎn)換可由批處理或者流處理進一步使用同一的格式進行消費。

批處理層

這是Lambda架構(gòu)核心層之一,批處理接受數(shù)據(jù),持久化到用戶定義好的數(shù)據(jù)結(jié)構(gòu)中,維護著主數(shù)據(jù)。數(shù)據(jù)結(jié)構(gòu)一般不做改變,只是追加數(shù)據(jù)。批處理還負責創(chuàng)建和維護批處理視圖。比如我們常做的Hive ETL ,統(tǒng)計一些數(shù)據(jù),最后將結(jié)果保存在hive表中,或者數(shù)據(jù)庫中,就屬于批處理層。

實時層

這是Lambda另一個核心層。批處理在很多場景下能夠滿足需求,但是隨著業(yè)務需求“苛刻性”,他們希望能夠及時看到數(shù)據(jù),而不是等到第二天才看指標變化和分析結(jié)果。所以引入了實時處理。實時層解決了一個問題,即只存儲可立即向用戶提供的一組數(shù)據(jù),這樣就不需要對全量數(shù)據(jù)進行處理,大大提供處理效率。比如流處理僅僅存儲最近5分鐘的數(shù)據(jù),處理計算并形成結(jié)果,這就是我們用spark streaming中要有的時間窗口。

服務層

這是Lambda架構(gòu)的最后一層,服務層的職責是獲取批處理和流處理的結(jié)果,向用戶提供統(tǒng)一查詢視圖服務。

四、Lambda架構(gòu)總結(jié)

Lambda數(shù)據(jù)架構(gòu)曾經(jīng)成為每一個公司大數(shù)據(jù)平臺必備的架構(gòu),它解決了一個公司大數(shù)據(jù)批量離線處理和實時數(shù)據(jù)處理的需求。

數(shù)據(jù)從底層的數(shù)據(jù)源開始,經(jīng)過各種各樣的格式進入大數(shù)據(jù)平臺,在大數(shù)據(jù)平臺中經(jīng)過Kafka、Flume等數(shù)據(jù)組件進行收集,然后分成兩條線進行計算。一條線是進入流式計算平臺(例如 Storm、Flink或者Spark Streaming),去計算實時的一些指標;另一條線進入批量數(shù)據(jù)處理離線計算平臺(例如Mapreduce、Hive,Spark SQL),去計算T+1的相關(guān)業(yè)務指標,這些指標需要隔日才能看見。

Lambda架構(gòu)經(jīng)歷多年的發(fā)展,非常穩(wěn)定,對于實時計算部分的計算成本可控,批量處理可以用晚上的時間來整體批量計算,這樣把實時計算和離線計算高峰分開,這種架構(gòu)支撐了數(shù)據(jù)行業(yè)的早期發(fā)展,但是它也有一些致命缺點:

實時與批量計算結(jié)果不一致

因為批量和實時計算走的是兩個計算框架和計算程序,算出的結(jié)果往往不同,經(jīng)??吹揭粋€數(shù)字當天看是一個數(shù)據(jù),第二天看昨天的數(shù)據(jù)反而發(fā)生了變化。

批處理的健壯性

隨著數(shù)據(jù)量級越來越大,經(jīng)常發(fā)現(xiàn)夜間只有4、5個小時的時間窗口,已經(jīng)無法完成白天20多個小時累計的數(shù)據(jù),保證早上上班前準時出數(shù)據(jù)已成為每個大數(shù)據(jù)團隊頭疼的問題,同時做個任務并行執(zhí)行對于大數(shù)據(jù)集群的穩(wěn)定性也是巨大的考驗,經(jīng)常會有任務因為資源不足沒有定時啟動或者報錯。

開發(fā)和維護的復雜

Lambda 架構(gòu)中對同樣的業(yè)務邏輯進行兩次編程:一次為批量計算的ETL系統(tǒng),一次為流式計算的Streaming系統(tǒng)。針對同一個業(yè)務問題產(chǎn)生了兩個代碼庫,各有不同的漏洞。

存儲增長快

數(shù)據(jù)倉庫的設計不合理,會產(chǎn)生大量的中間結(jié)果表,造成數(shù)據(jù)急速膨脹,加大服務器存儲壓力。比如我們經(jīng)常糾結(jié)于數(shù)據(jù)倉庫到底怎么分層,是直接ODS層到應用呢?還是ODS層要景觀DWS、DW等,最后才到應用呢?

Lambda架構(gòu)雖然有缺點,但是在很多公司依然適用,有時候我們沒有那么大的業(yè)務量,實時業(yè)務需求并沒有那么明顯,用著Lambda架構(gòu)依然很爽。對于超大數(shù)據(jù)量的業(yè)務或者實時業(yè)務同樣多的情況,可以探索改良Lambda,業(yè)內(nèi)也提出了Kappa架構(gòu),感興趣的小伙伴可以搜索學習下。
責編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 平臺
    +關(guān)注

    關(guān)注

    1

    文章

    202

    瀏覽量

    24572
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    9099

    瀏覽量

    144092
  • Lambda
    +關(guān)注

    關(guān)注

    0

    文章

    31

    瀏覽量

    10638
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    高校能源管理的“五合”模式——吉首大學

    與規(guī)范性,軟硬件設施已難以匹配學校的快速發(fā)展。為此,學校決定構(gòu)建套集監(jiān)測、控制、管理與運維于體的綜合能源管理平臺,核心需求歸納
    的頭像 發(fā)表于 04-21 14:01 ?83次閱讀
    高校能源管理的“五合<b class='flag-5'>一</b>”模式——<b class='flag-5'>以</b>吉首大學<b class='flag-5'>為</b><b class='flag-5'>例</b>

    高壓革命:英偉達800V平臺架構(gòu)與SiC MOSFET的商業(yè)技術(shù)共生

    高壓革命:英偉達800V平臺架構(gòu)的深層價值重構(gòu)與SiC MOSFET的商業(yè)技術(shù)共生 全球能源互聯(lián)網(wǎng)核心節(jié)點賦能者-BASiC Semiconductor基本半導體之級代理商傾佳電子(Changer
    的頭像 發(fā)表于 02-17 07:12 ?5795次閱讀
    高壓革命:英偉達800V<b class='flag-5'>平臺架構(gòu)</b>與SiC MOSFET的商業(yè)技術(shù)共生

    無人機高效能動力推進系統(tǒng):功能特點與平臺架構(gòu)解析

    無人機高效能動力推進系統(tǒng):功能特點與平臺架構(gòu)解析
    的頭像 發(fā)表于 01-14 15:27 ?381次閱讀
    無人機高效能動力推進系統(tǒng):功能特點與<b class='flag-5'>平臺架構(gòu)</b>解析

    光伏四可裝置硬件平臺架構(gòu)詳解:計算單元、通信接口與可靠性設計

    光伏設備“單功能、適配性差”的局限,“計算核、通信脈、可靠基”構(gòu)建架構(gòu)體系。西格電力提
    的頭像 發(fā)表于 01-04 15:40 ?1394次閱讀
    光伏四可裝置硬件<b class='flag-5'>平臺架構(gòu)</b>詳解:計算單元、通信接口與可靠性設計

    端到端下半場,如何做好高保真虛擬數(shù)據(jù)集的構(gòu)建與感知?

    01前言隨著自動駕駛技術(shù)的日益升級,UniAD、FSDV12代表的“端到端”架構(gòu)正重構(gòu)行業(yè)格局。這一架構(gòu)試圖通過單神經(jīng)網(wǎng)絡直接建立從傳
    的頭像 發(fā)表于 12-29 11:39 ?1920次閱讀
    端到端下半場,<b class='flag-5'>如何做好</b>高保真虛擬<b class='flag-5'>數(shù)據(jù)</b>集的構(gòu)建與感知?

    大數(shù)據(jù)平臺運營的基礎是什么

    ,值得每位企業(yè)運營者思考。 本文提供大數(shù)據(jù)平臺運營的三元素模型,旨在幫助企業(yè)管理層全面的視角審視企業(yè)當前正在建設的大數(shù)據(jù)體系,真正地實現(xiàn)
    的頭像 發(fā)表于 12-23 16:07 ?370次閱讀

    大模型支撐后勤保障方案生成系統(tǒng):功能特點與平臺架構(gòu)解析

    ? ? 大模型支撐后勤保障方案生成系統(tǒng):功能特點與平臺架構(gòu)解析 ? ?大模型支撐后勤保障方案生成系統(tǒng)憑借智能預測、動態(tài)調(diào)度、路徑優(yōu)化、庫存管理及可視化展示等核心能力,后勤保障方案生成系統(tǒng)提供關(guān)鍵
    的頭像 發(fā)表于 12-17 15:49 ?432次閱讀

    組態(tài)大數(shù)據(jù)平臺是什么?有什么功能?

    組態(tài)大數(shù)據(jù)平臺是融合 組態(tài)技術(shù) 與 大數(shù)據(jù)處理能力 的綜合性平臺,通過圖形化、可配置的方式實現(xiàn)數(shù)據(jù)采集、存儲、
    的頭像 發(fā)表于 10-30 11:29 ?342次閱讀
    組態(tài)<b class='flag-5'>大數(shù)據(jù)</b><b class='flag-5'>平臺</b>是什么?有什么功能?

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)

    數(shù)據(jù),結(jié)合大數(shù)據(jù)分析、流程自動化及云邊協(xié)同技術(shù),實現(xiàn)電磁環(huán)境全生命周期管理。以下從五大維度精簡解析: 應用案例 北京華盛恒輝、北京五木恒潤研發(fā)的 EMC/EMI 智能管理系統(tǒng)已落地應用,成效顯著,系統(tǒng)推廣提供有力支撐。
    的頭像 發(fā)表于 09-17 14:58 ?794次閱讀

    NVMe高速傳輸之擺脫XDMA設計23:UVM驗證平臺

    抽象 PCIeTLP 事務,因此為了方便的在事務層構(gòu)建復雜的測試用,項目基于 UVM 搭建驗證平臺進行功能驗證。圖1 驗證平臺架構(gòu)圖在驗證平臺
    發(fā)表于 08-26 09:49

    NVMe高速傳輸之擺脫XDMA設計18:UVM驗證平臺

    抽象 PCIeTLP 事務,因此為了方便的在事務層構(gòu)建復雜的測試用,項目基于 UVM 搭建驗證平臺進行功能驗證。圖1 驗證平臺架構(gòu)圖在驗證平臺
    發(fā)表于 07-31 16:39

    智能手表的適老化設計應考慮哪些方面?橙子大健康Watch D Pro

    生活的同時,獲得科技帶來的安全感與便利性。本文橙子大健康WatchDPro,談談智能健康手表如何做好適老化設計。、交互與顯示設計:兼
    的頭像 發(fā)表于 06-19 14:31 ?1247次閱讀
    智能手表的適老化設計應考慮哪些方面?<b class='flag-5'>以</b>橙子大健康Watch D Pro<b class='flag-5'>為</b><b class='flag-5'>例</b>

    ArkUI-X跨平臺技術(shù)落地-華為運動健康()

    、心臟健康)與 數(shù)據(jù)平臺的耦合關(guān)系,通過接口的形式隔離三端(iOS 和 Android和鴻蒙NEXT系統(tǒng))的數(shù)據(jù)平臺的實現(xiàn)差異,成為
    發(fā)表于 06-18 22:53

    深控數(shù)據(jù)平臺V1.0發(fā)布!IoT之力重塑工廠“數(shù)據(jù)脈絡”

    自主研發(fā)的“深控數(shù)據(jù)平臺V1.0”(軟著登記號:XXXXXXXX),IoT技術(shù)核心,打造“全域感知-智能分析-精準控制”的
    的頭像 發(fā)表于 05-28 14:56 ?749次閱讀

    光伏電站無人機巡檢系統(tǒng)平臺的設計架構(gòu)

    電站中不同的運維管理需求。 根據(jù)光伏電站的運維管理工作內(nèi)容,光伏電站無人機巡檢系統(tǒng)平臺從多個層面建設系統(tǒng)平臺架構(gòu),能夠全方位、智能化的實現(xiàn)電站的運維管理。其設計架構(gòu)包含設備層、數(shù)據(jù)采集
    的頭像 發(fā)表于 05-07 11:23 ?1060次閱讀
    光伏電站無人機巡檢系統(tǒng)<b class='flag-5'>平臺</b>的設計<b class='flag-5'>架構(gòu)</b>
    台南市| 麟游县| 吴忠市| 黄陵县| 阿合奇县| 碌曲县| 涿州市| 长白| 东光县| 原平市| 英德市| 丹东市| 武威市| 永和县| 桐城市| 泾川县| 高密市| 四平市| 嘉义市| 宜都市| 吴桥县| 南康市| 比如县| 揭西县| 留坝县| 徐闻县| 柳江县| 泌阳县| 宁波市| 临朐县| 桦南县| 卢湾区| 陈巴尔虎旗| 孝昌县| 邵武市| 湾仔区| 五台县| 石柱| 双桥区| 海兴县| 南昌县|