日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大數(shù)據計算引擎,你pick哪個?

8g3K_AI_Thinker ? 來源:人工智能頭條 ? 2019-11-22 15:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

不知道你是否有過和我類似的經歷?

我是 2018 年 6 月加入公司,一直負責監(jiān)控平臺的告警系統(tǒng)。之后,我們的整個監(jiān)控平臺架構中途換過兩次,其中一次架構發(fā)生了巨大的變化。我們監(jiān)控告警平臺最早的架構如下圖所示:

這個架構的挑戰(zhàn)難點在于:

海量的監(jiān)控數(shù)據(Metric & Log & Trace 數(shù)據)實時寫入 ElasticSearch;

多維度的監(jiān)控指標頁面展示(Dashboard) 查 ElasticSearch 的數(shù)據比較頻繁;

不斷遞增的告警規(guī)則需要通過查詢 ElasticSearch 數(shù)據來進行判斷是否要告警。

從上面的幾個問題我們就可以很明顯的發(fā)現(xiàn)這種架構的瓶頸就在于 ElasticSearch 集群的寫入和查詢能力,在海量的監(jiān)控數(shù)據(Metric & Log & Trace 數(shù)據)下實時的寫入對 ElasticSearch 有極大的影響。 我依然清楚記得,當時經常因為寫入的問題導致 ElasticSearch 集群掛掉,從而讓我的告警和監(jiān)控頁面(Dashboard)歇菜(那會老被噴:為啥配置的告警規(guī)則沒有觸發(fā)告警?為啥查看應用的 Dashboard 監(jiān)控頁面沒數(shù)據)。我也很無奈啊,只想祈禱我們的 ElasticSearch 集群穩(wěn)一點。

01

初次接觸 Flink

在如此糟糕的架構情況下,我們挺過了幾個月,后面由于一些特殊的原因,我們監(jiān)控平臺組的整體做了一個很大的架構調整,如下圖:

主要做了四點改變:

接入 Flink 集群去消費 Kafka 數(shù)據,告警的 Flink Job 消費 Kafka 數(shù)據去判斷異常點,然后做告警

Metric & Trace 數(shù)據存儲到 ElasticSearch,之前還存儲在 ElasticSearch 中的有 Log 數(shù)據

Log 數(shù)據存儲到 Cassandra

Dashboard 查詢數(shù)據增加 API 查詢 Cassandra 的日志數(shù)據

原先因為 Metric & Trace & Log 的數(shù)據量一起全部實時寫入到 ElasticSearch 中,對 ElasticSearch 的壓力很大,所以我們將 Log 的數(shù)據拆分存儲到 Cassandra 中,分擔了一些 ElasticSearch 的寫入壓力。 但是過后我們發(fā)現(xiàn)偶爾還會出現(xiàn)數(shù)據實時寫入到 ElasticSearch 集群把 ElasticSearch 寫掛的情況。所以那會不斷調優(yōu)我們的寫入數(shù)據到 ElasticSearch 的 Flink Job,然后也對 ElasticSearch 服務端做了不少的性能調優(yōu)。 另外那會我們的監(jiān)控數(shù)據是以 10s 一次為單位將采集的數(shù)據發(fā)上來的,后面我們調整了下數(shù)據采集的策略(變成 30s 一次為單位采集數(shù)據),采取多種調優(yōu)策略后,終于將我們的 ElasticSearch 弄穩(wěn)定了。

02

遇到 Flink 相關的挑戰(zhàn)

替換成這種新架構后,由于組里沒人熟悉 Flink,再加上那會兒 Flink 的資料真的很少很少,所以當時在組里對 Flink 這塊大家都是從 0 開始學習,于大家而言挑戰(zhàn)還挺大的。

那時候我們跑在 Flink 上面的 Job 也遇到各種各樣的問題:

消費 Kafka 數(shù)據延遲

checkpoint 失敗

窗口概念模糊、使用操作有誤

Event Time 和 Processing Time 選擇有誤

不知道怎么利用 Watermark 機制來處理亂序和延遲的數(shù)據

Flink 自帶的 Connector 的優(yōu)化

Flink 中的 JobManager 和 TaskManager 經常掛導致 Flink Job 重啟

Flink 集群模式的選型

...

因為碰到的各種各樣的問題,所以才會促使我們不斷地學習 Flink 的原理和內部機制,然后慢慢去解決上面遇到的各種問題,并逐步穩(wěn)定我們監(jiān)控平臺運行的 Flink Job。

03

為什么要學習 Flink?

隨著大數(shù)據的不斷發(fā)展,對數(shù)據的及時性要求越來越高,實時場景需求也變得越來越多,主要分下面幾大類:

那么為了滿足這些實時場景的需求,衍生出不少計算引擎框架,現(xiàn)有市面上的大數(shù)據計算引擎的對比如下:

可以發(fā)現(xiàn)無論從 Flink 的架構設計上,還是從其功能完整性和易用性來講都是領先的,再加上Flink 是阿里巴巴主推的計算引擎框架,所以從去年開始就越來越火了! 雖然市面上講 Flink 的太少太少,國內的中文資料太欠缺,已有的幾本書籍也不甚詳盡,但是國內在阿里的推動下,我相信 Flink 會越來越火的,并且阿里內部也將 Flink 做了一定的優(yōu)化和修改,叫 Blink,今年年初也將源碼貢獻到 Flink 上面,后面在 Flink 1.9 版本會將 Blink 的功能進行合并到 Flink 上去。 目前,阿里巴巴、騰訊、美團、華為、滴滴出行、攜程、餓了么、愛奇藝、有贊、唯品會等大廠都已經將 Flink 實踐于公司大型項目中,帶起了一波 Flink 風潮,勢必也會讓 Flink 人才市場產生供不應求的招聘現(xiàn)象。

04

我為什么要寫 FLink 專欄?

在這個過程中我持續(xù)記錄自己的 Flink 學習之路,目前已經對外公布了 20+ 篇 Flink 的個人學習博客,同時好多對 Flink 感興趣的童鞋也加我一起討論問題。 每天群里的童鞋會提很多遇到的 Flink 問題,但是我發(fā)現(xiàn)得到的回答比較少,其實這并不是因為群里大佬不活躍,而是因為大家對 Flink 的了解還不是很多,比如有的是大數(shù)據工程師但之前是搞 Spark 這塊的,有的是轉大數(shù)據開發(fā)的后端開發(fā)工程師,有的是對 Flink 這塊比較感興趣的研究生等。 因為自己就是從 Flink 小白過來的,所以知道初學者可能會遇到的哪些問題。當你回首的時候,你可能會發(fā)現(xiàn),這么簡單的問題自己當時那么費力地折騰了半天都出不來。這種時候要是有人指點一下,可以節(jié)省多少功夫啊! 所以自己在心里萌生了一個想法:寫一個 Flink 專欄幫助大家盡快地從小白階段過渡到入門階段,然后再從入門到能夠將 Flink 用上,在生產環(huán)境真正把你的 Flink Job 運行起來,再做到能夠根據你生產環(huán)境出現(xiàn)的錯誤進行排查并解決,還能根據你的 Job 的運行狀況進一步優(yōu)化!

專欄亮點

全網首個使用最新版本 Flink 1.9 進行內容講解(該版本更新很大,架構功能都有更新),領跑于目前市面上常見的 Flink 1.7 版本的教學課程。

包含大量的實戰(zhàn)案例和代碼去講解原理,有助于讀者一邊學習一邊敲代碼,達到更快,更深刻的學習境界。目前市面上的書籍沒有任何實戰(zhàn)的內容,還只是講解純概念和翻譯官網。

在專欄高級篇中,根據 Flink 常見的項目問題提供了排查和解決的思維方法,并通過這些問題探究了為什么會出現(xiàn)這類問題。

在實戰(zhàn)和案例篇,圍繞大廠公司的經典需求進行分析,包括架構設計、每個環(huán)節(jié)的操作、代碼實現(xiàn)都有一一講解。

專欄內容

預備篇

介紹實時計算常見的使用場景,講解 Flink 的特性,并且對比了 Spark Streaming、Structured Streaming 和 Storm 等大數(shù)據處理引擎,然后準備環(huán)境并通過兩個 Flink 應用程序帶大家上手 Flink。

基礎篇

深入講解 Flink 中 Time、Window、Watermark、Connector 原理,并有大量文章篇幅(含詳細代碼)講解如何去使用這些 Connector(比如 Kafka、ElasticSearch、HBase、Redis、MySQL 等),并且會講解使用過程中可能會遇到的坑,還教大家如何去自定義 Connector。

進階篇

講解 Flink 中 State、Checkpoint、Savepoint、內存管理機制、CEP、Table/SQL API、Machine Learning 、Gelly。在這篇中不僅只講概念,還會講解如何去使用 State、如何配置 Checkpoint、Checkpoint 的流程和如何利用 CEP 處理復雜事件。

高級篇

重點介紹 Flink 作業(yè)上線后的監(jiān)控運維:如何保證高可用、如何定位和排查反壓問題、如何合理的設置作業(yè)的并行度、如何保證 Exactly Once、如何處理數(shù)據傾斜問題、如何調優(yōu)整個作業(yè)的執(zhí)行效率、如何監(jiān)控 Flink 及其作業(yè)?

實戰(zhàn)篇

教大家如何分析實時計算場景的需求,并使用 Flink 里面的技術去實現(xiàn)這些需求,比如實時統(tǒng)計 PV/UV、實時統(tǒng)計商品銷售額 TopK、應用 Error 日志實時告警、機器宕機告警。這些需求如何使用 Flink 實現(xiàn)的都會提供完整的代碼供大家參考,通過這些需求你可以學到 ProcessFunction、Async I/O、廣播變量等知識的使用方式。

系統(tǒng)案例篇

講解大型流量下的真實案例:如何去實時處理海量日志(錯誤日志實時告警/日志實時 ETL/日志實時展示/日志實時搜索)、基于 Flink 的百億數(shù)據實時去重實踐(從去重的通用解決方案 --> 使用 BloomFilter 來實現(xiàn)去重 --> 使用 Flink 的 KeyedState 實現(xiàn)去重)。


▲Flink 專欄思維導圖

多圖講解 Flink 知識點

▲Flink 支持多種時間語義

▲Flink 提供靈活的窗口

▲Flink On YARN

▲Flink Checkpoint

▲Flink 監(jiān)控

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:大數(shù)據計算引擎,你 pick 哪個?

文章出處:【微信號:AI_Thinker,微信公眾號:人工智能頭條】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    黑M-狂野大數(shù)據5期|網盤無密Mp4+大數(shù)據直播課-狂野大數(shù)據

    科技重構數(shù)據生產力:狂野大數(shù)據直播實戰(zhàn)全解析 隨著數(shù)字化時代的快速發(fā)展,大數(shù)據已經滲透到我們生活的方方面面。無論是商業(yè)、教育,還是醫(yī)療、政府服務,大數(shù)據的應用都在不斷創(chuàng)造新的價值。而在
    的頭像 發(fā)表于 04-06 11:13 ?259次閱讀

    大數(shù)據解決方案如何實施

    大數(shù)據解決方案實施的難點在于以下幾點: ?1.很少有優(yōu)質可用的數(shù)據 ?在數(shù)聚股份看來,這幾年數(shù)據交易機構如雨后春筍,“數(shù)據變現(xiàn)”成為很多擁有數(shù)據
    的頭像 發(fā)表于 12-25 18:22 ?1190次閱讀

    大數(shù)據平臺運營的基礎是什么

    在數(shù)聚股份看來,越來越多的企業(yè)開始搭建自己的大數(shù)據平臺體系,并傾注大量資源用于平臺的迭代和運營。那么大數(shù)據平臺作為越來越被關注的企業(yè)新興價值點,它應該以何種方式看待,并且以什么樣的方式去建設和運營
    的頭像 發(fā)表于 12-23 16:07 ?400次閱讀

    硬件加密引擎在保障數(shù)據安全方面有哪些優(yōu)勢呢?

    通過專用電路(如 AES、RSA 等算法的專用邏輯單元)實現(xiàn)加密運算,可并行處理數(shù)據流,避免軟件加密依賴 CPU 通用計算資源的瓶頸。例如,在物聯(lián)網設備傳輸海量傳感器數(shù)據時,硬件加密引擎
    發(fā)表于 11-17 06:47

    覺得哪個軟件寫verilog體驗最好?有什么優(yōu)勢?

    覺得哪個軟件寫verilog體驗最好?有什么優(yōu)勢?請在評論區(qū)留言跟大家分享一下吧。
    發(fā)表于 11-10 07:47

    湖北大數(shù)據集團到訪維智科技參觀交流

    近日,湖北大數(shù)據集團有限公司黨委書記、董事長汪小波率隊到訪維智科技。雙方圍繞時空數(shù)據融合、公共數(shù)據授權運營及行業(yè)應用場景開發(fā)等議題展開深入探討。
    的頭像 發(fā)表于 11-03 10:02 ?821次閱讀

    組態(tài)大數(shù)據平臺是什么?有什么功能?

    組態(tài)大數(shù)據平臺是融合 組態(tài)技術 與 大數(shù)據處理能力 的綜合性平臺,通過圖形化、可配置的方式實現(xiàn)數(shù)據采集、存儲、分析、可視化及遠程控制,適用于工業(yè)自動化、能源管理、樓宇監(jiān)控等領域。其核心價值在于降低
    的頭像 發(fā)表于 10-30 11:29 ?358次閱讀
    組態(tài)<b class='flag-5'>大數(shù)據</b>平臺是什么?有什么功能?

    2025年七大數(shù)據防泄密軟件權威盤點:為的機密數(shù)據提供持續(xù)守護

    2025年七大數(shù)據防泄密軟件權威盤點:為的機密數(shù)據提供持續(xù)守護 無論是內部員工的無意泄露,還是外部黑客的有意竊取,都可能給企業(yè)帶來巨大的經濟損失和聲譽損害。 如何選擇一款可靠的數(shù)據
    的頭像 發(fā)表于 09-30 10:46 ?649次閱讀

    御控工業(yè)物聯(lián)網大數(shù)據解決方案:排水設備遠程監(jiān)控與大數(shù)據統(tǒng)計系統(tǒng)

    御控工業(yè)物聯(lián)網推出排水設備遠程監(jiān)控與大數(shù)據統(tǒng)計系統(tǒng),通過物聯(lián)網、大數(shù)據、云計算等技術構建“感知-傳輸-分析-決策”閉環(huán)管理體系,助力排水行業(yè)數(shù)字化轉型。
    的頭像 發(fā)表于 09-12 10:04 ?847次閱讀

    D3000飛騰工控主板,為數(shù)字中國提供核心計算引擎

    在數(shù)字中國建設的宏偉征程中,核心計算能力猶如基石,支撐著各個領域數(shù)字化轉型與發(fā)展。飛騰工控主板憑借良好的性能、強大的適應性和廣泛的應用潛力,正逐漸嶄露頭角,成為數(shù)字中國建設重要的核心計算引擎
    的頭像 發(fā)表于 07-29 09:08 ?619次閱讀

    信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

    診斷方案,為網絡運維帶來顯著的實用價值:1.快速提升故障處理效率l 實時監(jiān)控與智能預警: AI引擎持續(xù)分析海量流量、設備狀態(tài)及日志數(shù)據,實時識別異常模式(如流量突增、延遲抖動、微小丟包),實現(xiàn)故障發(fā)生
    發(fā)表于 07-16 15:29

    邊緣計算網關哪個好用?有哪些推薦?

    如果正在工業(yè)物聯(lián)網項目中尋找可靠的邊緣計算網關,面對市場上眾多品牌和型號,確實容易陷入“選擇困難”。以下是一些市場上表現(xiàn)較為出色的邊緣計算網關品牌排行(不分先后),希望能給你帶來一些參考。
    的頭像 發(fā)表于 07-05 15:47 ?1060次閱讀

    工業(yè)自動化的未來已來:邊緣計算如何成為新增長引擎?

    是否還在用“傳統(tǒng)中心化”方式處理工廠數(shù)據?邊緣計算正在成為工業(yè)自動化的新常態(tài),不僅重塑了工廠數(shù)據架構,更直接推動了運營效率和收入增長。本篇文章深入剖析了邊緣
    的頭像 發(fā)表于 06-12 11:56 ?686次閱讀
    工業(yè)自動化的未來已來:邊緣<b class='flag-5'>計算</b>如何成為新增長<b class='flag-5'>引擎</b>?

    RISC-V向量處理器:現(xiàn)代計算的革命性引擎

    在數(shù)字化高速發(fā)展的當下,人工智能、大數(shù)據處理、物聯(lián)網等前沿技術日新月異,現(xiàn)代計算需求面臨著嚴峻挑戰(zhàn)。海量數(shù)據的爆發(fā)式增長,讓傳統(tǒng)計算架構在處理大規(guī)模
    的頭像 發(fā)表于 06-04 10:03 ?1897次閱讀
    RISC-V向量處理器:現(xiàn)代<b class='flag-5'>計算</b>的革命性<b class='flag-5'>引擎</b>

    更改最大數(shù)據包大小時無法識別USB設備如何解決?

    將生產者 EP 端點描述符中的最大數(shù)據包大小從 1024 字節(jié)更改為 512 字節(jié)時,無法識別 USB 設備。 請告知如何解決這個問題。
    發(fā)表于 05-20 08:13
    绍兴市| 鹤峰县| 大荔县| 巴彦淖尔市| 贺兰县| 马龙县| 朔州市| 仪陇县| 海伦市| 阜南县| 黎城县| 易门县| 扬中市| 老河口市| 桐梓县| 蒙城县| 民乐县| 应用必备| 兴隆县| 大连市| 富宁县| 盈江县| 鹿邑县| 德州市| 淮滨县| 清苑县| 青阳县| 积石山| 台前县| 栾城县| 上思县| 山阴县| 武定县| 阿克| 明光市| 静海县| 定远县| 巴彦淖尔市| 楚雄市| 扶余县| 牟定县|