日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Flink+ClickHouse 玩轉(zhuǎn)企業(yè)級(jí)實(shí)時(shí)大數(shù)據(jù)開發(fā)-完整分享

撒水 ? 來源:jf_82580774 ? 作者:jf_82580774 ? 2026-04-01 15:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從個(gè)人觀點(diǎn)看Flink+ClickHouse構(gòu)建用戶畫像實(shí)時(shí)分析系統(tǒng):一場(chǎng)“快”與“準(zhǔn)”的聯(lián)姻

在數(shù)據(jù)領(lǐng)域摸爬滾打這些年,我經(jīng)歷過從離線批處理到實(shí)時(shí)流計(jì)算的整個(gè)演進(jìn)過程。如果說有什么技術(shù)組合讓我真正感受到了“實(shí)時(shí)分析”的威力,那一定是Flink與ClickHouse的搭配。這不僅僅是兩個(gè)開源組件的簡(jiǎn)單拼湊,在我看來,它們代表了一種數(shù)據(jù)處理范式的轉(zhuǎn)變——讓“用戶畫像”這個(gè)曾經(jīng)只能在T+1報(bào)表中看到的東西,變成了可以實(shí)時(shí)查詢、實(shí)時(shí)決策的動(dòng)態(tài)資產(chǎn)。

為什么是Flink和ClickHouse?一場(chǎng)命中注定的相遇

第一次接觸Flink時(shí),我被它的流式計(jì)算哲學(xué)深深吸引。在此之前,我們用Spark Streaming做微批處理,總有一個(gè)無法逾越的尷尬——數(shù)據(jù)到達(dá)和結(jié)果產(chǎn)出之間,永遠(yuǎn)隔著那幾秒鐘的窗口。而Flink真正做到了“來一條處理一條”,它的事件時(shí)間處理、狀態(tài)管理、Exactly-Once語義,讓實(shí)時(shí)計(jì)算第一次有了“確定性”。

ClickHouse則是另一個(gè)讓人驚艷的存在。當(dāng)我第一次看到它在百億級(jí)數(shù)據(jù)上做維度聚合查詢,返回結(jié)果只用了幾百毫秒時(shí),那種震撼至今難忘。它的列式存儲(chǔ)、向量化執(zhí)行、數(shù)據(jù)壓縮,每一個(gè)設(shè)計(jì)都在回答同一個(gè)問題:如何在OLAP場(chǎng)景下做到極致快。

但真正讓我覺得它們是“天生一對(duì)”的,是它們能力的互補(bǔ)。Flink擅長(zhǎng)“寫”——高吞吐、低延遲、狀態(tài)復(fù)雜的實(shí)時(shí)計(jì)算;ClickHouse擅長(zhǎng)“讀”——海量數(shù)據(jù)下的極速查詢分析。一個(gè)負(fù)責(zé)把用戶行為實(shí)時(shí)加工成畫像標(biāo)簽,一個(gè)負(fù)責(zé)讓這些標(biāo)簽可以被任意維度任意組合地秒級(jí)查詢。這種“寫快讀也快”的組合,解決了很多傳統(tǒng)架構(gòu)無法逾越的矛盾。

用戶畫像的實(shí)時(shí)化:從“昨天你是誰”到“現(xiàn)在你是誰”

傳統(tǒng)用戶畫像系統(tǒng),往往是T+1離線計(jì)算的。這意味著你今天看到的用戶標(biāo)簽,反映的是用戶昨天的行為。在移動(dòng)互聯(lián)網(wǎng)時(shí)代,這種延遲是致命的——用戶剛剛瀏覽了某個(gè)商品,你第二天才給他推相關(guān)優(yōu)惠,機(jī)會(huì)早已錯(cuò)過。

用Flink構(gòu)建實(shí)時(shí)畫像系統(tǒng)后,最大的改變是“時(shí)效性”。用戶的每一次點(diǎn)擊、每一次搜索、每一次加購,都會(huì)被Flink實(shí)時(shí)捕獲,經(jīng)過清洗、聚合、關(guān)聯(lián)、計(jì)算,在秒級(jí)內(nèi)更新到畫像系統(tǒng)中。用戶上一秒看了球鞋,下一秒就能在推薦流里看到耐克的廣告。

這種實(shí)時(shí)化的背后,是Flink強(qiáng)大的狀態(tài)管理能力。用戶畫像是典型的“有狀態(tài)”計(jì)算——需要記住用戶歷史的興趣偏好、行為軌跡,再與當(dāng)前行為結(jié)合產(chǎn)出新的標(biāo)簽。Flink的狀態(tài)后端(RocksDB)支持TB級(jí)的狀態(tài)存儲(chǔ),配合增量的checkpoint機(jī)制,讓長(zhǎng)周期的用戶狀態(tài)管理變得可行。

我曾在一次架構(gòu)選型時(shí)對(duì)比過幾種方案,最終選擇Flink的核心原因就是它對(duì)狀態(tài)的優(yōu)雅處理。相比其他流式計(jì)算引擎,F(xiàn)link把“狀態(tài)”作為一等公民,這讓復(fù)雜畫像邏輯的實(shí)現(xiàn)難度大大降低。

ClickHouse在畫像查詢上的“降維打擊”

有了實(shí)時(shí)生成的畫像數(shù)據(jù),下一步就是讓業(yè)務(wù)方能夠靈活使用這些數(shù)據(jù)。這就到了ClickHouse大顯身手的時(shí)候。

傳統(tǒng)做法是用HBase或Redis做KV查詢,根據(jù)用戶ID獲取標(biāo)簽。但業(yè)務(wù)的需求往往是復(fù)雜的——“找出過去7天活躍、年齡25-30歲、興趣標(biāo)簽包含‘數(shù)碼’且最近3小時(shí)瀏覽過手機(jī)的用戶”。這種多維組合查詢,在KV存儲(chǔ)里幾乎無法實(shí)現(xiàn),需要復(fù)雜的預(yù)計(jì)算和冗余存儲(chǔ)。

ClickHouse的出現(xiàn),改變了這個(gè)局面。它的寬表模型和列式存儲(chǔ),讓這種多維分析查詢變得異常簡(jiǎn)單。在百億級(jí)的畫像數(shù)據(jù)上做多條件過濾、聚合計(jì)算,ClickHouse可以在毫秒到秒級(jí)返回結(jié)果。這種能力,讓業(yè)務(wù)方可以從“預(yù)設(shè)標(biāo)簽的查詢”變成“任意維度的探索分析”,數(shù)據(jù)分析的自由度提升了一個(gè)數(shù)量級(jí)。

我印象最深的是一個(gè)場(chǎng)景:運(yùn)營(yíng)同學(xué)想做一次面向“高價(jià)值但近期沉默”用戶的召回活動(dòng)。以前,這個(gè)人群的圈選需要提需求給數(shù)據(jù)團(tuán)隊(duì),排期開發(fā),等幾天才能拿到數(shù)據(jù)。用Flink+ClickHouse的方案后,運(yùn)營(yíng)自己寫SQL,幾秒鐘就能圈出目標(biāo)人群。這種“數(shù)據(jù)民主化”帶來的效率提升,是難以量化的。

實(shí)時(shí)與離線:不是替代,而是融合

很多人誤以為引入實(shí)時(shí)系統(tǒng)后,離線就可以下崗了。從我實(shí)踐的經(jīng)驗(yàn)來看,實(shí)時(shí)和離線不是替代關(guān)系,而是互補(bǔ)關(guān)系。

Flink負(fù)責(zé)“熱數(shù)據(jù)”——用戶近幾個(gè)小時(shí)或幾天的實(shí)時(shí)行為,保證時(shí)效性;離線數(shù)倉(Hive/Spark)負(fù)責(zé)“冷數(shù)據(jù)”——?dú)v史全量數(shù)據(jù)的穩(wěn)定計(jì)算,保證準(zhǔn)確性。兩者在畫像系統(tǒng)中各司其職,通過合理的分層設(shè)計(jì)融合在一起。

比如用戶的長(zhǎng)期興趣標(biāo)簽(過去90天的偏好)可以由離線每日更新,短期興趣標(biāo)簽(近1小時(shí)的實(shí)時(shí)意圖)由Flink實(shí)時(shí)更新。查詢時(shí)通過ClickHouse的分布式表將兩者融合,對(duì)外提供統(tǒng)一的畫像服務(wù)。這種Lambda架構(gòu)的變體,既保證了實(shí)時(shí)性,又兼顧了歷史數(shù)據(jù)的計(jì)算穩(wěn)定性。

踩過的坑與收獲的成長(zhǎng)

這套架構(gòu)也不是一帆風(fēng)順的。Flink的狀態(tài)大小控制、ClickHouse的寫入限流、數(shù)據(jù)一致性的保障、Failover時(shí)的恢復(fù)策略,每一個(gè)環(huán)節(jié)都有過血淚教訓(xùn)。但正是這些踩坑的經(jīng)歷,讓我更深刻理解了實(shí)時(shí)系統(tǒng)的設(shè)計(jì)哲學(xué)——不是追求完美,而是追求可控的、可恢復(fù)的、可觀測(cè)的確定性。

回頭看,F(xiàn)link與ClickHouse的結(jié)合,不僅僅是技術(shù)選型的勝利,更是對(duì)“用戶畫像應(yīng)該是什么”這個(gè)問題的重新思考。它讓畫像從靜態(tài)的標(biāo)簽體系,變成了動(dòng)態(tài)的、可交互的、實(shí)時(shí)響應(yīng)的數(shù)據(jù)資產(chǎn)。在這個(gè)用戶注意力越來越稀缺的時(shí)代,誰能在毫秒之間理解用戶、服務(wù)用戶,誰就能贏得先機(jī)。

寫在最后

技術(shù)選型這件事,從來沒有標(biāo)準(zhǔn)答案。但Flink+ClickHouse這套組合,至少在“用戶畫像實(shí)時(shí)分析”這個(gè)場(chǎng)景下,給出了一個(gè)相當(dāng)優(yōu)雅的答案。它讓我相信,好的架構(gòu)不是最復(fù)雜的,而是最合適的——合適地解決了時(shí)效性問題,合適地平衡了實(shí)時(shí)與離線,合適地讓數(shù)據(jù)能夠真正服務(wù)于業(yè)務(wù)決策。

如果你也在探索實(shí)時(shí)畫像系統(tǒng)的建設(shè),不妨從理解Flink的狀態(tài)機(jī)制和ClickHouse的查詢特性開始,你會(huì)發(fā)現(xiàn),這條路雖然有不少坑,但風(fēng)景確實(shí)值得。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    9102

    瀏覽量

    144113
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    國(guó)內(nèi)企業(yè)級(jí)SSD廠商加速崛起

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)國(guó)際數(shù)據(jù)公司(IDC)發(fā)布最新報(bào)告顯示,中國(guó)企業(yè)級(jí)固態(tài)硬盤市場(chǎng)在2024年得到修復(fù),市場(chǎng)規(guī)模達(dá)到62.5億美元,與2023年相比增長(zhǎng)187.9%。IDC預(yù)計(jì)
    的頭像 發(fā)表于 06-09 07:54 ?1.3w次閱讀
    國(guó)內(nèi)<b class='flag-5'>企業(yè)級(jí)</b>SSD廠商加速崛起

    亞馬遜云科技×OpenAI深化合作:以“三重有限預(yù)覽”重構(gòu)企業(yè)級(jí)AI開發(fā)新范式

    近期,亞馬遜云科技宣布與OpenAI達(dá)成戰(zhàn)略級(jí)合作擴(kuò)展,通過“模型-工具-平臺(tái)”三重有限預(yù)覽版部署,將前沿生成式AI能力深度融入企業(yè)信賴的云基礎(chǔ)設(shè)施。此次合作標(biāo)志著企業(yè)級(jí)AI開發(fā)正式進(jìn)
    的頭像 發(fā)表于 05-08 10:07 ?366次閱讀

    憶聯(lián)連續(xù)四年穩(wěn)居國(guó)產(chǎn)企業(yè)級(jí)SSD市場(chǎng)榜首

    全球權(quán)威調(diào)研機(jī)構(gòu)IDC最新發(fā)布的2025《中國(guó)企業(yè)級(jí)固態(tài)硬盤市場(chǎng)跟蹤報(bào)告》顯示,憶聯(lián)以15.5%的市場(chǎng)份額位居中國(guó)企業(yè)級(jí)SSD市場(chǎng)國(guó)產(chǎn)廠商第一,連續(xù)四年蟬聯(lián)國(guó)產(chǎn)冠軍。
    的頭像 發(fā)表于 05-07 10:56 ?503次閱讀
    憶聯(lián)連續(xù)四年穩(wěn)居國(guó)產(chǎn)<b class='flag-5'>企業(yè)級(jí)</b>SSD市場(chǎng)榜首

    得瑞領(lǐng)新聚焦AI數(shù)據(jù)中心存儲(chǔ),全國(guó)產(chǎn)高性能企業(yè)級(jí)PCIe 5.0 SSD正當(dāng)時(shí)

    隨著大模型訓(xùn)練與推理、海量數(shù)據(jù)處理等場(chǎng)景的規(guī)模化落地,AI數(shù)據(jù)中心對(duì)企業(yè)級(jí)SSD提出嚴(yán)苛要求,不僅需要極致的低延遲與高IOPS性能支撐高并發(fā)訪問,還需兼顧大容量、高速讀取、穩(wěn)定可靠性與能效優(yōu)化,以
    的頭像 發(fā)表于 04-14 15:01 ?4459次閱讀
    得瑞領(lǐng)新聚焦AI<b class='flag-5'>數(shù)據(jù)</b>中心存儲(chǔ),全國(guó)產(chǎn)高性能<b class='flag-5'>企業(yè)級(jí)</b>PCIe 5.0 SSD正當(dāng)時(shí)

    中興通訊推出企業(yè)級(jí)桌面智能體Co-Claw

    今日,中興通訊宣布已正式上線企業(yè)級(jí)桌面智能體——Co-Claw 企業(yè)版。
    的頭像 發(fā)表于 02-03 09:57 ?567次閱讀

    德明利企業(yè)級(jí)SSD與OpenCloudOS、騰訊云完成技術(shù)兼容互認(rèn)證

    德明利TS3160系列企業(yè)級(jí)SATA SSD產(chǎn)品與OpenCloudOS、騰訊云相互兼容認(rèn)證
    的頭像 發(fā)表于 10-17 15:48 ?859次閱讀
    德明利<b class='flag-5'>企業(yè)級(jí)</b>SSD與OpenCloudOS、騰訊云完成技術(shù)兼容互認(rèn)證

    容量可達(dá)245.76TB,鎧俠企業(yè)級(jí)數(shù)據(jù)中心級(jí)SSD迎來全面升級(jí)

    鎧俠正式發(fā)布了LC9系列、CM9系列以及CD9P系列企業(yè)級(jí)數(shù)據(jù)中心級(jí)SSD,全新的系列可更好的滿足AI計(jì)算存儲(chǔ)需求,并適用于云端應(yīng)用、在線交易和虛擬化等多種應(yīng)用場(chǎng)景。
    的頭像 發(fā)表于 09-02 10:33 ?2306次閱讀
    容量可達(dá)245.76TB,鎧俠<b class='flag-5'>企業(yè)級(jí)</b>與<b class='flag-5'>數(shù)據(jù)</b>中心<b class='flag-5'>級(jí)</b>SSD迎來全面升級(jí)

    永銘固液混合鋁電解電容:為企業(yè)級(jí)固態(tài)硬盤 實(shí)現(xiàn)高效穩(wěn)定電源管理方案

    01企業(yè)級(jí)固態(tài)硬盤市場(chǎng)趨勢(shì)隨著大數(shù)據(jù)、云計(jì)算、人工智能、5G通信等技術(shù)的廣泛應(yīng)用,企業(yè)數(shù)據(jù)中心對(duì)數(shù)據(jù)存儲(chǔ)、處理和傳輸?shù)男枨蠹眲∩仙?/div>
    的頭像 發(fā)表于 09-01 10:09 ?970次閱讀
    永銘固液混合鋁電解電容:為<b class='flag-5'>企業(yè)級(jí)</b>固態(tài)硬盤 實(shí)現(xiàn)高效穩(wěn)定電源管理方案

    永不掉線的守護(hù):永銘鉭電容賦予“企業(yè)級(jí)固態(tài)硬盤”可靠護(hù)航者使命

    企業(yè)級(jí)固態(tài)硬盤面臨的考驗(yàn)SSD數(shù)據(jù)洪流時(shí)代,企業(yè)級(jí)固態(tài)硬盤面臨哪些生死考驗(yàn)?在數(shù)字化浪潮中,企業(yè)級(jí)固態(tài)硬盤如同數(shù)據(jù)中心的"數(shù)字糧倉",承載著
    的頭像 發(fā)表于 09-01 09:57 ?742次閱讀
    永不掉線的守護(hù):永銘鉭電容賦予“<b class='flag-5'>企業(yè)級(jí)</b>固態(tài)硬盤”可靠護(hù)航者使命

    Cognizant加速AI模型企業(yè)級(jí)開發(fā)

    -Cognizant推出AI Training Data Services,助力企業(yè)級(jí)AI模型加速開發(fā) Cognizant是數(shù)據(jù)與AI模型訓(xùn)練合作伙伴,長(zhǎng)期深受大型數(shù)字原生先鋒企業(yè)信賴
    的頭像 發(fā)表于 07-31 17:25 ?844次閱讀

    企業(yè)級(jí)Linux磁盤維護(hù)的完整流程

    企業(yè)級(jí)Linux環(huán)境中,磁盤故障是導(dǎo)致系統(tǒng)宕機(jī)和數(shù)據(jù)丟失的主要原因之一。據(jù)統(tǒng)計(jì),超過70%的企業(yè)級(jí)服務(wù)器故障與存儲(chǔ)系統(tǒng)相關(guān)。作為運(yùn)維工程師,掌握完整的磁盤維護(hù)流程不僅能預(yù)防故障,更能
    的頭像 發(fā)表于 07-23 16:59 ?1104次閱讀

    企業(yè)級(jí)智能體是什么?有什么作用?

    在人工智能技術(shù)飛速發(fā)展的今天,企業(yè)級(jí)智能體正成為推動(dòng)組織數(shù)字化轉(zhuǎn)型的重要力量。這種新型的企業(yè)智能化解決方案,正在重塑企業(yè)的運(yùn)營(yíng)模式和管理方式,為商業(yè)發(fā)展注入全新動(dòng)能。 一、 企業(yè)級(jí)智能
    的頭像 發(fā)表于 07-21 15:44 ?1144次閱讀
    <b class='flag-5'>企業(yè)級(jí)</b>智能體是什么?有什么作用?

    企業(yè)級(jí)MySQL數(shù)據(jù)庫管理指南

    在當(dāng)今數(shù)字化時(shí)代,MySQL作為全球最受歡迎的開源關(guān)系型數(shù)據(jù)庫,承載著企業(yè)核心業(yè)務(wù)數(shù)據(jù)的存儲(chǔ)與處理。作為數(shù)據(jù)庫管理員(DBA),掌握MySQL的企業(yè)
    的頭像 發(fā)表于 07-09 09:50 ?939次閱讀

    企業(yè)級(jí)SSD的核心技術(shù)與市場(chǎng)趨勢(shì)

    。 ? 企業(yè)級(jí)SSD的核心部件示意圖 ? 主控芯片(控制大腦) 控制數(shù)據(jù)讀寫,直接決定SSD 的性能、可靠性固件(操作系統(tǒng)) 確保SSD高效穩(wěn)定運(yùn)行 NAND Flash、DRAM(存儲(chǔ)介質(zhì)) NAND Flash是主要存儲(chǔ)介質(zhì),用于存儲(chǔ)用戶
    的頭像 發(fā)表于 07-06 05:34 ?7713次閱讀
    <b class='flag-5'>企業(yè)級(jí)</b>SSD的核心技術(shù)與市場(chǎng)趨勢(shì)

    憶聯(lián)持續(xù)領(lǐng)跑中國(guó)企業(yè)級(jí)固態(tài)硬盤市場(chǎng)

    全球權(quán)威調(diào)研機(jī)構(gòu)IDC最新《2024中國(guó)企業(yè)級(jí)固態(tài)硬盤市場(chǎng)跟蹤報(bào)告》顯示,憶聯(lián)以11.4%的市場(chǎng)份額(覆蓋PCIe/SATA/SAS接口類型)問鼎中國(guó)企業(yè)級(jí)固態(tài)硬盤市場(chǎng)國(guó)產(chǎn)廠商冠軍。
    的頭像 發(fā)表于 06-04 11:21 ?2381次閱讀
    高清| 赤壁市| 泉州市| 洛浦县| 大连市| 徐水县| 班戈县| 汕头市| 长岛县| 平南县| 建德市| 巩义市| 吉水县| 遂川县| 石棉县| 竹山县| 莆田市| 普安县| 石首市| 启东市| 竹山县| 隆尧县| 陇南市| 陇川县| 永城市| 乌海市| 马龙县| 平和县| 新和县| 江阴市| 琼海市| 兴业县| 永川市| 铜梁县| 中山市| 鹰潭市| 永宁县| 都昌县| 合作市| 宁化县| 平陆县|