日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)中流式數(shù)據(jù)處理的使用場景及相關(guān)技術(shù)介紹

數(shù)據(jù)分析與開發(fā) ? 來源:數(shù)據(jù)分析與開發(fā) ? 作者:數(shù)據(jù)分析與開發(fā) ? 2021-02-08 11:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在工業(yè)界,當(dāng)我們提到實(shí)時數(shù)據(jù)機(jī)器學(xué)習(xí)時,常常可以聽到如下討論:

他們希望有一個模型,這個模型利用最近歷史信息來進(jìn)行預(yù)測分析。舉一個天氣的例子,如果最近幾天都是晴天,那么未來幾天極小概率會出現(xiàn)雨雪和低溫天氣

這個模型還需要是可更新的。當(dāng)數(shù)據(jù)流經(jīng)系統(tǒng)時,模型是可以隨之進(jìn)化升級。舉個例子,隨著業(yè)務(wù)規(guī)模的擴(kuò)大,我們希望零售銷售模型仍然保持準(zhǔn)確。

實(shí)時機(jī)器學(xué)習(xí)應(yīng)用是人工智能真正落地服務(wù)化的關(guān)鍵一步,因?yàn)楣I(yè)界大部分場景下數(shù)據(jù)都是實(shí)時產(chǎn)生的。因此作為一名合格的人工智能領(lǐng)域?qū)<?,掌握流式場景下?a href="http://m.sdkjxy.cn/v/tag/2562/" target="_blank">算法設(shè)計必不可少。 本文主要介紹流式數(shù)據(jù)處理的使用場景、相關(guān)技術(shù),并從服務(wù)管理的角度,介紹了針對流式計算服務(wù)的設(shè)計及關(guān)鍵指標(biāo)。主要面向希望了解流式計算、服務(wù)管理的朋友們。

流式計算的使用場景

01

首先,當(dāng)前業(yè)界已經(jīng)有非常多數(shù)據(jù)處理的方式了,為什么還需要流式數(shù)據(jù)處理?要回答這個問題,我們先回顧一下傳統(tǒng)的的數(shù)據(jù)處理架構(gòu)。 傳統(tǒng)的數(shù)據(jù)處理架構(gòu)是一種典型的以數(shù)據(jù)庫為中心,適應(yīng)存儲事務(wù)性數(shù)據(jù)處理的場景。由于數(shù)據(jù)處理能力優(yōu)先,在該架構(gòu)下,往往數(shù)據(jù)都是以批量的方式進(jìn)行處理,例如:批量寫入數(shù)據(jù)庫、批量讀取數(shù)據(jù)庫進(jìn)行數(shù)據(jù)處理。這種架構(gòu)在面對實(shí)時性較低的場景中較為有效,但是在對實(shí)時性較高的場景則不太有效,例如:自動駕駛場景、工業(yè)機(jī)器人場景、基于會話的用戶統(tǒng)計等。

因此,流式計算或流式數(shù)據(jù)處理被提出。其實(shí)流處理它最接近數(shù)據(jù)產(chǎn)生的自然規(guī)律,只不過過去我們沒有流處理能力,只能做一些特殊的處理才能真正地使用流數(shù)據(jù),比如將流數(shù)據(jù)攢成批量數(shù)據(jù)再處理,不然無法進(jìn)行大規(guī)模的計算。使用流數(shù)據(jù)并不新鮮,新鮮的是我們有了新技術(shù),從而可以大規(guī)模、靈活、自然和低成本地使用它們。 流式處理的核心目標(biāo)有以下三點(diǎn):

低延遲:近實(shí)時的數(shù)據(jù)處理能力

高吞吐:能處理大批量的數(shù)據(jù)

可以容錯:在數(shù)據(jù)計算有誤的情況下,可容忍錯誤,且可更正錯誤

流式處理框架

02

典型的流處理框架結(jié)合了消息傳輸層技術(shù)以及流處理層技術(shù)。具體如圖所示:

a4808860-5fd2-11eb-8b86-12bb97331649.jpg

消息傳輸層的引入流處理層提供了以下支持:

消息傳輸層的一個作用是作為流處理層上游的安全隊列,它相當(dāng)于緩沖區(qū),可以將事件數(shù)據(jù)作為短期數(shù)據(jù)保留起來,以防數(shù)據(jù)處理過程發(fā)生中斷

具有持久性的好處之一是消息可以重播。實(shí)現(xiàn)時間穿梭

在當(dāng)前典型的流處理技術(shù)中,有這么幾類:

Lambda架構(gòu)

基于Lambda架構(gòu),實(shí)現(xiàn)了離線計算的精確性的同時,且獲得了流式數(shù)據(jù)處理的實(shí)時性。但是,由于要開發(fā)同樣邏輯的代碼,開發(fā)、維護(hù)成本高

a81f2850-5fd2-11eb-8b86-12bb97331649.jpg

Kappa架構(gòu)為了解決lambda架構(gòu)中維護(hù)兩套同樣邏輯的代碼,kappa架構(gòu)提出使用流式處理解決上述問題。當(dāng)需要重新處理、計算數(shù)據(jù)時,使用另一個流程處理的作業(yè)(可以是相同的、優(yōu)化的版本)進(jìn)行數(shù)據(jù)處理。

a8b7e4d2-5fd2-11eb-8b86-12bb97331649.jpg

spark streaming

基于小批量進(jìn)行數(shù)據(jù)處理

Flink

以上幾種技術(shù)中,flink既可以實(shí)現(xiàn)低延遲、高吞吐,還可以實(shí)現(xiàn)容錯。

Flink概況

03

Flink技術(shù)除支持流處理外,還支持批處理,其架構(gòu)如下圖所示:

a9d244e8-5fd2-11eb-8b86-12bb97331649.jpg

另外,F(xiàn)link具有分布式的特點(diǎn),具體體現(xiàn)在它能夠在成百上千臺機(jī)器上運(yùn)行,它將大型的計算任務(wù)分成許多小的部分,每個機(jī)器執(zhí)行一個部分。 Flink能夠自動地確保在發(fā)生機(jī)器故障或者其他錯誤時計算能持續(xù)進(jìn)行,或者在修復(fù)bug或進(jìn)行版本升級后有計劃地再執(zhí)行一次。這種能力使得開發(fā)人員不需要擔(dān)心失敗。 Flink本質(zhì)上使用容錯性數(shù)據(jù)流,這使得開發(fā)人員可以分析持續(xù)生成且永遠(yuǎn)不結(jié)束的數(shù)據(jù)(即流處理)。因?yàn)椴挥迷僭诰帉憫?yīng)用程序代碼時考慮如何解決問題,所以工程師的時間得以充分利用,整個團(tuán)隊也因此受益。好處并不局限于縮短開發(fā)時間,隨著靈活性的增加,團(tuán)隊整體的開發(fā)質(zhì)量得到了提高,運(yùn)維工作也變得更容易、更高效。Flink讓應(yīng)用程序在生產(chǎn)環(huán)境中獲得良好的性能。

總體來說,F(xiàn)link的主要特性:

符合產(chǎn)生數(shù)據(jù)的自然規(guī)律:支持流式數(shù)據(jù)處理

發(fā)生故障后仍保持準(zhǔn)確:具體容錯機(jī)制(exactly once)

及時給出所需結(jié)果:低延遲、實(shí)時性強(qiáng)

時間概念

在流數(shù)據(jù)處理的體系中,時間是一個重要的概念。總體來說,可分為以下三種時間:

事件時間:即事件實(shí)際發(fā)生的時間。更準(zhǔn)確地說,每一個事件都有一個與它相關(guān)的時間戳,并且時間戳是數(shù)據(jù)記錄的一部分(比如手機(jī)或者服務(wù)器的記錄)。事件時間其實(shí)就是時間戳。處理時間,即事件被處理的時間。

處理時間:其實(shí)就是處理事件的機(jī)器所測量的時間

攝取時間:也叫作進(jìn)入時間。它指的是事件進(jìn)入流處理框架的時間

Flink允許用戶根據(jù)所需的語義和對準(zhǔn)確性的要求選擇采用事件時間、處理時間或攝取時間定義窗口

窗口

窗口是一種機(jī)制,它用于將許多事件按照時間或者其他特征分組,從而將每一組作為整體進(jìn)行分析(比如求和)

ab2e3fae-5fd2-11eb-8b86-12bb97331649.jpg

時間穿梭

處理器支持事件時間,這意味著將數(shù)據(jù)流“倒帶”,用同一組數(shù)據(jù)重新運(yùn)行同樣的程序,會得到相同的結(jié)果

水印

假設(shè)第一個窗口從1000開始(即從10時0分0秒開始),需要計算從1000到1000的數(shù)值總和。當(dāng)時間就是記錄的一部分時,我們怎么知道1000已到呢?換句話說,我們怎么知道蓋有時間戳1059的元素還沒到呢?Flink通過水印來推進(jìn)事件時間。水印是嵌在流中的常規(guī)記錄,計算程序通過水印獲知某個時間點(diǎn)已到。

有狀態(tài)的計算

流式計算分為無狀態(tài)和有狀態(tài)兩種情況:

無狀態(tài)的計算觀察每個獨(dú)立事件,并根據(jù)最后一個事件輸出結(jié)果。例如,流處理應(yīng)用程序從傳感器接收溫度讀數(shù),并在溫度超過90度時發(fā)出警告。

有狀態(tài)的計算則會基于多個事件輸出結(jié)果。

數(shù)據(jù)處理容錯及一致性保障

在有狀態(tài)的數(shù)據(jù)處理中,如何保障數(shù)據(jù)的一致性是一個關(guān)鍵點(diǎn)。保障一致性的方式有以下三種:

at most once:這其實(shí)是沒有正確性保障的委婉說法——故障發(fā)生之后,計數(shù)結(jié)果可能丟失

at least once:這表示計數(shù)結(jié)果可能大于正確值,但絕不會小于正確值。也就是說,計數(shù)程序在發(fā)生故障后可能多算,但是絕不會少算

exactly once:這指的是系統(tǒng)保證在發(fā)生故障后得到的計數(shù)結(jié)果與正確值一致

Flink如何保證exactlyonce呢?它使用一種被稱為“檢查點(diǎn)”的特性,在出現(xiàn)故障時將系統(tǒng)重置回正確狀態(tài)。

有限流處理是無限流處理的一種特殊情況,它只不過在某個時間點(diǎn)停止而已。此外,如果計算結(jié)果不在執(zhí)行過程中連續(xù)生成,而僅在末尾處生成一次,那就是批處理(分批處理數(shù)據(jù))

原文標(biāo)題:流式計算、數(shù)據(jù)處理及相關(guān)技術(shù)

文章出處:【微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50385

    瀏覽量

    267109
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8567

    瀏覽量

    137275

原文標(biāo)題:流式計算、數(shù)據(jù)處理及相關(guān)技術(shù)

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    云端數(shù)據(jù)處理專利技術(shù):重塑數(shù)字時代的算力基石

    一、云端數(shù)據(jù)處理:數(shù)字經(jīng)濟(jì)的核心引擎在數(shù)字化浪潮席卷全球的今天,每天產(chǎn)生的數(shù)據(jù)量呈指數(shù)級增長。從智能終端的實(shí)時傳感數(shù)據(jù),到企業(yè)的業(yè)務(wù)運(yùn)營數(shù)據(jù),再到科研領(lǐng)域的海量實(shí)驗(yàn)
    的頭像 發(fā)表于 04-07 11:20 ?1565次閱讀
    云端<b class='flag-5'>數(shù)據(jù)處理</b>專利<b class='flag-5'>技術(shù)</b>:重塑數(shù)字時代的算力基石

    【智能檢測】基于AI深度學(xué)習(xí)與飛拍技術(shù)的影像測量系統(tǒng):實(shí)現(xiàn)高效精準(zhǔn)的全自動光學(xué)檢測與智能制造數(shù)據(jù)閉環(huán)

    、質(zhì)量檢測、自動化產(chǎn)線開發(fā)的技術(shù)人員及工程師,尤其適用于電子、半導(dǎo)體、新能源等領(lǐng)域的企業(yè)研發(fā)與生產(chǎn)管理人員。 使用場景及目標(biāo): ①應(yīng)對復(fù)雜表面、低對比度、模糊邊緣等傳統(tǒng)視覺難以處理的檢測
    發(fā)表于 03-31 17:11

    算法工程師需要具備哪些技能?

    、鏈?zhǔn)椒▌t等。應(yīng)用場景:梯度下降優(yōu)化算法、反向傳播計算等。 優(yōu)化理論核心內(nèi)容:凸優(yōu)化、非凸優(yōu)化、拉格朗日乘數(shù)法等。應(yīng)用場景:模型參數(shù)調(diào)優(yōu)、資源分配問題等。 編程語言Python:主流選擇,用于數(shù)據(jù)處理、模型
    發(fā)表于 02-27 10:53

    機(jī)器視覺的核心技術(shù)和應(yīng)用場景

    機(jī)器視覺正通過讓機(jī)器“看見”并解讀視覺數(shù)據(jù)來為行業(yè)帶來變革,進(jìn)而提升自動化水平、質(zhì)量控制效率與運(yùn)營效能。本文將深入探討機(jī)器視覺的技術(shù)核心,聚
    的頭像 發(fā)表于 12-29 16:32 ?1071次閱讀

    海光3350便攜機(jī)主板:大數(shù)據(jù)處理利器

    隨著企業(yè)數(shù)字化轉(zhuǎn)型加速,大數(shù)據(jù)處理需求從固定機(jī)房向移動場景延伸。無論是金融機(jī)構(gòu)外出調(diào)研、科研團(tuán)隊野外數(shù)據(jù)采集,還是個人創(chuàng)作者處理海量素材,便攜設(shè)備的性能成為關(guān)鍵。海光便攜機(jī)主板憑借獨(dú)特
    的頭像 發(fā)表于 12-26 11:15 ?731次閱讀

    Switch的應(yīng)用場景

    Switch的應(yīng)用場景如下: 調(diào)用一到多個函數(shù) 設(shè)置變量值或者返回一個值 執(zhí)行一到多個代碼片段 如果case標(biāo)簽很多,在switch的前兩個使用場景中,使用查找表可以更高效的完成。例如下面的兩種
    發(fā)表于 12-12 07:28

    藍(lán)牙網(wǎng)關(guān)是什么?都有哪些功能?應(yīng)用場景有哪些?

    點(diǎn),更構(gòu)建起“設(shè)備互聯(lián)-數(shù)據(jù)流轉(zhuǎn)-智能管控”的完整鏈路,成為物聯(lián)網(wǎng)生態(tài)中不可或缺的核心組件。本文將系統(tǒng)解析藍(lán)牙網(wǎng)關(guān)的核心價值、技術(shù)架構(gòu)、應(yīng)用場景、現(xiàn)存挑戰(zhàn)及未來趨勢,為讀者呈現(xiàn)這一關(guān)鍵技術(shù)
    發(fā)表于 12-11 15:21

    MCU數(shù)據(jù)采集模塊的數(shù)據(jù)處理和分析能力如何?

    MCU數(shù)據(jù)采集模塊的數(shù)據(jù)處理和分析能力如何?在現(xiàn)代化結(jié)構(gòu)物安全監(jiān)測領(lǐng)域,MCU數(shù)據(jù)采集模塊扮演著至關(guān)重要的角色。它不僅僅是數(shù)據(jù)的“搬運(yùn)工”,更是具備初步
    的頭像 發(fā)表于 12-02 16:03 ?585次閱讀
    MCU<b class='flag-5'>數(shù)據(jù)</b>采集模塊的<b class='flag-5'>數(shù)據(jù)處理</b>和分析能力如何?

    如何深度學(xué)習(xí)機(jī)器視覺的應(yīng)用場景

    深度學(xué)習(xí)視覺應(yīng)用場景大全 工業(yè)制造領(lǐng)域 復(fù)雜缺陷檢測:處理傳統(tǒng)算法難以描述的非標(biāo)準(zhǔn)化缺陷模式 非標(biāo)產(chǎn)品分類:對形狀、顏色、紋理多變的產(chǎn)品進(jìn)行智能分類 外觀質(zhì)量評估:基于學(xué)習(xí)的外觀質(zhì)量標(biāo)
    的頭像 發(fā)表于 11-27 10:19 ?359次閱讀

    小紅書API接口的應(yīng)用場景介紹

    ,逐步介紹小紅書API的典型應(yīng)用場景,幫助您理解其實(shí)際用途。這些場景基于社交平臺API的通用設(shè)計,確保真實(shí)可
    的頭像 發(fā)表于 11-04 15:03 ?581次閱讀
    小紅書API接口的應(yīng)<b class='flag-5'>用場景</b><b class='flag-5'>介紹</b>

    京東API接口的應(yīng)用場景介紹

    )。這些接口基于RESTful架構(gòu),使用HTTP協(xié)議進(jìn)行通信,數(shù)據(jù)格式通常為JSON,支持OAuth 2.0認(rèn)證以確保安全性。下面從技術(shù)角度,詳細(xì)介紹幾個關(guān)鍵應(yīng)用場景,包括其實(shí)現(xiàn)機(jī)制和
    的頭像 發(fā)表于 11-03 14:13 ?431次閱讀
    京東API接口的應(yīng)<b class='flag-5'>用場景</b><b class='flag-5'>介紹</b>

    1688 API接口的應(yīng)用場景介紹

    、集成企業(yè)系統(tǒng),并支持JSON或XML格式的數(shù)據(jù)傳輸。認(rèn)證機(jī)制通常采用OAuth 2.0或AppKey/AppSecret方式,確保安全訪問。以下從技術(shù)角度,我將逐步介紹1688 API的核心應(yīng)
    的頭像 發(fā)表于 11-03 13:58 ?880次閱讀
    1688 API接口的應(yīng)<b class='flag-5'>用場景</b><b class='flag-5'>介紹</b>

    淘寶API接口的技術(shù)應(yīng)用場景介紹

    JSON或XML,支持OAuth 2.0認(rèn)證機(jī)制以確保安全性。開發(fā)者通過這些接口可以編程式地訪問淘寶的商品、訂單、用戶等核心數(shù)據(jù)和服務(wù)。以下從技術(shù)角度,分場景介紹其典型應(yīng)用,每個
    的頭像 發(fā)表于 11-03 13:49 ?519次閱讀
    淘寶API接口的<b class='flag-5'>技術(shù)</b>應(yīng)<b class='flag-5'>用場景</b><b class='flag-5'>介紹</b>

    AI 驅(qū)動三維逆向:點(diǎn)云降噪算法工具與機(jī)器學(xué)習(xí)建模能力的前沿應(yīng)用

    在三維逆向工程領(lǐng)域,傳統(tǒng)方法在處理復(fù)雜數(shù)據(jù)和構(gòu)建高精度模型時面臨諸多挑戰(zhàn)。隨著人工智能(AI)技術(shù)的發(fā)展,點(diǎn)云降噪算法工具與機(jī)器學(xué)習(xí)建模能力
    的頭像 發(fā)表于 08-20 10:00 ?890次閱讀
    AI 驅(qū)動三維逆向:點(diǎn)云降噪算法工具與<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>建模能力的前沿應(yīng)用

    milvus向量數(shù)據(jù)庫的主要特性和應(yīng)用場景

    Milvus 是一個開源的向量數(shù)據(jù)庫,專門為處理和分析大規(guī)模向量數(shù)據(jù)而設(shè)計。它適用于需要高效存儲、檢索和管理向量數(shù)據(jù)的應(yīng)用場景,如
    的頭像 發(fā)表于 07-04 11:36 ?1268次閱讀
    milvus向量<b class='flag-5'>數(shù)據(jù)</b>庫的主要特性和應(yīng)<b class='flag-5'>用場景</b>
    天等县| 剑阁县| 达尔| 庆元县| 司法| 夏河县| 壶关县| 特克斯县| 汉川市| 长汀县| 潮安县| 兰溪市| 修文县| 聂拉木县| 南丰县| 石城县| 龙江县| 九寨沟县| 婺源县| 和平县| 洛扎县| 东海县| 晋宁县| 雷山县| 佛坪县| 呼图壁县| 滦南县| 高清| 阳春市| 岑溪市| 马尔康县| 兴宁市| 获嘉县| 三亚市| 滁州市| 虎林市| 治县。| 桃园县| 来安县| 金堂县| 司法|