日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是數(shù)據(jù)倉庫、數(shù)據(jù)集市、數(shù)據(jù)湖?

工業(yè)互聯(lián)網(wǎng)前線 ? 來源:一個數(shù)據(jù)玩家的自我修養(yǎng) ? 作者:一個數(shù)據(jù)玩家的自 ? 2020-09-21 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:一個數(shù)據(jù)玩家的自我修養(yǎng) 本文已授權(quán)

經(jīng)??吹接腥藛栠@個問題,數(shù)據(jù)玩家也看過很多解釋,感覺都不夠直觀,這里,我嘗試用一個大家都理解的例子來說明。

什么是數(shù)據(jù)倉庫?

大家都去宜家買過東西吧,還記得一樓的大倉庫不,你如果看中了某個家具,想要自己去倉庫提貨,一般都會記下商品上的編碼:

這個編碼對于顧客來說,肯定是沒有任何含義的,看到這個編碼,不可能知道他是一個什么商品。

但是這個編碼,對于倉庫管理員來說是有含義的,他們可以清楚的知道,是哪一個貨架,哪一個位置。

當(dāng)然,顧客到倉庫里順著貨架和位置也可以找到商品,但是總歸不太直觀,挑選的過程還是得在樓上進(jìn)行。

因此數(shù)據(jù)倉庫就相當(dāng)于宜家的一樓倉庫,在這里,數(shù)據(jù)(家具)按照特定的模型,如FS-LDM等(貨架-位置)組織起來,這種模型,對于顧客(業(yè)務(wù)人員,數(shù)據(jù)最終用戶)是不友好的,但是對于科技人員(倉庫管理員,宜家員工)來說相對友好,因?yàn)樗凑找环N更加集約化的規(guī)則將數(shù)據(jù)(家具)管理起來了,存放集中、規(guī)整,提取數(shù)據(jù)(提貨)不用跨庫(貨倉)尋找,查找的效率更加高。

那什么是數(shù)據(jù)集市呢?

還是用這個例子,上文提到,數(shù)據(jù)倉庫對業(yè)務(wù)人員不是很友好,同樣,你總不能讓顧客直接逛倉庫吧?顧客的需求,是按照家具的種類分門別類,按照家庭的不同房間,組合在一起展示的,正如宜家樓上的展廳:

雖然也被吐槽像迷宮一樣,但是總的來說,購物體驗(yàn)肯定比逛倉庫來得好多了。

所以,數(shù)據(jù)集市就像宜家樓上的展廳,正如其名字“集市”一樣,是一個面向最終用戶(顧客)的數(shù)據(jù)市場,在這里,數(shù)據(jù)(家具)以一種更加容易被業(yè)務(wù)人員(顧客)接受的方式組合在一起,這些組合方式可能是多變的,因?yàn)闃I(yè)務(wù)人員(顧客)的需求是多變的,因此我們需要定期調(diào)整集市的計算口徑(展廳的陳列方式),經(jīng)常會創(chuàng)建新的數(shù)據(jù)集市(裝修新的展廳)。

數(shù)據(jù)倉庫和集市的概念理解了,其他一些相關(guān)問題也就迎刃而解,比如為什么有了數(shù)據(jù)倉庫還要建數(shù)據(jù)集市?等等。

那什么是數(shù)據(jù)湖呢?

數(shù)據(jù)湖至今仍然沒有一個特別標(biāo)準(zhǔn)的概念,各種概念中,比較統(tǒng)一的一點(diǎn)是數(shù)據(jù)湖存儲的是未經(jīng)加工的原始數(shù)據(jù),包含結(jié)構(gòu)化和非結(jié)構(gòu)化的各類數(shù)據(jù)。數(shù)據(jù)玩家仍然嘗試用上面的例子來解釋。

大家都知道,宜家的家具是需要自己組裝的,所以宜家的顧客們都有一些動手能力,他們突發(fā)奇想,所有的家具能不能全部拆散成零部件存放,由顧客們根據(jù)實(shí)際需要挑選零部件自行拼裝?

所以,數(shù)據(jù)湖就是一個存儲了所有企業(yè)內(nèi)原始數(shù)據(jù)(家具零部件)的存儲,這就帶來一系列問題,加工后數(shù)據(jù)的存儲已經(jīng)非常復(fù)雜,原始數(shù)據(jù)則依賴更多的管理功能,不然數(shù)據(jù)又多又雜難以管理,數(shù)據(jù)湖會退化為數(shù)據(jù)沼澤。此外,原始數(shù)據(jù)如果缺少統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),就像不同的家具零部件之間的接口不同,那就無法組裝在一起了。

因此,數(shù)據(jù)湖必須有完善的數(shù)據(jù)管理功能,也依賴于統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)和良好的數(shù)據(jù)質(zhì)量管理。

那什么又是數(shù)據(jù)中臺呢?

數(shù)據(jù)中臺也沒有一個特別明確的定義,這里很難套用宜家的例子強(qiáng)行解釋了,我們來看下各類數(shù)據(jù)平臺:

在我們傳統(tǒng)的數(shù)據(jù)應(yīng)用中,隨著數(shù)據(jù)對于業(yè)務(wù)友好度的增加,其時效性也在減弱。而我們的目標(biāo),顯然是數(shù)據(jù)又快又好。既然各部門的需求都不一樣,為何不讓業(yè)務(wù)自助分析數(shù)據(jù)呢?于是我們有了右上角的目標(biāo)狀態(tài)。但是這個理想狀態(tài)和我們現(xiàn)在的數(shù)據(jù)應(yīng)用中間有巨大的空隙,靠什么來填補(bǔ)?答案就是數(shù)據(jù)中臺。

我們可以將其分為狹義的數(shù)據(jù)中臺和廣義的數(shù)據(jù)中臺。狹義的數(shù)據(jù)中臺,指的是一套數(shù)據(jù)應(yīng)用和工具,包括分布式ETL、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)標(biāo)簽管理、數(shù)據(jù)沙箱、自助分析平臺、元數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理等等,底層則以現(xiàn)有的數(shù)倉、大數(shù)據(jù)平臺等為數(shù)據(jù)源,為企業(yè)提供數(shù)據(jù)資產(chǎn)管理的能力,并持續(xù)挖掘數(shù)據(jù)價值,持續(xù)提供數(shù)據(jù)智能服務(wù)。

廣義的數(shù)據(jù)中臺,則在狹義的數(shù)據(jù)中臺基礎(chǔ)之上,包含了頂層數(shù)據(jù)戰(zhàn)略,數(shù)據(jù)治理體系以及數(shù)據(jù)管理及運(yùn)營、數(shù)據(jù)文化培養(yǎng)和組織架構(gòu)支撐,是一套持續(xù)管理和運(yùn)營的體系。

可以這么說,狹義的數(shù)據(jù)中臺,是專為達(dá)成數(shù)據(jù)中臺的使命而打造,一類是讓數(shù)據(jù)更快的處理、整合、加工,比如分布式ETL工具。隨著傳統(tǒng)數(shù)據(jù)被大數(shù)據(jù)平臺逐步替代,ETL工具對于大數(shù)據(jù)平臺的適配也需要與時俱進(jìn),支持分布式計算、彈性計算,并且減少開發(fā)量。

另一類是讓數(shù)據(jù)更好的產(chǎn)生業(yè)務(wù)價值,比如數(shù)據(jù)標(biāo)簽管理,自助分析平臺等。數(shù)據(jù)標(biāo)簽大家都在用,但是真正深度使用的企業(yè)都會感覺:建好容易用好難,如果沒有一套標(biāo)簽管理系統(tǒng),標(biāo)簽是否重復(fù)加工,標(biāo)簽的使用率、準(zhǔn)確性等都無從掌控,業(yè)務(wù)部門想要針對近期營銷活動新建一個標(biāo)簽,還得走開發(fā)流程,時效性也難以保證。數(shù)據(jù)標(biāo)簽管理系統(tǒng)就是為了解決數(shù)據(jù)標(biāo)簽的使用問題而建立。自助分析平臺則是方便業(yè)務(wù)人員自助進(jìn)行數(shù)據(jù)分析、加工、探索的平臺,它與數(shù)據(jù)沙箱結(jié)合,直接將去隱私化的生產(chǎn)數(shù)據(jù)提供業(yè)務(wù)人員分析,使數(shù)據(jù)更快的產(chǎn)生價值,支撐關(guān)鍵決策。

廣義的數(shù)據(jù)中臺,則是輔助狹義數(shù)據(jù)中臺達(dá)成使命的機(jī)制,雖然看起來都很“虛”,但是卻是數(shù)據(jù)中臺成功落地的必要保障。

那所有這些都必須做嗎?

這個問題要看具體的企業(yè)情況,總的來說,一個大原則是以滿足業(yè)務(wù)發(fā)展為第一優(yōu)先,不要為了做基礎(chǔ)設(shè)施而做基礎(chǔ)設(shè)施,一定要以能解決業(yè)務(wù)訴求為最終目的。

《人月神話》里早就宣告了銀彈不存在,自然,數(shù)據(jù)倉庫、數(shù)據(jù)集市、數(shù)據(jù)湖、數(shù)據(jù)中臺都不是銀彈,千萬不能以為做了他們就水到渠成,數(shù)字化轉(zhuǎn)型就自動完成了。

簡言之,用了一系列時髦的新技術(shù)不見得就是數(shù)字化領(lǐng)軍企業(yè),不用也不見得就是古典互聯(lián)網(wǎng)時代的落后作坊。關(guān)鍵是認(rèn)清自身的數(shù)字化現(xiàn)狀,擬定數(shù)字化目標(biāo),制定數(shù)字化路徑,優(yōu)選場景,實(shí)現(xiàn)價值。新技術(shù)、各類數(shù)據(jù)基礎(chǔ)設(shè)施只是這條道路上,一套套切實(shí)可行的行動方案,是把過去銀行的種種數(shù)字化的嘗試,重新以體系化、結(jié)構(gòu)化的方法論梳理,并且賦予當(dāng)下最新的技術(shù)架構(gòu)予以實(shí)施。

原文標(biāo)題:數(shù)據(jù)倉庫、數(shù)據(jù)集市、數(shù)據(jù)湖、數(shù)據(jù)中臺到底有什么區(qū)別?

文章出處:【微信公眾號:工業(yè)IoT】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7349

    瀏覽量

    95055
  • 數(shù)據(jù)倉庫
    +關(guān)注

    關(guān)注

    0

    文章

    65

    瀏覽量

    11021

原文標(biāo)題:數(shù)據(jù)倉庫、數(shù)據(jù)集市、數(shù)據(jù)湖、數(shù)據(jù)中臺到底有什么區(qū)別?

文章出處:【微信號:IndustryIOT,微信公眾號:工業(yè)互聯(lián)網(wǎng)前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于 LES33-HUB-3-RS485 的冷鏈倉庫多傳感器智能組網(wǎng)解決方案

    ,構(gòu)建了一套 “接入 - 中繼 - 隔離 - 傳輸” 全閉環(huán)的冷鏈倉庫多傳感器智能組網(wǎng)系統(tǒng)。文章詳細(xì)闡述了系統(tǒng)整體架構(gòu)、核心產(chǎn)品技術(shù)特性、應(yīng)用價值與效益,為冷鏈倉庫多區(qū)域、遠(yuǎn)距離的溫濕度傳感組網(wǎng)及數(shù)據(jù)
    發(fā)表于 03-17 16:01

    生態(tài)水量動態(tài)監(jiān)測與管理系統(tǒng)

    生態(tài)水量是維持水生態(tài)系統(tǒng)健康的關(guān)鍵要素,關(guān)系到生物多樣性、水質(zhì)凈化與景觀維護(hù)。傳統(tǒng)河湖水量管理多依賴人工觀測與經(jīng)驗(yàn)調(diào)度,難以實(shí)現(xiàn)動態(tài)精準(zhǔn)調(diào)控,容易造成生態(tài)用水不足或浪費(fèi)。同時,在進(jìn)行數(shù)據(jù)匯總
    的頭像 發(fā)表于 02-05 13:36 ?302次閱讀
    河<b class='flag-5'>湖</b>生態(tài)水量動態(tài)監(jiān)測與管理系統(tǒng)

    1688庫存API:多倉庫同步,庫存周轉(zhuǎn)快!

    庫存流程。 第一步:理解多倉庫同步的挑戰(zhàn) 在實(shí)際業(yè)務(wù)中,企業(yè)往往擁有多個倉庫(如華東倉、華南倉),庫存數(shù)據(jù)分散。不同步會導(dǎo)致超賣、缺貨等問題。傳統(tǒng)方式依賴手動更新,效率低下且易出錯。多倉庫
    的頭像 發(fā)表于 01-08 14:47 ?398次閱讀
    1688庫存API:多<b class='flag-5'>倉庫</b>同步,庫存周轉(zhuǎn)快!

    BI決策分析系統(tǒng)的關(guān)鍵組成部分:業(yè)務(wù)數(shù)據(jù)整合有何意義

    ?在數(shù)聚股份看來,業(yè)務(wù)數(shù)據(jù)整合是bi決策分析系統(tǒng)的關(guān)鍵組成部分,可將來自多個源系統(tǒng)的數(shù)據(jù)進(jìn)行整合,并將它們合并到數(shù)據(jù)倉庫以作分析。不過,對于bi決策分析系統(tǒng)的業(yè)務(wù)數(shù)據(jù)整合策略,
    的頭像 發(fā)表于 12-18 13:16 ?341次閱讀

    人工智能+正當(dāng)時,中山腫瘤AI數(shù)據(jù)守護(hù)生命之火

    喚醒沉睡的數(shù)據(jù)冰山,中山腫瘤AI數(shù)據(jù)湖里的科技暖意
    的頭像 發(fā)表于 12-16 00:04 ?5804次閱讀
    人工智能+正當(dāng)時,中山腫瘤AI<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>湖</b>守護(hù)生命之火

    zfs數(shù)據(jù)恢復(fù)—ZFS存儲遷移數(shù)據(jù)讀不出數(shù)據(jù)怎么恢復(fù)數(shù)據(jù)?

    管理員對一臺存儲設(shè)備內(nèi)的文件進(jìn)行遷移操作時,數(shù)據(jù)突然無法讀取,管理界面出現(xiàn)報錯。管理員查看數(shù)據(jù)時發(fā)現(xiàn)其中一個lun的數(shù)據(jù)丟失。
    的頭像 發(fā)表于 12-09 14:10 ?364次閱讀
    zfs<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—ZFS存儲遷移<b class='flag-5'>數(shù)據(jù)</b>讀不出<b class='flag-5'>數(shù)據(jù)</b>怎么恢復(fù)<b class='flag-5'>數(shù)據(jù)</b>?

    Next Pathway成為Snowflake最高級別合作伙伴

    的持續(xù)投入。 Next Pathway始終展現(xiàn)出卓越的專業(yè)能力,以無可匹敵的效率幫助全球客戶將復(fù)雜的數(shù)據(jù)倉庫數(shù)據(jù)遷移至Snowflake AI數(shù)據(jù)云平臺?!熬⒓墶钡匚惶貏e認(rèn)可
    的頭像 發(fā)表于 12-04 18:08 ?1178次閱讀
    Next Pathway成為Snowflake最高級別合作伙伴

    UART接口數(shù)據(jù)線接收和發(fā)送數(shù)據(jù)

    具體方法和步驟 UART模塊依照UART協(xié)議標(biāo)準(zhǔn)的異步方式發(fā)送和接收數(shù)據(jù),每個UART模塊有TX和RX兩根數(shù)據(jù)線,TX為輸出,RX為輸入。使用TX數(shù)據(jù)線串行發(fā)送數(shù)據(jù),使用RX
    發(fā)表于 10-29 07:37

    部署Denodo與數(shù)據(jù)倉架構(gòu)聯(lián)用,用戶可獲得345%投資回報率(ROI),實(shí)現(xiàn)3–4倍數(shù)據(jù)洞察提速

    AI Hackathon 2025,助力企業(yè)通過可信數(shù)據(jù)和先進(jìn) AI 技術(shù)加速創(chuàng)新。此次新聞稿覆蓋兩大重點(diǎn):數(shù)據(jù)倉價值釋放的最新研究,以及全球開發(fā)者參與的 AI 創(chuàng)新賽事。 研究發(fā)現(xiàn):邏輯
    的頭像 發(fā)表于 10-23 17:27 ?875次閱讀

    倉庫物品計數(shù)遠(yuǎn)程監(jiān)控系統(tǒng)方案

    庫存已滿時現(xiàn)場紅燈常亮,但仍需員工現(xiàn)場值守。 對此,物通博聯(lián)提供倉庫物品數(shù)據(jù)采集到ERP系統(tǒng)的解決方案,以實(shí)現(xiàn)倉儲的遠(yuǎn)程管理與智慧升級。物通博聯(lián)工業(yè)智能網(wǎng)關(guān)通過接入計數(shù)傳感器,能夠?qū)崟r采集物品數(shù)據(jù)對接到ERP系統(tǒng)中
    的頭像 發(fā)表于 09-16 14:11 ?780次閱讀
    <b class='flag-5'>倉庫</b>物品計數(shù)遠(yuǎn)程監(jiān)控系統(tǒng)方案

    微軟推出全新Microsoft Sentinel數(shù)據(jù)國際版

    近期,MicrosoftSentinel數(shù)據(jù)(國際版)正式開放公開預(yù)覽,重塑安全運(yùn)營架構(gòu)。它通過統(tǒng)一所有安全數(shù)據(jù),以遠(yuǎn)低于傳統(tǒng)方案的成本,解決了海量數(shù)據(jù)管理和可見性不足的痛點(diǎn)。這一新
    的頭像 發(fā)表于 08-04 15:36 ?1136次閱讀

    數(shù)據(jù)數(shù)據(jù)恢復(fù)—MongoDB數(shù)據(jù)庫文件丟失的數(shù)據(jù)恢復(fù)案例

    MongoDB數(shù)據(jù)數(shù)據(jù)恢復(fù)環(huán)境: 一臺操作系統(tǒng)為Windows Server的虛擬機(jī)上部署MongoDB數(shù)據(jù)庫。 MongoDB數(shù)據(jù)庫故障: 工作人員在MongoDB服務(wù)仍
    的頭像 發(fā)表于 07-01 11:13 ?814次閱讀
    <b class='flag-5'>數(shù)據(jù)</b>庫<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—MongoDB<b class='flag-5'>數(shù)據(jù)</b>庫文件丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫被加密如何恢復(fù)數(shù)據(jù)?

    SQL Server數(shù)據(jù)庫故障: SQL Server數(shù)據(jù)庫被加密,無法使用。 數(shù)據(jù)庫MDF、LDF、log日志文件名字被篡改。
    的頭像 發(fā)表于 06-25 13:54 ?871次閱讀
    <b class='flag-5'>數(shù)據(jù)</b>庫<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)</b>庫被加密如何恢復(fù)<b class='flag-5'>數(shù)據(jù)</b>?

    通過標(biāo)準(zhǔn)化數(shù)據(jù)通路來實(shí)現(xiàn)數(shù)據(jù)共享

    場景介紹 在多對多跨應(yīng)用數(shù)據(jù)共享的場景下,需要提供一條數(shù)據(jù)通路能夠接入多個不同應(yīng)用的數(shù)據(jù)并共享給其他應(yīng)用進(jìn)行讀取。 UDMF針對多對多跨應(yīng)用數(shù)據(jù)共享的不同業(yè)務(wù)場景提供了標(biāo)準(zhǔn)化的
    發(fā)表于 06-17 06:57

    藍(lán)牙數(shù)據(jù)通道空口包(數(shù)據(jù)包)

    ? 與藍(lán)牙廣播包相對應(yīng),藍(lán)牙數(shù)據(jù)包是另一種Bluetooth LE packet。藍(lán)牙數(shù)據(jù)包是藍(lán)牙數(shù)據(jù)信道空中包的簡稱,表示空中包只在藍(lán)牙數(shù)據(jù)信道上傳輸,即除37/38/39之外的其他
    發(fā)表于 06-03 10:51
    山西省| 永善县| 凤冈县| 银川市| 武安市| 石台县| 甘南县| 吉水县| 洞头县| 梁山县| 冷水江市| 彰化市| 双江| 伊宁县| 会泽县| 江孜县| 余干县| 岫岩| 盐津县| 红安县| 荥阳市| 鹤庆县| 绥滨县| 新安县| 长寿区| 涟源市| 昌平区| 高雄县| 阿拉善右旗| 太湖县| 玛多县| 工布江达县| 新郑市| 镇康县| 琼结县| 顺昌县| 灵山县| 丹江口市| 天等县| 沾益县| 莆田市|