日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

常見阻礙數(shù)據(jù)建模的原因有哪些

工業(yè)互聯(lián)網(wǎng)前線 ? 來源:數(shù)據(jù)驅(qū)動(dòng)智能 ? 作者:數(shù)據(jù)驅(qū)動(dòng)智能 ? 2022-11-29 11:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著大數(shù)據(jù)和數(shù)據(jù)湖的發(fā)展,數(shù)據(jù)建模似乎瀕臨滅亡。數(shù)據(jù)湖的開發(fā)者留下了大量數(shù)據(jù)沼澤,所以建?;顒?dòng)還是必須的。那么為什么仍然存在關(guān)于數(shù)據(jù)建模的問題呢?當(dāng)然有各種各樣的原因。有些問題至少已有 30 年歷史,而最近人們更加認(rèn)為使用云數(shù)據(jù)平臺(tái)和分析數(shù)據(jù)架構(gòu)的 ELT 方法所致。下面我們看看常見的阻礙數(shù)據(jù)建模的原因:

1缺乏興趣——企業(yè)真的不在乎

盡管 CIO 和 CEO 宣傳“數(shù)據(jù)驅(qū)動(dòng)”,但對于某些企業(yè)而言,數(shù)據(jù)的管理和利用并沒有放在主要日程上,至少在高層是這樣。這可能是可以理解的——并非每個(gè)企業(yè)都是“數(shù)據(jù)企業(yè)”;數(shù)據(jù)可能很重要,但僅在特定的獨(dú)立領(lǐng)域內(nèi)使用。有些組織從事采購和銷售產(chǎn)品、提供法律顧問等行業(yè),這并不是說他們不使用數(shù)據(jù),而是,就目前而言即使使用 Excel 這種處理工具也滿足使用了。

這可能發(fā)生在傳統(tǒng)的組織中,可能發(fā)生在行業(yè)領(lǐng)軍企業(yè),也可能發(fā)生在技術(shù)初創(chuàng)企業(yè)中,在這些組織中,良好的數(shù)據(jù)是運(yùn)營次要考慮因素。

解決方案:除非組織遭受足夠多的數(shù)據(jù)相關(guān)痛苦,或者高級管理層選擇支持戰(zhàn)略性數(shù)據(jù)支持業(yè)務(wù)方法,否則數(shù)據(jù)建模以及治理和其他數(shù)據(jù)內(nèi)容將主要在項(xiàng)目級別完成,以實(shí)現(xiàn)本地目標(biāo)。

2 缺乏“全局”——沒有全面的業(yè)務(wù)數(shù)據(jù)模型

數(shù)據(jù)建模通常被視為支持運(yùn)營和分析產(chǎn)品開發(fā)的詳細(xì)活動(dòng),從數(shù)據(jù)策略中刪除,并且僅作為詳細(xì)業(yè)務(wù)分析的一部分影響業(yè)務(wù)用戶。但是,如果沒有組織數(shù)據(jù)分布的高級地圖,公司如何“數(shù)據(jù)驅(qū)動(dòng)”,或者業(yè)務(wù)領(lǐng)域如何就數(shù)據(jù)所有權(quán)和責(zé)任達(dá)成一致?CDO 應(yīng)該如何合理跨越多個(gè)應(yīng)用程序或孤島的數(shù)據(jù),每個(gè)應(yīng)用程序或孤島都有相互獨(dú)立的目標(biāo),成為“客戶”的真正來源,或者了解特定數(shù)據(jù)流的原因?

90年代的情況是龐大、詳細(xì)的 3NF“企業(yè)數(shù)據(jù)模型”,通常會(huì)運(yùn)行到 100 或 1000 個(gè)實(shí)體。有時(shí),這是為特定行業(yè)“現(xiàn)成”購買的,但隨后需要在企業(yè)內(nèi)部進(jìn)行驗(yàn)證和調(diào)整。毫不奇怪,這些做法通常會(huì)陷入困境,被更緊迫的業(yè)務(wù)優(yōu)先事項(xiàng)所取代。

解決方案:高級“業(yè)務(wù)數(shù)據(jù)建?!被颉案拍顢?shù)據(jù)建模”的藝術(shù)已經(jīng)存在超過 15 年。在經(jīng)驗(yàn)豐富的從業(yè)者手中,對于中型企業(yè)或部門,應(yīng)該可以在 1-3 個(gè)月內(nèi)制作出良好的初稿,包括與企業(yè)所有部門的適當(dāng)互動(dòng)。通常,這可以與針對更多高級管理人員和員工的數(shù)據(jù)素養(yǎng)練習(xí)一起完成。隨著從一個(gè)業(yè)務(wù)域更詳細(xì)的數(shù)據(jù)工作引發(fā)對概念或全新概念的差異化的需求,可以改進(jìn)和擴(kuò)展這樣的模型。

從“頂層”開始數(shù)據(jù)建模本身就非常有用,這是組織數(shù)據(jù)處理方法的基礎(chǔ)。

3數(shù)據(jù)作為應(yīng)用程序完成或事后的想法

盡管許多應(yīng)用程序產(chǎn)生并依賴于數(shù)據(jù),但一直存在一種趨勢,尤其是程序開發(fā)中,忽視數(shù)據(jù)建模,而不是應(yīng)用程序設(shè)計(jì)中首要事情。這尤其體現(xiàn)在兩個(gè)方面:

a) 使用第三方程序加速業(yè)務(wù)能力

許多應(yīng)用程序都有自己的數(shù)據(jù)模型,該模型存在于“要么接受要么放棄”的基礎(chǔ)上——您可以調(diào)整數(shù)據(jù)需求,以適應(yīng)應(yīng)用程序的數(shù)據(jù)模型。另一方面,其他應(yīng)用程序積極鼓勵(lì)業(yè)務(wù)用戶進(jìn)行本地定制,而不考慮數(shù)據(jù)模型是否真的有意義。

更廣泛的集成問題可能會(huì)被擱置一旁,只要應(yīng)用程序可以獲取或交換數(shù)據(jù)以滿足即時(shí)需求,也許是通過 API。一些應(yīng)用程序甚至積極阻止在其自身環(huán)境之外提取數(shù)據(jù)。

解決方案:僅購買能夠提供清晰數(shù)據(jù)模型和/或用于分析目的的精心構(gòu)建的提取/數(shù)據(jù)共享選項(xiàng)的應(yīng)用程序。建議將這部分作為采購必要條件,而不僅僅是“是/否”的回答。

b) 內(nèi)部應(yīng)用程序開發(fā)人員將數(shù)據(jù)建模視為事后的想法

這是企業(yè)內(nèi)部的問題,開發(fā)人員通常在時(shí)間壓力下工作,向內(nèi)部或外部用戶提供數(shù)據(jù)展示,這些用戶對數(shù)據(jù)的存儲(chǔ)方式?jīng)]有直接興趣。

解決方案:數(shù)據(jù)建模師應(yīng)該是任何應(yīng)用程序團(tuán)隊(duì)的核心部分。數(shù)據(jù)模型初稿通常應(yīng)該是開始第一個(gè)真正的敏捷開發(fā)的先決條件。將產(chǎn)生的數(shù)據(jù)供下游使用,無論是出于操作目的還是分析目的,都應(yīng)該是整體框架的一部分。這是數(shù)據(jù)驅(qū)動(dòng)開發(fā)的最佳實(shí)踐,數(shù)據(jù)網(wǎng)格模式強(qiáng)烈建議這種做法。

4 效率問題——建模只會(huì)減慢速度

模型就是這樣——對現(xiàn)實(shí)世界的簡化。在進(jìn)行數(shù)據(jù)建模的情況下,通常會(huì)捕獲一些隱式規(guī)則和關(guān)系,希望能夠適應(yīng)企業(yè)管理其現(xiàn)實(shí)世界交互的方式。

90 年代的關(guān)系建模被認(rèn)為太慢了,識(shí)別實(shí)體、關(guān)系和屬性的視圖通常被業(yè)務(wù)變化和新數(shù)據(jù)源所取代,并且在捕獲和傳輸在線事件時(shí)未能增加價(jià)值。隨著組織從生產(chǎn)純物理產(chǎn)品轉(zhuǎn)向更多數(shù)字產(chǎn)品,定期更改成為常態(tài),建模被視為阻礙或與保持最新所需相沖突。

解決方案:在在線應(yīng)用程序中,半結(jié)構(gòu)化“文檔模型”方法提供了事件封裝和可擴(kuò)展模式的一定程度的靈活性。使用此類結(jié)構(gòu)的最佳實(shí)踐隱含地承認(rèn) 3NF 分析的原則。分析數(shù)據(jù)平臺(tái)轉(zhuǎn)而提供對 JSON 等格式的本地支持,并具有不同程度的承諾。

在分析領(lǐng)域,Data Vault 方法通過歸納關(guān)鍵實(shí)體之間的關(guān)系、識(shí)別來源的多樣性和高變化概率以及構(gòu)建歷史記錄來提供敏捷性。

數(shù)據(jù)網(wǎng)格建議將大部分建模留給本地域——盡管它也提倡雙時(shí)態(tài)建模方法,并談到需要通用標(biāo)準(zhǔn)、一種新的建模方法,甚至一種語言來實(shí)現(xiàn)跨域的“可組合性”。

最終,為用例或應(yīng)用構(gòu)建正確類型的模型是成功的最佳秘訣,無論是文檔、3NF、Data Vault 還是維度。雖然建模首先是一項(xiàng)邏輯活動(dòng),在底層數(shù)據(jù)平臺(tái)中支持一系列具有良好性能的數(shù)據(jù)建模方法可以顯著簡化邏輯到物理的映射。

5 直接獲取數(shù)據(jù)——數(shù)據(jù)沼澤遺留問題

雖然大數(shù)據(jù)運(yùn)動(dòng)是由互聯(lián)網(wǎng)生成的龐大數(shù)據(jù)驅(qū)動(dòng)的,但它也是對復(fù)雜性和數(shù)據(jù)變化率問題的回應(yīng)。隨著一些組織開始通過利用一切數(shù)據(jù)產(chǎn)生巨大收益,人們越來越不愿意丟棄任何數(shù)據(jù)。而且數(shù)據(jù)湖從業(yè)者認(rèn)為,建模已經(jīng)過時(shí)了?,F(xiàn)在,當(dāng)連接大型數(shù)據(jù)集或多表模型的數(shù)據(jù)很痛苦時(shí),創(chuàng)建大量非規(guī)范化數(shù)據(jù)集的動(dòng)力就非常強(qiáng)烈,通常會(huì)導(dǎo)致大量重復(fù)。對數(shù)據(jù)安全的忽視也進(jìn)一步助長了這一趨勢。

受此經(jīng)驗(yàn)的影響,基于云的“現(xiàn)代數(shù)據(jù)堆棧”中出現(xiàn)的兩個(gè)互補(bǔ)趨勢出現(xiàn)了一些阻力:“廉價(jià)”存儲(chǔ)和“轉(zhuǎn)換(ELT) 模式”。

許多云數(shù)據(jù)平臺(tái)參與者至少在某種程度上將存儲(chǔ)與計(jì)算分開。云對象存儲(chǔ)具有彈性且相對成本低。大量數(shù)據(jù)出于未知原因被保留,原始數(shù)據(jù)或建模不佳的數(shù)據(jù)被直接使用并且從未正確集成。雖然存儲(chǔ)很便宜,但不斷增長的數(shù)據(jù)量推高了按消費(fèi)定價(jià)的計(jì)算,使平臺(tái)提供商有鼓勵(lì)客戶不要在乎數(shù)據(jù)建模。

這筆費(fèi)用不能完全回避——即使是廉價(jià)存儲(chǔ)的數(shù)據(jù)有時(shí)也應(yīng)該被刪除,無論是為了減少混亂、降低濫用風(fēng)險(xiǎn)還是讓地球更輕盈。

許多組織已經(jīng)轉(zhuǎn)向分層數(shù)據(jù)建模方法,其中第一層采用“原始”數(shù)據(jù),無論是直接匹配 OLTP 系統(tǒng)上的表格,還是未經(jīng)提煉的 JSON Web 和 IoT 日志。這種 ELT 模式并不新鮮,例如在 Teradata 等平臺(tái)上的數(shù)據(jù)倉庫模式和實(shí)施中很常見,已有十年或更長時(shí)間。理想的目標(biāo)是原始層饋送到更多層,通常是反映某些規(guī)范模型(例如 3NF 或 Data Vault)的一致性層和針對最終用戶的表示或交付層(通常按維度建模)。

將數(shù)據(jù)保存更長時(shí)間是有正當(dāng)理由的——監(jiān)管(證明你五年前所做的是合法的)、網(wǎng)絡(luò)安全(攻擊模式可以發(fā)展數(shù)月)、數(shù)據(jù)科學(xué)和長期分析(將原始數(shù)據(jù)轉(zhuǎn)化為新功能)、或者僅僅是利用直接的內(nèi)置歷史從舊數(shù)據(jù)重構(gòu)下游新產(chǎn)品的能力。與此相反的是隱私法規(guī)和違規(guī)風(fēng)險(xiǎn),以及將半衰期短的數(shù)據(jù)保存太久的環(huán)境成本。最終,這又回到了數(shù)據(jù)所有權(quán)和“為什么”的問題上。

解決方案:僅僅因?yàn)榭梢院鲆暎⒉灰馕吨鴳?yīng)該這樣。具有可靠治理、良好的數(shù)據(jù)高級模型和可靠數(shù)據(jù)架構(gòu)的組織可以受益于更便宜的存儲(chǔ)和易于使用的平臺(tái)支持的數(shù)據(jù)底座和轉(zhuǎn)換模式。不急于對數(shù)據(jù)進(jìn)行詳細(xì)的過度建模并在其價(jià)值確定之前花費(fèi)大量的計(jì)算周期和工程師時(shí)間進(jìn)行轉(zhuǎn)換可能是有價(jià)值的。

同樣,讓我們現(xiàn)實(shí)地看待數(shù)據(jù)的“半衰期”,尤其是原始數(shù)據(jù)——很少有法規(guī)要求保留超過 7 年的歷史,而 ML 模型則更少,除非著眼于長期的事件。您的數(shù)據(jù)平臺(tái)在捕獲依賴關(guān)系和訪問歷史記錄方面有多好?這有助于識(shí)別那些從未或很少使用的數(shù)據(jù)集,并避免因擔(dān)心下游后果而保留數(shù)據(jù)。

總之…

就像數(shù)據(jù)中的許多好東西一樣,良好的建模源于組織承諾、適當(dāng)應(yīng)用良好實(shí)踐和模式的技能、精心設(shè)計(jì)的流程以及設(shè)計(jì)師的優(yōu)秀技能。在大多數(shù)數(shù)據(jù)平臺(tái)上,不進(jìn)行建模是災(zāi)難性的。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7349

    瀏覽量

    95054
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    9099

    瀏覽量

    144082

原文標(biāo)題:談?wù)勛璧K數(shù)據(jù)建模的5大借口

文章出處:【微信號(hào):IndustryIOT,微信公眾號(hào):工業(yè)互聯(lián)網(wǎng)前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    MOS 管燒壞、炸管的主要原因哪些?怎么快速排查和解決?

    MOS管燒壞/炸管的主要原因哪些?怎么快速排查和解決?相信不少工程師都經(jīng)歷過這樣的“高光時(shí)刻”:上電瞬間,一聲脆響,一縷青煙,MOS管直接報(bào)廢。更讓人頭疼的是,有時(shí)候換上新管子,一上電又“故技重施
    的頭像 發(fā)表于 03-23 13:59 ?641次閱讀
    MOS 管燒壞、炸管的主要<b class='flag-5'>原因</b><b class='flag-5'>有</b>哪些?怎么快速排查和解決?

    單片機(jī)程序跑飛死機(jī)的幾種原因分享

    時(shí)間主動(dòng)報(bào)錯(cuò)退出。 4、堆棧溢出 常見于容量小的單片機(jī),重復(fù)中斷、函數(shù)調(diào)用導(dǎo)致超出堆棧空間,正常數(shù)據(jù)被改寫。該問題最難查,一定特殊性,很難穩(wěn)定復(fù)現(xiàn) 5、中斷異常 打開了某個(gè)中斷但是沒有編寫中斷
    發(fā)表于 01-21 07:34

    常見的石英晶振失效原因哪些?

    不適配選型環(huán)節(jié)的參數(shù)匹配度直接決定晶振能否穩(wěn)定工作,常見失效原因集中在核心電氣參數(shù)與設(shè)計(jì)需求不契合。?電路不匹配:電路中的匹配電容、反饋電阻、串聯(lián)電容與晶振規(guī)格不匹
    的頭像 發(fā)表于 01-12 17:18 ?394次閱讀
    <b class='flag-5'>常見</b>的石英晶振失效<b class='flag-5'>原因</b><b class='flag-5'>有</b>哪些?

    UART發(fā)送數(shù)據(jù)后,接收端未收到數(shù)據(jù),原因哪些?

    UART 發(fā)送數(shù)據(jù)后,接收端未收到數(shù)據(jù),可能的原因哪些?
    發(fā)表于 11-24 06:03

    Jtti分析SSL證書安裝不成功是怎么回事?哪些原因?

    。本文Jtti.cc將探討一些常見的SSL證書安裝失敗的原因,并提供相應(yīng)的解決方案。 1.證書文件或密鑰文件格式錯(cuò)誤 SSL證書的安裝需要正確格式的證書文件和密鑰文件。常見的證書格式
    的頭像 發(fā)表于 10-27 16:15 ?786次閱讀

    FPGA測試DDR帶寬跑不滿的常見原因及分析方法

    在 FPGA 中測試 DDR 帶寬時(shí),帶寬無法跑滿是常見問題。下面我將從架構(gòu)、時(shí)序、訪問模式、工具限制等多個(gè)維度,系統(tǒng)梳理導(dǎo)致 DDR 帶寬跑不滿的常見原因及分析方法。
    的頭像 發(fā)表于 10-15 10:17 ?1295次閱讀

    PLC通訊失敗的常見原因

    PLC通訊中斷是自動(dòng)化現(xiàn)場的常見問題。遵循“先硬后軟、先簡后繁”的原則,能快速定位并解決大部分故障。
    的頭像 發(fā)表于 10-14 15:16 ?3155次閱讀

    電壓暫降的原因哪些?

    電壓暫降的原因可歸納為 電網(wǎng)側(cè)故障、負(fù)荷側(cè)擾動(dòng)、外部環(huán)境影響 三大類,其中電網(wǎng)側(cè)短路故障和負(fù)荷側(cè)沖擊性負(fù)荷啟動(dòng)是最主要誘因,兩者合計(jì)占所有暫降事件的 80% 以上。不同原因的發(fā)生場景、影響機(jī)制及頻率
    的頭像 發(fā)表于 10-11 17:23 ?4542次閱讀
    電壓暫降的<b class='flag-5'>原因</b><b class='flag-5'>有</b>哪些?

    常見的電能質(zhì)量在線監(jiān)測裝置硬件故障哪些?

    硬件故障的分類說明,包含 故障現(xiàn)象、可能原因、初步判斷方法 : 一、前端傳感器故障(信號(hào)采集源頭,影響最直接) 傳感器是裝置獲取電壓、電流原始信號(hào)的核心部件,故障會(huì)導(dǎo)致 “無數(shù)據(jù)” 或 “數(shù)據(jù)嚴(yán)重失真”,是現(xiàn)場最
    的頭像 發(fā)表于 09-24 18:25 ?1377次閱讀
    <b class='flag-5'>常見</b>的電能質(zhì)量在線監(jiān)測裝置硬件故障<b class='flag-5'>有</b>哪些?

    哪些常見的傳感器數(shù)據(jù)失真原因?

    ? 傳感器數(shù)據(jù)失真的本質(zhì)是 “ 傳感器輸出信號(hào)與被測量的真實(shí)值偏離超出允許范圍 ”,其原因可按 “ 傳感器自身硬件、安裝與接線、外部環(huán)境、使用維護(hù)、信號(hào)處理 ” 五大維度分類,覆蓋從元件到系統(tǒng)的全鏈
    的頭像 發(fā)表于 09-24 11:53 ?3040次閱讀

    汽車連接器端子被燒壞哪些原因

    汽車電氣系統(tǒng)中,連接器端子燒壞是一種常見的故障形式,這一現(xiàn)象可能引發(fā)安全事故,甚至火災(zāi)。本期蓬生電子帶大家深入探討端子燒壞的原因,從接觸不良、過電流、環(huán)境劣化和材料與工藝缺陷四個(gè)方面進(jìn)行分析。
    的頭像 發(fā)表于 06-27 17:01 ?2084次閱讀

    數(shù)據(jù)集下載失敗的原因?

    數(shù)據(jù)集下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報(bào)錯(cuò)網(wǎng)絡(luò)錯(cuò)誤 大的數(shù)據(jù)集多大?數(shù)據(jù)多少?
    發(fā)表于 06-18 07:04

    工業(yè)物聯(lián)網(wǎng)常見的協(xié)議哪些

    工業(yè)物聯(lián)網(wǎng)常見的協(xié)議哪些
    的頭像 發(fā)表于 06-14 15:52 ?1475次閱讀

    VirtualLab Fusion應(yīng)用:Herriott池的建模

    。Herriott單元是這種系統(tǒng)的一個(gè)例子,其特點(diǎn)是使用兩個(gè)球面反射鏡,在其中一個(gè)球面反射鏡上鉆一個(gè)離軸孔,以允許光束進(jìn)出。鏡子的曲率改變了光束的方向并控制了它的發(fā)散。在此用例中,我們用光學(xué)建模和設(shè)計(jì)軟件
    發(fā)表于 06-11 08:52

    什么是SD卡、TF卡寫保護(hù)?寫保護(hù)的常見原因

    部分SD卡、TF卡適配器或卡套上設(shè)有物理寫保護(hù)開關(guān),當(dāng)開關(guān)滑動(dòng)到"鎖定"位置時(shí),卡片會(huì)自動(dòng)進(jìn)入寫保護(hù)狀態(tài)。這是最常見也是最容易解決的寫保護(hù)原因。
    的頭像 發(fā)表于 06-10 00:00 ?6962次閱讀
    什么是SD卡、TF卡寫保護(hù)?寫保護(hù)的<b class='flag-5'>常見</b><b class='flag-5'>原因</b>
    正阳县| 肃北| 新源县| 海城市| 建平县| 唐山市| 包头市| 浪卡子县| 天长市| 古丈县| 泾阳县| 迁西县| 丰原市| 浦东新区| 灵台县| 诸城市| 横峰县| 乌兰察布市| 贵定县| 溧阳市| 卢龙县| 红河县| 德兴市| 岑巩县| 深泽县| 唐海县| 常熟市| 罗山县| 鹰潭市| 连州市| 霍林郭勒市| 体育| 昌乐县| 阜宁县| 青海省| 涞水县| 龙游县| 图们市| 文成县| 新巴尔虎左旗| 石嘴山市|