日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)如何幫助解決大數(shù)據(jù)轉(zhuǎn)換及管理問(wèn)題?

電子設(shè)計(jì) ? 來(lái)源:電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2020-12-24 23:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

盡管大數(shù)據(jù)分析技術(shù)取得了驚人的進(jìn)步,但我們?cè)诤艽蟪潭壬先孕枰謩?dòng)來(lái)完成重要任務(wù),例如數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)管理。隨著數(shù)據(jù)量的增長(zhǎng),手動(dòng)完成任務(wù)與自動(dòng)化產(chǎn)生的生產(chǎn)力差距越來(lái)越大,這使得以人工智能機(jī)器學(xué)習(xí)為基礎(chǔ)的自動(dòng)化趨勢(shì)越來(lái)越有市場(chǎng)。機(jī)器學(xué)習(xí)可以幫助縮小這一差距嗎?

坦率地說(shuō),數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)管理問(wèn)題頗具挑戰(zhàn)性。各行各業(yè)的公司都渴望將機(jī)器學(xué)習(xí)與他們的數(shù)據(jù)庫(kù)結(jié)合使用,以獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。但是,數(shù)據(jù)不干凈、數(shù)據(jù)未集成、不可比較和不匹配的數(shù)據(jù)問(wèn)題層出不窮,使公司的大數(shù)據(jù)計(jì)劃陷入困境。

許多從事機(jī)器學(xué)習(xí)的數(shù)據(jù)科學(xué)家花費(fèi)了90%的時(shí)間來(lái)查找、集成、修復(fù)和清理其輸入數(shù)據(jù)。 人們似乎沒(méi)有意識(shí)到數(shù)據(jù)科學(xué)家不再是數(shù)據(jù)科學(xué)家,而是成為了數(shù)據(jù)集成商。

不過(guò)也有一個(gè)好消息,機(jī)器學(xué)習(xí)本身可以幫助機(jī)器學(xué)習(xí)。這個(gè)想法是利用算法的預(yù)測(cè)能力來(lái)模擬人類(lèi)數(shù)據(jù)處理。這不是100%完美的解決方案,但它可以幫助緩解工作強(qiáng)度,讓數(shù)據(jù)科學(xué)家轉(zhuǎn)向真正的創(chuàng)新工作。

您可以在任何你能買(mǎi)到的地方購(gòu)買(mǎi)ML,通過(guò)使用ML來(lái)來(lái)幫助您完成ETL的轉(zhuǎn)換部分。

轉(zhuǎn)換和管理數(shù)據(jù)

雖然它們?cè)谀承┓矫媸窍嗨频?,但是?shù)據(jù)管理和數(shù)據(jù)轉(zhuǎn)換之間有重要的區(qū)別。數(shù)據(jù)轉(zhuǎn)換是數(shù)據(jù)集成過(guò)程中的第一步,其目標(biāo)是將異類(lèi)數(shù)據(jù)轉(zhuǎn)換為通用的全局模式,組織可以提前制定該模式。自動(dòng)腳本通常用于將美元轉(zhuǎn)換成歐元,或?qū)⒂㈡^轉(zhuǎn)換成公斤。

轉(zhuǎn)換階段之后,分析人員開(kāi)始管理和分析數(shù)據(jù)。第一步通常涉及運(yùn)行“match/merge”函數(shù)來(lái)創(chuàng)建與相同實(shí)體對(duì)應(yīng)的記錄集群,例如將不同但拼寫(xiě)相似的名稱分組在一起。像“編輯距離”這樣的概念可以用來(lái)確定兩個(gè)不同實(shí)體之間的距離。

然后使用更多的規(guī)則來(lái)比較各種實(shí)體,以確定給定記錄的最佳值。公司可以聲明最后一項(xiàng)是最好的,或者使用一組值中的公共值,這樣就可以產(chǎn)生最佳數(shù)據(jù)。

幾十年來(lái),這種通用的兩步過(guò)程已在許多數(shù)據(jù)倉(cāng)庫(kù)中使用,并且在現(xiàn)代的數(shù)據(jù)湖中繼續(xù)使用。但是,ETL和數(shù)據(jù)管理在很大程度上未能跟上今天的數(shù)據(jù)量以及企業(yè)面臨的挑戰(zhàn)規(guī)模。

例如,這需要預(yù)先定義一個(gè)全局模式,這阻礙了許多ETL的進(jìn)行,這些工作試圖集成更多的數(shù)據(jù)源。在有些時(shí)候,程序員無(wú)法跟上必須設(shè)置的數(shù)據(jù)轉(zhuǎn)換規(guī)則的數(shù)量。

如果您有10個(gè)數(shù)據(jù)源,您還可以這樣做,但是,如果您有10,000個(gè),那就不太可能了。

顯然,這需要一種不同的方法。

在小型企業(yè)中,您可能可以提前創(chuàng)建全局?jǐn)?shù)據(jù)模式,然后在整個(gè)組織中強(qiáng)制使用它,從而省去了昂貴的ETL和數(shù)據(jù)管理項(xiàng)目的成本,一起放在數(shù)據(jù)倉(cāng)庫(kù)中。但是,在大型組織中,這種自上而下的方法不可避免地會(huì)失敗。

即使大型企業(yè)中的業(yè)務(wù)部門(mén)彼此非常相似,它們記錄數(shù)據(jù)的方式也會(huì)有微小的差異。這些微小差異需要加以考慮,然后才能對(duì)其進(jìn)行有意義的分析,這只是企業(yè)數(shù)據(jù)性質(zhì)的反映。

因此業(yè)務(wù)靈活性需要一定程度的獨(dú)立性,這意味著每個(gè)業(yè)務(wù)部門(mén)都建立自己的數(shù)據(jù)中心。

例如,以豐田汽車(chē)歐洲公司(Toyota Motor Europe)為例,該公司在每個(gè)業(yè)務(wù)國(guó)家都有獨(dú)立的客戶支持組織。該公司希望為250個(gè)數(shù)據(jù)庫(kù)中的所有實(shí)體創(chuàng)建一個(gè)主記錄,其中包含40種不同語(yǔ)言的3000萬(wàn)條記錄。

豐田汽車(chē)歐洲公司面臨的問(wèn)題是,ETL和數(shù)據(jù)管理項(xiàng)目的規(guī)模是巨大的,如果按照傳統(tǒng)方式進(jìn)行,將消耗大量的資源。該公司決定使用Tamr來(lái)幫助解決機(jī)器學(xué)習(xí)的挑戰(zhàn),而不是數(shù)據(jù)轉(zhuǎn)換和使用數(shù)據(jù)管理過(guò)程。

ETL最大的問(wèn)題是已經(jīng)預(yù)先定義了全局模式,如何大規(guī)模地做到這一點(diǎn)是個(gè)問(wèn)題。需要使用機(jī)器學(xué)習(xí)進(jìn)行自下向上的匹配、自下而上地構(gòu)造目標(biāo)模式,從規(guī)模上看,這是唯一可行的方式。

這并不意味著機(jī)器學(xué)習(xí)提供了非常簡(jiǎn)單的方法來(lái)解決這些棘手的數(shù)據(jù)集成問(wèn)題。它仍然需要大量的數(shù)據(jù)和處理能力,您通常需要一個(gè)最優(yōu)秀的員工來(lái)幫助指導(dǎo)軟件獲得正確的數(shù)據(jù)分析結(jié)果與決策見(jiàn)解。

這樣來(lái)看的話,成本并不便宜,但這不是最重要的。但還有一個(gè)問(wèn)題是,不同的供應(yīng)商之間該如何選擇。不同國(guó)家或地區(qū)的供應(yīng)商提供的解決方案不同,而且出于一些宏觀因素,會(huì)出現(xiàn)不同的選擇。

出于安全考慮,這些數(shù)據(jù)問(wèn)題不能完全外包給其他公司,所以不要指望完全用機(jī)器學(xué)習(xí)來(lái)處理數(shù)據(jù),人在其中的作用還是非常重要的。人與機(jī)器學(xué)習(xí)合作才能夠使您的數(shù)據(jù)集成和管理效率最大化。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)質(zhì)量雙保障:從“驗(yàn)證”到“標(biāo)記”

    機(jī)器學(xué)習(xí)的世界里,有句老話尤為貼切:“garbagein,garbageout”(輸入垃圾,輸出垃圾)。無(wú)論模型架構(gòu)多先進(jìn)、算法多精妙,數(shù)據(jù)的質(zhì)量始終是決定模型性能的核心。本文聚焦數(shù)據(jù)
    的頭像 發(fā)表于 04-24 15:48 ?115次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>中的<b class='flag-5'>數(shù)據(jù)</b>質(zhì)量雙保障:從“驗(yàn)證”到“標(biāo)記”

    黑M-狂野大數(shù)據(jù)5期|網(wǎng)盤(pán)無(wú)密Mp4+大數(shù)據(jù)直播課-狂野大數(shù)據(jù)

    科技重構(gòu)數(shù)據(jù)生產(chǎn)力:狂野大數(shù)據(jù)直播實(shí)戰(zhàn)全解析 隨著數(shù)字化時(shí)代的快速發(fā)展,大數(shù)據(jù)已經(jīng)滲透到我們生活的方方面面。無(wú)論是商業(yè)、教育,還是醫(yī)療、政府服務(wù),大數(shù)據(jù)的應(yīng)用都在不斷創(chuàng)造新的價(jià)值。而在
    的頭像 發(fā)表于 04-06 11:13 ?223次閱讀

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    無(wú)論你是剛?cè)腴T(mén)還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見(jiàn)錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)
    的頭像 發(fā)表于 01-07 15:37 ?365次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    大數(shù)據(jù)平臺(tái)運(yùn)營(yíng)的基礎(chǔ)是什么

    ,值得每一位企業(yè)運(yùn)營(yíng)者思考。 本文提供大數(shù)據(jù)平臺(tái)運(yùn)營(yíng)的三元素模型,旨在幫助企業(yè)管理層以全面的視角審視企業(yè)當(dāng)前正在建設(shè)的大數(shù)據(jù)體系,真正地實(shí)現(xiàn)數(shù)據(jù)
    的頭像 發(fā)表于 12-23 16:07 ?365次閱讀

    大數(shù)據(jù)時(shí)代下的管理變革:勤哲EXCEL服務(wù)器助力企業(yè)高效運(yùn)營(yíng)

    大數(shù)據(jù)高速發(fā)展的今天,先進(jìn)信息技術(shù)正在潛移默化地改變現(xiàn)代企業(yè)的經(jīng)營(yíng)管理模式。實(shí)踐證明,這些技術(shù)不但提升了管理效率,還為企業(yè)決策提供了科學(xué)依據(jù)。信息化建設(shè)已成為企業(yè)管理創(chuàng)新的重要趨勢(shì),
    的頭像 發(fā)表于 11-19 14:29 ?634次閱讀

    組態(tài)大數(shù)據(jù)平臺(tái)是什么?有什么功能?

    組態(tài)大數(shù)據(jù)平臺(tái)是融合 組態(tài)技術(shù) 與 大數(shù)據(jù)處理能力 的綜合性平臺(tái),通過(guò)圖形化、可配置的方式實(shí)現(xiàn)數(shù)據(jù)采集、存儲(chǔ)、分析、可視化及遠(yuǎn)程控制,適用于工業(yè)自動(dòng)化、能源管理、樓宇監(jiān)控等領(lǐng)域。其核心
    的頭像 發(fā)表于 10-30 11:29 ?339次閱讀
    組態(tài)<b class='flag-5'>大數(shù)據(jù)</b>平臺(tái)是什么?有什么功能?

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)

    北京華盛恒輝電磁兼容 (EMC) 大數(shù)據(jù)智能管理系統(tǒng)精簡(jiǎn)解析 在 EMC 大數(shù)據(jù)分析中,電磁兼容與電磁干擾(EMI)智能管理系統(tǒng)是保障設(shè)備穩(wěn)定、提升系統(tǒng)可靠性的核心工具。系統(tǒng)整合 EM
    的頭像 發(fā)表于 09-17 14:58 ?784次閱讀

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理平臺(tái)

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)
    的頭像 發(fā)表于 09-17 14:58 ?752次閱讀
    電磁兼容與電磁干擾在電磁兼容性<b class='flag-5'>大數(shù)據(jù)</b>分析中的智能<b class='flag-5'>管理</b>平臺(tái)

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)
    的頭像 發(fā)表于 09-17 14:42 ?1072次閱讀
    電磁兼容與電磁干擾在電磁兼容性<b class='flag-5'>大數(shù)據(jù)</b>分析中的智能<b class='flag-5'>管理</b>系統(tǒng)

    御控工業(yè)物聯(lián)網(wǎng)大數(shù)據(jù)解決方案:排水設(shè)備遠(yuǎn)程監(jiān)控與大數(shù)據(jù)統(tǒng)計(jì)系統(tǒng)

    御控工業(yè)物聯(lián)網(wǎng)推出排水設(shè)備遠(yuǎn)程監(jiān)控與大數(shù)據(jù)統(tǒng)計(jì)系統(tǒng),通過(guò)物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù)構(gòu)建“感知-傳輸-分析-決策”閉環(huán)管理體系,助力排水行業(yè)數(shù)字化轉(zhuǎn)型。
    的頭像 發(fā)表于 09-12 10:04 ?820次閱讀

    東軟集團(tuán)與貴州省大數(shù)據(jù)發(fā)展管理局達(dá)成戰(zhàn)略合作

    8月20日,東軟與貴州省大數(shù)據(jù)發(fā)展管理局共同簽署戰(zhàn)略合作協(xié)議。此次簽約將加速推動(dòng)貴州省醫(yī)療、養(yǎng)老、就業(yè)的數(shù)據(jù)價(jià)值化進(jìn)程,為地方經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展注入強(qiáng)大動(dòng)力,也將為東軟在數(shù)據(jù)價(jià)值化、人
    的頭像 發(fā)表于 08-25 16:53 ?1157次閱讀

    深度學(xué)習(xí)對(duì)工業(yè)物聯(lián)網(wǎng)有哪些幫助

    深度學(xué)習(xí)作為人工智能的核心分支,通過(guò)模擬人腦神經(jīng)網(wǎng)絡(luò)的層級(jí)結(jié)構(gòu),能夠自動(dòng)從海量工業(yè)數(shù)據(jù)中提取復(fù)雜特征,為工業(yè)物聯(lián)網(wǎng)(IIoT)提供了從數(shù)據(jù)感知到智能決策的全鏈路升級(jí)能力。以下從技術(shù)賦能、場(chǎng)景突破
    的頭像 發(fā)表于 08-20 14:56 ?1246次閱讀

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無(wú)法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)作為一種靈活且高效的硬件加速平臺(tái)
    的頭像 發(fā)表于 07-16 15:34 ?3115次閱讀

    安科瑞有序充電平臺(tái):物聯(lián)網(wǎng)與大數(shù)據(jù)驅(qū)動(dòng)的充電設(shè)施管理

    概述 有序充電運(yùn)營(yíng)管理平臺(tái)是基于物聯(lián)網(wǎng)和大數(shù)據(jù)技術(shù)的充電設(shè)施管理系統(tǒng),可以實(shí)現(xiàn)對(duì)充電樁的監(jiān)控、調(diào)度和管理、提供充電樁的利用率和充電效率,提升用戶的充電體驗(yàn)和服務(wù)質(zhì)量。用戶可以通過(guò)APP
    的頭像 發(fā)表于 07-15 15:58 ?1705次閱讀
    安科瑞有序充電平臺(tái):物聯(lián)網(wǎng)與<b class='flag-5'>大數(shù)據(jù)</b>驅(qū)動(dòng)的充電設(shè)施<b class='flag-5'>管理</b>

    智慧環(huán)保大數(shù)據(jù)管理平臺(tái)有什么功能

    在環(huán)境污染問(wèn)題日益嚴(yán)峻的當(dāng)下,智慧環(huán)保大數(shù)據(jù)管理平臺(tái)成為環(huán)境治理的重要利器。它圍繞污水處理、垃圾處理、氣體監(jiān)測(cè)三大核心場(chǎng)景,深度融合大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等技術(shù),構(gòu)建起全方位、智能化的環(huán)境管理
    的頭像 發(fā)表于 06-06 15:17 ?729次閱讀
    智慧環(huán)保<b class='flag-5'>大數(shù)據(jù)管理</b>平臺(tái)有什么功能
    当涂县| 浮山县| 沾益县| 塘沽区| 秦皇岛市| 屯昌县| 五莲县| 交城县| 揭阳市| 秭归县| 章丘市| 仪陇县| 旬阳县| 沾益县| 东乌珠穆沁旗| 河南省| 晋宁县| 广宁县| 蒙阴县| 宝坻区| 长葛市| 斗六市| 大冶市| 玛多县| 兴安盟| 丽水市| 龙口市| 巴彦淖尔市| 扶绥县| 金阳县| 镇巴县| 阿尔山市| 班玛县| 桃园县| 商水县| 望城县| 循化| 大竹县| 康马县| 泽库县| 墨脱县|