日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

幫助我們創(chuàng)建數(shù)據(jù)科學領域的下一代數(shù)據(jù)可視化工具

Tableau社區(qū) ? 來源:Tableau社區(qū) ? 作者:ANA CRISAN ? 2021-03-19 10:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)科學在過去十年里蓬勃發(fā)展,改變了我們的商業(yè)模式,同時對于新一代的年輕人來說,提供了一個未來的職業(yè)方向。但在數(shù)據(jù)科學快速發(fā)展的同時,人們對它的理解也在逐步演變,這導致了不同的人對于如何更好地從數(shù)據(jù)中獲取洞察有了不同的觀點。對于我來說,數(shù)據(jù)科學的發(fā)展重塑了我的職業(yè)生涯,接下來我想深入研究數(shù)據(jù)科學是什么、數(shù)據(jù)科學的研究工作是什么以及數(shù)據(jù)科學家是誰等問題。我查閱了大量的文獻,將數(shù)據(jù)科學和數(shù)據(jù)科學家的各種研究和分析關聯(lián)匯總到一起,從而試圖來回答了這些問題。我在一篇題為 “Passing the Data Baton: A Retrospective Analysis on Data Science Work and Workers” 的研究出版物中說明了以上結果。

這項研究的部分動機是作為未來研究和開發(fā)的基礎,這樣我可能可以找到一個可視化分析工具還未滿足其需求的領域。而另一個動機是,我希望對十多年前我剛開始學習計算機科學時還不存在的這個領域進行自我反思和回顧。在這篇文章中,我總結了這篇研究論文的幾個關鍵收獲,并分享了這些發(fā)現(xiàn)將如何幫助我們創(chuàng)建數(shù)據(jù)科學領域的下一代數(shù)據(jù)可視化工具。

什么是數(shù)據(jù)科學?

數(shù)據(jù)科學對不同的人來說是不一樣的。對某些人來說,數(shù)據(jù)科學并不是什么新鮮事,只是統(tǒng)計技術的實際應用,并且已經(jīng)存在了很長一段時間。對其他人來說,數(shù)據(jù)科學不僅需要統(tǒng)計方法的知識,而且還需要計算技術使這些方法得到應用。例如,一個數(shù)據(jù)科學家僅僅理解線性回歸是不夠的,他們還需要知道如何在大規(guī)模的數(shù)據(jù)中應用線性回歸——這不是傳統(tǒng)統(tǒng)計學教育的一部分。盡管如此,即使是那些認為數(shù)據(jù)科學不僅僅是應用統(tǒng)計學的人,也可能并不認為它是一件新事物。收集和分析數(shù)據(jù)的做法,長期以來一直是科學研究的一部分,例如生物學或物理學;許多人認為,數(shù)據(jù)科學只是經(jīng)驗科學中對已經(jīng)存在的研究的延伸。

eee32ca0-879b-11eb-8b86-12bb97331649.png

但其實還有第三種觀點,即數(shù)據(jù)科學確實是一件新的事物,既不同于統(tǒng)計學,也不同于科學家在研究原子和基因時使用的方法。數(shù)據(jù)科學將統(tǒng)計學、計算機科學以及其他必要的學科專業(yè)知識結合起來,帶來了數(shù)據(jù)科學所獨有的、由數(shù)據(jù)科學家所應對的全新挑戰(zhàn)。此外,數(shù)據(jù)科學家開展的工作與其他類型的數(shù)據(jù)分析不同,它需要更廣泛的跨學科技能。我們和其他人的研究都認為數(shù)據(jù)科學確實是一件全新的、不同的事物,基于這點,我們創(chuàng)建了一個關于數(shù)據(jù)科學的定義,作為我們工作的基礎:

數(shù)據(jù)科學是一個跨學科領域,旨在通過統(tǒng)計和計算技術的結構化應用,從現(xiàn)實世界的數(shù)據(jù)中得到新的見解。 這一定義很重要,因為它幫助我們了解數(shù)據(jù)科學工作者面臨的挑戰(zhàn)和未滿足的需求,它們主要來自于處理真實數(shù)據(jù)的挑戰(zhàn)(而不是模擬數(shù)據(jù)),以及大規(guī)模應用統(tǒng)計和計算方法的挑戰(zhàn)。

什么是數(shù)據(jù)科學工作?

efed810e-879b-11eb-8b86-12bb97331649.png

重要的是,數(shù)據(jù)科學的有效定義縮小了研究范圍。我們并沒有包含人們可能希望進行研究的所有類型的數(shù)據(jù)分析,而是仔細研究那些數(shù)據(jù)科學家進行研究的分析類型。這種區(qū)別很重要,因為實驗物理學家分析數(shù)據(jù)所采取的具體步驟與數(shù)據(jù)科學家可能采取的分析步驟不同,盡管它們有共同點。這就引出了一個重要的后續(xù)問題:究竟什么是數(shù)據(jù)科學的研究工作? 有好幾個行業(yè)標準來分解數(shù)據(jù)科學的研究工作。第一種是 KDD(數(shù)據(jù)發(fā)現(xiàn)中的知識)方法,隨著時間的推移,其他人會對該方法進行修改和擴展?;谶@些推論,以及采訪數(shù)據(jù)科學家,我們創(chuàng)建了一個框架,其中包括四個高階過程(準備、分析、部署和通信)和 14 個低階過程。使用紅色筆劃輪廓,我們還強調了數(shù)據(jù)可視化在數(shù)據(jù)科學工作中已經(jīng)發(fā)揮突出作用的具體領域。在我們的研究文章中,我們提供了這些過程的詳細定義和示例。

誰是數(shù)據(jù)科學工作者?

我們在與數(shù)據(jù)科學家進行的 12 項深入研究中發(fā)現(xiàn)了 9 個數(shù)據(jù)科學角色。這些年來,我聽到了許多關于數(shù)據(jù)科學家的不同看法。我喜歡的一個例子是,數(shù)據(jù)科學家是“比統(tǒng)計學家更擅長軟件工程,比軟件工程師更擅長統(tǒng)計學” 的人。我最近聽到的一個直白的說法是,數(shù)據(jù)科學家是“西海岸的統(tǒng)計學家”。

然而,當我們深入研究現(xiàn)有的數(shù)據(jù)科學家的研究時,我們沒想到發(fā)現(xiàn)了一個重要且一致的特征,即 “數(shù)據(jù)科學家” 的多樣性以及它們在特定數(shù)據(jù)科學過程中的作用如何變化。您可能已經(jīng)注意到數(shù)據(jù)工程師的崛起,例如,作為一個獨特但仍然相鄰的數(shù)據(jù)科學角色。隨著數(shù)據(jù)科學工作的復雜性的增加,數(shù)據(jù)科學家變得更專業(yè),往往從事數(shù)據(jù)科學研究工作的具體方面。Harris 等人的訪談早在 2012 年就已經(jīng)確定了這一趨勢,這種趨勢只是隨著時間的推移而加速。他們敏銳地發(fā)現(xiàn),數(shù)據(jù)科學角色之間的這種多樣性導致了 “數(shù)據(jù)科學家和尋求幫助的人之間的交流不暢”。

我們根據(jù) Harris 的研究結果,對 12 項研究進行了調查,共有數(shù)千名被認定為數(shù)據(jù)科學家的個體。通過對這些研究的分析,我們能夠識別出 9 個不同的數(shù)據(jù)角色。這些人有不同的技能和背景,我們以統(tǒng)計、計算機科學和領域專業(yè)知識為軸心來說明。我們還將以人為中心的設計納入了我們對數(shù)據(jù)科學技能的描述,因為考慮到數(shù)據(jù)產(chǎn)品的影響,就像面部識別應用程序一樣,越來越重要。我們要強調的是,這些角色不是絕對的范疇,它們的邊界是不固定的,同時這些角色的技術技能也符合類似的規(guī)律。相反,提出這些角色類別的目的是提供一個指導,從而幫助研究人員對于正在交談的人以及他們的背景有一個直觀的認識。

這將如何改變我們創(chuàng)建可視化

和數(shù)據(jù)分析工具的方式?

當然,最重要的是我們對數(shù)據(jù)科學的定義以及我們的數(shù)據(jù)科學工作框架和工作人員如何幫助我們構建更好的數(shù)據(jù)可視化工具。首先也是最重要的一點是,它有助于提供一個清晰的標準,從而明確了數(shù)據(jù)科學研究工作的多樣性和對應的工作人員。我們已經(jīng)使用這個框架創(chuàng)建了更清晰的標準來分解數(shù)據(jù)科學中的 Tableau 客戶體驗。我們可以更精確地確定他們正試圖做什么,并可以就這些過程提出更深入的問題。

已知 “數(shù)據(jù)科學家” 這個角色本身包含了大量的多樣性,我們可以通過將與我們交談的個人歸類到九個數(shù)據(jù)科學的角色,從而更好地確定誰在執(zhí)行這項工作。這樣的分類使得我們更容易理解可視化系統(tǒng)需要支持的任務以及在什么級別上支持這些任務。例如,技術分析員和 ML/AI 工程師是我們描述的兩個數(shù)據(jù)科學角色,他們都可以參與模型構建的共同任務,但需求截然不同;如果我們忽略這些差異,我們就有可能為這兩個角色創(chuàng)建錯誤的工具。

但也許對我來說最重要的是,這個框架還幫助我思考當前可視化分析工具生態(tài)系統(tǒng)中缺少的東西。我得出的一個令人擔憂的結論是,現(xiàn)有工具對可視化機器學習模型的關注范圍很窄,缺乏支持數(shù)據(jù)科學研究工作的其他關鍵方面的工具,如數(shù)據(jù)準備、部署或通信。這種工具的缺乏不僅增加了數(shù)據(jù)科學研究工作的開銷,還使得數(shù)據(jù)科學家無論擔任什么角色,都更難讓他們的工作影響到組織的決策和實踐。這項關于數(shù)據(jù)科學工作和工作者的研究幫助我面對以上挑戰(zhàn),同時為構建更好的工具來幫助人們查看和理解他們的數(shù)據(jù)提供了機會。

原文標題:數(shù)據(jù)科學的十年回顧與可視化工具的未來

文章出處:【微信公眾號:Tableau社區(qū)】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)

    關注

    8

    文章

    7349

    瀏覽量

    95057
  • 機器學習
    +關注

    關注

    67

    文章

    8567

    瀏覽量

    137260

原文標題:數(shù)據(jù)科學的十年回顧與可視化工具的未來

文章出處:【微信號:TableauChina,微信公眾號:Tableau社區(qū)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    利用數(shù)據(jù)API構建實時數(shù)據(jù)分析與可視化報表系統(tǒng)

    API(涵蓋銷售統(tǒng)計、用戶畫像、流量分析等)進行高效的數(shù)據(jù)整合、分析,并實現(xiàn) 自定義報表生成 和 實時數(shù)據(jù)可視化 ,為商業(yè)決策提供強大支持。 、
    的頭像 發(fā)表于 04-02 15:56 ?188次閱讀
    利用<b class='flag-5'>數(shù)據(jù)</b>API構建實時<b class='flag-5'>數(shù)據(jù)</b>分析與<b class='flag-5'>可視化</b>報表系統(tǒng)

    華為數(shù)據(jù)通信攜手全球伙伴共探下一代網(wǎng)絡發(fā)展方向

    作為全球互聯(lián)網(wǎng)技術領域頂級盛會,第125屆互聯(lián)網(wǎng)工程任務組會議(IETF 125)近日在深圳召開。華為數(shù)據(jù)通信深度參與,通過前沿技術提案與創(chuàng)新實踐,攜手全球伙伴共探下一代網(wǎng)絡發(fā)展方向。
    的頭像 發(fā)表于 03-24 15:03 ?466次閱讀
    華為<b class='flag-5'>數(shù)據(jù)</b>通信攜手全球伙伴共探<b class='flag-5'>下一代</b>網(wǎng)絡發(fā)展方向

    Molex產(chǎn)品組合推動下一代數(shù)據(jù)中心高速互連

    云計算、物聯(lián)網(wǎng)、VR/AR、數(shù)字孿生、人工智能(AI)……這些讓科技圈熱血沸騰的技術背后,都有個共同的底層邏輯——它們都是以海量數(shù)據(jù)的處理作為支撐的。因此,無論是哪條賽道上的競爭,都會體現(xiàn)為數(shù)字基礎設施建設上的比拼,即新一代數(shù)據(jù)
    的頭像 發(fā)表于 03-12 10:38 ?674次閱讀

    芯科科技免費提供SystemView可視化分析工具

    Silicon Labs(芯科科技)近期宣布與嵌入式設計領導者 SEGGER 建立合作伙伴關系,為所有采用芯科科技技術的開發(fā)者免費提供SystemView工具-這是款專業(yè)級的跟蹤與可視化工具,無需
    的頭像 發(fā)表于 02-28 15:13 ?1236次閱讀

    最受歡迎的大數(shù)據(jù)可視化工具

    ?在數(shù)聚股份看來,大數(shù)據(jù)可視化是進行各種大數(shù)據(jù)分析的最重要組成部分之。 旦原始數(shù)據(jù)流被以圖像
    的頭像 發(fā)表于 12-24 17:05 ?398次閱讀
    最受歡迎的大<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>可視化工具</b>

    工業(yè)物聯(lián)網(wǎng)可視化平臺是什么?有什么功能?

    工業(yè)物聯(lián)網(wǎng)可視化平臺是基于物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術,將工業(yè)生產(chǎn)中的設備、系統(tǒng)、流程等數(shù)據(jù)以圖形化方式呈現(xiàn),實現(xiàn)實時監(jiān)控、智能分析與交互式管理的數(shù)字化工具。 其核心功能涵蓋
    的頭像 發(fā)表于 11-17 17:49 ?1480次閱讀

    安森美SiC器件賦能下一代AI數(shù)據(jù)中心變革

    安森美(onsemi)憑借其業(yè)界領先的Si和SiC技術,從變電站的高壓交流/直流轉換,到處理器級的精準電壓調節(jié),為下一代AI數(shù)據(jù)中心提供了從3kW到25-30kW HVDC的供電全環(huán)節(jié)高能效、高密度
    的頭像 發(fā)表于 10-31 13:47 ?1030次閱讀

    工業(yè)可視化平臺是什么

    工業(yè)可視化平臺是種基于信息技術和可視化技術,將工業(yè)生產(chǎn)過程中的數(shù)據(jù)、信息、流程等以直觀、動態(tài)的圖形化方式呈現(xiàn),并實現(xiàn)交互式管理與分析的數(shù)字化工具
    的頭像 發(fā)表于 10-24 18:00 ?1254次閱讀

    適用于下一代 GGE 和 HSPA 手機的多模/多頻段 PAM skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()適用于下一代 GGE 和 HSPA 手機的多模/多頻段 PAM相關產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有適用于下一代 GGE 和 HSPA 手機的多模/多頻段 PAM的引腳圖、接線圖、封裝
    發(fā)表于 09-05 18:34
    適用于<b class='flag-5'>下一代</b> GGE 和 HSPA 手機的多模/多頻段 PAM skyworksinc

    文讀懂 | 晶圓圖Wafer Maps:半導體數(shù)據(jù)可視化的核心工具

    在精密復雜的半導體制造領域,海量數(shù)據(jù)的有效解讀是提升產(chǎn)能、優(yōu)化良率的關鍵。數(shù)據(jù)可視化技術通過直觀呈現(xiàn)信息,幫助工程師快速識別問題、分析規(guī)律,
    的頭像 發(fā)表于 08-19 13:47 ?3405次閱讀
    <b class='flag-5'>一</b>文讀懂 | 晶圓圖Wafer Maps:半導體<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>可視化</b>的核心<b class='flag-5'>工具</b>

    安森美攜手英偉達推動下一代AI數(shù)據(jù)中心發(fā)展

    安森美(onsemi,美國納斯達克股票代號:ON)宣布與英偉達(NVIDIA)合作,共同推動向800V直流(VDC)供電架構轉型。這變革性解決方案將推動下一代人工智能(AI)數(shù)據(jù)中心在能效、密度及可持續(xù)性方面實現(xiàn)顯著提升。
    的頭像 發(fā)表于 08-06 17:27 ?1746次閱讀

    如何使用協(xié)議分析儀進行數(shù)據(jù)分析與可視化

    使用協(xié)議分析儀進行數(shù)據(jù)分析與可視化,需結合數(shù)據(jù)捕獲、協(xié)議解碼、統(tǒng)計分析及可視化工具,將原始數(shù)據(jù)轉化為可解讀的圖表和報告。以下是詳細步驟及關鍵
    發(fā)表于 07-16 14:16

    什么是數(shù)字孿生 —— 釋放數(shù)據(jù)價值,預見運營未來

    大核心技術的下一代數(shù)字孿生系統(tǒng),正在徹底改變企業(yè)運營與決策模式! 我們專注于數(shù)字孿生領域,深知其變革潛力?;陬I先的數(shù)字孿生平臺、強大的大數(shù)據(jù)中心、穩(wěn)健的物聯(lián)網(wǎng)平臺 ,
    的頭像 發(fā)表于 06-25 11:19 ?808次閱讀
    什么是數(shù)字孿生 —— 釋放<b class='flag-5'>數(shù)據(jù)</b>價值,預見運營未來

    結構可視化:利用數(shù)據(jù)編輯器剖析數(shù)據(jù)內在架構?

    流動路徑,為數(shù)據(jù)驅動的決策提供堅實基礎。借助數(shù)據(jù)編輯器,企業(yè)還能更便捷地對可視化呈現(xiàn)的數(shù)據(jù)進行編輯、調整,以滿足不同分析場景的需求,進步優(yōu)
    的頭像 發(fā)表于 05-07 18:42 ?955次閱讀

    工業(yè)設備數(shù)據(jù)集中監(jiān)控可視化管理平臺是什么

    工業(yè)設備數(shù)據(jù)集中監(jiān)控可視化管理平臺是種用于整合、監(jiān)控和可視化工業(yè)設備數(shù)據(jù)的綜合性系統(tǒng),旨在幫助
    的頭像 發(fā)表于 05-06 11:10 ?1235次閱讀
    易门县| 长海县| 泸州市| 永泰县| 安国市| 辰溪县| 贵州省| 安义县| 新田县| 凤翔县| 广宁县| 开平市| 开江县| 当阳市| 沙坪坝区| 南丰县| 福州市| 长汀县| 丰宁| 奉新县| 平度市| 土默特左旗| 滦南县| 呼玛县| 信丰县| 邯郸县| 左贡县| 封丘县| 乾安县| 河源市| 新平| 江西省| 沅陵县| 仙游县| 彭阳县| 本溪市| 襄汾县| 九江县| 乌兰察布市| 滦南县| 丰都县|