日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究者最近仔細(xì)估算了各種知識(shí)圖譜每創(chuàng)建一條記錄所需要的成本

MqC7_CAAI_1981 ? 來(lái)源:lq ? 2019-02-18 16:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我們知道強(qiáng)大的深度模型需要很多計(jì)算力,那你知道創(chuàng)建一個(gè)知識(shí)圖譜的成本到底是多少嗎?德國(guó) Mannheim 大學(xué)的研究者最近仔細(xì)估算了各種知識(shí)圖譜每創(chuàng)建一條記錄所需要的成本,他們表示對(duì)于大型知識(shí)圖譜,手動(dòng)創(chuàng)建一個(gè)三元組(即一條記錄)的成本在 2 到 6 美元之間,總成本在數(shù)百萬(wàn)到數(shù)十億美元之間。

知識(shí)圖譜廣泛用于各種領(lǐng)域,它的統(tǒng)計(jì)信息也常被分析。但有一個(gè)問(wèn)題一直缺乏研究:產(chǎn)出價(jià)格是多少?在此論文中,研究者提出了一種方法預(yù)估知識(shí)圖譜的成本。他們表示手動(dòng)創(chuàng)建一個(gè)三元組(triple)的成本大約在 2 到 6 美元左右,而自動(dòng)創(chuàng)建知識(shí)圖譜的成本要降低 15 到 250 倍(即一個(gè)三元組 1 美分到 15 美分)。

注意其中 15 美分每條的「自動(dòng)化」知識(shí)圖譜還是需要大量人力進(jìn)行數(shù)據(jù)的驗(yàn)證。此外,作者表示成本也應(yīng)該作為知識(shí)圖譜的評(píng)價(jià)標(biāo)準(zhǔn),例如可以使用每個(gè)三元組的成本或其他更優(yōu)的度量方法。

論文:How much is a Triple? Estimating the Cost of Knowledge Graph Creation

論文地址:http://ceur-ws.org/Vol-2180/ISWC_2018_Outrageous_Ideas_paper_10.pdf

估計(jì)知識(shí)圖譜的成本

隨著知識(shí)圖譜的廣泛應(yīng)用,我們?cè)絹?lái)越關(guān)注大型知識(shí)圖譜,例如 DBpedia、YAGO 等。我們已經(jīng)有很多方法從各種角度檢查這些大型知識(shí)圖譜,例如大小、覆蓋度和質(zhì)量等。然而這些分析不足的地方在于成本,即創(chuàng)建知識(shí)圖譜的價(jià)格。

人工創(chuàng)建:Cyc 和 Freebase

對(duì)于人工創(chuàng)建的知識(shí)圖譜,我們必須評(píng)估提供這些陳述語(yǔ)句(statement)的工作量,從而估計(jì)平均成本。

Cyc 是最早的通用知識(shí)圖譜之一,同時(shí)它的開發(fā)成本也能公開獲得。在 2017 年的一項(xiàng)會(huì)議中,Cyc 的創(chuàng)建者 Douglas Lenat 表示:構(gòu)建 Cyc 的成本為 1.2 億美元。在同一個(gè) PPT 中,Lenat 表示 Cyc 一共有 21M 斷言(assertion),因此每條陳述語(yǔ)句或斷言需要 5.71 美元。若 1000 人有一年的時(shí)間完成,則每人每 9.5 分鐘需要完成一條斷言。

Freebase 是由志愿者共同完成的,因此其工作量更難判斷。截止至 2011 年 4 月份,創(chuàng)建英文維基百科的估計(jì)時(shí)長(zhǎng)為 41M 工時(shí)。同時(shí)維基百科包含 3.6M 的頁(yè)面,平均每一個(gè)頁(yè)面 36.4 個(gè)句子,因此換算下來(lái)每一條語(yǔ)句需要 18.7 分鐘。由于大多數(shù)維基百科條目都是由美國(guó)構(gòu)建的,我們可以使用每小時(shí) 7.25 美元的美國(guó)聯(lián)邦最低工資作為人工成本估算,因此每一句的成本可以換算為 2.25 美元。借鑒這個(gè)成本,我們可以假設(shè) Freebase 每一條陳述語(yǔ)句的成本也是 2.25 美元。

這比 Cyc 的平均成本低了一半,這種低成本也是合理的,因?yàn)?Cyc 是由人類專家構(gòu)建的,而 Freebase 由非專業(yè)人員創(chuàng)建??偟亩?,對(duì)于包含 30 億事實(shí)(fact)的最新版 Freebase,它的總成本約為 67.5 億美元($6.75B)。

自動(dòng)創(chuàng)建: DBpedia、YAGO 和 NELL

評(píng)估自動(dòng)創(chuàng)建知識(shí)圖譜所花費(fèi)成本不同于人工創(chuàng)建知識(shí)圖譜。我們參考了用于創(chuàng)建知識(shí)圖譜的軟件,基于代碼行數(shù)(LOC)來(lái)估計(jì)開發(fā)知識(shí)圖譜的成本。我們遵循 [2] 中的分析,即一個(gè)軟件生成項(xiàng)目平均每小時(shí)生產(chǎn) 37 行代碼(LOC)。

DBpedia 主要是基于 DBpedia 提取框架從維基百科 Dump 得到的,它通過(guò)映射中心實(shí)體而創(chuàng)建知識(shí)圖譜。DBpedia 兩部分需要 4.9M 和 2.2M LOC,它需要的總開發(fā)成本為 510 萬(wàn)美元。鑒于英語(yǔ) DBpedia[11] 共有 400M 陳述語(yǔ)句,每一條成本約為 1.85 美分。相比于人工搭建的知識(shí)圖譜(每一條 2.25 美元),自動(dòng)搭建的要節(jié)省百倍的成本。

YAGO 也是一種知識(shí)圖譜,它將維基百科提取的知識(shí)與 WordNet[7] 相結(jié)合。為了公平比較,它的成本應(yīng)該包含 WordNet 的搭建費(fèi)用。YAGO 代碼庫(kù)有 1.6M LOC(包括將信息框映射到本體的規(guī)則),因此它的總體成本為 160 萬(wàn)美元。此外,WordNet 本身還包含了 117k 個(gè)同義詞集,每一個(gè)包含一條注釋。我們估計(jì)定義一個(gè)同義詞集的成本與構(gòu)建一個(gè)維基百科頁(yè)面的成本相近,即最高 1000 萬(wàn)美元。若 YAGO 有 14 億條陳述語(yǔ)句 [11],那么每一條的成本為 0.83 美分。相比人工搭建,它的成本要節(jié)省 250 倍。

NELL 是一個(gè)學(xué)習(xí)關(guān)系抽取 [8] 模式的系統(tǒng),其核心技術(shù)包含 103k 的 LOC,預(yù)估開發(fā)成本為 10.9 萬(wàn)美元。此外,該數(shù)據(jù)集每月還需要人工校驗(yàn) 1467 條陳述語(yǔ)句。假設(shè)人工校驗(yàn)一條陳述語(yǔ)句的成本和創(chuàng)建成本一樣,那么總的校驗(yàn)成本為 37.6 萬(wàn)美元,即通成本為 48.5 美元。因此換算下來(lái),NELL 每條陳述語(yǔ)句的成本為 14.25 美分,即比手動(dòng)搭建便宜 16 倍。

新的評(píng)估標(biāo)準(zhǔn)

把成本作為創(chuàng)建知識(shí)圖譜的一種測(cè)量方法也能為其他評(píng)估方法鋪平道路。例如,可以通過(guò)成本查驗(yàn)為知識(shí)圖譜補(bǔ)充缺失信息提供新方法 [9]:一個(gè)人一年半開發(fā)知識(shí)圖譜應(yīng)該可以添加 2800 條陳述語(yǔ)句,這應(yīng)該是人力手動(dòng)產(chǎn)出的三元組數(shù)量。

另一個(gè)有趣的思路是開發(fā)成本與數(shù)據(jù)質(zhì)量之間的關(guān)系。在圖 1 中,我們圖像描述了該論文討論的知識(shí)圖譜中每個(gè)三元組成本與錯(cuò)誤率之間的關(guān)系。我們可以看到,高成本創(chuàng)建的三元組準(zhǔn)確率也會(huì)更高,NELL 是個(gè)例外,準(zhǔn)確率與成本之間關(guān)系極差。

每個(gè)三元組成本與錯(cuò)誤率之間的關(guān)系展示圖。

總結(jié)

在這篇論文中,我們大體估計(jì)了創(chuàng)建一個(gè)流行的知識(shí)圖譜所花費(fèi)的成本,這也是當(dāng)前研究忽視的一個(gè)方面。我們量化了自動(dòng)創(chuàng)建知識(shí)圖譜相比于手動(dòng)方法的收益,并提出使用成本定義新型的評(píng)價(jià)標(biāo)準(zhǔn),例如權(quán)衡成本與準(zhǔn)確率。

有研究者反饋,我們也意識(shí)到有很多假設(shè)或估計(jì)在計(jì)算中都存在著問(wèn)題(例如,我們沒(méi)有考慮第三方庫(kù)或基礎(chǔ)設(shè)施的成本)。其次,知識(shí)圖譜的來(lái)源或數(shù)據(jù)成本當(dāng)前也沒(méi)有考慮在內(nèi)。然而,我們相信:知識(shí)圖譜自身帶來(lái)的價(jià)值將遠(yuǎn)超過(guò)各種構(gòu)建成本的總和。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7349

    瀏覽量

    95058
  • 自動(dòng)化
    +關(guān)注

    關(guān)注

    31

    文章

    5989

    瀏覽量

    90699
  • 知識(shí)圖譜
    +關(guān)注

    關(guān)注

    2

    文章

    132

    瀏覽量

    8359

原文標(biāo)題:67 億美金搞個(gè)圖,創(chuàng)建知識(shí)圖譜的成本有多高你知道嗎?

文章出處:【微信號(hào):CAAI-1981,微信公眾號(hào):中國(guó)人工智能學(xué)會(huì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    還在搶信道?Wi-Fi 6E直接給你一條“專屬高速路”

    Wi-Fi6E的核心,不在“更快”,而在多了一條全新的6GHz頻段。簡(jiǎn)單理解:以前是兩高速路(2.4GHz/5GHz)現(xiàn)在,直接多了一條“幾乎沒(méi)人走的超級(jí)高速路”。結(jié)果:
    的頭像 發(fā)表于 04-29 18:03 ?241次閱讀
    還在搶信道?Wi-Fi 6E直接給你<b class='flag-5'>一條</b>“專屬高速路”

    翼輝信息工信部“一條龍”應(yīng)用計(jì)劃項(xiàng)目成功驗(yàn)收

    近日,翼輝信息牽頭承擔(dān)的工業(yè)和信息化部重點(diǎn)產(chǎn)品、工藝“一條龍”應(yīng)用計(jì)劃項(xiàng)目順利通過(guò)驗(yàn)收。這標(biāo)志著我國(guó)工業(yè)實(shí)時(shí)操作系統(tǒng)在關(guān)鍵核心技術(shù)自主可控及規(guī)?;瘧?yīng)用方面取得重要進(jìn)展。
    的頭像 發(fā)表于 04-28 16:08 ?191次閱讀
    翼輝信息工信部“<b class='flag-5'>一條</b>龍”應(yīng)用計(jì)劃項(xiàng)目成功驗(yàn)收

    4億元!廣州又一條8英寸MEMS芯片產(chǎn)線開工建設(shè)

    芯片潔凈車間裝修及產(chǎn)線建設(shè),涵蓋6寸升級(jí)8寸的技術(shù)更新。項(xiàng)目采購(gòu)批半導(dǎo)體設(shè)備,建設(shè)一條月產(chǎn)1500片晶圓片的MEMS工藝濾波芯片生產(chǎn)線。項(xiàng)目起止年限為2026年3月1日至2028年12月1日。 ? ? ? ? 該項(xiàng)目建設(shè)單位為廣州市艾佛光通科技有限公司(下文簡(jiǎn)稱“艾佛
    的頭像 發(fā)表于 03-23 17:58 ?1296次閱讀
    4億元!廣州又<b class='flag-5'>一條</b>8英寸MEMS芯片產(chǎn)線開工建設(shè)

    金航標(biāo)電子便扎根在深圳市華強(qiáng)北,在華強(qiáng)北理論研究專家華強(qiáng)北文化研究者宋仕強(qiáng)先生帶領(lǐng)下...

    早在2007年,金航標(biāo)電子便扎根在深圳市華強(qiáng)北,在華強(qiáng)北理論研究專家華強(qiáng)北文化研究者宋仕強(qiáng)先生帶領(lǐng)下,近20年來(lái)金航標(biāo)深耕無(wú)線信號(hào)收發(fā)、電子連接器及信號(hào)互連系統(tǒng)領(lǐng)域,打造“kinghelm”品牌,并
    發(fā)表于 03-14 11:24

    惠州雷曼入選國(guó)家知識(shí)產(chǎn)權(quán)示范企業(yè)創(chuàng)建對(duì)象

    近日,國(guó)家知識(shí)產(chǎn)權(quán)局正式公布了2025-2027年度國(guó)家知識(shí)產(chǎn)權(quán)強(qiáng)國(guó)建設(shè)示范創(chuàng)建對(duì)象名單。雷曼光電全資子公司——惠州雷曼,憑借其在知識(shí)產(chǎn)權(quán)創(chuàng)造、運(yùn)用、保護(hù)和管理方面的體系化優(yōu)勢(shì),成功入
    的頭像 發(fā)表于 03-03 16:36 ?1076次閱讀

    羅萊迪思入選國(guó)家知識(shí)產(chǎn)權(quán)示范企業(yè)創(chuàng)建對(duì)象

    公司在自主創(chuàng)新與知識(shí)產(chǎn)權(quán)體系建設(shè)方面躋身先進(jìn)行列,在數(shù)智化轉(zhuǎn)型賦能高質(zhì)量發(fā)展的道路上迎來(lái)新的里程碑。國(guó)家知識(shí)產(chǎn)權(quán)示范企業(yè)創(chuàng)建對(duì)象評(píng)選,旨在遴選
    的頭像 發(fā)表于 01-27 16:06 ?954次閱讀
    羅萊迪思入選國(guó)家<b class='flag-5'>知識(shí)</b>產(chǎn)權(quán)示范企業(yè)<b class='flag-5'>創(chuàng)建</b>對(duì)象

    芯原入選國(guó)家知識(shí)產(chǎn)權(quán)示范企業(yè)創(chuàng)建對(duì)象

    1月12日,國(guó)家知識(shí)產(chǎn)權(quán)局公示了“2025-2027年國(guó)家知識(shí)產(chǎn)權(quán)強(qiáng)國(guó)建設(shè)示范創(chuàng)建對(duì)象”的評(píng)審結(jié)果,芯原微電子 (上海) 股份有限公司憑借其在知識(shí)產(chǎn)權(quán)創(chuàng)造、運(yùn)用、管理和保護(hù)方面的扎實(shí)基
    的頭像 發(fā)表于 01-27 15:28 ?367次閱讀

    度亙核芯成功入選“國(guó)家知識(shí)產(chǎn)權(quán)示范企業(yè)創(chuàng)建對(duì)象”

    近日,國(guó)家知識(shí)產(chǎn)權(quán)局正式公布2025-2027年新知識(shí)產(chǎn)權(quán)強(qiáng)國(guó)建設(shè)示范企業(yè)創(chuàng)建對(duì)象名單,度亙憑借在知識(shí)產(chǎn)權(quán)創(chuàng)造、運(yùn)用、保護(hù)、管理全鏈條的
    的頭像 發(fā)表于 01-21 17:31 ?1507次閱讀
    度亙核芯成功入選“國(guó)家<b class='flag-5'>知識(shí)</b>產(chǎn)權(quán)示范企業(yè)<b class='flag-5'>創(chuàng)建</b>對(duì)象”

    潤(rùn)和軟件入選大模型體機(jī)產(chǎn)業(yè)圖譜

    近日,由中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟與中國(guó)信息通信研究院聯(lián)合編制的《大模型體機(jī)產(chǎn)業(yè)圖譜》正式發(fā)布。該圖譜系統(tǒng)梳理并收錄了國(guó)內(nèi)大模型體機(jī)產(chǎn)業(yè)鏈
    的頭像 發(fā)表于 12-10 17:56 ?1744次閱讀
    潤(rùn)和軟件入選大模型<b class='flag-5'>一</b>體機(jī)產(chǎn)業(yè)<b class='flag-5'>圖譜</b>

    如何估算焊錫膏的印刷量?

    估算焊錫膏的印刷量是表面貼裝技術(shù)(SMT)中的關(guān)鍵環(huán)節(jié),直接影響焊接質(zhì)量和成本。以下是分步驟的估算方法及關(guān)鍵注意事項(xiàng):
    的頭像 發(fā)表于 11-26 09:06 ?964次閱讀
    如何<b class='flag-5'>估算</b>焊錫膏的印刷量?

    萬(wàn)字長(zhǎng)文AI智能體:17種體架構(gòu)詳細(xì)實(shí)現(xiàn)

    數(shù)據(jù)科學(xué)AI智能體領(lǐng)域發(fā)展迅猛,但許多資源仍然過(guò)于抽象和理論化。創(chuàng)建此項(xiàng)目的目的是為開發(fā)、研究人員和AI愛好提供一條結(jié)構(gòu)化、實(shí)用且深入的
    的頭像 發(fā)表于 11-07 13:16 ?785次閱讀
    萬(wàn)字長(zhǎng)文AI智能體:17種體架構(gòu)詳細(xì)實(shí)現(xiàn)

    如何創(chuàng)建個(gè)浮點(diǎn)立即數(shù)

    32位的常量,包括32位的立即數(shù)或內(nèi)存地址。有些情況下只需要一條I-type指令,或者一條U-type指令就可以了。 例如加載常量0x12345678: lui x15,0x12345 # 首先加載
    發(fā)表于 10-21 13:51

    從材質(zhì)到結(jié)構(gòu):一條優(yōu)質(zhì)HDMI線背后的技術(shù)講究

    因素——材質(zhì)與結(jié)構(gòu)設(shè)計(jì)。今天,我們將深入探討一條優(yōu)質(zhì)HDMI線背后的技術(shù)講究,幫助您做出更加明智的選擇。 、導(dǎo)體材料:信號(hào)傳輸?shù)幕A(chǔ) HDMI線的導(dǎo)體材料直接關(guān)系到信號(hào)傳輸?shù)馁|(zhì)量和穩(wěn)定性。優(yōu)質(zhì)的導(dǎo)體材料能夠有效降低電阻,減少信
    的頭像 發(fā)表于 07-09 17:59 ?1336次閱讀

    如何在Unified IDE中創(chuàng)建視覺(jué)庫(kù)HLS組件

    組件開始,該組件可以導(dǎo)出為 XO 文件用于 Vitis 系統(tǒng)工程;這與“自上而下的流程”相反,后者從 Vitis 工程開始,然后將 HLS 組件導(dǎo)入該工程。我們將創(chuàng)建視覺(jué)庫(kù)示例“remap”,并在 Unified IDE 中執(zhí)行
    的頭像 發(fā)表于 07-02 10:55 ?1702次閱讀
    如何在Unified IDE中<b class='flag-5'>創(chuàng)建</b>視覺(jué)庫(kù)HLS組件

    曙光AI解決方案助力光大銀行數(shù)字化基礎(chǔ)設(shè)施升級(jí)

    作為國(guó)有股份制商業(yè)銀行,光大銀行以全力做好“五篇大文章”為目標(biāo),結(jié)合曙光AI解決方案推進(jìn)數(shù)字化基礎(chǔ)設(shè)施升級(jí),創(chuàng)新金融服務(wù),深化科技賦能,走出了一條具有光大特色的AI之路。 近年來(lái),光大銀行主動(dòng)順應(yīng)
    的頭像 發(fā)表于 05-12 10:46 ?1028次閱讀
    溆浦县| 侯马市| 莱西市| 罗田县| 桦甸市| 阳山县| 古蔺县| 车致| 许昌市| 淄博市| 柳林县| 安多县| 介休市| 衡山县| 祁阳县| 洞头县| 三明市| 和平县| 贡觉县| 岳池县| 富蕴县| 双流县| 噶尔县| 溧水县| 化隆| 景宁| 白山市| 商河县| 镇宁| 仪陇县| 宁国市| 旬邑县| 滨海县| 双辽市| 五家渠市| 海盐县| 凭祥市| 江津市| 繁峙县| 桐庐县| 万宁市|