日韩老熟妇一二区,亚洲av麻豆,少妇自拍无码视频

在一篇新論文中，F(xiàn)rankle及其同事發(fā)現(xiàn)了潛伏在BERT中的此類子網(wǎng)，BERT是一種用于自然語言處理（NLP）的先進神經(jīng)網(wǎng)絡方法。作為人工智能的一個分支，NLP旨在通過預測文本生成或在線聊天機器人等應用程序來解密和分析人類語言。在計算方面，BERT體積龐大，通常需要大多數(shù)用戶無法獲得的超級計算能力。從而可能使更多用戶在智能手機上開發(fā)有效的NLP工具。

弗蘭克勒說：“我們正在達到必須使這些模型更精簡，更高效的地步?！彼a充說，這一進步有一天可能會“減少NLP的準入門檻”。

麻省理工學院計算機科學與人工智能實驗室的邁克爾·卡賓小組的博士生Frankle是該研究的共同作者，該研究將于下個月在神經(jīng)信息處理系統(tǒng)會議上發(fā)表。德克薩斯大學奧斯汀分校的陳天龍是該論文的主要作者，其中包括得克薩斯州A&M的合作者Wang Zhangyang Wang，以及所有MIT-IBM Watson AI Lab的常石宇，劉思佳和張揚。

您今天可能已經(jīng)與BERT網(wǎng)絡進行了互動。這是Google搜索引擎的基礎技術之一，自Google于2018年發(fā)布BERT以來，它一直引起研究人員的興奮。BERT是一種創(chuàng)建神經(jīng)網(wǎng)絡的方法-使用分層節(jié)點或“神經(jīng)元”的算法來學習執(zhí)行通過培訓大量實例來完成一項任務。

BERT是通過反復嘗試填寫寫作段落中遺漏的單詞來進行訓練的，它的功能在于此初始訓練數(shù)據(jù)集的龐大大小。然后，用戶可以將BERT的神經(jīng)網(wǎng)絡微調(diào)至特定任務，例如構建客戶服務聊天機器人。但是爭吵的BERT需要大量的處理能力。

弗蘭克爾說：“如今，標準的BERT模型-園林品種-具有3.4億個參數(shù)，”他補充說，這個數(shù)字可以達到10億。對如此龐大的網(wǎng)絡進行微調(diào)可能需要一臺超級計算機?！斑@簡直太貴了。這遠遠超出了您或我的計算能力?！?/p>

為了削減計算成本，Chen和他的同事試圖找出隱藏在BERT中的較小模型。他們通過迭代修剪整個BERT網(wǎng)絡的參數(shù)進行了實驗，然后將新子網(wǎng)的性能與原始BERT模型的性能進行了比較。他們對一系列NLP任務進行了此比較，從回答問題到填充句子中的空白詞。

責任編輯：lq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

神經(jīng)網(wǎng)絡

神經(jīng)網(wǎng)絡

+關注

關注
42

文章
4844

瀏覽量
108227
數(shù)據(jù)集

數(shù)據(jù)集

+關注

關注
4

文章
1240

瀏覽量
26270
自然語言處理

自然語言處理

+關注

關注
1

文章
630

瀏覽量
14747

日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

搜索歷史

BERT是一種用于自然語言處理的先進神經(jīng)網(wǎng)絡方法

評論