日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么要做AI研究器

深度學(xué)習(xí)自然語言處理 ? 來源:李rumor ? 2023-08-23 15:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

對于怎么實(shí)現(xiàn)AGI這個玄學(xué)的目標(biāo),感覺大家都是差不多的狀態(tài):咱也不知道怎么做,但就是覺得現(xiàn)在的LLM技術(shù)還遠(yuǎn)遠(yuǎn)不夠。

所以之前看到OpenAI說要用模型去做對齊研究[1],以及最近發(fā)話要4年內(nèi)做出SuperAlignment[2]時,我都是一臉問號,覺得沒什么新東西,get不到他們的思路。

為什么要做AI研究器

直到最近斷斷續(xù)續(xù)刷了兩遍Jan Leike的訪談,我突然有種悟了的感覺,原來核心思想就這么簡單。而且回過頭看,OpenAI近幾年其實(shí)就是在遵循這個思想,卻做出了看似「暴力」的一個個突破。

OpenAI所選擇的路徑就是:「Turn compute into alignment」,通過計算的量變產(chǎn)生智能的質(zhì)變。計算需要數(shù)據(jù)、算力、模型框架的共同作用,拆解成具體的步驟,則是自動化->規(guī)?;?>迭代。

以前我們總以「范式」這個詞來劃分NLP的發(fā)展,比如監(jiān)督學(xué)習(xí)->預(yù)訓(xùn)練+精調(diào)->預(yù)訓(xùn)練+RLHF。其實(shí)這些范式只是增加有效計算量的方法:

自動化:有監(jiān)督 -> 自監(jiān)督,擺脫人的依賴,更高效地獲取監(jiān)督信號

規(guī)模化:在更多的數(shù)據(jù)、更大的模型上進(jìn)行更多的計算

迭代:不斷基于新的case迭代模型,形成數(shù)據(jù)飛輪

自動化和規(guī)?;鶐淼馁|(zhì)變不用多說,GPT系列足以證明。但最后一步的「迭代」卻經(jīng)常被忽視,而這可能是通向Superalignment重要的一步,Alpha GO就是最好的栗子。它從最開始模仿人類棋手落子,到具備基本能力后不斷自我博弈,最終超越人類棋手。

那么問題來了:目前我們所做的「迭代」,不管是RLHF還是純SFT,仍舊需要人工提供監(jiān)督信號,無法做到自動化和規(guī)?;?,迭代速度就會很慢。同時人類也無法監(jiān)督超越自身水平的任務(wù),不可能訓(xùn)出超智能的模型。這就是為什么OpenAI從22年就開始說,要用AI來輔助人類進(jìn)行評估[3]。

繼續(xù)思考,如果有個模型可以給出等同人類水平的監(jiān)督信號,我們除了評估還可以用它干什么?當(dāng)然是順著量變產(chǎn)生質(zhì)變的思想,讓它自動化、規(guī)?;貛兔Φ鯝GI呀!

自動化:讓AI研究器自動規(guī)劃實(shí)驗(yàn)、提供監(jiān)督信號訓(xùn)練模型

規(guī)?;喊焉鲜鲎詣恿鞒虜U(kuò)展

迭代:AI研究器本身也是一個模型,讓它們雞生蛋蛋生雞,不斷互相訓(xùn)練

想到這里,OpenAI為什么要構(gòu)建「a roughly human-level automated alignment researcher」的思路就水到渠成了。不知道Jan Leike大佬的思考邏輯是怎樣的,反正我自己這么捋下來還挺順,歡迎討論。

如何做AI研究器

找到「AI研究器」這個啟動點(diǎn)之后,接下來就是怎么實(shí)現(xiàn)的問題了。相比于如何訓(xùn)練出這個模型,Jan大佬把主要的中心都放在了如何構(gòu)建自動化、全面化的評估上,其實(shí)跟上面的道理一樣,好的評估可以提供監(jiān)督反饋,從而指導(dǎo)模型的迭代方向。

首先,需要能驗(yàn)證模型可以達(dá)到人類水平。其實(shí)要真正評估出這個還是很難的,就像現(xiàn)在業(yè)內(nèi)這么多模型,沒人能給出一個真的排行榜一樣。而且最好是自動化的,避免人來提供ground truth,才能進(jìn)行更全面的評估。這里大佬提供了一個discriminator-critique gap的測量方法,比如我們做了一個編程模型,想利用ChatGPT自動評估他的效果,最簡單的做法是直接命令ChatGPT判斷某道編程題做的對不對。那問題就來了,我們怎么確定ChatGPT評估結(jié)果是否置信?都人工看一遍太浪費(fèi)時間了。自動化的做法是直接基于ChatGPT訓(xùn)練一個判斷變成結(jié)果是否正確的判別模型,然后我們專門用一些有l(wèi)abel的難樣本,去看判別模型的準(zhǔn)確率和ChatGPT的準(zhǔn)確率,如果差的不多,就說明不用訓(xùn)練也可以用它直接評估編程結(jié)果的好壞。

其次,自動化地進(jìn)行魯棒性檢測、可解釋性分析。為啥非要做可解釋性呢?

可以為我們指出解決問題的途徑

現(xiàn)有很多研究是在做知識和神經(jīng)元的關(guān)聯(lián)性,大佬認(rèn)為更有意義的是自動化、規(guī)模化地去做,從而探究更高維度(模型整體)的可解釋性

最后,故意訓(xùn)練不對齊的模型進(jìn)行對抗測試,驗(yàn)證評估方法的有效性。從而避免出現(xiàn)假對齊的情況。最極端的就是真訓(xùn)出了一個超級智能,他可能會想辦法備份自己的權(quán)重,逃脫人類控制,需要專門通過其他代理任務(wù)(比如讓模型去hack某臺機(jī)器)看一下這個程度有多難,評估系統(tǒng)能否檢測出來。

投入成本的考量

OpenAI未來4年內(nèi)將會在Superalignment上組建30-100人規(guī)模的團(tuán)隊,投入20%的算力。其實(shí)20%個人感覺主要是先表個決心,這個數(shù)量Jan大佬說已經(jīng)是對齊方向上最大的單筆投入了,做得好以后還會再加。

倒是4年這個規(guī)劃,說近不近說遠(yuǎn)不遠(yuǎn),還關(guān)乎于其他從業(yè)者要經(jīng)歷多久的紅利衰退期(狗頭),Jan給出了如下規(guī)劃:

2年內(nèi)搞清楚用什么技術(shù)實(shí)現(xiàn)AI對齊研究器,把問題拆的足夠細(xì),剩下就是工程問題了

3年內(nèi)實(shí)現(xiàn)AI對齊研究器

剩下一年探索超級對齊

這么一看時間還是挺緊的,后面兩個計劃略顯樂觀,Jan給出的信心是85%,而且表示有很多實(shí)驗(yàn)已經(jīng)在實(shí)驗(yàn)中了(至少從22年8月那個博文發(fā)出前就開始研究了)。他的信心主要來自于5方面:

語言模型的成功:LLM可以理解自然語言,讓我們可以向模型表達(dá)我們希望他們怎么做,操控起來更加容易

RLHF的效果超出預(yù)期:只用了很少的計算,甚至還沒嘗試收集數(shù)據(jù),就可以在小模型上得到比大模型更好的效果

在評估度量方面已經(jīng)取得了很多進(jìn)展,可以提供改進(jìn)的方向

評估比生成更簡單:如果人類只做評估,而不做生成,那么開發(fā)速度就會加快,還是自動化監(jiān)督信號的思想

對語言模型的信念:語言模型很適合做超級對齊,任何任務(wù)都可以表述為文本的輸入輸出,不管是做實(shí)驗(yàn)和理解結(jié)果都可以做

目前的技術(shù)還有用嗎

對于預(yù)訓(xùn)練,Jan Leike認(rèn)為預(yù)測下一個token這種方式并不一個長期目標(biāo),可能需要更好的任務(wù)。個人認(rèn)為互聯(lián)網(wǎng)上視頻、圖像、文字?jǐn)?shù)據(jù)遲早會被消耗殆盡,所以目前的預(yù)訓(xùn)練主要是提供一個較好的基模型,后續(xù)高質(zhì)量的監(jiān)督信號應(yīng)該會來源于模型本身,就像前文一直說的「自動化」。但這樣是否還能稱作「預(yù)訓(xùn)練」就不一定了。

對于RLHF,Jan Leike也持懷疑態(tài)度,因?yàn)槟壳暗谋O(jiān)督信號來源于人工評判,但人工并不擅長區(qū)分看起來都很好的答案,各種論文顯示人類之間的一致率有70%就不錯了,這個監(jiān)督信號本身自己都不一定對的齊。同時,需要人工就導(dǎo)致無法規(guī)?;瘮U(kuò)展,也不符合我們增加計算量的需求。

目前預(yù)訓(xùn)練+RLHF的范式大概率也只是AI發(fā)展中的一個版本,按照OpenAI的AI研究器思路,后續(xù)模型訓(xùn)練的系統(tǒng)復(fù)雜度可能會提升很多,估計會有N多個擅長不同任務(wù)的AI研究器來訓(xùn)一個模型,人工只需要提供少量監(jiān)督信號,告訴系統(tǒng)要做什么,就可以讓他們自動運(yùn)轉(zhuǎn),訓(xùn)完了自動同步權(quán)重,不斷升級。

總結(jié)

整個Jan Leike的采訪看下來,真的收獲頗豐,不知道有沒有清晰地表達(dá)出來,其實(shí)就是:

計算是核心,計算的量變產(chǎn)生智能的質(zhì)變

加速有效計算量的方法是:自動化->規(guī)?;?>迭代

就像人類百萬年來,從石器時代進(jìn)化到現(xiàn)在的信息時代,科技的進(jìn)步不是一蹴而就,而是螺旋上升,由幾代人的智慧凝結(jié)而成。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41326

    瀏覽量

    302731
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3831

    瀏覽量

    52289
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23347
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1252

    瀏覽量

    10296

原文標(biāo)題:總結(jié)

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    當(dāng)我們談AI時 我們要做什么?

    這樣高度重合,在過去的幾年里,AI技術(shù)的創(chuàng)新速度驚人,小規(guī)模的企業(yè)也以前所未有的速度成長。 有研究機(jī)構(gòu)斷言,定制AI芯片、IoT與AI在邊緣計算的融合、神經(jīng)網(wǎng)絡(luò)的互操作性、自動化機(jī)器學(xué)
    發(fā)表于 01-15 15:03 ?2470次閱讀

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能在科學(xué)研究中的核心技術(shù),包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復(fù)雜的數(shù)據(jù)集,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和規(guī)律。 2. 高性能
    發(fā)表于 10-14 09:16

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    人們對AI for Science的關(guān)注推向了高潮。 2. 跨學(xué)科融合與科學(xué)研究新范式 AI與生命科學(xué)的結(jié)合,不僅推動了生命科學(xué)本身的進(jìn)步,還促進(jìn)了多個學(xué)科之間的交叉融合。這種跨學(xué)科的合作模式,打破
    發(fā)表于 10-14 09:21

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    、集成芯片、分子器件與分子憶阻,以及打印類腦芯片等。 第五章至第八章分別探討用化學(xué)或生物方法實(shí)現(xiàn)AIAI在科學(xué)發(fā)現(xiàn)中創(chuàng)新應(yīng)用、實(shí)現(xiàn)神經(jīng)形態(tài)計算與類腦芯片的創(chuàng)新方法,以及具身智能芯片。 第九章
    發(fā)表于 09-05 15:10

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    生物化學(xué)計算機(jī),它通過離子、分子間的相互作用來進(jìn)行復(fù)雜的并行計算。因而未來可期的前景是AI硬件將走向AI濕件。 根據(jù)研究,估算出大腦的功率是20W,在進(jìn)行智力活動時,其功率會增大到25~50W。在大腦進(jìn)化
    發(fā)表于 09-06 19:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    和關(guān)聯(lián)性 AI驅(qū)動科學(xué):研究和模擬人類思維和認(rèn)識過程。 本章節(jié)作者為我們講解了第五范式,介紹了科學(xué)發(fā)現(xiàn)的一般方法和流程等。一、科學(xué)發(fā)現(xiàn)的5個范式 第一范式:產(chǎn)生于公元1000年左右的阿拉伯世界和歐洲
    發(fā)表于 09-17 11:45

    基于CPLD的SPI控制研究與實(shí)現(xiàn)

    要做基于CPLD的SPI控制研究與實(shí)現(xiàn),有沒有會的人,求教,有什么資料推薦點(diǎn)也行
    發(fā)表于 04-27 14:37

    要做一套水質(zhì)監(jiān)測系統(tǒng),想請問一下各位大神有研究得能提供一下方案不

    現(xiàn)在想要做一套水質(zhì)監(jiān)測系統(tǒng),系統(tǒng)的實(shí)現(xiàn),關(guān)于傳感的選型,想要請教一下各位大神,請大家有研究的分享一下,謝謝
    發(fā)表于 04-08 17:03

    AI研究所:指甲上有問題,去醫(yī)院該掛什么科?

    科學(xué)研究,智能算法能挖掘變量相關(guān)性,激發(fā)論文思路,同時提供針對臨床科研的專業(yè)統(tǒng)計分析支持。3 診后可以讓AI在檢查和就診后,評估愈后狀況,甚至給出建議。同時這些數(shù)據(jù)也可以更好的用于科研,給醫(yī)生提供這樣的科研
    發(fā)表于 08-07 09:17

    【免費(fèi)直播】讓AI芯片擁有最強(qiáng)大腦—AI芯片的操作系統(tǒng)設(shè)計介紹.

    、深度學(xué)習(xí)推斷處理(DPU)運(yùn)行時設(shè)計介紹3、如何加速優(yōu)化,提高系統(tǒng)并行執(zhí)行效率1、AI芯片中的操作系統(tǒng)管理原則2、操作系統(tǒng)運(yùn)行時設(shè)計準(zhǔn)則3、多核多線程加速計算效率方法主講老師:陳小柏,男,中山大學(xué)
    發(fā)表于 11-07 14:18

    【HarmonyOS HiSpark AI Camera】基于HiSpark AI Camera HarmonyOS 智能巡檢機(jī)器人開發(fā)

    Camera HarmonyOS 鴻蒙OS開發(fā)板首先介紹一下,我叫abner,本科湖北工業(yè)大學(xué),碩士在合肥工業(yè)大學(xué),參與導(dǎo)師國家級重大科研項(xiàng)目?,F(xiàn)在供職于上海**智能科技有限公司,現(xiàn)在項(xiàng)目主要做AI賦能toB
    發(fā)表于 11-18 18:15

    AI是什么呢?AI應(yīng)用又會給人們帶來哪些改變

    Intelligence的縮寫,即人工智能。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。AI研究工作已取得驚人進(jìn)展,經(jīng)過學(xué)習(xí)后,機(jī)器在操作某些環(huán)節(jié)時比人類更快、更精
    發(fā)表于 12-20 06:42

    Ai 部署的臨界考慮電子指南

    雖然GPU解決方案對訓(xùn)練,AI部署需要更多。 預(yù)計到2020年代中期,人工智能行業(yè)將增長到200億美元,其中大部分增長是人工智能推理。英特爾Xeon可擴(kuò)展處理約占運(yùn)行AI推理的處理
    發(fā)表于 08-04 07:25

    依圖率先入局,AI算法獨(dú)角獸為什么要做芯片?

    依圖率先入局,AI算法獨(dú)角獸為什么要做芯片視覺四小龍之一的依圖科技推出云端視覺推理AI芯片“求索”,以及基于該芯片構(gòu)建的服務(wù)產(chǎn)品和行業(yè)解決方案。依圖成立于2012年,已經(jīng)完成6輪融資
    發(fā)表于 07-02 17:14 ?1112次閱讀

    AI ready是什么?文明的發(fā)展需要做好準(zhǔn)備

    接入”那么簡單,還需要做好“AI ready”。 AI ready及其重要性 AI ready這個概念最早是由飛書提出的,在去年11月末的飛書7發(fā)布會上,飛書CEO謝欣提到:“在
    的頭像 發(fā)表于 01-17 10:19 ?1675次閱讀
    <b class='flag-5'>AI</b> ready是什么?文明的發(fā)展需<b class='flag-5'>要做</b>好準(zhǔn)備
    林州市| 潍坊市| 吴川市| 桐梓县| 淅川县| 普格县| 蕉岭县| 嘉祥县| 洮南市| 洛宁县| 绿春县| 元谋县| 深圳市| 梧州市| 道孚县| 陕西省| 水城县| 菏泽市| 建瓯市| 宁陵县| 星子县| 乐亭县| 安远县| 嘉定区| 关岭| 密云县| 高碑店市| 阜南县| 阜新| 金溪县| 台东县| 台北县| 扶绥县| 岳阳市| 建宁县| 同仁县| 青冈县| 阿拉善左旗| 金乡县| 平顶山市| 石台县|