日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

自然語言處理或?qū)⒂瓉硇碌姆妒阶冞w

深度學習自然語言處理 ? 來源:李rumor ? 作者:車萬翔 ? 2022-12-08 16:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近幾天被OpenAI推出的ChatGPT[1]刷屏了,其影響已經(jīng)不僅局限于自然語言處理(NLP)圈,就連投資圈也開始蠢蠢欲動了,短短幾天ChatGPT的用戶數(shù)就超過了一百萬。通過眾多網(wǎng)友以及我個人對其測試的結(jié)果看,ChatGPT的效果可以用驚艷來形容,具體結(jié)果我在此就不贅述了。不同于GPT-3剛推出時人們的反應,對ChatGPT大家發(fā)出更多的是贊嘆之詞。聊天、問答、寫作、編程等等,樣樣精通。因此也有人驚呼,“通用人工智能(AGI)即將到來”、“Google等傳統(tǒng)搜索引擎即將被取代”,所以也對傳說中即將發(fā)布的GPT-4更加期待。

從技術(shù)角度講,ChatGPT還是基于大規(guī)模預訓練語言模型(GPT-3.5)強大的語言理解和生成的能力,并通過在人工標注和反饋的大規(guī)模數(shù)據(jù)上進行學習,從而讓預訓練語言模型能夠更好地理解人類的問題并給出更好的回復。這一點上和OpenAI于今年3月份推出的InstructGPT[2]是一致的,即通過引入人工標注和反饋,解決了自然語言生成結(jié)果不易評價的問題,從而就可以像玩兒游戲一樣,利用強化學習技術(shù),通過嘗試生成不同的結(jié)果并對結(jié)果進行評分,然后鼓勵評分高的策略、懲罰評分低的策略,最終獲得更好的模型。

不過說實話,我當時并不看好這一技術(shù)路線,因為這仍然需要大量的人工勞動,本質(zhì)上還是一種“人工”智能。不過ChatGPT通過持續(xù)投入大量的人力,把這條路走通了,從而更進一步驗證了那句話,“有多少人工,就有多少智能”。

不過,需要注意的是,ChatGPT以及一系列超大規(guī)模預訓練語言模型的成功將為自然語言處理帶來新的范式變遷,即從以BERT為代表的預訓練+精調(diào)(Fine-tuning)范式,轉(zhuǎn)換為以GPT-3為代表的預訓練+提示(Prompting)的范式[3]。所謂提示,指的是通過構(gòu)造自然語言提示符(Prompt),將下游任務轉(zhuǎn)化為預訓練階段的語言模型任務。例如,若想識別句子“我喜歡這部電影?!钡那楦袃A向性,可以在其后拼接提示符“它很 ”。如果預訓練模型預測空格處為“精彩”,則句子大概率為褒義。這樣做的好處是無需精調(diào)整個預訓練模型,就可以調(diào)動模型內(nèi)部的知識,完成“任意”的自然語言處理任務。當然,在ChatGPT出現(xiàn)之前,這種范式轉(zhuǎn)變的趨勢并不明顯,主要有兩個原因:

第一,GPT-3級別的大模型基本都掌握在大公司手里,因此學術(shù)界在進行預訓練+提示的研究時基本都使用規(guī)模相對比較小的預訓練模型。由于規(guī)模規(guī)模不夠大,因此預訓練+提示的效果并不比預訓練+精調(diào)的效果好。而只有當模型的規(guī)模足夠大后,才會涌現(xiàn)(Emerge)出“智能”[4]。最終,導致之前很多在小規(guī)模模型上得出的結(jié)論,在大規(guī)模模型下都未必適用了。

第二,如果僅利用預訓練+提示的方法,由于預訓練的語言模型任務和下游任務之間差異較大,導致這種方法除了擅長續(xù)寫文本這種預訓練任務外,對其他任務完成得并不好。因此,為了應對更多的任務,需要在下游任務上繼續(xù)預訓練(也可以叫預精調(diào)),而且現(xiàn)在的趨勢是在眾多的下游任務上預精調(diào)大模型,以應對多種、甚至未曾見過的新任務[5]。所以更準確地說,預訓練+預精調(diào)+提示將成為自然語言處理的新范式。

不同于傳統(tǒng)預訓練+精調(diào)范式,預訓練+預精調(diào)+提示范式將過去一個自然語言處理模型擅長處理一個具體任務的方式,轉(zhuǎn)換為了用一個模型處理多個任務,甚至未曾見過的通用任務的方式。所以從這個角度來講,通用人工智能也許真的即將到來了。這似乎也和我?guī)啄昵暗念A測相吻合,我當時曾預測,“結(jié)合自然語言處理歷次范式變遷的規(guī)律(圖1),2018年預訓練+精調(diào)的范式出現(xiàn)之后5年,即2023年自然語言處理也許將迎來新的范式變遷”。

30d6543e-76c4-11ed-8abf-dac502259ad0.jpg

那么,接下來如何進一步提升預訓練+預精調(diào)+提示新范式的能力,并在實際應用中將其落地呢?

首先,顯式地利用人工標注和反饋仍然費時費力,我們應該設法更自然地獲取并利用人類的反饋。也就是在實際應用場景中,獲取真實用戶的自然反饋,如其回復的語句、所做的行為等,并利用這些反饋信息提升系統(tǒng)的性能,我們將這種方式稱為交互式自然語言處理。不過用戶的交互式反饋相對稀疏,并且有些用戶會做出惡意的反饋,如何克服稀疏性以及避免惡意性反饋都將是亟待解決的問題。

其次,目前該范式生成的自然語言文本具有非常好的流暢性,但是經(jīng)常會出現(xiàn)事實性錯誤,也就是會一本正經(jīng)地胡說八道。當然,使用上面的交互式自然語言處理方法可以一定程度上解決此類問題,不過對于用戶都不知道答案的問題,他們是無法對結(jié)果進行反饋的。此時又回到了可解釋性差,這一深度學習模型的老問題上。如果能夠像寫論文時插入?yún)⒖嘉墨I一樣,在生成的結(jié)果中插入相關信息的出處,則會大大提高結(jié)果的可解釋性。

最后,該范式依賴超大規(guī)模預訓練語言模型,然而這些模型目前只掌握在少數(shù)的大公司手中,即便有個別開源的大模型,由于其過于龐大,小型公司或研究組也無法下載并使用它們。所以,在線調(diào)用是目前使用這些模型最主要的模式。在該模式下,如何針對不同用戶面對的不同任務,使用用戶私有的數(shù)據(jù)對模型進行進一步預精調(diào),并且不對公有的大模型造成影響,成為該范式實際應用落地所迫切需要解決的問題。此外,為了提高系統(tǒng)的運行速度,如何通過在線的大模型獲得離線的小模型,并且讓離線小模型保持大模型在某些任務上的能力,也成為模型能實際應用的一種解決方案。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1821

    文章

    50377

    瀏覽量

    267100
  • nlp
    nlp
    +關注

    關注

    1

    文章

    491

    瀏覽量

    23347

原文標題:哈工大車萬翔:自然語言處理范式正在變遷

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    [完結(jié)15章]Java轉(zhuǎn) AI高薪領域必備-從0到1打通生產(chǎn)級AI Agent開發(fā)

    數(shù)據(jù)的檢索增強生成(RAG)系統(tǒng)。這也是Java+AI轉(zhuǎn)型的技術(shù)深水區(qū)。 RAG絕非簡單的向量檢索,它是一項復雜的系統(tǒng)工程。Java工程師需要跨界理解自然語言處理(NLP)的基礎技術(shù)鏈路:從文檔解析的容錯
    發(fā)表于 04-30 13:46

    Vibe Coding AI全棧開發(fā)實戰(zhàn)

    “直覺編程”,它并非某種具體的編程語言框架,而是一種融合了AI輔助開發(fā)、直覺化編程和高效迭代的實戰(zhàn)思維方式。在這種模式下,開發(fā)者不再需要逐行編寫代碼,而是通過自然語言描述需求,A
    發(fā)表于 04-15 16:02

    自然語言處理NLP的概念和工作原理

    自然語言處理 (NLP) 是人工智能 (AI) 的一個分支,它會教計算機如何理解口頭和書面形式的人類語言自然語言處理將計算
    的頭像 發(fā)表于 01-29 14:01 ?628次閱讀
    <b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>NLP的概念和工作原理

    匯編語言的起源

    (opcode),比如加法指令就是00000011。編譯器的作用,就是高級語言寫好的程序,翻譯成一條條操作碼。 對于人類來說,二進制程序是不可讀的,根本看不出來機器干了什么。為了解決可讀性的問題,以及偶爾
    發(fā)表于 11-20 07:19

    Transformer如何讓自動駕駛變得更聰明?

    ]自動駕駛中常提的Transformer本質(zhì)上是一種神經(jīng)網(wǎng)絡結(jié)構(gòu),最早在自然語言處理里火起來。與卷積神經(jīng)網(wǎng)絡(CNN)循環(huán)神經(jīng)網(wǎng)絡(RNN)不同,Transformer能夠自動審視所有輸入信息,并動態(tài)判斷哪些部分更為關鍵,同時
    的頭像 發(fā)表于 11-19 18:17 ?2489次閱讀

    云知聲論文入選自然語言處理頂會EMNLP 2025

    近日,自然語言處理(NLP)領域國際權(quán)威會議 ——2025 年計算語言學與自然語言處理國際會議(EMNLP 2025)公布論文錄用結(jié)果,云知
    的頭像 發(fā)表于 11-10 17:30 ?918次閱讀
    云知聲論文入選<b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>頂會EMNLP 2025

    HarmonyOSAI編程自然語言代碼生成

    安裝CodeGenie后,在下方對話框內(nèi),輸入代碼需求描述,根據(jù)描述智能生成代碼,生成內(nèi)容可一鍵復制一鍵插入至編輯區(qū)當前光標位置。 提問示例 使用ArkTs語言寫一段代碼,在頁面中間部分
    發(fā)表于 09-05 16:58

    北斗生態(tài)環(huán)境監(jiān)測站:讀懂自然的 “語言

    北斗生態(tài)環(huán)境監(jiān)測站:讀懂自然的 “語言”柏峰【BF-BDQX】當生態(tài)監(jiān)測遇上北斗技術(shù),一場關于 “精準守護自然” 的變革正悄然發(fā)生 ——北斗生態(tài)環(huán)境監(jiān)測站以北斗定位導航系統(tǒng)為核心
    的頭像 發(fā)表于 09-04 10:59 ?655次閱讀
    北斗生態(tài)環(huán)境監(jiān)測站:讀懂<b class='flag-5'>自然</b>的 “<b class='flag-5'>語言</b>”

    HarmonyOSAI編程頁面生成

    支持通過自然語言對話,生成應用/元服務可用的頁面代碼,生成結(jié)果支持實時預覽,幫助開發(fā)者快速完成頁面搭建。 點擊頁面右側(cè)菜單欄CodeGenie圖標,完成登錄后在輸入框輸入\"/\"
    發(fā)表于 08-29 15:50

    【HZ-T536開發(fā)板免費體驗】5- 無需死記 Linux 命令!用 CangjieMagic 在 HZ-T536 開發(fā)板上搭建 MCP 服務器,自然語言輕松控板

    對應的 Linux 命令 API 調(diào)用; MCP服務器執(zhí)行指令,獲取HZ-T536開發(fā)板上的運行結(jié)果(如命令輸出、硬件狀態(tài)); MCP服務器結(jié)果返回給客戶端,以自然語言形式展示(如 “IP 地址為
    發(fā)表于 08-23 13:10

    高德與阿里云一起,開啟智慧出行新范式

    ,加速智能化場景落地。 技術(shù)融合:大模型賦能地圖交互升級 基于阿里云通義千問系列大模型領先的自然語言處理與多模態(tài)交互能力,MCP Server實現(xiàn)從文本指令到可視化地圖的精準轉(zhuǎn)化。用戶可通過自然語言生成個性化出行方案(如智能路徑
    的頭像 發(fā)表于 07-18 10:29 ?680次閱讀

    ArkUI介紹

    考慮: 開發(fā)效率: 聲明式開發(fā)范式更接近自然語義的編程方式,開發(fā)者可以直觀地描述UI,無需關心如何實現(xiàn)UI繪制和渲染,開發(fā)高效簡潔。 應用性能: 如下圖所示,兩種開發(fā)范式的UI后端引擎和語言
    發(fā)表于 06-24 06:41

    如何一個FA模型開發(fā)的聲明式范式應用切換到Stage模型

    模型切換概述 本文介紹如何一個FA模型開發(fā)的聲明式范式應用切換到Stage模型,您需要完成如下動作: 工程切換:新建一個Stage模型的應用工程。 配置文件切換:config.json切換
    發(fā)表于 06-04 06:22

    人工智能浪潮下,制造企業(yè)如何借力DeepSeek實現(xiàn)數(shù)字化轉(zhuǎn)型?

    DeepSeek,憑借其強大的深度學習和自然語言處理能力,能夠理解復雜問題并提供精準解決方案。它不僅能夠作為學習、工作、生活的助手,滿足用戶在不同場景下的需求,更能在制造業(yè)中發(fā)揮重要作用。通過自然語言交互,用戶無需學習復雜的操作
    的頭像 發(fā)表于 05-29 16:17 ?763次閱讀

    云知聲四篇論文入選自然語言處理頂會ACL 2025

    近日,第63屆國際計算語言學年會ACL 2025(Annual Meeting of the Association for Computational Linguistics,簡稱ACL)論文接收
    的頭像 發(fā)表于 05-26 14:15 ?1490次閱讀
    云知聲四篇論文入選<b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>頂會ACL 2025
    仙桃市| 长阳| 吉木乃县| 江门市| 醴陵市| 青铜峡市| 商南县| 桃江县| 泾川县| 贵港市| 仁布县| 永德县| 香河县| 措勤县| 高雄市| 吉安县| 青神县| 青冈县| 新化县| 陇南市| 宁蒗| 洞头县| 确山县| 陈巴尔虎旗| 宿州市| 富蕴县| 金华市| 罗源县| 贺兰县| 珠海市| 石屏县| 赤壁市| 正阳县| 习水县| 漳浦县| 海盐县| 磐安县| 枝江市| 灵宝市| 文成县| 英山县|