日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NLP的兩個(gè)部分:NLU和NLG

GKwL_infoqchina ? 來(lái)源:InfoQ ? 2019-12-12 14:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

比爾·蓋茨曾說(shuō)過(guò),「語(yǔ)言理解是人工智能皇冠上的明珠」。自然語(yǔ)言處理的進(jìn)步將會(huì)推動(dòng)人工智能整體進(jìn)展。NLP 的歷史幾乎跟計(jì)算機(jī)和人工智能的歷史一樣長(zhǎng)。自計(jì)算機(jī)誕生,就開始有了對(duì)人工智能的研究,而人工智能領(lǐng)域最早的研究就是機(jī)器翻譯以及自然語(yǔ)言理解。

隨著大數(shù)據(jù)和技術(shù)設(shè)施的完善,人工智能技術(shù)在近年來(lái)迎來(lái)了井噴式的發(fā)展。在產(chǎn)業(yè)方面,不少專注于計(jì)算機(jī)視覺的公司也獲得了長(zhǎng)足發(fā)展。其中比較具有代表性的是估值已經(jīng)超過(guò) 20 億美元的商湯科技,在經(jīng)歷了數(shù)輪大額融資之后,其隱隱有從獨(dú)角獸變成巨頭的趨勢(shì)。

不過(guò),人工智能另一個(gè)相關(guān)領(lǐng)域自然語(yǔ)言處理似乎沒(méi)有達(dá)到這種高度。在技術(shù)方面,這一領(lǐng)域的技術(shù)準(zhǔn)確率遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到計(jì)算機(jī)視覺和語(yǔ)音識(shí)別的水平,技術(shù)產(chǎn)品也因?yàn)檩^高的錯(cuò)誤率,缺少實(shí)際價(jià)值。那么 NLP 技術(shù)到底有哪些難點(diǎn)呢?

什么是 NLP?

在人工智能出現(xiàn)之前,計(jì)算機(jī)只能處理結(jié)構(gòu)化的數(shù)據(jù),就比如我們平時(shí)用的表格里的數(shù)據(jù),但是網(wǎng)絡(luò)中大部分的數(shù)據(jù)都是非結(jié)構(gòu)化的,比如我們看到的文章、圖片、視頻等等。在這些數(shù)據(jù)中,文本數(shù)據(jù)又往往是最多的,為了能夠分析和利用這些文本信息,我們就需要利用 NLP 技術(shù),讓機(jī)器理解這些文本信息,并加以利用。

人類可以通過(guò)語(yǔ)言來(lái)交流,而為了讓計(jì)算機(jī)之間互相交流,人們讓所有計(jì)算機(jī)都遵守一些規(guī)則,計(jì)算機(jī)的這些規(guī)則就是計(jì)算機(jī)之間的語(yǔ)言。自然語(yǔ)言處理(NLP)就是在機(jī)器語(yǔ)言和人類語(yǔ)言之間溝通的橋梁,以實(shí)現(xiàn)人機(jī)交流的目的。

NLP 的兩個(gè)部分:NLU 和 NLG

自然語(yǔ)言理解(NLU) 則是 NLP 的一部分,這幾年深度學(xué)習(xí)技術(shù)的發(fā)展使 NLU 能在一些場(chǎng)景中落地。自然語(yǔ)言理解就是希望機(jī)器像人一樣,具備正常人的語(yǔ)言理解能力,由于自然語(yǔ)言在理解上有很多難點(diǎn) (下面詳細(xì)說(shuō)明),所以 NLU 是至今還遠(yuǎn)不如人類的表現(xiàn)。

NLU 目前應(yīng)用的領(lǐng)域主要集中在機(jī)器翻譯、機(jī)器客服、智能音箱等領(lǐng)域,但由于需要大量的數(shù)據(jù)訓(xùn)練和 NLU 本身存在的一些語(yǔ)言語(yǔ)義上的難點(diǎn),其實(shí)機(jī)器還不是非常智能。

自然語(yǔ)言生成(NLG)是 NLP 的重要組成部分,NLU 負(fù)責(zé)理解內(nèi)容,NLG 負(fù)責(zé)生成內(nèi)容。他的主要目的是降低人類和機(jī)器之間的溝通鴻溝,將非語(yǔ)言格式的數(shù)據(jù)轉(zhuǎn)換成人類可以理解的語(yǔ)言格式。

自然語(yǔ)言生成 – NLG 有 2 種方式:

text – to – text:文本到語(yǔ)言的生成

data – to – text :數(shù)據(jù)到語(yǔ)言的生成

NLP 的難點(diǎn)

對(duì)于機(jī)器來(lái)說(shuō),難點(diǎn)主要分為 5 類問(wèn)題:

語(yǔ)言的多樣性,我們?nèi)粘K玫恼Z(yǔ)言是沒(méi)有規(guī)律的,不同的組合可以表達(dá)出很多的含義。

語(yǔ)言的歧義性,如果不聯(lián)系上下文,缺少環(huán)境的約束,語(yǔ)言有很大的歧義性

語(yǔ)言是一個(gè)開放集合,我們可以任意的發(fā)明創(chuàng)造一些新的表達(dá)方式。

語(yǔ)言需要知識(shí)依賴,需要聯(lián)系到實(shí)踐知識(shí)。

語(yǔ)言的上下文

應(yīng)用場(chǎng)景復(fù)雜,很難出現(xiàn)“獨(dú)角獸”

總的來(lái)說(shuō),NLP 技術(shù)領(lǐng)域之所以沒(méi)有出現(xiàn)如計(jì)算機(jī)視覺領(lǐng)域那些獨(dú)角獸公司,是因?yàn)樽匀徽Z(yǔ)言處理的技術(shù)難度太大,和應(yīng)用場(chǎng)景太復(fù)雜。一個(gè)公司的成立發(fā)展都是由需求驅(qū)動(dòng)的,自然語(yǔ)言應(yīng)用主要是機(jī)器翻譯,雖然機(jī)器翻譯的需求長(zhǎng)期存在,但機(jī)器翻譯的水平一直未取得突破性的進(jìn)展,即使到今天,機(jī)器也很難翻譯有背景的復(fù)雜句子。

另外,自然語(yǔ)言處理的應(yīng)用太依賴于UI了。圖像識(shí)別基本不需要 UI,直接在系統(tǒng)內(nèi)部集成一些技術(shù)就行。一些公司做翻譯軟件,如果UI做得不行,用戶體驗(yàn)不行,人們就不會(huì)愿意使用。

技術(shù)產(chǎn)業(yè)化最重要的是商業(yè)模式,也就是怎么讓技術(shù)掙錢。圖像識(shí)別公司的掙錢模式已經(jīng)成立了,但翻譯付費(fèi)就難多了。所以自然語(yǔ)言是從研究到技術(shù)到落地到商業(yè)化,面臨一系列的挑戰(zhàn)。目前的現(xiàn)狀是,自然語(yǔ)言處理技術(shù)更多的是作為公司內(nèi)部技術(shù),比如內(nèi)部的商業(yè)情報(bào)或人機(jī)接口功能。

NLP 技術(shù)發(fā)展,未來(lái)可期

從今年的 ACL 大會(huì)可以看出 NLP 技術(shù)的火爆。會(huì)議共收到了 2900 余篇提交的論文,投稿規(guī)模相較于 2018 年增長(zhǎng)了 75%!自然語(yǔ)言處理領(lǐng)域?qū)嵲谑侵耸挚蔁?,學(xué)術(shù)界和工業(yè)界的熱情都創(chuàng)下了歷史新高。

從商業(yè)層面來(lái)講也涌現(xiàn)出了微軟小冰、小米小愛等比較成熟的機(jī)器人產(chǎn)品,相信在未來(lái)的不久 NLP 技術(shù)一定會(huì)給我們帶來(lái)更多的驚喜。

大咖現(xiàn)場(chǎng)分享 NLP 技術(shù)干貨

王斌博士,是小米人工智能實(shí)驗(yàn)室主任,NLP 首席科學(xué)家。中國(guó)中文信息學(xué)會(huì)理事,計(jì)算語(yǔ)言學(xué)、信息檢索、社會(huì)媒體處理、語(yǔ)言與知識(shí)計(jì)算等專委會(huì)委員及《中文信息學(xué)報(bào)》編委,中國(guó)計(jì)算機(jī)學(xué)會(huì)中文信息處理專業(yè)委員會(huì)委員。

加入小米之前,他在中科院計(jì)算所、信工所從事自然語(yǔ)言處理和信息檢索相關(guān)的科研工作。在AICon 全球人工智能與機(jī)器學(xué)習(xí)大會(huì)現(xiàn)場(chǎng),他將會(huì)帶來(lái) NLP 技術(shù)方面的相關(guān)演講,各位感興趣的小伙伴歡迎來(lái)現(xiàn)場(chǎng)聽他分享。

AICon 全球人工智能與機(jī)器學(xué)習(xí)技術(shù)大會(huì),將于 11 月 21-22 日在北京國(guó)際會(huì)議中心舉行。顏水成、賈揚(yáng)清、崔寶秋等 AI 技術(shù)大咖屆時(shí)也會(huì)來(lái)現(xiàn)場(chǎng),跟大家聊一聊今年在 AI 商業(yè)化場(chǎng)景落地的大背景下,又涌現(xiàn)出了哪些新技術(shù)。本次大會(huì)我們?cè)O(shè)立了機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、NLP、AI芯片、搜索推薦、產(chǎn)業(yè)互聯(lián)網(wǎng)、硅谷 AI 技術(shù)實(shí)踐等 13+ 技術(shù)專場(chǎng),細(xì)分到 AI 技術(shù)的各個(gè)領(lǐng)域,為大家全方位的展示 AI 技術(shù)在國(guó)內(nèi)目前發(fā)展的現(xiàn)狀。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50396

    瀏覽量

    267216
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1716

    瀏覽量

    47744
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23347

原文標(biāo)題:為何NLP領(lǐng)域難以出現(xiàn)“獨(dú)角獸”?丨AICon

文章出處:【微信號(hào):infoqchina,微信公眾號(hào):InfoQ】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    是否可以通過(guò)基于UART的DMA在兩個(gè)外部SRAM之間發(fā)送和接收數(shù)據(jù)?

    兩個(gè)MPC5777C微控制器通過(guò)外部總線接口連接到兩個(gè)外部SRAM。是否可以通過(guò)基于UART的DMA在兩個(gè)外部SRAM之間發(fā)送和接收數(shù)據(jù)?
    發(fā)表于 04-06 07:38

    圖像上兩個(gè)多邊形的ROI區(qū)域,如何獲得這兩個(gè)ROI區(qū)域重合部分的ROI

    labview中,圖像上兩個(gè)多邊形的ROI區(qū)域,如何獲得這兩個(gè)ROI區(qū)域重合部分的ROI
    發(fā)表于 03-16 14:03

    兩個(gè)RS485(Modbus RTU)主站與主站之間如何通訊

    本產(chǎn)品能很好解決Master-1主站向模塊寫入數(shù)據(jù),Master-2主站讀取數(shù)據(jù);Master-2主站向模塊寫入數(shù)據(jù),Master-1主站讀取數(shù)據(jù)。由此解決兩個(gè)主站之間的互相讀通信難題。
    的頭像 發(fā)表于 02-08 15:32 ?946次閱讀
    <b class='flag-5'>兩個(gè)</b>RS485(Modbus RTU)主站與主站之間如何通訊

    兩個(gè)RS485-Modbus主站如何通訊

    本產(chǎn)品能很好解決Master-1主站向模塊寫入數(shù)據(jù),Master-2主站讀取數(shù)據(jù);Master-2主站向模塊寫入數(shù)據(jù),Master-1主站讀取數(shù)據(jù)。由此解決兩個(gè)主站之間的互相讀通信難題。
    發(fā)表于 02-08 15:32 ?0次下載

    使用博圖(TIA Portal)監(jiān)控PROFINET從站通訊狀態(tài)的兩個(gè)方法

    如何使用博圖監(jiān)控Profinet從站通訊狀態(tài),這里有兩個(gè)方法供你選擇。 方法一 | 使用DeviceStates指令 創(chuàng)建全局?jǐn)?shù)據(jù)塊 在博圖項(xiàng)目中,創(chuàng)建一個(gè)全局?jǐn)?shù)據(jù)塊(DB),用于存儲(chǔ)從站狀態(tài)信息
    的頭像 發(fā)表于 01-17 11:21 ?1586次閱讀
    使用博圖(TIA Portal)監(jiān)控PROFINET從站通訊狀態(tài)的<b class='flag-5'>兩個(gè)</b>方法

    曙光存儲(chǔ)連續(xù)斬獲兩個(gè)行業(yè)獎(jiǎng)項(xiàng)

    近期,曙光存儲(chǔ)連續(xù)斬獲兩個(gè)行業(yè)獎(jiǎng)項(xiàng),自研技術(shù)產(chǎn)品在國(guó)產(chǎn)突破、AI行業(yè)應(yīng)用等方面的成果獲得廣泛關(guān)注。
    的頭像 發(fā)表于 01-15 16:28 ?2750次閱讀

    一文讀懂:直線模組兩個(gè)滑塊距離能否調(diào)節(jié)?

    關(guān)鍵問(wèn)題:直線模組中的兩個(gè)滑塊距離可以調(diào)節(jié)嗎?答案并非絕對(duì),而是要根據(jù)直線模組的具體類型、結(jié)構(gòu)設(shè)計(jì)來(lái)綜合判斷,不同類型的直線模組在滑塊距離調(diào)節(jié)上有著截然不同的特性。?飛
    的頭像 發(fā)表于 12-29 15:47 ?480次閱讀
    一文讀懂:直線模組<b class='flag-5'>兩個(gè)</b>滑塊距離能否調(diào)節(jié)?

    FreeRtos 能否同時(shí)使用兩個(gè) CPU?

    的情況下,CM0 更愿意專門用于管理外設(shè)。 - 是否有在 CM0 和 CM4 中同時(shí)運(yùn)行代碼的簡(jiǎn)單示例或教程? - FreeRtos 能否同時(shí)使用兩個(gè) CPU?
    發(fā)表于 11-11 08:28

    個(gè)硬件SPI兩個(gè)CS操作兩個(gè)norflash,怎么互斥操作兩個(gè)norflash?

    個(gè)硬件SPI兩個(gè)CS操作兩個(gè)norflash,怎么互斥操作兩個(gè)norflash,有一個(gè)norflash被模擬成U盤,會(huì)在中斷中操作spi。
    發(fā)表于 09-26 06:18

    基本半導(dǎo)體連獲兩個(gè)行業(yè)獎(jiǎng)項(xiàng)

    近日,基本半導(dǎo)體憑借在碳化硅模塊領(lǐng)域的突出表現(xiàn),連獲“國(guó)產(chǎn)SiC模塊TOP企業(yè)獎(jiǎng)”和“年度優(yōu)秀功率器件產(chǎn)品獎(jiǎng)”兩個(gè)行業(yè)獎(jiǎng)項(xiàng)。
    的頭像 發(fā)表于 09-05 16:31 ?1257次閱讀

    如何使用 SPI 全雙工在兩個(gè) 5LP MPU 之間連接 RAM?

    我需要將兩個(gè) 5LP MPU 連接在一起以鏡像兩個(gè) 5LP MPU 內(nèi)的 RAM。 我認(rèn)為這將是 DMA 的一個(gè)功能,但我不確定如何實(shí)現(xiàn)該功能。 我的主 SPI 單元將向從屬 MPU 發(fā)送一個(gè)
    發(fā)表于 07-15 06:20

    圖中兩個(gè)按鍵開關(guān)是兩個(gè)干簧管,為什么不直接對(duì)GND設(shè)計(jì)來(lái)檢測(cè)這個(gè)干簧管通斷呢?

    圖中兩個(gè)按鍵開關(guān)是兩個(gè)干簧管,為什么不直接對(duì)GND設(shè)計(jì)來(lái)檢測(cè)這個(gè)干簧管通斷呢? 這樣設(shè)計(jì)的原理是什么?
    發(fā)表于 06-17 06:30

    看到STM8L152用兩個(gè)IO用兩個(gè)或非門檢測(cè)兩個(gè)通斷,是什么原理呢?

    圖中兩個(gè)按鍵開關(guān)是兩個(gè)干簧管,為什么不直接對(duì)GND設(shè)計(jì)來(lái)檢測(cè)這個(gè)干簧管通斷呢? 這樣設(shè)計(jì)的原理是什么?
    發(fā)表于 06-12 06:25

    用于四頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,帶兩個(gè) Rx 交換機(jī)端口和雙頻 TD-SCDMA skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于四頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,帶兩個(gè) Rx 交換機(jī)端口和雙頻 TD-SCDMA相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有用于四頻 GSM
    發(fā)表于 05-29 18:31
    用于四頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,帶<b class='flag-5'>兩個(gè)</b> Rx 交換機(jī)端口和雙頻 TD-SCDMA skyworksinc

    ADAU1787四個(gè)ADC、兩個(gè)DAC、帶音頻DSP的低功耗編解碼器技術(shù)手冊(cè)

    ADAU1787 是一款具有四個(gè)輸入和兩個(gè)輸出的編解碼器,其中整合了兩個(gè)數(shù)字信號(hào)處理器 (DSP)。從模擬輸入到 DSP 內(nèi)核再到模擬輸出的路徑已針對(duì)低延遲進(jìn)行優(yōu)化,適用于噪聲消除耳機(jī)。通過(guò)加入少量無(wú)源組件,ADAU1787 提
    的頭像 發(fā)表于 05-12 14:57 ?1796次閱讀
    ADAU1787四<b class='flag-5'>個(gè)</b>ADC、<b class='flag-5'>兩個(gè)</b>DAC、帶音頻DSP的低功耗編解碼器技術(shù)手冊(cè)
    东乡族自治县| 孟连| 三江| 太谷县| 垦利县| 寿宁县| 乐都县| 无棣县| 贺州市| 繁峙县| 栾川县| 施秉县| 西乡县| 文山县| 张家港市| 拉孜县| 白朗县| 南安市| 利川市| 铁力市| 交口县| 博爱县| 德清县| 颍上县| 康定县| 大名县| 丰城市| 古蔺县| 黄浦区| 洞头县| 资溪县| 嘉禾县| 宾阳县| 广西| 沙河市| 武安市| 玉溪市| 乐陵市| 旺苍县| 英山县| 井冈山市|