日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

口語語言理解在任務(wù)型對話系統(tǒng)中的探討

深度學(xué)習(xí)自然語言處理 ? 來源:哈工大SCIR ? 作者:滕德川 ? 2021-03-31 17:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1.1 研究背景與任務(wù)定義

口語語言理解在任務(wù)型對話系統(tǒng)中扮演了一個(gè)非常重要的角色,其目的是識別出用戶的輸入文本中蘊(yùn)含的意圖和提及到的槽位,一般被分為意圖識別和槽位填充兩個(gè)子任務(wù)[1]。以句子“use netflix to play music”為例,意圖識別將整個(gè)句子的意圖分類為播放音樂(PlayMusic),槽位填充為句子中的每個(gè)單詞賦予不同的槽位標(biāo)簽(即,O, B-service,O,O,O)。從任務(wù)類型來區(qū)分,意圖識別屬于句子分類任務(wù),槽位填充可以被建模成序列標(biāo)注任務(wù)。 與英文口語語言理解相比,中文口語語言理解面臨了一個(gè)獨(dú)特的挑戰(zhàn):在完成任務(wù)之前需要進(jìn)行詞語切分。盡管事先做了分詞,不完美的分詞系統(tǒng)仍然會錯誤識別槽位的邊界,隨即預(yù)測了錯誤的槽位類別,使得模型的性能遭受來自分詞系統(tǒng)的錯誤級聯(lián)。

c21a09d8-8e8e-11eb-8b86-12bb97331649.png

圖1 中文口語語言理解示例

1.2 研究動機(jī)

為了避免來自分詞系統(tǒng)的錯誤級聯(lián),Liu等人[2]提出了一個(gè)基于字符的聯(lián)合模型完成中文口語語言理解,達(dá)到了當(dāng)時(shí)最好的效果。

然而,直觀上,中文詞語信息的引入有助于對中文文本的理解,進(jìn)而正確完成意圖識別和槽位填充任務(wù)。

以圖1為例,正確的中文分詞為"周冬雨 / 有 / 哪些 / 電影"。如果不引入這種分詞信息作為補(bǔ)充,可能會給"周"賦予Datetime_date槽位標(biāo)記,將"冬雨"看作Datetime_time。而有了類似于"周冬雨"這樣詞語的幫助,檢測正確的槽位標(biāo)簽Artist會變得異常容易。

除此之外,由于口語語言理解由兩個(gè)類型不同又相互關(guān)聯(lián)的任務(wù)組成,利用任務(wù)間的交互可以對在兩個(gè)任務(wù)間建模細(xì)粒度的詞語信息遷移起到重要的幫助。

所以,在考慮任務(wù)特性的同時(shí)引入詞語信息是很有必要的。

因此,接下來的問題是:是否可以在避免分詞系統(tǒng)錯誤級聯(lián)、考慮口語語言理解任務(wù)特性的同時(shí),引入中文詞語信息增強(qiáng)中文意圖識別和槽位填充。

為了解決此問題,我們提出了簡單而有效的Multi-LevelWordAdapter (MLWA)模型引入中文詞語信息,對意圖識別和槽位填充進(jìn)行聯(lián)合建模。其中,1) sentence-level word adapter 直接融合詞級別和字級別的句子表示實(shí)現(xiàn)對意圖的識別;2) character-level word adapter 針對輸入文本中的每個(gè)字動態(tài)地確定不同字特征和不同詞特征之間的融合比例,進(jìn)而得出該字的槽位標(biāo)簽,以達(dá)到對詞語知識的細(xì)粒度組合這一目的。另外,word adapter可以作為一個(gè)依附于輸出層的插件被應(yīng)用于各種基于字符的中文口語語言理解模型,其無需改變原始模型其他分量的特性帶來了更多的應(yīng)用靈活性。

2. 模型

2.1 整體框架

模型以一個(gè)普通的基于字符的模型(圖2 (a))為基礎(chǔ),附以multi-level word adapter模塊(圖2 (b))針對意圖識別和槽位填充分別引入并捕獲句子級和字符級詞語信息。

c2cdea34-8e8e-11eb-8b86-12bb97331649.png

圖2 Multi-Level Word Adapter 整體框架

2.2 Vanilla Character-based Model

Char-Channel Encoder

自注意力編碼器(Self-Attentive Encoder)[3]由抽取序列上下文信息的自注意力模塊[4]和捕獲序列信息的雙向LSTM[5]組成。其接收中文字輸入序列 = ,獲得BiLSTM和self-attention的輸出后,連接兩者輸出字符編碼表示序列 = 。

Intent Detection and Slot Filling

意圖識別和槽位填充均以自注意力編碼器的輸出為基礎(chǔ),進(jìn)行進(jìn)一步的編碼,即兩者共享底層表示信息。其中,意圖識別模塊利用一個(gè)MLP Attention模塊獲得整個(gè)字序列的綜合表示向量 ,進(jìn)而完成對意圖的分類(意圖標(biāo)簽集表示為 ):

c32b106a-8e8e-11eb-8b86-12bb97331649.png

c3973858-8e8e-11eb-8b86-12bb97331649.png

槽位填充應(yīng)用一個(gè)單向LSTM作為解碼器,在每個(gè)解碼時(shí)間步 ,其接收每個(gè)字表示 ,意圖標(biāo)簽編碼 ,來自上一個(gè)時(shí)間步解碼的槽位標(biāo)簽編碼 ,輸出解碼器隱層向量 ,進(jìn)而計(jì)算得到第 個(gè)字 的槽位標(biāo)簽(槽位標(biāo)簽集表示為 ):

c3d0bca4-8e8e-11eb-8b86-12bb97331649.png

c41caac4-8e8e-11eb-8b86-12bb97331649.png

2.3 Multi-Level Word Adapter

Word-Channel Encoder

在我們的框架中,單詞通道編碼器獨(dú)立于字符通道編碼器,也就是說,如何編碼單詞信息,編碼何種單詞信息都是自由的,在這里以使用外部中文分詞系統(tǒng)(CWS)為例。對字序列 進(jìn)行分詞可以得到單詞序列 = 。與字符通道編碼器相同,單詞通道編碼器利用另一個(gè)自注意力編碼器生成單詞編碼表示序列 = 。

Word Adapter

word adapter 是一個(gè)簡單的神經(jīng)網(wǎng)絡(luò),可以適應(yīng)性地融合不同的字特征的詞語特征,圖2 (c)顯示了其內(nèi)部結(jié)構(gòu)。給定輸入字符向量 和詞語向量 ,word adapter可以計(jì)算兩者之間的權(quán)重比例,進(jìn)而加權(quán)求和得到融合后的特征向量:

c4570cd2-8e8e-11eb-8b86-12bb97331649.png

Sentence-Level Word Adapter

給定字符序列和單詞序列的上下文表示序列 和 ,可以通過上文的MLP Attention模塊獲得兩種序列的綜合表示向量 和 。

隨后,sentence-level word adapter計(jì)算融合后的綜合向量 ,并利用它預(yù)測意圖標(biāo)簽 :

c4a19c02-8e8e-11eb-8b86-12bb97331649.png

Character-Level Word Adapter

在完成槽位填充之前,我們首先采納一個(gè)雙向LSTM增強(qiáng)單詞序列的表示。在每個(gè)時(shí)間步 ,單詞通道的槽位填充編碼器輸出的隱層向量由相應(yīng)的單詞表示 和意圖標(biāo)簽的編碼 計(jì)算得到。

然后,character-level word adapter針對每個(gè)輸入字符,為字符特征和詞語特征的不同組合確定不同的融合比例:

c50ba124-8e8e-11eb-8b86-12bb97331649.png

最后,我們利用融合后的表示 完成第 個(gè)字符的槽位標(biāo)注:

c574d86a-8e8e-11eb-8b86-12bb97331649.png

2.4 Joint Training

我們采納聯(lián)合訓(xùn)練策略優(yōu)化模型,最終的聯(lián)合目標(biāo)函數(shù)如下, and 分別是正確的意圖和槽位標(biāo)簽:

c5dd6d44-8e8e-11eb-8b86-12bb97331649.png

3. 實(shí)驗(yàn)

3.1 實(shí)驗(yàn)設(shè)置

數(shù)據(jù)集

我們在兩個(gè)公開的中文數(shù)據(jù)集CAIS和ECDT-NLU上進(jìn)行了實(shí)驗(yàn),我們保持了兩個(gè)數(shù)據(jù)集原分割不變。

CAIS中, 訓(xùn)練集包含7995個(gè)句子,驗(yàn)證集和測試集分別有994和1024個(gè)句子。

ECDT-NLU由2576個(gè)訓(xùn)練樣本和1033個(gè)測試樣本組成。

評價(jià)指標(biāo)

與前人相同,我們使用以下三個(gè)指標(biāo)來評價(jià)中文口語語言理解模型的性能:

F1值作為槽位填充任務(wù)的評價(jià)指標(biāo)。

準(zhǔn)確率(accuracy)作為意圖識別任務(wù)的評價(jià)指標(biāo)。

使用整體準(zhǔn)確率(overall accuracy)指標(biāo)評價(jià)句子級語義幀解析能力。一個(gè)整體準(zhǔn)確的預(yù)測表示預(yù)測的意圖和槽位標(biāo)簽與人工標(biāo)注完全相同。

3.2 主實(shí)驗(yàn)結(jié)果

表1 主實(shí)驗(yàn)結(jié)果

c6496e7c-8e8e-11eb-8b86-12bb97331649.png

所有的baseline模型均考慮了意圖識別和槽位填充兩個(gè)任務(wù)之間的相關(guān)性,并聯(lián)合建模這兩個(gè)相關(guān)任務(wù)。從結(jié)果可以看出:

我們的實(shí)驗(yàn)結(jié)果在所有指標(biāo)上均超過了這些baseline模型,達(dá)到了當(dāng)前最好的性能,證明了我們提出的multi-level word adapter的有效性。

Slot和Intent指標(biāo)的提升表明利用multi-level word adapter融入單詞信息可以促進(jìn)模型對于中文意圖和槽位的識別和標(biāo)注。

整體準(zhǔn)確率的提升歸因于考慮了兩個(gè)任務(wù)之間的相關(guān)性,并通過聯(lián)合訓(xùn)練相互增強(qiáng)兩者。

3.3 消融實(shí)驗(yàn)結(jié)果

為了驗(yàn)證已提出的word adapters的有效性,我們對以下幾個(gè)重要分量執(zhí)行了消融實(shí)驗(yàn):

w/o Multiple Levels 設(shè)置中,我們移除了character-level word adapter,在對每個(gè)字符的槽位標(biāo)記時(shí)使用相同的單詞信息。

w/o Sentence-Level word adapter 設(shè)置中,不使用sentence-level word adapter,只使用字序列編碼信息去完成意圖識別。

w/o Character-Level word adapter 設(shè)置中,不使用character-level word adapter,只使用字序列編碼信息去完成槽位填充。

表2 消融實(shí)驗(yàn)結(jié)果

c69c29e6-8e8e-11eb-8b86-12bb97331649.png

上表是消融實(shí)驗(yàn)的結(jié)果,從中可以看出:

使用多層次機(jī)制帶來了顯著的正向效果,這從側(cè)面證實(shí)了對于字符級的槽位填充任務(wù),每個(gè)字需要不同的單詞信息,即細(xì)粒度的詞信息。

不使用sentence-level word adapter時(shí),在ECDT-NLU數(shù)據(jù)集上,意圖識別準(zhǔn)確率出現(xiàn)了明顯的下降,表明sentence-level word adapter可以抽取有利的詞信息去提升中文意圖識別。

不使用character-level word adapter時(shí),兩個(gè)數(shù)據(jù)集上的槽位填充指標(biāo)出現(xiàn)了不同程度的下降,證明了詞語信息可以為中文槽位填充的完成提供有效的指導(dǎo)信息(例如,明確的單詞信息可以幫助模型檢測單詞邊界)。

3.4 預(yù)訓(xùn)練模型探索實(shí)驗(yàn)

我們進(jìn)一步在這兩個(gè)數(shù)據(jù)集上探索了預(yù)訓(xùn)練模型的效果。我們將char-channel encoder替換為預(yù)訓(xùn)練模型BERT,模型的其他部分保持不變,進(jìn)行fine-tuning訓(xùn)練,來觀察我們提出的multi-level word adapter的效果。

表3 BERT模型探索結(jié)果

c6e29ad4-8e8e-11eb-8b86-12bb97331649.png

表3是對于BERT預(yù)訓(xùn)練模型的探索結(jié)果。其中,

Joint BERT 利用預(yù)訓(xùn)練模型BERT得到輸入字序列的編碼,經(jīng)過線性分類層完成意圖識別和槽位填充,隨后應(yīng)用多任務(wù)學(xué)習(xí)方法進(jìn)行訓(xùn)練。

Our Model + BERT 是使用BERT替換掉char-channel encoder作為字序列的Encoder。具體來說,BERT的[CLS]輸出向量作為字序列的綜合向量,其他輸出向量作為各字的表示向量。

實(shí)驗(yàn)結(jié)果表明,multi-level word adapter和BERT的結(jié)合可以進(jìn)一步提升模型效果,證明了我們的貢獻(xiàn)與預(yù)訓(xùn)練模型是互補(bǔ)的。

4.結(jié)論

在這篇文章中,我們的貢獻(xiàn)如下:

我們首次利用一個(gè)簡單有效的方法向中文口語語言理解中引入中文單詞信息。

我們提出了一個(gè)多層次的單詞適配器,句子級和字符級單詞適配器分別向意圖識別和槽位填充提供兩個(gè)層次的單詞信息表示,從而實(shí)現(xiàn)了不同級別任務(wù)的詞信息表示定制化。

在兩個(gè)公開數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn)表明,我們的模型取得了顯著性的改進(jìn),并實(shí)現(xiàn)了最佳的性能。此外,我們的方法與預(yù)訓(xùn)練模型(BERT)在性能上是互補(bǔ)的。

原文標(biāo)題:【工大SCIR】首次探索中文詞信息增強(qiáng)中文口語語言理解!

文章出處:【微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3831

    瀏覽量

    52287
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23346

原文標(biāo)題:【工大SCIR】首次探索中文詞信息增強(qiáng)中文口語語言理解!

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    深入理解積分ADC

    具備良好的噪聲抑制能力,常用于數(shù)字萬用表、面板儀表等應(yīng)用。接下來,我們就詳細(xì)探討這種轉(zhuǎn)換器的工作原理及其特性。 文件下載: ICL7126IPL+.pdf 二、積分ADC概述 積分
    的頭像 發(fā)表于 04-02 09:15 ?732次閱讀

    Amphenol FlexTraX:創(chuàng)新電纜管理解決方案深度剖析

    Amphenol FlexTraX:創(chuàng)新電纜管理解決方案深度剖析 在電子設(shè)備和網(wǎng)絡(luò)系統(tǒng),電纜管理一直是一個(gè)關(guān)鍵且具有挑戰(zhàn)性的任務(wù)。合理的電纜管理不僅能提高
    的頭像 發(fā)表于 12-11 14:50 ?538次閱讀

    FreeRTOS 空閑任務(wù)

    FreeRTOS 很多人會注意到為什么有一個(gè)叫IDLE task的任務(wù)占用了CPU百分之九十多的使用權(quán),但是這個(gè)任務(wù)并沒有自己手動創(chuàng)建。原因就是這個(gè)空閑任務(wù)
    發(fā)表于 12-04 07:35

    在多任務(wù)系統(tǒng),如何平衡任務(wù)調(diào)度以防止因高負(fù)載導(dǎo)致的再次進(jìn)入低功耗模式的延遲?

    在多任務(wù)系統(tǒng),如何平衡任務(wù)調(diào)度以防止因高負(fù)載導(dǎo)致的再次進(jìn)入低功耗模式的延遲?
    發(fā)表于 12-04 06:37

    C語言在嵌入式開發(fā)的應(yīng)用

    對外部事件做出響應(yīng)并完成任務(wù)系統(tǒng),對任務(wù)的響應(yīng)時(shí)間和執(zhí)行時(shí)間有著嚴(yán)格的要求。C 語言在實(shí)時(shí)系統(tǒng)開發(fā)
    發(fā)表于 11-21 08:09

    思必馳任務(wù)對話算法通過國家備案

    近日,國家網(wǎng)信辦公開發(fā)布第十四批境內(nèi)深度合成服務(wù)算法備案信息,思必馳任務(wù)對話算法正式通過備案。這是思必馳第八項(xiàng)通過備案的算法,進(jìn)一步鞏固了在對話式人工智能領(lǐng)域的技術(shù)與合規(guī)優(yōu)勢。
    的頭像 發(fā)表于 11-20 10:33 ?1076次閱讀

    拉夫勞倫攜手微軟推出對話式AI應(yīng)用購物助手Ask Ralph

    拉夫·勞倫攜手微軟,推出由Microsoft Azure OpenAl(國際版)驅(qū)動的對話式AI應(yīng)用購物助手“Ask Ralph”,旨在重塑數(shù)字購物體驗(yàn)。該工具能理解用戶自然語言提問,提供高度個(gè)性化
    的頭像 發(fā)表于 10-13 15:45 ?870次閱讀

    廣和通發(fā)布端側(cè)情感對話大模型FiboEmo-LLM

    9月,廣和通正式發(fā)布自主研發(fā)的端側(cè)情感對話大模型FiboEmo-LLM。該模型專注于情感計(jì)算與自然語言交互融合,致力于為AI玩具、智能陪伴設(shè)備等終端場景提供“情感理解-情感響應(yīng)”一體化能力,推動終端人工智能向更具人性化、情感化的
    的頭像 發(fā)表于 09-26 13:37 ?2047次閱讀

    米爾RK3576部署端側(cè)多模態(tài)多輪對話,6TOPS算力驅(qū)動30億參數(shù)LLM

    (Multi-Turn Dialogue)是指用戶與智能系統(tǒng)通過多輪交互逐步明確需求、解決問題的對話形式。這種交互依賴對話歷史的上下文連貫性,要求系統(tǒng)能夠動態(tài)
    發(fā)表于 09-05 17:25

    Task任務(wù):LuatOS實(shí)現(xiàn)“任務(wù)級并發(fā)”的核心引擎

    Task任務(wù)通過其強(qiáng)大的并發(fā)處理能力,使LuatOS能夠在單線程環(huán)境模擬多線程執(zhí)行,通過協(xié)程的掛起與恢復(fù)機(jī)制,實(shí)現(xiàn)任務(wù)級的并行操作,顯著提升系統(tǒng)效能。 sys核心庫是LuatOS運(yùn)行
    的頭像 發(fā)表于 08-28 13:49 ?654次閱讀
    Task<b class='flag-5'>任務(wù)</b>:LuatOS實(shí)現(xiàn)“<b class='flag-5'>任務(wù)</b>級并發(fā)”的核心引擎

    圖解環(huán)路設(shè)計(jì)及控制技術(shù)探討

    只要在 bode 圖上移動零極點(diǎn)并采用加減運(yùn)算就能得出較理想的控制效果,貌似比 PID 還簡單(PID 的優(yōu)點(diǎn)是無需被控系統(tǒng)的模型)。如何理解零極點(diǎn)、雙重零極點(diǎn)、斜率-1 過穿越頻率、 條件穩(wěn)定、1
    發(fā)表于 08-22 17:39

    Aux-Think打破視覺語言導(dǎo)航任務(wù)的常規(guī)推理范式

    視覺語言導(dǎo)航(VLN)任務(wù)的核心挑戰(zhàn),是讓機(jī)器人在復(fù)雜環(huán)境中聽懂指令、看懂世界,并果斷行動。我們系統(tǒng)性地引入推理任務(wù),探索其在導(dǎo)航策略學(xué)習(xí)
    的頭像 發(fā)表于 07-08 10:00 ?762次閱讀
    Aux-Think打破視覺<b class='flag-5'>語言</b>導(dǎo)航<b class='flag-5'>任務(wù)</b>的常規(guī)推理范式

    深入理解C語言:函數(shù)—編程的“積木塊”藝術(shù)

    在編程的世界里,函數(shù)就像建筑的“積木塊”——它們是構(gòu)建復(fù)雜程序的基石。通過靈活組合這些模塊,開發(fā)者能打造出功能強(qiáng)大且結(jié)構(gòu)清晰的代碼。函數(shù)之所以成為C語言的核心,正是因?yàn)樗鉀Q了編程的三大關(guān)
    的頭像 發(fā)表于 06-30 17:26 ?2088次閱讀
    深入<b class='flag-5'>理解</b>C<b class='flag-5'>語言</b>:函數(shù)—編程<b class='flag-5'>中</b>的“積木塊”藝術(shù)

    I/O密集任務(wù)開發(fā)指導(dǎo)

    使用異步并發(fā)可以解決單次I/O任務(wù)阻塞的問題,但是如果遇到I/O密集任務(wù),同樣會阻塞線程其它任務(wù)的執(zhí)行,這時(shí)需要使用多線程并發(fā)能力來進(jìn)行
    發(fā)表于 06-19 07:19

    CPU密集任務(wù)開發(fā)指導(dǎo)

    CPU密集任務(wù)是指需要占用系統(tǒng)資源處理大量計(jì)算能力的任務(wù),需要長時(shí)間運(yùn)行,這段時(shí)間會阻塞線程其它事件的處理,不適宜放在主線程進(jìn)行。例如圖像處理、視頻編碼、數(shù)據(jù)分析等。 基于多線程并發(fā)
    發(fā)表于 06-19 06:05
    德兴市| 新民市| 临城县| 文山县| 子长县| 隆安县| 永修县| 木里| 许昌市| 花莲市| 兰州市| 若尔盖县| 耒阳市| 龙南县| 禄丰县| 化德县| 忻城县| 兴和县| 青州市| 独山县| 洛宁县| 富民县| 凉城县| 夏邑县| 屏东市| 海兴县| 萨嘎县| 玛曲县| 曲沃县| 伊春市| 浦江县| 林甸县| 义乌市| 二连浩特市| 夹江县| 蓝田县| 上杭县| 和田市| 鄢陵县| 桓仁| 乐陵市|