日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

三種LM任務形式:單向LM,雙向LM,序列到序列LM

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2021-01-03 09:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天分享一個論文UniLM[1],核心點是掌握三種LM任務形式:單向LM,雙向LM,序列到序列LM;

1. 生成任務

NLP任務大致可以分為NLU和NLG兩種;Bert在NLU任務上效果很好,但是天生不適合處理生成任務。

原因在于Bert的預訓練過程是使用的MLM,和生成任務的目標并不一致。

生成任務目標是每次蹦出來一個詞,只能看到當前位置之前的詞匯。

而Bert采用的是雙向的語言模型,除了mask的單詞,兩個方向的詞匯都可以被看到。

所以對Bert的一個改進思路就是讓它在具有NLU能力的時候,同時兼?zhèn)銷LG能力。

2. 三種LM任務

UniLM做的就是這樣一個事情。

具體的實現(xiàn)方式是設計了一系列的完形填空任務,這些完形填空任務的不同之處在于對上下文的定義。

從左到右的LM:使用mask單詞的左側單詞來預測被遮掩的單詞

從右到左的LM:和上面第一個相比就是方向的變化,使用mask單詞的右側單詞來預測遮掩的單詞

雙向LM:就是當前mask的左右詞匯都可以看到

sequence-to-sequence LM:這個就是UniLM能夠具有生成能力的關鍵。我們的輸入是source句子和target句子,mask單詞在target上,那么當前mask的上下文就是source句子的所有單詞和target句子中mask單詞左側的詞匯可以被看到

我們把從左到右LM和從右到左LM我們歸為一種任務叫單向LM;

有個點需要注意,三個任務是一起優(yōu)化的,具體來講是這樣做的:

在訓練的時候,1/3的時候使用雙向LM,1/3的時候使用序列到序列 LM,1/6的時候使用從左到右的LM,1/6的時間使用從右到做的LM。

我們是使用不同的Mask矩陣來對應不同任務輸入數(shù)據形式。

文中使用的是這樣一張圖來展示:

f1836372-4690-11eb-8b86-12bb97331649.jpg

UniLM不同mask

3. 其他細枝末節(jié)

Gelu 激勵函數(shù)

24層TRM,最大長度512,1024Hidden Size,16Heads,340M參數(shù)量

初始化使用Bert Large

15%被mask,其中80%真正替換mask,10%隨機替換,10%不動。替換的時候,80% 的時候替換單個token,20%的時候替換bigram 或者 trigram

第四個步驟類似中文實體詞的mask,也算是一點改進。

有個細節(jié)點需要注意的是,作者強調,不同的segment embedding用來區(qū)分不同LM任務。

Bert的時候,區(qū)分上下句子,我們使用0和1,在這里,我們使用這個segment embedding用來區(qū)分任務:

比如說,雙向對應0和1;單向left-right對應2;單向right-left對應3;序列對應4和5;

4. 總結

掌握以下幾個細節(jié)點就可以:

聯(lián)合訓練三種任務:單向LM,雙向LM,序列LM

使用不同的attention矩陣控制三種任務形式的參與

segment embedding可以區(qū)分不同的任務形式

mask的時候15% 的有被替換的概率,其中80% 被真正替換。在這80%真正替換的里面有80%單個token被替換,20%的二元或者三元tokens被替換

參考資料

[1]

Unified Language Model Pre-training for Natural Language Understanding and Generation: https://arxiv.org/pdf/1905.03197.pdf,

責任編輯:xj

原文標題:如何讓BERT具有文本生成能力

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自然語言
    +關注

    關注

    1

    文章

    292

    瀏覽量

    14027
  • nlp
    nlp
    +關注

    關注

    1

    文章

    491

    瀏覽量

    23347

原文標題:如何讓BERT具有文本生成能力

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    探索LM2703/LM2704評估板:設計與應用解析

    探索LM2703/LM2704評估板:設計與應用解析 在電子設計領域,評估板是我們工程師快速驗證芯片性能、加速產品開發(fā)的得力工具。今天就來深入探討一下德州儀器(TI)的LM2703/LM
    的頭像 發(fā)表于 04-19 14:40 ?157次閱讀

    低功耗雙運算放大器LM158、LM258、LM358系列解析

    低功耗雙運算放大器LM158、LM258、LM358系列解析 在電子設計領域,運算放大器是一非常重要的基礎元件。今天我們來詳細探討一下LM
    的頭像 發(fā)表于 04-14 17:15 ?472次閱讀

    低功耗雙運算放大器LM158、LM258、LM358系列解析

    低功耗雙運算放大器LM158、LM258、LM358系列解析 在電子電路設計中,運算放大器是一非常重要的基礎元件。今天我們來詳細了解一下LM
    的頭像 發(fā)表于 03-25 15:55 ?373次閱讀

    探索LM185/LM285/LM385可調微功耗電壓基準源

    (TI)的LM185/LM285/LM385可調微功耗電壓基準源。 文件下載: lm185-adj.pdf 產品概述 LM185/
    的頭像 發(fā)表于 03-02 15:40 ?298次閱讀

    低功耗雙運算放大器LM158/LM258/LM358系列:特性、參數(shù)與應用解析

    低功耗雙運算放大器LM158/LM258/LM358系列:特性、參數(shù)與應用解析 在電子設計領域,運算放大器是一極為基礎且關鍵的元件,廣泛應用于各種電子電路中。今天,我們就來深入探討一
    的頭像 發(fā)表于 02-27 14:55 ?673次閱讀

    深入解析LM111-N/LM211-N/LM311-N電壓比較器

    深入解析LM111-N/LM211-N/LM311-N電壓比較器 在電子工程師的日常設計工作中,電壓比較器是一常用的基礎器件。今天我們就來深入了解一下德州儀器(TI)的
    的頭像 發(fā)表于 02-06 11:05 ?553次閱讀

    深入解析LM134/LM234/LM334 3-端子可調電流源

    深入解析LM134/LM234/LM334 3-端子可調電流源 在電子設計領域,電流源是一個關鍵的組成部分,它在眾多應用中發(fā)揮著重要作用。今天,我們要詳細探討的是德州儀器(TI)的LM
    的頭像 發(fā)表于 02-06 11:00 ?399次閱讀

    深入解析LM134/LM234/LM334:多功能3端可調電流源的設計與應用

    )推出的3端可調電流源,憑借其獨特的性能和廣泛的應用場景,成為眾多工程師的首選。今天,我們就來深入探討這款器件的特點、性能參數(shù)以及實際應用中的注意事項。 文件下載: lm134.pdf 器件特性 寬工作電壓范圍與高精度調節(jié) LM
    的頭像 發(fā)表于 02-06 10:50 ?523次閱讀

    深入解析LM111 - N/LM211 - N/LM311 - N電壓比較器

    深入解析LM111-N/LM211-N/LM311-N電壓比較器 在電子設計領域,電壓比較器是一常用的基礎器件,它能對兩個輸入電壓進行比較,并根據比較結果輸出高或低電平信號。今天,我
    的頭像 發(fā)表于 02-05 10:25 ?533次閱讀

    深入剖析LM134/LM234/LM334:多功能端可調電流源的應用與特性

    深入剖析LM134/LM234/LM334:多功能端可調電流源的應用與特性 在電子設計領域,電流源是一個基礎且關鍵的組件,而TI的LM13
    的頭像 發(fā)表于 01-18 15:45 ?1311次閱讀

    深入解析LM134/LM234/LM334:多功能端可調電流源

    深入解析LM134/LM234/LM334:多功能端可調電流源 在電子設計領域,電流源是一個基礎且關鍵的元件,廣泛應用于各種電路中。今天我們要深入探討的是德州儀器(TI)的
    的頭像 發(fā)表于 01-18 15:10 ?1063次閱讀

    LM134/LM234/LM334:端可調電流源的全方位解析

    LM134/LM234/LM334:端可調電流源的全方位解析 作為電子工程師,在電路設計的過程中,我們常常需要精準且性能優(yōu)良的電流源。今天要和大家分享的是ST公司的
    的頭像 發(fā)表于 12-31 16:10 ?816次閱讀

    LM134/LM234/LM334:端可調電流源的特性與應用解析

    LM134/LM234/LM334:端可調電流源的特性與應用解析 在電子設計領域,電流源是一基礎且關鍵的元件,廣泛應用于各種電路中。德州
    的頭像 發(fā)表于 12-29 15:55 ?1301次閱讀

    深入剖析LM134/LM234/LM334 3 - 終端可調電流源

    深入剖析LM134/LM234/LM334 3 - 終端可調電流源 在電子設計領域,可調電流源是一非常重要的基礎元件,廣泛應用于各種電路中。今天我們就來詳細探討一下德州儀器(TI)的
    的頭像 發(fā)表于 12-26 17:15 ?1678次閱讀

    深入解析LM2512A:高性能RGB顯示接口序列化器

    深入解析LM2512A:高性能RGB顯示接口序列化器 在電子設備的顯示領域,如何高效、穩(wěn)定地傳輸高質量的圖像數(shù)據是一個關鍵問題。TI的LM2512A作為一款專門的移動像素鏈路(MPL - 1)24位
    的頭像 發(fā)表于 12-26 11:30 ?615次閱讀
    龙海市| 龙南县| 青河县| 彭阳县| 来宾市| 南京市| 乐山市| 兴业县| 长顺县| 内乡县| 深州市| 繁昌县| 栖霞市| 长丰县| 临澧县| 承德市| 东莞市| 武定县| 镇坪县| 新疆| 满城县| 和平县| 津市市| 启东市| 合水县| 奉节县| 上饶市| 鄂托克旗| 柳江县| 舞阳县| 柯坪县| 彭泽县| 盖州市| 原阳县| 陕西省| 潮州市| 哈尔滨市| 宣汉县| 隆化县| 远安县| 满城县|