日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在風(fēng)格遷移中如何進(jìn)行數(shù)據(jù)增強(qiáng)

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:丁磊 ? 2021-01-13 09:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這是一篇關(guān)于風(fēng)格遷移中如何進(jìn)行數(shù)據(jù)增強(qiáng)的論文。在introduction部分,informal-->formal 的風(fēng)格遷移問題,最大的障礙是訓(xùn)練數(shù)據(jù)的不足。為了解決此問題,本篇論文提出三種數(shù)據(jù)增強(qiáng)的方法來獲得有用的語句對,分別為

back translation (BT)

我們使用原始語料庫訓(xùn)練一個seq2seq模型。其中將formal語句作為模型的輸入,讓seq2seq模型有能力輸出對應(yīng)的informal句子。則 模型輸入的formal語句和輸出的informal語句就構(gòu)成了一個新的語句對。

formality discrimination (F-Dis)

F-Dis方法使用機(jī)器翻譯模型,將一個informal句子重寫為formal句子。首先使用Google翻譯API 將這些informal語句翻譯成 其他語種(比如法語),然后又翻譯回英語。如下圖所示:

831f1182-549c-11eb-8b86-12bb97331649.jpg

其中,informal語句可以從網(wǎng)上論壇上收集得到。

表示收集到的第i條句子(informal), 是最后翻譯回的句子(formal), 二者構(gòu)成了一個新的語句對。

本方法同時使用CNN構(gòu)建了一個“格式判別器”:用來給一個句子的“正規(guī)”程度 打分。就是上圖中右邊括號內(nèi)的小數(shù)。最終選出的新數(shù)據(jù)集要求如下:

837b0564-549c-11eb-8b86-12bb97331649.png

其中表示句子的“正規(guī)”程度, 是閾值

multi-task transfer (M-Task)

我們觀察到,formal語句通常語法正確,而informal語句的語法經(jīng)常出錯。

前人研究表明,對FST的輸出再使用一個語法錯誤糾正模型( grammatical error correction model,GEC)可以提高模型效果。受此啟發(fā),本論文直接使用GEC的訓(xùn)練數(shù)據(jù)作為增強(qiáng)的新數(shù)據(jù)集。如下圖

83e7497c-549c-11eb-8b86-12bb97331649.png

模型訓(xùn)練

上面提到的seq2seq模型為Transformer (base)。

本論文首先使用增強(qiáng)的新數(shù)據(jù)用于 預(yù)訓(xùn)練,然后使用原始語料數(shù)據(jù)做微調(diào),將這稱為pre-training & finetuning (PT&FT)方法。下面結(jié)果證明了PT&FT的效果優(yōu)于ST方法。ST是把增強(qiáng)數(shù)據(jù)和原數(shù)據(jù)一起訓(xùn)練。

843ca7b4-549c-11eb-8b86-12bb97331649.jpg

下圖展現(xiàn)了三種數(shù)據(jù)增強(qiáng)方法的效果:

84b0048e-549c-11eb-8b86-12bb97331649.jpg

下圖展現(xiàn)了我們的方法與前人模型的比較結(jié)果:

84cef614-549c-11eb-8b86-12bb97331649.jpg

責(zé)任編輯:xj

原文標(biāo)題:【ACL2020】關(guān)于正式風(fēng)格遷移的數(shù)據(jù)增強(qiáng)方法

文章出處:【微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:【ACL2020】關(guān)于正式風(fēng)格遷移的數(shù)據(jù)增強(qiáng)方法

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    通過對?數(shù)字音頻信號進(jìn)行數(shù)學(xué)運(yùn)算和算法處理的高性能Audio DSP-DU562

    高性能 Audio DSP(音頻數(shù)字信號處理器)的核心工作原理是通過對?數(shù)字音頻信號進(jìn)行數(shù)學(xué)運(yùn)算和算法處理?,實現(xiàn)音質(zhì)優(yōu)化、噪聲抑制、空間增強(qiáng)等效果。
    的頭像 發(fā)表于 04-03 09:26 ?307次閱讀
    通過對?數(shù)字音頻信號<b class='flag-5'>進(jìn)行數(shù)</b>學(xué)運(yùn)算和算法處理的高性能Audio DSP-DU562

    對于設(shè)備上的舊固件如何進(jìn)行備份和恢復(fù)?

    對于設(shè)備上的舊固件,如何進(jìn)行備份和恢復(fù)?
    發(fā)表于 12-12 08:23

    zfs數(shù)據(jù)恢復(fù)—ZFS存儲遷移數(shù)據(jù)讀不出數(shù)據(jù)怎么恢復(fù)數(shù)據(jù)?

    管理員對一臺存儲設(shè)備內(nèi)的文件進(jìn)行遷移操作時,數(shù)據(jù)突然無法讀取,管理界面出現(xiàn)報錯。管理員查看數(shù)據(jù)時發(fā)現(xiàn)其中一個lun的數(shù)據(jù)丟失。
    的頭像 發(fā)表于 12-09 14:10 ?362次閱讀
    zfs<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—ZFS存儲<b class='flag-5'>遷移數(shù)據(jù)</b>讀不出<b class='flag-5'>數(shù)據(jù)</b>怎么恢復(fù)<b class='flag-5'>數(shù)據(jù)</b>?

    設(shè)備PLC沒有以太網(wǎng)口如何進(jìn)行數(shù)據(jù)采集

    工業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型的過程,需要對各類自動化設(shè)備進(jìn)行數(shù)據(jù)采集,其實質(zhì)是實現(xiàn)對可編程邏輯控制器PLC的數(shù)據(jù)采集。但對很多老舊設(shè)備來說,通常只具備串口、只走TCP通信,甚至出現(xiàn)接口被占用
    的頭像 發(fā)表于 12-03 10:57 ?694次閱讀

    無質(zhì)量損失的數(shù)據(jù)遷移:Nikon SLM Solutions信賴3Dfindit企業(yè)版

    制造和航空航天,其中整個渦輪機(jī)部件都可以通過3D打印實現(xiàn)。 使用3Dfindit企業(yè)版進(jìn)行數(shù)據(jù)遷移引入新的PLM和CAD軟件時,Nikon SLM Solutions曾面臨著數(shù)據(jù)
    發(fā)表于 11-25 10:06

    蜂鳥E203怎樣外部的攝像頭進(jìn)行數(shù)據(jù)傳輸?

    蜂鳥E203怎樣外部的攝像頭進(jìn)行數(shù)據(jù)傳輸
    發(fā)表于 11-05 06:58

    溫度循環(huán)測試后如何進(jìn)行數(shù)據(jù)記錄和分析?

    溫度循環(huán)測試后的數(shù)據(jù)記錄和分析是驗證電能質(zhì)量在線監(jiān)測裝置精度穩(wěn)定性、功能完整性、硬件可靠性的核心環(huán)節(jié),需圍繞 “數(shù)據(jù)溯源可查、分析邏輯閉環(huán)、結(jié)論依據(jù)充分” 展開,結(jié)合測試標(biāo)準(zhǔn)(IEC
    的頭像 發(fā)表于 09-26 14:22 ?690次閱讀

    如何使用運(yùn)行數(shù)據(jù)趨勢分析驗證裝置準(zhǔn)確性?

    負(fù)荷變化、設(shè)備啟停、電網(wǎng)事件)高度匹配,且關(guān)鍵參數(shù)波動范圍在合理區(qū)間內(nèi)。以下是具體實施步驟、核心分析維度及判斷標(biāo)準(zhǔn): 一、前提:數(shù)據(jù)預(yù)處理 —— 確保分析基礎(chǔ)有效 開展趨勢分析前,需先對運(yùn)行數(shù)據(jù)
    的頭像 發(fā)表于 09-18 10:33 ?621次閱讀
    如何使用運(yùn)<b class='flag-5'>行數(shù)據(jù)</b>趨勢分析驗證裝置準(zhǔn)確性?

    工業(yè)數(shù)據(jù)智能制造的作用

    智能制造場景下,數(shù)據(jù)分散PLC、SCADA、MES、ERP等異構(gòu)系統(tǒng),格式不統(tǒng)一且難以互通。工業(yè)數(shù)據(jù)臺通過標(biāo)準(zhǔn)化接口(如OPC UA
    的頭像 發(fā)表于 08-26 14:29 ?908次閱讀

    宏集方案 | 如何進(jìn)行產(chǎn)線高階能耗數(shù)據(jù)的計算和可視化?

    前言在當(dāng)前經(jīng)濟(jì)下行時期,越來越來多企業(yè)開始對產(chǎn)線進(jìn)行數(shù)字化轉(zhuǎn)型,提高企業(yè)競爭力。產(chǎn)線數(shù)字化轉(zhuǎn)型過程,產(chǎn)線高階能耗數(shù)據(jù)的計算和可視化是比較重要的一環(huán),今天小編就和大家分享如何對產(chǎn)線能
    的頭像 發(fā)表于 08-08 18:28 ?647次閱讀
    宏集方案 | 如<b class='flag-5'>何進(jìn)行</b>產(chǎn)線高階能耗<b class='flag-5'>數(shù)據(jù)</b>的計算和可視化?

    軟國際上云遷移服務(wù)充分釋放云計算價值

    在數(shù)字經(jīng)濟(jì)時代,企業(yè)上云已成為提升業(yè)務(wù)敏捷性、降低成本、增強(qiáng)安全性的關(guān)鍵路徑。然而,上云遷移涉及復(fù)雜的業(yè)務(wù)系統(tǒng)、海量數(shù)據(jù)和高可用性要求,如何確保遷移過程高效、穩(wěn)定、安全,成為企業(yè)面臨的
    的頭像 發(fā)表于 07-25 14:32 ?1109次閱讀
    <b class='flag-5'>中</b>軟國際上云<b class='flag-5'>遷移</b>服務(wù)充分釋放云計算價值

    使用Cypress FX2 EZ USB進(jìn)行數(shù)據(jù)采集應(yīng)用,為什么采集到的數(shù)據(jù)不是連續(xù)的?

    我正在使用Cypress FX2 EZ USB進(jìn)行數(shù)據(jù)采集應(yīng)用。 我已經(jīng)將其配置為 512 字節(jié),BULK-IN 和 EP6 端點(diǎn),AUTO IN。我 labview 開發(fā)了一個應(yīng)用程序,用于
    發(fā)表于 05-28 07:38

    三菱CNC如何進(jìn)行數(shù)據(jù)采集并對接到ERP系統(tǒng)

    需要高速、高精度加工的行業(yè)。同時越來越企業(yè)希望將CNC數(shù)據(jù)采集到ERP或MES系統(tǒng)。 對此,物通博聯(lián)提供接入發(fā)那科、西門子、三菱、廣數(shù)、哈斯、海德漢、凱恩帝、馬扎克、兄弟等品牌的CNC數(shù)采網(wǎng)關(guān),實時采集機(jī)床狀態(tài)與加工參數(shù)并對
    的頭像 發(fā)表于 05-14 11:16 ?1727次閱讀
    三菱CNC如<b class='flag-5'>何進(jìn)行數(shù)據(jù)</b>采集并對接到ERP系統(tǒng)

    KaihongOS應(yīng)用開發(fā),如何利用Socket進(jìn)行數(shù)據(jù)傳輸

    Socket KaihongOS應(yīng)用開發(fā),可以利用Socket進(jìn)行數(shù)據(jù)傳輸?shù)哪芰?,支持TCPSocket、UDPSocket、WebSocket和TLSSocket。詳細(xì)的API接口文檔請
    發(fā)表于 05-08 07:25

    工業(yè)設(shè)備運(yùn)行數(shù)據(jù)采集管理平臺是什么

    工業(yè)設(shè)備運(yùn)行數(shù)據(jù)采集管理平臺是一種用于集中采集、管理和分析工業(yè)設(shè)備運(yùn)行數(shù)據(jù)的系統(tǒng),廣泛應(yīng)用于制造業(yè)、能源、化工等多個領(lǐng)域。以下是其定義、功能及應(yīng)用場景的詳細(xì)說明: 定義 工業(yè)設(shè)備運(yùn)行數(shù)據(jù)采集管理平臺
    的頭像 發(fā)表于 05-06 14:34 ?843次閱讀
    南华县| 探索| 谢通门县| 枣阳市| 霍邱县| 如皋市| 凌海市| 宁波市| 长乐市| 义马市| 淅川县| 巨野县| 玛曲县| 芦溪县| 长白| 丰原市| 中牟县| 宜昌市| 饶阳县| 锡林郭勒盟| 梁河县| 墨竹工卡县| 桂林市| 高要市| 蒲城县| 游戏| 新巴尔虎右旗| 盐边县| 岳阳县| 望江县| 望都县| 平邑县| 无锡市| 肥西县| 乡宁县| 肇源县| 蒙山县| 渝中区| 中宁县| 临澧县| 维西|