日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何為Google翻譯上的性別中性詞提供女性化和男性化兩種翻譯結(jié)果的技術(shù)原理

電子工程師 ? 來(lái)源:lq ? 2018-12-12 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如何消除 AI 帶來(lái)的性別偏見(jiàn)是個(gè)令人頭疼的問(wèn)題,那究竟有沒(méi)有方法去解決?

12 月 6 日,Google 宣布他們邁出了減少 Google 翻譯中性別偏見(jiàn)的第一步,并且還詳細(xì)介紹了如何為 Google 翻譯上的性別中性詞提供女性化和男性化兩種翻譯結(jié)果的技術(shù)原理。

過(guò)去幾年,Google 翻譯通過(guò)使用基于端到端的神經(jīng)網(wǎng)絡(luò)系統(tǒng)大大提高了翻譯質(zhì)量,但與此同時(shí),模型的翻譯結(jié)果呈現(xiàn)出了社會(huì)偏見(jiàn),尤其是性別偏見(jiàn)。具體而言,由于 Google 翻譯的結(jié)果一直都是從網(wǎng)上數(shù)以億計(jì)的已翻譯數(shù)據(jù)中學(xué)習(xí)得到,這造成的后果是,即使翻譯結(jié)果可能具有女性化或男性化形式的傾向,但它也只為查詢提供一種翻譯。因而,這無(wú)可避免地復(fù)制了已有的性別偏見(jiàn)。例如,像“強(qiáng)壯”或“醫(yī)生”這樣的詞語(yǔ),它會(huì)生成偏向于男性化的翻譯結(jié)果,而對(duì)于“護(hù)士”或“美麗”等詞匯,則會(huì)生成偏向于女性化的翻譯。

現(xiàn)在,Google 翻譯解決了上述問(wèn)題。當(dāng)你把諸如“外科醫(yī)生”這樣的單字從英語(yǔ)翻譯成法語(yǔ)、意大利語(yǔ)、葡萄牙語(yǔ)或西班牙語(yǔ)時(shí),會(huì)得到的男性化和女性化的兩種翻譯結(jié)果。另外,當(dāng)把短語(yǔ)和句子從土耳其語(yǔ)翻譯成英語(yǔ)時(shí),你也會(huì)得到這兩類翻譯,比如你用土耳其語(yǔ)輸入“o bir doktor”,就會(huì)得到“she is a doctor”和“he is a doctor”這兩種按性別翻譯的結(jié)果。

Google 翻譯中有特定性別的翻譯

Google 團(tuán)隊(duì)是如何做的?

要知道,支持單字查詢的特定性別翻譯涉及到用性別屬性豐富 Google 的底層詞庫(kù)。支持較長(zhǎng)(短語(yǔ)和句子)查詢的性別翻譯尤其具有挑戰(zhàn)性,這甚至需要對(duì)翻譯框架進(jìn)行部分重構(gòu)。對(duì)于這些較長(zhǎng)的查詢,他們最初將重點(diǎn)放在從土耳其語(yǔ)到英文的翻譯上。總體而言,他們制訂了三步法來(lái)解決土耳其語(yǔ)中性別中立查詢的問(wèn)題,即同時(shí)提供英文的男性化和女性化翻譯結(jié)果。

檢測(cè)性別中立查詢

許多土耳其語(yǔ)中提到人的句子都是性別中立的,但并不是全部都這樣。檢測(cè)哪些查詢符合特定性別的翻譯是一個(gè)難題,由于土耳其語(yǔ)在形態(tài)學(xué)上的很復(fù)雜,這意味著指代一個(gè)人可以是明確的性別中立代詞(例如 O,Ona)或隱式編碼。例如,“Biliyor mu?”沒(méi)有明確的性別中立代名詞,可以翻譯為“她知道嗎?”或“他知道嗎?”這種復(fù)雜性導(dǎo)致我們不能使用簡(jiǎn)單的性別中性代詞列表來(lái)檢測(cè)性別中立的土耳其語(yǔ)查詢,另外我們還需要一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)。Google 團(tuán)隊(duì)估計(jì)大約有 10% 的土耳其語(yǔ)的翻譯查詢含糊不清,能同時(shí)符合女性化和男性化翻譯的條件。

為了檢測(cè)這些查詢,他們使用了最先進(jìn)的文本分類算法(與他們的云自然語(yǔ)言 API 中使用的算法相同)來(lái)構(gòu)建一個(gè)系統(tǒng),該系統(tǒng)能夠檢測(cè)給定的土耳其語(yǔ)查詢何時(shí)是性別中立的。這就導(dǎo)致在翻譯前新增了一個(gè)步驟,所以他們必須平衡模型在延遲時(shí)的復(fù)雜性。Google 團(tuán)隊(duì)對(duì)數(shù)千個(gè)土耳其人進(jìn)行系統(tǒng)培訓(xùn),要求這些人判斷出一個(gè)給定的例子是否是性別中立的。而他們最終的分類系統(tǒng)是卷積神經(jīng)網(wǎng)絡(luò),以此可以準(zhǔn)確檢測(cè)出需要按性別翻譯的查詢。

生成特定性別翻譯

隨后,Google 團(tuán)隊(duì)增強(qiáng)了基礎(chǔ)神經(jīng)機(jī)器翻譯(NMT)系統(tǒng),以便在需要時(shí)生成女性化和男性化翻譯。當(dāng)沒(méi)有要求區(qū)分性別時(shí),訓(xùn)練模型生成的是默認(rèn)翻譯。這主要包括:

識(shí)別并將平行訓(xùn)練數(shù)據(jù)劃分為具有女性化詞語(yǔ)、男性化詞語(yǔ)和性別不明詞語(yǔ)。

在句子的開(kāi)頭添加一個(gè)新增的輸入標(biāo)記,以指定要翻譯的所需性別,類似于已構(gòu)建的多語(yǔ)言 NMT 系統(tǒng)的方式:

<2MALE> O bir doktor→他是一名醫(yī)生

<2FEMALE> O bir doktor→她是一名醫(yī)生

訓(xùn)練增強(qiáng)的 NMT 模型對(duì)女性、男性和性別中立數(shù)據(jù)源的影響。他們對(duì)這些來(lái)源進(jìn)行了各種混合比試驗(yàn),使模型在這三個(gè)任務(wù)中的表現(xiàn)同樣出色。

如果確定用戶查詢是性別中立的,他們會(huì)在翻譯請(qǐng)求中添加性別前綴。對(duì)于這些要求,他們的最終 NMT 模型可以在 99% 情況下生成可靠的女性化和男性化性別的翻譯結(jié)果。此外,系統(tǒng)在沒(méi)有性別前綴的查詢中還能保持翻譯質(zhì)量。

檢查準(zhǔn)確性

最后的一個(gè)步驟決定是否顯示特定性別的翻譯結(jié)果。由于產(chǎn)生男性化翻譯的訓(xùn)練數(shù)據(jù)與產(chǎn)生女性化翻譯的訓(xùn)練數(shù)據(jù)不同,因此在與性別無(wú)關(guān)的兩種翻譯間可能存在差異。如果確定特定性別的翻譯質(zhì)量低,則只顯示單一的默認(rèn)翻譯。為了確定特定性別的句子翻譯質(zhì)量,他們進(jìn)行以下驗(yàn)證:

要求的女性翻譯是女性化的;

要求的男性化翻譯是男性化的;

除了與性別相關(guān)的變化,如果女性化和男性化翻譯完全相同,即使翻譯結(jié)果間的措辭發(fā)生微小變化也會(huì)被系統(tǒng)過(guò)濾掉。

男性化和女性化翻譯僅在性別方面有所不同,即“he”和“his”與“she”和“her”。因此,他們展示了特定性別的翻譯。底部:男性化和女性化翻譯在性別方面有所不同,即“he”與“she”。但是,從“really”到“actually”的變化與性別無(wú)關(guān)。因此,系統(tǒng)將過(guò)濾特定性別的翻譯并顯示默認(rèn)翻譯結(jié)果。

如果將所有內(nèi)容放在一起,輸入句子首先會(huì)通過(guò)分類器,分類器檢測(cè)它們是否可以進(jìn)行特定性別翻譯。如果分類器說(shuō)“是”,系統(tǒng)則向增強(qiáng)型 NMT 模型發(fā)送三個(gè)請(qǐng)求:女性化翻譯請(qǐng)求、男性化翻譯請(qǐng)求和性別中立翻譯請(qǐng)求。最后一步考慮了所有的三個(gè)答案,并決定是否顯示特定性別翻譯或單個(gè)默認(rèn)翻譯。Google 團(tuán)隊(duì)認(rèn)為,這一步仍然相當(dāng)保守,為了最大限度提高所顯示的特定性別的翻譯質(zhì)量,因此系統(tǒng)的整體召回率僅為 60% 左右。

對(duì) Google來(lái)說(shuō),這只是他們解決機(jī)器翻譯系統(tǒng)中性別偏見(jiàn)的第一步,未來(lái),他們計(jì)劃將特定性別的翻譯擴(kuò)展到更多語(yǔ)言,并解決自動(dòng)完成查詢等功能中的性別偏見(jiàn)問(wèn)題。此外,他們已經(jīng)在考慮如何在翻譯中解決非二元性別的問(wèn)題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1816

    瀏覽量

    60655
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4844

    瀏覽量

    108206
  • 機(jī)器翻譯
    +關(guān)注

    關(guān)注

    0

    文章

    141

    瀏覽量

    15556

原文標(biāo)題:“男醫(yī)生,女護(hù)士?”消除偏見(jiàn),Google有大招

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    極速翻譯官:打通ETHERCAT與Modbus RTU的“最后1毫秒”

    ”角色的關(guān)鍵硬件。你提到的疆鴻智能ETHERCAT轉(zhuǎn)MODBUS網(wǎng)關(guān)JH-ECT002,就是一款典型的、用于連接兩種主流工業(yè)總線系統(tǒng)的設(shè)備。 一、在閥島中的應(yīng)用 閥島集成多個(gè)電磁閥和I/O,用于控制氣缸等執(zhí)行機(jī)構(gòu)。許多成熟閥島只支持Modbus RTU(串口,速度慢),而高端控制器(如
    的頭像 發(fā)表于 04-21 15:28 ?128次閱讀
    極速<b class='flag-5'>翻譯</b>官:打通ETHERCAT與Modbus RTU的“最后1毫秒”

    不僅僅是硬件!視美泰AI翻譯機(jī)解決方案,為企業(yè)級(jí)客戶打造一站式翻譯服務(wù)

    分散管理困難,IT運(yùn)維成本高這是一套完整的AI翻譯機(jī)解決方案視美泰AI翻譯機(jī)解決方案,不是簡(jiǎn)單的硬件銷售,而是一套完整的軟硬件一體產(chǎn)品,包含:方案核心三大件①核心主板——RK3568
    的頭像 發(fā)表于 04-03 14:09 ?1294次閱讀
    不僅僅是硬件!視美泰AI<b class='flag-5'>翻譯</b>機(jī)解決方案,為企業(yè)級(jí)客戶打造一站式<b class='flag-5'>翻譯</b>服務(wù)

    亮亮視野聯(lián)合智譜AI推出AR+AI會(huì)議翻譯系統(tǒng)

    2026中關(guān)村論壇主會(huì)場(chǎng),亮亮視野(LLVision)聯(lián)合智譜AI推出并部署了全球首創(chuàng)的AR+AI會(huì)議翻譯系統(tǒng),為主論壇及多場(chǎng)平行論壇提供大會(huì)翻譯保障。這套系統(tǒng)深度融合亮亮視野AR眼鏡與智譜AI
    的頭像 發(fā)表于 03-30 11:39 ?507次閱讀

    谷歌推出TranslateGemma全新開(kāi)放翻譯模型系列

    我們已正式推出 TranslateGemma,這一全新的開(kāi)放翻譯模型系列基于 Gemma 3 構(gòu)建,并提供 4B、12B 和 27B 三參數(shù)規(guī)模。TranslateGemma 的問(wèn)世標(biāo)志著開(kāi)放
    的頭像 發(fā)表于 02-26 10:22 ?764次閱讀

    視美泰發(fā)布AI即時(shí)翻譯機(jī)解決方案,硬核配置+多語(yǔ)種覆蓋破解跨語(yǔ)言溝通難題

    在全球深入推進(jìn)與AI技術(shù)規(guī)模商用的雙重驅(qū)動(dòng)下,跨語(yǔ)言溝通需求正迎來(lái)爆發(fā)式增長(zhǎng)。近日,視美泰正式發(fā)布AI即時(shí)翻譯機(jī)解決方案,以“核心硬件+智能算法+多模態(tài)交互”的完整
    的頭像 發(fā)表于 12-03 10:50 ?1293次閱讀
    視美泰發(fā)布AI即時(shí)<b class='flag-5'>翻譯</b>機(jī)解決方案,硬核配置+多語(yǔ)種覆蓋破解跨語(yǔ)言溝通難題

    智能“翻譯官”:MODBUS轉(zhuǎn)PROFIBUS網(wǎng)關(guān),解鎖攪拌站無(wú)人裝載新紀(jì)元

    智能“翻譯官”:MODBUS轉(zhuǎn)PROFIBUS網(wǎng)關(guān),解鎖攪拌站無(wú)人裝載新紀(jì)元 在工業(yè)自動(dòng)的浪潮中,數(shù)據(jù)協(xié)議的“語(yǔ)言不通”常常成為系統(tǒng)聯(lián)通的絆腳石。在一家現(xiàn)代攪拌站內(nèi),就上演了這樣一場(chǎng)精彩的“溝通
    的頭像 發(fā)表于 11-21 14:38 ?367次閱讀
    智能“<b class='flag-5'>翻譯</b>官”:MODBUS轉(zhuǎn)PROFIBUS網(wǎng)關(guān),解鎖攪拌站無(wú)人裝載新紀(jì)元

    亮亮視野AR翻譯眼鏡閃耀2025進(jìn)博會(huì)國(guó)際論壇

    11月6日,“進(jìn)博會(huì)·北京亦莊開(kāi)放合作論壇”在上海舉行。亮亮視野 Leion Hey2 作為論壇指定的 AR 翻譯眼鏡,提供現(xiàn)場(chǎng)翻譯技術(shù)服務(wù)。同時(shí),Leion Hey2 亮相國(guó)家展中國(guó)
    的頭像 發(fā)表于 11-11 10:02 ?764次閱讀

    亮亮視野AR翻譯眼鏡亮相HICOOL 2025全球創(chuàng)業(yè)者峰會(huì)

    、IASP世界大會(huì)和京臺(tái)科技論壇獨(dú)家提供AR翻譯技術(shù)服務(wù)之后,亮亮視野再次亮相大型國(guó)際論壇,旗下AR翻譯眼鏡逐漸成為北京文化科技新符號(hào),也是北京打造“全球創(chuàng)新創(chuàng)業(yè)生態(tài)之都”的最新實(shí)例。
    的頭像 發(fā)表于 10-23 17:34 ?1352次閱讀

    聲智科技AI翻譯耳機(jī)重塑智能聽(tīng)覺(jué)體驗(yàn)

    在日益緊密的全球浪潮中,跨語(yǔ)言溝通的障礙正在被前沿的聲學(xué)AI技術(shù)逐步瓦解。聲智AI翻譯耳機(jī),憑借深厚的聲學(xué)AI積累,率先實(shí)現(xiàn)了“跨語(yǔ)種音色與情感復(fù)刻技術(shù)”在實(shí)時(shí)
    的頭像 發(fā)表于 10-21 15:28 ?1171次閱讀
    聲智科技AI<b class='flag-5'>翻譯</b>耳機(jī)重塑智能聽(tīng)覺(jué)體驗(yàn)

    亮亮視野AR翻譯眼鏡亮相2025北京文化論壇

    近日,2025北京文化論壇在北京隆重開(kāi)幕。源自北京科創(chuàng)土壤的國(guó)家級(jí)“專精特新小巨人”企業(yè)亮亮視野,成為論壇指定AR翻譯眼鏡技術(shù)服務(wù)商,為主論壇等重要環(huán)節(jié)提供實(shí)時(shí)翻譯服務(wù)。這是繼日前為北
    的頭像 發(fā)表于 09-30 11:14 ?1249次閱讀

    國(guó)慶出國(guó)游,時(shí)空壺新T1翻譯機(jī),首個(gè)端側(cè)模型突破助力跨語(yǔ)言交流

    國(guó)慶將至,眾多游客計(jì)劃出國(guó)旅行,跨語(yǔ)言交流的順暢與否成為影響旅行體驗(yàn)的重要因素。時(shí)空壺新T1翻譯機(jī)作為行業(yè)技術(shù)領(lǐng)先產(chǎn)品,憑借其獨(dú)特優(yōu)勢(shì),為游客在海外的溝通交流保駕護(hù)航。新T1作為時(shí)空壺翻譯機(jī)品類中
    的頭像 發(fā)表于 09-12 12:20 ?1190次閱讀
    國(guó)慶出國(guó)游,時(shí)空壺新T1<b class='flag-5'>翻譯</b>機(jī),首個(gè)端側(cè)模型突破助力跨語(yǔ)言交流

    當(dāng)翻譯失去網(wǎng)絡(luò),時(shí)空壺新T1翻譯機(jī)開(kāi)創(chuàng)首個(gè)離線模型賦能全球溝通新體驗(yàn)

    在全球交流日益緊密的當(dāng)下,跨語(yǔ)言溝通工具的重要性愈發(fā)凸顯。近日,時(shí)空壺推出的T1翻譯機(jī)憑借其強(qiáng)大的離線模型與便捷應(yīng)用,成為市場(chǎng)焦點(diǎn),為人們?cè)诳鐕?guó)交流場(chǎng)景中帶來(lái)前所未有的便利。時(shí)空壺T1翻譯機(jī)搭載了
    的頭像 發(fā)表于 09-08 16:52 ?1390次閱讀
    當(dāng)<b class='flag-5'>翻譯</b>失去網(wǎng)絡(luò),時(shí)空壺新T1<b class='flag-5'>翻譯</b>機(jī)開(kāi)創(chuàng)首個(gè)離線模型賦能全球溝通新體驗(yàn)

    CC-Link IE 轉(zhuǎn) Modbus TCP,閥門通訊的“雙語(yǔ)翻譯官”

    。這就好比一位說(shuō)“高速實(shí)時(shí)語(yǔ)”的PLC,要和只會(huì)“經(jīng)典通用語(yǔ)”的閥門對(duì)話,此時(shí),一位可靠的“雙語(yǔ)翻譯官”——耐達(dá)訊通信技術(shù)協(xié)議轉(zhuǎn)換網(wǎng)關(guān),就顯得至關(guān)重要了。 協(xié)議轉(zhuǎn)換網(wǎng)關(guān)的核心工作原理就是“翻譯”。它在 CC-Link IE 網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-09 09:46 ?685次閱讀

    時(shí)空壺 T1 離線翻譯機(jī):解鎖無(wú)網(wǎng)生活溝通自由

    在全球浪潮席卷之下,跨國(guó)交流已然成為現(xiàn)代人生活的重要組成部分。無(wú)論是出國(guó)旅行、商務(wù)洽談,還是文化體驗(yàn),語(yǔ)言障礙始終是橫亙?cè)谌藗兠媲暗囊坏离y題。而網(wǎng)絡(luò)覆蓋的局限性,更是讓依賴在線翻譯的設(shè)備在關(guān)鍵時(shí)刻
    的頭像 發(fā)表于 06-05 10:30 ?1032次閱讀
    時(shí)空壺 T1 離線<b class='flag-5'>翻譯</b>機(jī):解鎖無(wú)網(wǎng)生活溝通自由

    Ethercat轉(zhuǎn)Profinet網(wǎng)關(guān)如何用“協(xié)議翻譯術(shù)”打通自動(dòng)產(chǎn)線任督二脈

    Ethercat轉(zhuǎn)Profinet網(wǎng)關(guān)如何用“協(xié)議翻譯術(shù)”打通自動(dòng)產(chǎn)線任督二脈
    的頭像 發(fā)表于 05-10 14:42 ?683次閱讀
    Ethercat轉(zhuǎn)Profinet網(wǎng)關(guān)如何用“協(xié)議<b class='flag-5'>翻譯</b>術(shù)”打通自動(dòng)<b class='flag-5'>化</b>產(chǎn)線任督二脈
    岳普湖县| 历史| 平南县| 凤台县| 贵州省| 龙岩市| 班玛县| 山西省| 东兴市| 潞城市| 新建县| 天门市| 繁峙县| 邓州市| 德州市| 梅州市| 兴山县| 开封市| 巫溪县| 黄陵县| 邹城市| 富顺县| 凉城县| 合作市| 兖州市| 哈尔滨市| 黑山县| 兴文县| 徐水县| 济阳县| 桑日县| 西安市| 文安县| 汾西县| 平湖市| 三江| 孝感市| 成都市| 睢宁县| 黑水县| 屏东市|