日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

簡述位置編碼在注意機制中的作用

深度學(xué)習自然語言處理 ? 來源:DeepHub ? 作者:DeepHub ? 2021-06-16 17:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

神經(jīng)網(wǎng)絡(luò)知識。

有一種叫做注意機制的東西,但是你不需要知道注意力具體實現(xiàn)。

RNN/LSTM的不足。

A. Vaswani等人的《Attention Is All You Need》被認為是解決了眾所周知的LSTM/RNN體系結(jié)構(gòu)在深度學(xué)習空間中的局限性的突破之一。本文介紹了transformers 在seq2seq任務(wù)中的應(yīng)用。該論文巧妙地利用了 D.Bahdanau 等人通過聯(lián)合學(xué)習對齊和翻譯的神經(jīng)機器翻譯注意機制的使用。并且提供一些示例明確且詳盡地解釋了注意力機制的數(shù)學(xué)和應(yīng)用。

在本文中,我將專注于注意力機制的位置編碼部分及其數(shù)學(xué)。

假設(shè)您正在構(gòu)建一個 seq2seq 學(xué)習任務(wù),并且您想要開發(fā)一個模型,該模型將輸入英語句子并將其翻譯成其他 語言?!癆ll animals are equal but some are more equal than others ”→Badhā prā?ī’ō samāna chē parantu kē?alāka an’ya karatā vadhu samāna chē你的第一步是獲取這個輸入句子,運行一個分詞器,將它轉(zhuǎn)換成數(shù)字,然后將它傳遞給一個嵌入層,這可能會為這個句子中的每個單詞添加一個額外的維度。

在運行 RNN 或 LSTM 時,隱藏狀態(tài)保留單詞在句子中的相對位置信息。然而,在 Transformer 網(wǎng)絡(luò)中,如果編碼器包含一個前饋網(wǎng)絡(luò),那么只傳遞詞嵌入就等于為您的模型增加了不必要的混亂,因為在詞嵌入中沒有捕獲有關(guān)句子的順序信息。為了處理單詞相對位置的問題,位置編碼的想法出現(xiàn)了。

在從嵌入層提取詞嵌入后,位置編碼被添加到這個嵌入向量中。

解釋位置編碼最簡單的方法是為每個單詞分配一個唯一的數(shù)字 ∈ ? ?;蛘邽槊總€單詞分配一個在 [0,1] ∈ ? 范圍內(nèi)的實數(shù)(如果輸入句子很長,這樣可以處理很大的值)。但是,上述兩種方法都沒有捕捉到單詞之間時間步長的準確性。為了克服這個問題,本文使用了 sin 和 cosine 函數(shù)形式的位置編碼。

打個比方,我們輸入模型的序列,無論是句子、視頻序列還是股票市場價格數(shù)據(jù),都將始終是時域信號。表示時域信號的最佳方式是通過正弦方程 sin(ωt)。如果我們巧妙地使用這個波動方程,我們可以在一次拍攝中捕獲詞嵌入的時間和維度信息。

讓我們看一下這個等式,在接下來的步驟中,我們將嘗試把它形象化。

052682a0-cab3-11eb-9e57-12bb97331649.png

讓我們考慮一個簡單的句子,它被分詞,然后它的詞嵌入被提取。句子長度為5,嵌入維數(shù)為8。因此,每個單詞都表示為1x8的向量。

現(xiàn)在我們在時間維度上取一個序列把正弦PE向量加到這個嵌入向量上。

進一步,我們對沿dim維數(shù)的其他向量做類似的操作。

本文在嵌入向量中交替加入正弦和余弦。如果dim是偶數(shù),則sin級數(shù)相加,如果dim是奇數(shù),則cos級數(shù)相加。

這很好地捕獲了沿時間維度(或等式中描述的 pos 維度。我將 pos 和 time 互換使用,因為它們意味著相同的事情)但是如何也捕獲沿dims維度的相對位置信息呢?這里的答案也在于等式本身。ω 項。

05f41878-cab3-11eb-9e57-12bb97331649.png

隨著 i 從 0 增加到 d_embedding/2,頻率也從 1/2π 減少到 1/(2π.10000)

因此我們看到,沿著無序方向的每個向量,位置的唯一性被捕獲。該論文還描述了這種編碼的魯棒性。但是我仍然無法找出為什么特別使用數(shù)字 10000 進行位置編碼(它可能是一個超參數(shù)嗎?)。這個解釋粗略地展示了如何使用正弦和余弦對于模型理解是非常合理和有效的。下面的圖表本身講述了位置編碼如何隨位置(時間)和尺寸變化。

人們可以很容易地看到,這些是簡單的時頻圖,其中位置代表時間,深度代表頻率。時間頻率圖已被用于從射電天文學(xué)到材料光譜分析的許多應(yīng)用中。因此,從現(xiàn)有的現(xiàn)實世界系統(tǒng)構(gòu)建類比確實可以更好地理解問題。

這是我對注意力機制中使用的位置編碼的看法。在接下來的系列中,我將嘗試撰寫有關(guān)編碼器-解碼器部分的內(nèi)容,并將注意力應(yīng)用于現(xiàn)實世界的規(guī)模問題。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4844

    瀏覽量

    108203
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    1041

    瀏覽量

    57155
  • rnn
    rnn
    +關(guān)注

    關(guān)注

    0

    文章

    92

    瀏覽量

    7374
  • LSTM
    +關(guān)注

    關(guān)注

    0

    文章

    63

    瀏覽量

    4448

原文標題:位置編碼在注意機制中的作用

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    無刷電機驅(qū)動板在位置傳感、功率驅(qū)動及保護機制的綜合作用

    硬件載體,并非單一功能模塊,而是集 高精度位置傳感采集、精密功率驅(qū)動、全鏈路故障保護 于一體的綜合控制平臺。本文從位置傳感、功率驅(qū)動、保護機制三大核心模塊出發(fā),系統(tǒng)解析驅(qū)動板無刷
    的頭像 發(fā)表于 03-31 16:33 ?160次閱讀

    磁鐵在編碼作用與應(yīng)用

    編碼,磁鐵的作用不可小覷,常用的磁性材料主要是釹鐵硼和鐵氧體,今天這篇文章主要介紹下磁鐵用于哪些編碼器類型,以及其具體作用。磁鐵在
    的頭像 發(fā)表于 03-19 14:42 ?454次閱讀
    磁鐵在<b class='flag-5'>編碼</b>器<b class='flag-5'>中</b>的<b class='flag-5'>作用</b>與應(yīng)用

    麥歌恩AMR/TMR磁編碼器核心原理與高精度位置檢測技術(shù)

    AMR與TMR的物理機理、芯片內(nèi)部傳感架構(gòu)、信號處理流程、高精度解算算法及工程化誤差抑制技術(shù),完整揭示麥歌恩磁編碼器從磁場到角度的全鏈路工作機制,為高精度運動控制的位置反饋設(shè)計提供理論與實踐依據(jù)。全文約2000字,適合硬件開發(fā)、
    的頭像 發(fā)表于 03-04 16:01 ?362次閱讀

    磁場空間分布感知型位置編碼與測速原理

    一、核心原理與技術(shù)體系 (一)位置編碼:磁場空間指紋的感知與匹配 ? ? ? ? 磁場空間分布感知型位置編碼的本質(zhì),是利用磁場在三維空間中 “位置
    的頭像 發(fā)表于 02-27 15:40 ?257次閱讀

    淺談錫膏在手機制造上的作用

    錫膏在手機制扮演著“隱形橋梁”與“工藝基石”的雙重角色,其作用貫穿電路板焊接、元件可靠性保障、生產(chǎn)效率提升及質(zhì)量管控等核心環(huán)節(jié),是確保手機性能穩(wěn)定、壽命持久的關(guān)鍵材料。以下從功能實現(xiàn)、工藝價值及行業(yè)趨勢三個維度展開分析:
    的頭像 發(fā)表于 02-25 17:16 ?638次閱讀

    磁性編碼器磁環(huán)的作用有哪些?

    磁性編碼器是一種利用磁場變化來檢測轉(zhuǎn)軸角度、轉(zhuǎn)速或位移的傳感裝置,其中磁環(huán)是關(guān)鍵的感應(yīng)元件。磁環(huán)通過與磁敏傳感器的配合,實現(xiàn)高精度、非接觸式的信號采集。它不僅決定了編碼器的測量精度和穩(wěn)定性,也是影響系統(tǒng)可靠性的重要因素,下面是磁性編碼
    的頭像 發(fā)表于 01-14 16:01 ?461次閱讀
    磁性<b class='flag-5'>編碼</b>器磁環(huán)的<b class='flag-5'>作用</b>有哪些?

    MOSFET電源控制作用是什么?

    請問MOSFET電源控制作用是什么?
    發(fā)表于 12-16 06:37

    `lv_obj_tree.h` **LVGL v9** 位置作用

    lv_obj_tree.h LVGL v9 位置作用如下: 文件路徑 lv_obj_tree.h 位于 LVGL 源碼的 src/core/ 目錄下,完整路徑是: lvgl/
    發(fā)表于 11-13 15:49

    舵機伺服編碼

    —— 沒有編碼器的反饋,舵機就無法判斷自身是否到達目標位置,控制精度會大幅下降。 核心作用:實現(xiàn) “閉環(huán)控制” 舵機伺服編碼器的本質(zhì)是為舵機提供 “
    的頭像 發(fā)表于 10-30 10:05 ?506次閱讀

    集成MT6816磁性角度編碼器實現(xiàn)伺服電機緊湊型非接觸位置傳感

    隨著工業(yè)自動化技術(shù)的快速發(fā)展,伺服電機作為核心執(zhí)行元件,其位置檢測精度和可靠性直接影響系統(tǒng)性能。傳統(tǒng)光電編碼器存在易受污染、抗震性差等固有缺陷,而磁性編碼器憑借非接觸式測量、抗干擾能力強等優(yōu)勢,正
    的頭像 發(fā)表于 08-16 14:15 ?1607次閱讀

    油駁器空壓機斷油保護作用

    油駁器空壓機斷油保護作用 油駁器(根據(jù)客戶提供的現(xiàn)場空壓機油濾料號來定制)是空壓機斷油保護裝置的核心配件,被用于油路系統(tǒng)
    發(fā)表于 06-24 14:03

    什么是伺服電機編碼器?作用/關(guān)鍵技術(shù)/選型等一起看看吧!

    什么是伺服電機編碼器? 伺服電機編碼器是伺服系統(tǒng)的核心反饋元件,用于實時檢測電機的轉(zhuǎn)速、位置、角度等參數(shù),并將信號反饋給控制器(如伺服驅(qū)動器),形成閉環(huán)控制,確保電機運動的精準性和穩(wěn)
    的頭像 發(fā)表于 06-09 11:07 ?3308次閱讀
    什么是伺服電機<b class='flag-5'>編碼</b>器?<b class='flag-5'>作用</b>/關(guān)鍵技術(shù)/選型等一起看看吧!

    精準進階:增量型位置編碼器技術(shù)解析與應(yīng)用突破

    工業(yè)自動化與精密制造領(lǐng)域,位置測量技術(shù)是決定設(shè)備性能與效率的核心要素。增量型位置編碼器憑借其高性價比、動態(tài)響應(yīng)速度及靈活性,成為數(shù)控機床、機器人關(guān)節(jié)、自動化流水線等場景
    的頭像 發(fā)表于 05-19 08:36 ?815次閱讀
    精準進階:增量型<b class='flag-5'>位置</b><b class='flag-5'>編碼</b>器技術(shù)解析與應(yīng)用突破

    超級電容故障指示器作用有哪些?

    超級電容故障指示器作用有哪些?安裝在輸配電線路、電力電纜及開關(guān)柜進出線上的故障指示器電流流通的線路起著非常重要的
    的頭像 發(fā)表于 05-16 08:41 ?827次閱讀
    超級電容<b class='flag-5'>在</b>故障指示器<b class='flag-5'>中</b>的<b class='flag-5'>作用</b>有哪些?

    工業(yè)相機焊縫跟蹤的關(guān)鍵作用有哪些

    工業(yè)相機焊縫跟蹤系統(tǒng),扮演了捕捉、處理與反饋焊縫位置信息的核心角色,通過高速、高分辨率的圖像采集,并結(jié)合智能算法的實時圖像處理,成為焊縫跟蹤系統(tǒng)的“眼睛”,能夠
    的頭像 發(fā)表于 05-13 17:56 ?867次閱讀
    工業(yè)相機<b class='flag-5'>在</b>焊縫跟蹤<b class='flag-5'>中</b>的關(guān)鍵<b class='flag-5'>作用</b>有哪些
    博罗县| 余庆县| 金塔县| 焉耆| 枣庄市| 湛江市| 兴业县| 左权县| 延津县| 社会| 绥化市| 成都市| 铜川市| 黑水县| 顺义区| 政和县| 青河县| 句容市| 博客| 政和县| 马龙县| 伊金霍洛旗| 芒康县| 巨野县| 任丘市| 辽源市| 周口市| 西青区| 洪洞县| 云南省| 弥渡县| 南陵县| 元江| 海伦市| 七台河市| 桐柏县| 元江| 霸州市| 莱西市| 东港市| 兰溪市|