日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于語言和視覺處理的高效 Transformer能在多種語言和視覺任務(wù)中帶來優(yōu)異效果

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2021-12-28 10:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

白皮書《Transformer-LS:用于語言和視覺處理的高效 Transformer》中提出了“長(zhǎng)-短 Transformer” (Transformer-LS),這是一種高效的 Transformer 架構(gòu),用于為語言和視覺任務(wù)模擬中具有線性復(fù)雜度的長(zhǎng)序列。

鑒于 Transformer 的模型在自然語言處理 (NLP) 和計(jì)算機(jī)視覺領(lǐng)域已經(jīng)取得了巨大的成功。這種模型可受益于自注意力模塊,后者既可捕獲詞元間的相鄰相關(guān)性和長(zhǎng)距離相關(guān)性,同時(shí)又能在現(xiàn)代硬件上高效擴(kuò)展。

然而,自注意力機(jī)制所消耗的時(shí)間和內(nèi)存與輸入長(zhǎng)度呈二次方關(guān)系,使其處理長(zhǎng)序列的成本非常高昂。許多語言和視覺任務(wù)能夠從長(zhǎng)序列建模中獲益。在 NLP 中,文檔級(jí)任務(wù)需要處理較長(zhǎng)的文章,而語言模型的性能往往隨序列長(zhǎng)度而增加。

在計(jì)算機(jī)視覺里,大量任務(wù)涉及高分辨率圖像。而這些圖像在使用 Transformer 模型處理前,會(huì)被轉(zhuǎn)換成圖像塊的長(zhǎng)序列。因此,設(shè)計(jì)一種能泛化到各種不同領(lǐng)域的長(zhǎng)序列建模的高效注意力機(jī)制至關(guān)重要。

一直以來,業(yè)界提出了各種方法來減少完全注意力機(jī)制的二次方成本。但是,在語言和視覺領(lǐng)域都有良好應(yīng)用的高效注意力機(jī)制尚未得到深入研究。一類方法使用滑動(dòng)窗口和隨機(jī)稀疏模式等預(yù)定義模式對(duì)注意力矩陣進(jìn)行稀疏化處理。

這類方法使用強(qiáng)大的歸納偏置來改善計(jì)算性能和模型性能,但它們會(huì)限制自注意力層的能力,因?yàn)槊總€(gè)特定分詞器只能處理一個(gè)詞元子集。

另一類方法使用 low-rank 投影為輸入序列構(gòu)成低分辨率表示,但這類方法只能對(duì)特定的 NLP 任務(wù)有效。與稀疏注意力不同,這類方法允許每個(gè)分詞器處理整個(gè)輸入序列。但是,由于缺少高保真度詞元級(jí)信息,對(duì)于需要細(xì)粒度局部信息的任務(wù)(包括語言領(lǐng)域和視覺領(lǐng)域的標(biāo)準(zhǔn)基準(zhǔn)測(cè)試)而言,這類方法的性能有時(shí)并不優(yōu)于完全注意力或稀釋注意力機(jī)制。

盡管高效 Transformer 的發(fā)展相當(dāng)迅速,一些提出的架構(gòu)只適用于雙向模型。基于 Transformer 的自回歸模型已經(jīng)在語言建模 、圖像合成 和文本轉(zhuǎn)圖像合成領(lǐng)域取得了巨大的成功。這些領(lǐng)域都涉及長(zhǎng)文本或高分辨率圖像。

因此,有必要設(shè)計(jì)一種同時(shí)適用于自回歸模型和雙向模型的高效 Transformer。

在白皮書《Transformer-LS:用于語言和視覺處理的高效 Transformer》中,研究把局部窗口注意力和新穎的長(zhǎng)距離注意力統(tǒng)一成單個(gè)高效注意力機(jī)制。展示這兩種注意力機(jī)制的互補(bǔ)效應(yīng),能在多種語言和視覺任務(wù)中為自回歸模型和雙向模型帶來優(yōu)異的效果。

原文標(biāo)題:白皮書 | 《Transformer-LS:用于語言和視覺處理的高效Transformer》

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:彭菁
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1716

    瀏覽量

    47732
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    156

    瀏覽量

    6962

原文標(biāo)題:白皮書 | 《Transformer-LS:用于語言和視覺處理的高效Transformer》

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    人工智能多模態(tài)與視覺大模型開發(fā)實(shí)戰(zhàn) - 2026必會(huì)

    和訓(xùn)練,模型可以逐漸提升對(duì)圖像的理解能力,實(shí)現(xiàn)對(duì)各種視覺任務(wù)的精準(zhǔn)處理。 此外,視覺大模型的發(fā)展還得益于大規(guī)模數(shù)據(jù)集和強(qiáng)大計(jì)算資源的支持。海量標(biāo)注數(shù)據(jù)為模型提供了豐富的學(xué)習(xí)樣本,使其能
    發(fā)表于 04-15 16:06

    面向視覺語言導(dǎo)航的任務(wù)驅(qū)動(dòng)式地圖學(xué)習(xí)框架MapDream介紹

    視覺語言導(dǎo)航(VLN),地圖長(zhǎng)期作為獨(dú)立模塊構(gòu)建,并通過固定接口交由導(dǎo)航策略使用。無論是BEV網(wǎng)格、拓?fù)鋱D還是語義記憶模塊,這些表示大多脫離策略學(xué)習(xí)而設(shè)計(jì)。結(jié)果是,機(jī)器人即使掌握?qǐng)鼍暗男畔ⅲ踩钥赡芾@行甚至偏離目標(biāo),因?yàn)榈貓D
    的頭像 發(fā)表于 03-02 10:40 ?632次閱讀
    面向<b class='flag-5'>視覺</b><b class='flag-5'>語言</b>導(dǎo)航的<b class='flag-5'>任務(wù)</b>驅(qū)動(dòng)式地圖學(xué)習(xí)框架MapDream介紹

    自然語言處理NLP的概念和工作原理

    自然語言處理 (NLP) 是人工智能 (AI) 的一個(gè)分支,它會(huì)教計(jì)算機(jī)如何理解口頭和書面形式的人類語言。自然語言處理將計(jì)算
    的頭像 發(fā)表于 01-29 14:01 ?620次閱讀
    自然<b class='flag-5'>語言</b><b class='flag-5'>處理</b>NLP的概念和工作原理

    機(jī)器視覺網(wǎng)卡:工業(yè)視覺系統(tǒng)的高速傳輸基石

    在智能制造的浪潮,機(jī)器視覺技術(shù)如同工業(yè)設(shè)備的“精細(xì)之眼”,為生產(chǎn)線賦予了自動(dòng)化檢測(cè)、精細(xì)定位、智能分揀的主要能力。而這雙“眼睛”能否高效運(yùn)轉(zhuǎn),不只依賴于工業(yè)相機(jī)的成像精度和算法的處理
    的頭像 發(fā)表于 01-14 16:01 ?360次閱讀
    機(jī)器<b class='flag-5'>視覺</b>網(wǎng)卡:工業(yè)<b class='flag-5'>視覺</b>系統(tǒng)的高速傳輸基石

    低成本改造實(shí)錄:如何讓MODBUS TCP與PROFIBUS在鋁廠握手言和

    低成本改造實(shí)錄:如何讓MODBUS TCP與PROFIBUS在鋁廠握手言和 去年夏天,我負(fù)責(zé)的一個(gè)鋁電解車間數(shù)字化改造項(xiàng)目,遇到了個(gè)典型的老難題。中控室嶄新的監(jiān)控平臺(tái)說著流利的“MODBUS TCP
    的頭像 發(fā)表于 12-22 14:25 ?288次閱讀
    低成本改造實(shí)錄:如何讓MODBUS TCP與PROFIBUS在鋁廠握手<b class='flag-5'>言和</b>

    瑞芯微SOC智能視覺AI處理

    需要連接多種外設(shè)的產(chǎn)品。顯示: 支持雙屏異顯,最高4K@60fps輸出。 RK1126B: 一款集成自研NPU的智能視覺AI處理器,專注于視頻輸入端的AI分析與處理。CPU: 雙核A5
    發(fā)表于 12-19 13:44

    C語言和C++之間的區(qū)別是什么

    區(qū)別 1、面向?qū)ο缶幊?(OOP): C語言是一種面向過程的語言,它強(qiáng)調(diào)的是通過函數(shù)將任務(wù)分解為一系列步驟進(jìn)行執(zhí)行。 C++在C語言的基礎(chǔ)上擴(kuò)展了面向?qū)ο蟮奶匦裕С诸?class)
    發(fā)表于 12-11 06:23

    C語言特性

    1、高效性:直接操作硬件 C 語言代碼的執(zhí)行效率極高,這是其最為顯著的優(yōu)勢(shì)之一。它能夠直接訪問硬件資源,與底層硬件進(jìn)行緊密交互,充分發(fā)揮硬件的性能潛力。在嵌入式開發(fā),硬件資源往往十分有限,對(duì)程序
    發(fā)表于 11-24 07:01

    C語言在嵌入式開發(fā)的應(yīng)用

    對(duì)外部事件做出響應(yīng)并完成任務(wù)的系統(tǒng),對(duì)任務(wù)的響應(yīng)時(shí)間和執(zhí)行時(shí)間有著嚴(yán)格的要求。C 語言在實(shí)時(shí)系統(tǒng)開發(fā)具有重要的地位,它能夠滿足實(shí)時(shí)系統(tǒng)對(duì)高效
    發(fā)表于 11-21 08:09

    C語言和單片機(jī)C語言有什么差異

    單片機(jī)c語言相對(duì)于普通C語言增加了一些基本的指令,還有變量的賦值是16進(jìn)制,當(dāng)然單片機(jī)c語言只牽涉到普通c語言非?;A(chǔ)部分。 主要的差異具體體現(xiàn)在: 1、單片機(jī)
    發(fā)表于 11-14 07:55

    一文了解Mojo編程語言

    ,利用硬件加速提升效率。 科學(xué)計(jì)算與數(shù)據(jù)處理 高效處理大規(guī)模數(shù)值分析、基因組學(xué)數(shù)據(jù)等任務(wù)。 系統(tǒng)工具開發(fā) 開發(fā)操作系統(tǒng)級(jí)工具,結(jié)合 Python 的便捷性和 C 的性能優(yōu)勢(shì)。 嵌入式與
    發(fā)表于 11-07 05:59

    機(jī)器視覺缺陷檢測(cè)傳感器集成的五大關(guān)鍵

    質(zhì)量控制是制造流程至關(guān)重要但往往效率低下的環(huán)節(jié)。機(jī)器視覺能夠自動(dòng)化部分或全部缺陷檢測(cè)任務(wù),但僅靠技術(shù)本身無法帶來顯著改進(jìn)。必須理解并優(yōu)化整個(gè)機(jī)器
    的頭像 發(fā)表于 11-03 11:40 ?962次閱讀
    機(jī)器<b class='flag-5'>視覺</b>缺陷檢測(cè)<b class='flag-5'>中</b>傳感器集成的五大關(guān)鍵

    【HZ-T536開發(fā)板免費(fèi)體驗(yàn)】3 - Cangjie Magic調(diào)用視覺語言大模型(VLM)真香,是不是可以沒有YOLO和OCR了?

    Sampling)全面提升模型能力, 達(dá)到 10B 參數(shù)級(jí)別的視覺語言模型的最強(qiáng)性能,在18個(gè)榜單任務(wù)持平甚至超過8倍參數(shù)量的 Qwen-2.5-VL-72B。 同步開源基座模型
    發(fā)表于 08-01 22:15

    Aux-Think打破視覺語言導(dǎo)航任務(wù)的常規(guī)推理范式

    視覺語言導(dǎo)航(VLN)任務(wù)的核心挑戰(zhàn),是讓機(jī)器人在復(fù)雜環(huán)境中聽懂指令、看懂世界,并果斷行動(dòng)。我們系統(tǒng)性地引入推理任務(wù),探索其在導(dǎo)航策略學(xué)習(xí)
    的頭像 發(fā)表于 07-08 10:00 ?757次閱讀
    Aux-Think打破<b class='flag-5'>視覺</b><b class='flag-5'>語言</b>導(dǎo)航<b class='flag-5'>任務(wù)</b>的常規(guī)推理范式

    C語言精彩編程百例-364頁

    內(nèi)容提要 C是一種通用的程序設(shè)計(jì)語言,它包含了緊湊的表達(dá)式、豐富的運(yùn)算符集合、現(xiàn)代控制流以及數(shù)據(jù)結(jié)構(gòu)等四個(gè)部分。C語言功能豐富,衣達(dá)能力強(qiáng),使用起來靈活方便:它應(yīng)用面廣,可移植性強(qiáng),網(wǎng)時(shí)具有高級(jí)語言和
    發(fā)表于 06-13 17:28
    汤原县| 噶尔县| 东莞市| 新沂市| 海南省| 逊克县| 定州市| 蓬安县| 丹东市| 酉阳| 社会| 三台县| 元氏县| 策勒县| 连州市| 加查县| 陈巴尔虎旗| 静宁县| 桃源县| 西吉县| 合阳县| 秦安县| 河源市| 阳西县| 南阳市| 乌兰察布市| 安陆市| 绥德县| 余江县| 云阳县| 集贤县| 同仁县| 额尔古纳市| 神农架林区| 长春市| 新巴尔虎右旗| 四川省| 巴楚县| 上思县| 嵊泗县| 茌平县|