日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在手持設(shè)備上安裝龐大的transformer網(wǎng)絡(luò)

CEVA ? 來源:CEVA ? 2023-10-11 14:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Siri和OK Google是最早實(shí)現(xiàn)語(yǔ)音控制的應(yīng)用程序,這著實(shí)為我們帶來了很多樂趣;但很快我們便意識(shí)到,必須仔細(xì)說出請(qǐng)求才能獲得實(shí)用回答。

就現(xiàn)在所見,ChatGPT理解程度高,使用起來更容易,但直到最近,其功能還僅限于通過基于云的應(yīng)用程序進(jìn)行文本互動(dòng)?,F(xiàn)如今,ChatGPT是大勢(shì)所趨,手機(jī)幾乎人人必備,促使著針對(duì)ChatGPT(手機(jī)版)的transformer網(wǎng)絡(luò)盡快推出,讓每個(gè)擁有手機(jī)的人都能感受到大語(yǔ)言模型的威力。

在此方面面臨的一個(gè)明顯挑戰(zhàn)是,我們所知的 ChatGPT依賴于數(shù)萬(wàn)億個(gè)參數(shù)。而這種規(guī)模的transformer網(wǎng)絡(luò)只能在云端運(yùn)行。有人建議采用混合模式,即先由手機(jī)或其他應(yīng)用程序負(fù)責(zé)完成部分簡(jiǎn)單工作,再連接到云端進(jìn)行更為繁重的推理。然而,普通手機(jī)用戶可能無法接受混合解決方案與生俱來的長(zhǎng)時(shí)間延遲和隱私風(fēng)險(xiǎn)問題。因此,更好的方法是,直接在手機(jī)上處理大部分或全部transformer網(wǎng)絡(luò)工作,只在需要時(shí)將偶爾出現(xiàn)的匿名搜索請(qǐng)求轉(zhuǎn)至云端處理。

縮減網(wǎng)絡(luò)大小

如何在手持設(shè)備上安裝龐大的transformer網(wǎng)絡(luò)?Google DeepMind在檢索transformer方面取得了重大突破。其RETRO transformer網(wǎng)絡(luò)運(yùn)行時(shí)的大小只有 LLM transformer的百分之幾,因?yàn)榍罢叩哪P蛥?shù)中不包含具體數(shù)據(jù)。只保留了基本的語(yǔ)言對(duì)話技能,但在理解水平上仍可與GPT3相媲美。如此將網(wǎng)絡(luò)大小縮減到了約80億個(gè)參數(shù)。

CEVA在預(yù)處理時(shí)進(jìn)一步縮減此網(wǎng)絡(luò)大小,將對(duì)感興趣領(lǐng)域提示的準(zhǔn)確度幾乎沒有影響的參數(shù)歸零,進(jìn)行再訓(xùn)練。仔細(xì)利用這一功能可以大大加快transformer網(wǎng)絡(luò)分析的速度。

準(zhǔn)備邊緣模型的第二步是壓縮,CEVA對(duì)此非常熟悉,并在支持檢索transformer方面做得更好。我們充分利用NeuPro-M架構(gòu)進(jìn)行再訓(xùn)練,大力推進(jìn)此步驟,促使廣泛的混合定點(diǎn)精度和低精度選項(xiàng)降到4位,未來甚至還能降到2位。

通過使用這些技術(shù),我們可以將現(xiàn)有檢索transformer壓縮至最低1/20(較現(xiàn)在而言),盡管其相較LLM而言已經(jīng)壓縮了很多。將這種壓縮剪枝應(yīng)用于RETRO模型縮減后,可以產(chǎn)生巨大縮減,將萬(wàn)億參數(shù)模型轉(zhuǎn)換為十億參數(shù)模型,進(jìn)而有望實(shí)現(xiàn)ChatGPT(移動(dòng)版)。

NeuPro-M AI核心

當(dāng)然,僅僅適合的transformer網(wǎng)絡(luò)是不夠的。它還需要運(yùn)行得足夠快,才能滿足用戶對(duì)響應(yīng)時(shí)間的期望。而這一點(diǎn)可以通過專為L(zhǎng)LM應(yīng)用程序優(yōu)化的NeuPro-M NPU IP多引擎架構(gòu)實(shí)現(xiàn)。在此流程中,首先要做到的是由真正的稀疏引擎來進(jìn)行管理,且這一步舉足輕重。稀疏引擎管理可跳過權(quán)重或數(shù)據(jù)為零的冗余操作,提高吞吐量,這是需要注意的一點(diǎn)。而在預(yù)處理時(shí)縮減之后,會(huì)出現(xiàn)大量歸零參數(shù),盡管這些參數(shù)分布不均勻。對(duì)于這種非結(jié)構(gòu)化稀疏引擎,每個(gè)NeuPro-M處理器內(nèi)核中的專用稀疏引擎可發(fā)揮4倍性能優(yōu)勢(shì)(與傳統(tǒng)稀疏引擎相比),并相應(yīng)地降低功耗。

鑒于transformer架構(gòu)可以分解為可并行實(shí)現(xiàn)的離散正交運(yùn)算,下一優(yōu)化應(yīng)運(yùn)而生。此時(shí),可以利用 NeuPro-M多核架構(gòu)支持多達(dá)8個(gè)內(nèi)核。transformer中 query、key和value三個(gè)向量的計(jì)算會(huì)在引擎中分批進(jìn)行,在共享公共二級(jí)緩存的多個(gè)內(nèi)核并行處理。并行處理不僅有利于attention步驟,還有利于softmax步驟,以及計(jì)算attention函數(shù)之后的歸一化函數(shù)。在傳統(tǒng)的人工智能系統(tǒng)中,softmax可能是遏制性能提升的重大瓶頸。在NeuPro-M中,attention和softmax可以并行實(shí)現(xiàn),因此softmax對(duì)于吞吐時(shí)間的增加幾乎可以忽略不計(jì)。NeuPro-M在transformer計(jì)算中實(shí)現(xiàn)大規(guī)模并行處理如下圖所示。

fca80bde-67ff-11ee-939d-92fbcf53809c.png

fcbd0f2a-67ff-11ee-939d-92fbcf53809c.png

▲transformer計(jì)算中的可擴(kuò)展并行化

NeuPro-M架構(gòu)包括特殊支持,最大限度地提高芯片吞吐量,線程之間幾乎沒有停滯,進(jìn)一步簡(jiǎn)化這些流中的高度并行性以及線程之間的數(shù)據(jù)共享。

為ChatGPT(移動(dòng)版)構(gòu)建語(yǔ)音界面

完成最難的部分后,在前端添加語(yǔ)音識(shí)別和在后端添加文本轉(zhuǎn)語(yǔ)音,便可以通過額外相對(duì)簡(jiǎn)單的transformer網(wǎng)絡(luò)實(shí)現(xiàn)。將我們的ClearVox語(yǔ)音處理前端軟件連接到語(yǔ)音識(shí)別transformer,以輸入提示,并接受引導(dǎo),確定主transformer應(yīng)執(zhí)行哪一組精煉提示。必要時(shí),可從互聯(lián)網(wǎng)上檢索查詢相關(guān)文檔。最后,使用文本轉(zhuǎn)語(yǔ)音transformer對(duì)下載的回復(fù)或文件進(jìn)行語(yǔ)音處理?,F(xiàn)在來說,完全在手機(jī)上運(yùn)行,且具有完全基于語(yǔ)音的 ChatGPT功能界面便是ChatGPT(移動(dòng)版)的不同之處。

更廣泛的應(yīng)用

NeuPro-M平臺(tái)并不局限于ChatGPT(移動(dòng)版)這樣的GPT類應(yīng)用。它可以同樣應(yīng)用于任何生成式方法。例如,您可以使用穩(wěn)定的擴(kuò)散transformer生成圖像、視頻或任何其他人工生成或修改的體驗(yàn)。NeuPro-M解決方案在transformer網(wǎng)絡(luò)建模方面非常通用。

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    8340

    瀏覽量

    95608
  • 手持設(shè)備
    +關(guān)注

    關(guān)注

    0

    文章

    60

    瀏覽量

    24782
  • 應(yīng)用程序
    +關(guān)注

    關(guān)注

    38

    文章

    3346

    瀏覽量

    60435
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    156

    瀏覽量

    6963

原文標(biāo)題:針對(duì)ChatGPT(手機(jī)版)的優(yōu)化版Transformer網(wǎng)絡(luò)

文章出處:【微信號(hào):CEVA-IP,微信公眾號(hào):CEVA】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    何在 s32k312 板啟動(dòng)后驗(yàn)證 RAM 檢查?

    何在 s32k312 板啟動(dòng)后驗(yàn)證 RAM 檢查?我們是否有任何模塊或寄存器可以在啟動(dòng)期間驗(yàn)證 RAM CHECK。 我們正在使用 Autosar 模塊,到目前為止,我們找不到任何用于 RAM 檢查的 API。在手動(dòng)執(zhí)行時(shí),
    發(fā)表于 04-23 10:40

    FT 5000 Smart Transceiver與FT - X3 Communications Transformer:智能網(wǎng)絡(luò)新選擇

    FT 5000 Smart Transceiver與FT - X3 Communications Transformer:智能網(wǎng)絡(luò)新選擇 在智能網(wǎng)絡(luò)的發(fā)展進(jìn)程中,設(shè)備的性能、成本和兼容
    的頭像 發(fā)表于 03-31 09:10 ?167次閱讀

    請(qǐng)問如何在 VisionFive 23.04 安裝 Ubuntu 2?

    何在 VisionFive 23.04 安裝 Ubuntu 2?
    發(fā)表于 03-11 06:30

    MAX8969:手持設(shè)備應(yīng)用的高效升壓轉(zhuǎn)換器

    MAX8969:手持設(shè)備應(yīng)用的高效升壓轉(zhuǎn)換器 在手持設(shè)備的電源管理領(lǐng)域,高效、緊湊且功能強(qiáng)大的升壓轉(zhuǎn)換器至關(guān)重要。今天,我們就來深入了解一下Maxim Integrated推出的MAX
    的頭像 發(fā)表于 03-10 16:55 ?494次閱讀

    何在 Vision Five 2 安裝 python 庫(kù)?

    這可能是一個(gè)完全愚蠢的問題,但我如何在 Vision Five 2 安裝 python 庫(kù)。 使用該命令后,它給了我這個(gè)錯(cuò)誤。 默認(rèn)為用戶安裝,因?yàn)槠胀ㄕ军c(diǎn)包不可寫 錯(cuò)誤:找不到滿足
    發(fā)表于 03-06 07:51

    何在2026年Rocky Linux(8、9和10)安裝Docker

    負(fù)載的強(qiáng)大平臺(tái)。 本指南是一個(gè)統(tǒng)一的資源,解釋如何在 Rocky Linux 8、9 和 10 安裝 Docker,驗(yàn)證安裝,配置 Docker Compose,并
    的頭像 發(fā)表于 01-12 17:21 ?1964次閱讀

    何在DGX Spark運(yùn)行NVIDIA Omniverse

    首先感謝 Vigor 同學(xué)第一時(shí)間的分享,以下是具體如何在 DGX Spark 運(yùn)行 Omniverse 的方法。
    的頭像 發(fā)表于 12-17 10:13 ?969次閱讀
    如<b class='flag-5'>何在</b>DGX Spark<b class='flag-5'>上</b>運(yùn)行NVIDIA Omniverse

    手持移動(dòng)終端的常見設(shè)備,智能移動(dòng)終端設(shè)備的機(jī)型有哪些?

    目前常見的智能手持移動(dòng)終端設(shè)備有:PDA手持終端,RFID讀寫器,條碼掃碼移動(dòng)終端、二維碼掃碼手持終端、NFC手持終端、工業(yè)平板、測(cè)溫測(cè)振P
    的頭像 發(fā)表于 12-03 11:14 ?1259次閱讀
    <b class='flag-5'>手持</b>移動(dòng)終端的常見<b class='flag-5'>設(shè)備</b>,智能移動(dòng)終端<b class='flag-5'>設(shè)備</b>的機(jī)型有哪些?

    Transformer如何讓自動(dòng)駕駛變得更聰明?

    ]自動(dòng)駕駛中常提的Transformer本質(zhì)是一種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),最早在自然語(yǔ)言處理里火起來。與卷積神經(jīng)網(wǎng)絡(luò)(CNN)或循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN
    的頭像 發(fā)表于 11-19 18:17 ?2488次閱讀

    何在NVIDIA Jetson AGX Thor通過Docker高效部署vLLM推理服務(wù)

    繼系統(tǒng)安裝與環(huán)境配置后,本期我們將繼續(xù)帶大家深入 NVIDIA Jetson AGX Thor 的開發(fā)教程之旅,了解如何在 Jetson AGX Thor ,通過 Docker 高效部署 vLLM 推理服務(wù)。
    的頭像 發(fā)表于 11-13 14:08 ?4465次閱讀
    如<b class='flag-5'>何在</b>NVIDIA Jetson AGX Thor<b class='flag-5'>上</b>通過Docker高效部署vLLM推理服務(wù)

    RFID手持掃描設(shè)備是什么 RFID手持掃描設(shè)備有什么作用

    在物流倉(cāng)庫(kù)、商場(chǎng)貨架、圖書館等場(chǎng)景中,你可能見過工作人員拿著一個(gè)類似手機(jī)或?qū)χv機(jī)的設(shè)備,輕輕一掃就能快速識(shí)別物品信息——這就是RFID手持掃描設(shè)備。它不像傳統(tǒng)條碼掃描那樣需要對(duì)準(zhǔn)標(biāo)簽,哪怕物品被包裝
    的頭像 發(fā)表于 08-18 16:22 ?1322次閱讀
    RFID<b class='flag-5'>手持</b>掃描<b class='flag-5'>設(shè)備</b>是什么 RFID<b class='flag-5'>手持</b>掃描<b class='flag-5'>設(shè)備</b>有什么作用

    什么是RFID手持終端設(shè)備

    在大型倉(cāng)庫(kù)里,管理員握著一個(gè)巴掌大的設(shè)備在貨架間漫步,無需逐件翻看,數(shù)十件貨物的信息就自動(dòng)顯示在屏幕;在圖書館,工作人員用一個(gè)便攜儀器掃過書架,幾十本圖書的借閱狀態(tài)瞬間統(tǒng)計(jì)完成——這些高效場(chǎng)景
    的頭像 發(fā)表于 08-01 15:01 ?1235次閱讀
    什么是RFID<b class='flag-5'>手持</b>終端<b class='flag-5'>設(shè)備</b>?

    【經(jīng)驗(yàn)分享】在Omni3576編譯Redis-8.0.2源碼,并安裝及性能測(cè)試

    本文首先介紹Redis是什么,然后介紹如何在Omni3576編譯Redis-8.0.2源碼,以及從源碼編譯、安裝Redis,最后介紹如何在Omni3576
    的頭像 發(fā)表于 06-05 08:05 ?1117次閱讀
    【經(jīng)驗(yàn)分享】在Omni3576<b class='flag-5'>上</b>編譯Redis-8.0.2源碼,并<b class='flag-5'>安裝</b>及性能測(cè)試

    何在Android設(shè)備安裝Cyusb3014芯片驅(qū)動(dòng)?

    1.如何在Android設(shè)備安裝Cyusb3014芯片驅(qū)動(dòng)? 我們?cè)?Windows 上有 FX3 驅(qū)動(dòng)程序 SDK。 2.如何在Andr
    發(fā)表于 05-15 07:23

    何在Ubuntu安裝NVIDIA顯卡驅(qū)動(dòng)?

    專有顯卡驅(qū)動(dòng)。本文將詳細(xì)介紹在Ubuntu系統(tǒng)安裝NVIDIA顯卡驅(qū)動(dòng)的多種方法,幫助用戶根據(jù)自身情況選擇最適合的安裝方式。 二,硬件參數(shù) 平臺(tái):PX22_GPU CPU:I7-1165G7
    的頭像 發(fā)表于 05-07 16:05 ?2965次閱讀
    如<b class='flag-5'>何在</b>Ubuntu<b class='flag-5'>上</b><b class='flag-5'>安裝</b>NVIDIA顯卡驅(qū)動(dòng)?
    潮安县| 湟中县| 襄樊市| 政和县| 光泽县| 固镇县| 兴山县| 五台县| 南城县| 鄂尔多斯市| 安多县| 自治县| 昭觉县| 区。| 长顺县| 平阴县| 桦南县| 日喀则市| 华蓥市| 神池县| 钦州市| 陇西县| 高平市| 青河县| 阿克苏市| 武胜县| 新巴尔虎左旗| 高安市| 凌海市| 宁化县| 天津市| 皋兰县| 涡阳县| 喜德县| 东源县| 克拉玛依市| 杂多县| 乐平市| 东源县| 铜山县| 贵定县|