日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

倪亞宇:面向端側(cè)智能應(yīng)用,國科微打造更高效的NPU與工具鏈

科技訊息 ? 來源:科技訊息 ? 作者:科技訊息 ? 2026-04-03 10:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

4月1日,在2026中國IC領(lǐng)袖峰會(huì)“邊緣AI與算力芯片”垂直技術(shù)論壇上,國科微AI算法部部長倪亞宇發(fā)表題為《FlashAttention-4:新一代大模型推理NPU流水線范式設(shè)計(jì)》的主題演講。

wKgZPGnPJJaANhzSAAPFs7tf1RE06.jpeg

隨著大模型加速走向產(chǎn)業(yè)落地,推理效率、內(nèi)存帶寬與系統(tǒng)功耗成為端側(cè)部署的關(guān)鍵瓶頸。尤其在Transformer與大型語言模型持續(xù)演進(jìn)的背景下,注意力機(jī)制(Attention)的高效實(shí)現(xiàn),已成為芯片架構(gòu)與工具鏈優(yōu)化的重要突破口。

倪亞宇表示,國科微正聚焦FlashAttention等前沿技術(shù)在NPU平臺(tái)上的落地探索,推動(dòng)構(gòu)建更適合端側(cè)量產(chǎn)部署的NPU架構(gòu)與工具鏈,為自動(dòng)駕駛、邊緣計(jì)算、智能終端及AIGC等場景提供高效能算力支撐。

NPU部署“滿血版”FlashAttention仍面臨挑戰(zhàn)

作為大模型中的核心計(jì)算結(jié)構(gòu)之一,注意力機(jī)制在實(shí)際運(yùn)行中普遍面臨訪存開銷高、流水線效率受限等問題。FlashAttention的提出,為解決這一問題提供了新的路徑。

FlashAttention是由斯坦福大學(xué)Tri Dao等人于2022年提出的一種快速且內(nèi)存高效的精確注意力算法。它通過對(duì)注意力計(jì)算過程進(jìn)行等價(jià)重構(gòu),通過分塊計(jì)算、在線Softmax、重計(jì)算與異步流水等方式,將中間計(jì)算過程保留在片上緩存中,減少外部存儲(chǔ)訪問帶寬壓力,顯著提升推理效率。

在剛剛過去的3月中旬,F(xiàn)lashAttention 4.0版本正式發(fā)布。倪亞宇指出,F(xiàn)lashAttention從1.0演進(jìn)至4.0,在并行性、長序列支持、低精度計(jì)算及異步執(zhí)行等方面持續(xù)增強(qiáng)。但相較GPU,當(dāng)前NPU在向量單元算力、異步流水排布、動(dòng)態(tài)調(diào)度及超長上下文等能力上仍存差距。倪亞宇指出,要實(shí)現(xiàn)“滿血版”FlashAttention,需圍繞計(jì)算流水線、數(shù)據(jù)復(fù)用與系統(tǒng)帶寬進(jìn)行協(xié)同設(shè)計(jì)。

wKgZO2nPJJeAC-ynAARFnfW13jQ55.jpeg

國科微NPU 4.0:構(gòu)建更高效的推理單元

自2020年起,國科微持續(xù)投入NPU自主研發(fā),形成從GKNPU 1.0到4.0的演進(jìn)路線,產(chǎn)品能力向更高算力、更廣模型覆蓋與更優(yōu)能效比升級(jí)。目前,國科微AI視覺與車載AI系列芯片已搭載3.0版本NPU,支持0.5T至8T算力,支持視覺、音頻、時(shí)序等AI模型在端側(cè)芯片應(yīng)用落地。

在GKNPU 4.0架構(gòu)設(shè)計(jì)中,國科微提出面向高效注意力計(jì)算的增強(qiáng)型脈動(dòng)陣列架構(gòu),針對(duì)性擴(kuò)展矩陣和向量計(jì)算能力,強(qiáng)化對(duì)大模型注意力機(jī)制中的關(guān)鍵操作的支持,壓縮數(shù)據(jù)搬運(yùn)路徑與流水線開銷,增強(qiáng)片上閉環(huán)計(jì)算能力。該設(shè)計(jì)旨在減少對(duì)外部帶寬的依賴,提升推理鏈路執(zhí)行效率,有效應(yīng)對(duì)大模型推理中的帶寬瓶頸、激活值碎片化及超長上下文的內(nèi)存壓力。

強(qiáng)化工具鏈,推動(dòng)高效規(guī)?;渴?/p>

在NPU架構(gòu)演進(jìn)的同時(shí),國科微持續(xù)強(qiáng)化工具鏈能力。新一代GKToolchain 3.0面向端側(cè)異構(gòu)算力場景,重點(diǎn)提升硬件感知編譯、自動(dòng)分塊、自動(dòng)向量化、異步數(shù)據(jù)讀寫與計(jì)算流水編排能力,推動(dòng)模型部署從“可適配”邁向“高效率、可規(guī)?;薄?/p>

同時(shí),工具鏈圍繞動(dòng)態(tài)內(nèi)存管理、投機(jī)推理加速等前沿方向持續(xù)演進(jìn),增強(qiáng)對(duì)長上下文管理及復(fù)雜推理流程的支撐能力,助力客戶高效完成從模型到芯片的部署閉環(huán)。

隨著AI應(yīng)用從訓(xùn)練側(cè)走向推理側(cè)、從云端走向終端,產(chǎn)業(yè)對(duì)算力平臺(tái)的要求正從“高峰值性能”轉(zhuǎn)向“高能效、可量產(chǎn)、易部署”的綜合能力。NPU在端側(cè)規(guī)?;涞刂芯邆滹@著的成本與功耗優(yōu)勢。

倪亞宇表示,國科微將持續(xù)堅(jiān)持算法與硬件協(xié)同創(chuàng)新,圍繞大模型推理核心瓶頸,不斷完善NPU架構(gòu)、產(chǎn)品能力與工具鏈體系,推動(dòng)端側(cè)智能計(jì)算平臺(tái)向更高性能、更低功耗、更強(qiáng)工程可落地方向演進(jìn),為客戶提供更具競爭力的算力方案。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4810

    瀏覽量

    98610
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41319

    瀏覽量

    302703
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    387

    瀏覽量

    21374
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    黑芝麻智能基于華山A2000芯片打造全新自研高效易用山海AI工具

    黑芝麻智能新一代山海AI工具以“高效易用”為核心理念,打通智駕算法開發(fā)全路壁壘,真正實(shí)現(xiàn)了“從原型到量產(chǎn),
    的頭像 發(fā)表于 04-30 10:20 ?288次閱讀

    子公司榮獲“2026中IC設(shè)計(jì)成就獎(jiǎng)”

    3月31日,2026中IC領(lǐng)袖峰會(huì)暨中國IC設(shè)計(jì)成就獎(jiǎng)?lì)C獎(jiǎng)典禮在上海舉行。旗下全資子公司——杭州
    的頭像 發(fā)表于 04-02 16:52 ?1034次閱讀
    <b class='flag-5'>國</b><b class='flag-5'>科</b><b class='flag-5'>微</b>子公司榮獲“2026中<b class='flag-5'>國</b>IC設(shè)計(jì)成就獎(jiǎng)”

    slkor持續(xù)推進(jìn)企業(yè)數(shù)字化升級(jí),將產(chǎn)品數(shù)據(jù)成功導(dǎo)入創(chuàng)工業(yè)基礎(chǔ)資源庫及supply frame旗下Datasheet5平臺(tái)

    slkor持續(xù)推進(jìn)企業(yè)數(shù)字化升級(jí),將產(chǎn)品數(shù)據(jù)成功導(dǎo)入創(chuàng)工業(yè)基礎(chǔ)資源庫及supply frame旗下Datasheet5平臺(tái),以及加入該平臺(tái)的“芯耀計(jì)劃”,實(shí)現(xiàn)了技術(shù)數(shù)據(jù)與產(chǎn)業(yè)
    發(fā)表于 03-18 10:55

    芯科技側(cè)AI MCU芯片CCR4001S出貨量突破10萬顆

    近期,芯科技邊緣側(cè)/側(cè) AI MCU CCR4001S以10萬顆交貨的新里程碑,助力客戶在智能時(shí)代開啟新的動(dòng)態(tài)節(jié)能征程!
    的頭像 發(fā)表于 02-09 16:02 ?1840次閱讀
    <b class='flag-5'>國</b>芯科技<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI MCU芯片CCR4001S出貨量突破10萬顆

    【新品發(fā)布】艾為重磅發(fā)布側(cè)AI高性能NPU語音芯片,打造智能語音體驗(yàn)新標(biāo)桿

    數(shù)模龍頭艾為電子全新推出高性能NPU神經(jīng)網(wǎng)絡(luò)智能語音處理芯片:AWA89601,集成音頻專用NPU(神經(jīng)網(wǎng)絡(luò)處理器),通過聲音模型訓(xùn)練與NPU硬件結(jié)合,該芯片在AI降噪、AI人聲增強(qiáng)、
    的頭像 發(fā)表于 01-07 18:33 ?582次閱讀
    【新品發(fā)布】艾為重磅發(fā)布<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI高性能<b class='flag-5'>NPU</b>語音芯片,<b class='flag-5'>打造</b><b class='flag-5'>智能</b>語音體驗(yàn)新標(biāo)桿

    安謀科技:側(cè)NPU技術(shù)創(chuàng)新,拉動(dòng)AI算力落地引擎

    X3 NPU IP以及生態(tài)建設(shè)、NPU發(fā)展趨勢等話題。 ? 圖:安謀科技產(chǎn)品總監(jiān)鮑敏祺 ? 周易X3 NPU IP正當(dāng)時(shí) ? 安謀科技周易X3 NPU IP
    的頭像 發(fā)表于 12-09 16:44 ?6148次閱讀
    安謀科技:<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>NPU</b>技術(shù)創(chuàng)新,拉動(dòng)AI算力落地引擎

    芯原與谷歌聯(lián)合推出開源Coral NPU IP

    芯原股份近日宣布與谷歌聯(lián)合推出面向始終在線、超低能耗側(cè)大語言模型應(yīng)用的Coral NPU IP。
    的頭像 發(fā)表于 11-13 11:24 ?1285次閱讀
    芯原與谷歌聯(lián)合推出開源Coral <b class='flag-5'>NPU</b> IP

    力合PLC獲朵集團(tuán)選用,打造新一代互聯(lián)互通酒店智能客控

    近期,朵集團(tuán)正式發(fā)布智能客控招標(biāo)公告,明確要各廠家客控方案“基于力合PLC客控模組的定制通訊協(xié)議方案”,覆蓋朵、朵S、薩和等全系列酒
    的頭像 發(fā)表于 11-01 07:03 ?1279次閱讀
    力合<b class='flag-5'>微</b>PLC獲<b class='flag-5'>亞</b>朵集團(tuán)選用,<b class='flag-5'>打造</b>新一代互聯(lián)互通酒店<b class='flag-5'>智能</b>客控

    精彩亮相CPSE安博會(huì)2025,以視覺AI洞見未來

    通過此次CPSE安博會(huì),不僅系統(tǒng)展示了從視覺AI到側(cè)計(jì)算的完整產(chǎn)品布局,更凸顯了以“圓鸮”AI ISP與自研
    的頭像 發(fā)表于 10-30 15:09 ?1248次閱讀
    <b class='flag-5'>國</b><b class='flag-5'>科</b><b class='flag-5'>微</b>精彩亮相CPSE安博會(huì)2025,以視覺AI洞見未來

    AI體驗(yàn)躍遷,天璣9500用雙NPU開創(chuàng)側(cè)AI新時(shí)代

    AI 正從“嘗鮮”邁向“常用”,下一代體驗(yàn)該由誰定義?聯(lián)發(fā)天璣9500給出答案:行業(yè)首發(fā)將側(cè) AI 4K 文生圖帶到手機(jī),引領(lǐng)移動(dòng)影像與創(chuàng)造力的范式躍遷。 全新“超性能 + 超能效”雙 N
    的頭像 發(fā)表于 09-24 14:47 ?909次閱讀
    AI體驗(yàn)躍遷,天璣9500用雙<b class='flag-5'>NPU</b>開創(chuàng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI新時(shí)代

    基于米爾瑞芯RK3576開發(fā)板的Qwen2-VL-3B模型NPU多模態(tài)部署評(píng)測

    關(guān)鍵詞:瑞芯 RK3576、NPU(神經(jīng)網(wǎng)絡(luò)處理器)、側(cè)小語言模型(SLM)、多模態(tài) LLM、邊緣 AI 部署、開發(fā)板、RKLLM隨著大語言模型(LLM)技術(shù)的快速迭代,從云端集
    發(fā)表于 08-29 18:08

    側(cè)AI推理賦能效率革命,美格智能多領(lǐng)域落地打造行業(yè)范本

    產(chǎn)業(yè)進(jìn)階:側(cè)AI推理助手成為應(yīng)用剛需作為人工智能技術(shù)最普遍的產(chǎn)品形式之一,“AI助手”已成為各類軟件、終端的重要組成部分,成為AIAgent的主要外在呈現(xiàn)和功能入口。隨著
    的頭像 發(fā)表于 08-25 17:06 ?4184次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI推理賦能效率革命,美格<b class='flag-5'>智能</b>多領(lǐng)域落地<b class='flag-5'>打造</b>行業(yè)范本

    兩款智能側(cè)開關(guān)產(chǎn)品通過AEC-Q100車規(guī)認(rèn)證

    兩款產(chǎn)品——智能側(cè)開關(guān)RM77100DD與MOS預(yù)驅(qū)RM7515KSF,成功通過AEC-Q100車規(guī)認(rèn)證。截至目前,
    的頭像 發(fā)表于 07-04 16:58 ?1481次閱讀
    <b class='flag-5'>亞</b>成<b class='flag-5'>微</b>兩款<b class='flag-5'>智能</b>高<b class='flag-5'>側(cè)</b>開關(guān)產(chǎn)品通過AEC-Q100車規(guī)認(rèn)證

    華邦電子創(chuàng)新存儲(chǔ)賦能側(cè)智能側(cè)

    華邦電子于 4 月 15 日、4 月 25 日受邀參加新唐科技 2025 新品發(fā)布會(huì),期間進(jìn)行了題為“創(chuàng)新存儲(chǔ)賦能側(cè)智能”的主旨演講,展示了華邦電子在
    的頭像 發(fā)表于 05-14 09:59 ?1809次閱讀
    華邦電子創(chuàng)新存儲(chǔ)賦能<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>智能</b><b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>

    蘋芯科技 N300 存算一體 NPU,開啟側(cè) AI 新征程

    隨著側(cè)人工智能技術(shù)的爆發(fā)式增長,智能設(shè)備對(duì)本地算力與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問題成為制約
    的頭像 發(fā)表于 05-06 17:01 ?1372次閱讀
    蘋芯科技 N300 存算一體 <b class='flag-5'>NPU</b>,開啟<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b> AI 新征程
    呼和浩特市| 灵璧县| 溧阳市| 九龙坡区| 桃园县| 精河县| 万载县| 临安市| 永宁县| 诸城市| 观塘区| 安平县| 河北省| 佛教| 梁平县| 双牌县| 江山市| 双桥区| 长泰县| 贵溪市| 杭州市| 韩城市| 遂川县| 扶绥县| 冷水江市| 垫江县| 华坪县| 高青县| 定襄县| 洛川县| 南陵县| 西华县| 寻甸| 连江县| 汪清县| 昌乐县| 巩义市| 成武县| 房山区| 东至县| 西乌珠穆沁旗|