日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構(gòu)算力計(jì)算效能

美格智能 ? 2025-11-21 16:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI算力已成為數(shù)字經(jīng)濟(jì)時(shí)代的核心生產(chǎn)力,但全球AI產(chǎn)業(yè)正面臨“供給不足、成本高企、生態(tài)待建”三重挑戰(zhàn)。據(jù)行業(yè)統(tǒng)計(jì),行業(yè)算力資源平均利用率僅為30%~40%,存在嚴(yán)重的算力浪費(fèi)現(xiàn)象。國(guó)內(nèi)領(lǐng)先的科技企業(yè)也在近期表示,將通過軟件層創(chuàng)新大幅提升算力資源利用率。


作為高算力AI模組和端側(cè)AI領(lǐng)域的領(lǐng)先企業(yè),美格智能長(zhǎng)期專注于端側(cè)AI算力的優(yōu)化與提升,通過深耕SoC架構(gòu)、容器化和虛擬化、內(nèi)存帶寬壓縮、算法量化、電源策略優(yōu)化等關(guān)鍵技術(shù),美格智能在端側(cè)AI領(lǐng)域形成了獨(dú)特的“軟件+硬件”協(xié)同優(yōu)勢(shì),為提升AI算力利用率提供了一整套完整方案。

優(yōu)化SoC架構(gòu)調(diào)度:激發(fā) CPU + GPU + NPU 算力協(xié)同潛能

異構(gòu)計(jì)算架構(gòu)是現(xiàn)代SoC芯片的核心優(yōu)勢(shì)。美格智能多年深耕SoC架構(gòu),通過軟硬協(xié)同優(yōu)化最大化利用平臺(tái)AI算力,充分發(fā)揮每個(gè)處理器的獨(dú)特優(yōu)勢(shì):CPU擅長(zhǎng)順序控制和通用任務(wù),GPU適合并行數(shù)據(jù)流處理,而NPU則專精于標(biāo)量、向量和張量數(shù)學(xué)運(yùn)算,是AI工作負(fù)載的核心執(zhí)行單元。

db1549f2-c6b0-11f0-8ce9-92fbcf53809c.jpg

美格智能具備領(lǐng)先的SoC集成開發(fā)、性能調(diào)度和智能化系統(tǒng)研發(fā)能力,并積累了豐富的高算力AI應(yīng)用和虛擬化經(jīng)驗(yàn)。針對(duì)AI算法應(yīng)用特點(diǎn),美格智能進(jìn)行了針對(duì)性的大型算法調(diào)度和多算法并行調(diào)整。

在大型算法調(diào)度方面:通過將大型算法拆分與并行處理,將復(fù)雜AI算法拆解成多個(gè)部分,根據(jù)CPU、GPU、NPU的算力特性,分別加載不同部分至相應(yīng)處理器,基于流水線作業(yè)實(shí)現(xiàn)算力并行和多算法負(fù)載均衡。


在多算法并行調(diào)整方面:根據(jù)各個(gè)算法對(duì)算力的不同需求,合理分配算法到最合適的處理器上運(yùn)行,避免資源爭(zhēng)搶和閑置,從而實(shí)現(xiàn)算力資源的充分利用。

突破內(nèi)存墻瓶頸:以壓縮與量化技術(shù)提升計(jì)算效率

內(nèi)存帶寬壓縮技術(shù)通過在有限內(nèi)存帶寬下交換更多數(shù)據(jù),顯著降低了內(nèi)存訪問瓶頸對(duì)算力發(fā)揮的影響。該技術(shù)利用LPDDR5X內(nèi)存提供超過120GB/s的帶寬,滿足7B模型推理時(shí)的高吞吐需求。


算法量化技術(shù)基于量化感知的混合量化方案,部分層使用INT4精度,在精度損失可控的情況下進(jìn)一步降低計(jì)算開銷,提升處理速度。具體實(shí)現(xiàn)包括:

混合精度量化:美格智能支持INT4/FP8混合精度計(jì)算,與DeepSeek-R1模型的量化格式高度適配。以7B參數(shù)模型為例,經(jīng)INT4量化后,模型體積從FP32所需的28GB壓縮至僅2-4GB,大幅降低存儲(chǔ)和內(nèi)存占用。


量化感知訓(xùn)練(QAT):在模型訓(xùn)練過程中插入偽量化節(jié)點(diǎn)模擬量化效果,使模型在訓(xùn)練階段即適應(yīng)低精度計(jì)算,顯著減少量化后的精度損失。


訓(xùn)練后量化(PTQ):使用少量校準(zhǔn)數(shù)據(jù)估計(jì)權(quán)重和激活值的動(dòng)態(tài)范圍,確定量化參數(shù),無需重新訓(xùn)練即可實(shí)現(xiàn)模型壓縮,適配周期縮短50%。

db31352c-c6b0-11f0-8ce9-92fbcf53809c.jpg

強(qiáng)化電源與散熱設(shè)計(jì):為高算力持續(xù)輸出保駕護(hù)航

除了計(jì)算和內(nèi)存優(yōu)化,電源管理和散熱設(shè)計(jì)同樣直接影響算力利用率的穩(wěn)定性和持續(xù)性。美格智能通過多維度創(chuàng)新確保端側(cè)設(shè)備在功耗約束下保持穩(wěn)定性能。

在電源管理方面:

精細(xì)化功耗調(diào)度:模組內(nèi)置的電源管理芯片(PMIC)可對(duì)SoC上不同計(jì)算單元(CPU/GPU/NPU)的供電進(jìn)行獨(dú)立監(jiān)控和動(dòng)態(tài)調(diào)節(jié)。系統(tǒng)會(huì)根據(jù)實(shí)時(shí)算力需求,智能調(diào)整各單元的工作電壓和頻率(DVFS技術(shù)),在滿足性能需求的同時(shí),將整體功耗降至最低。


分級(jí)供電與智能待機(jī):模組為處理器、內(nèi)存及通信單元提供了獨(dú)立的供電域。在低負(fù)載場(chǎng)景下,可自動(dòng)關(guān)閉非必要功能單元的供電,或使其進(jìn)入低功耗休眠狀態(tài),顯著降低待機(jī)功耗,這對(duì)于依賴電池供電的移動(dòng)設(shè)備至關(guān)重要。

在散熱優(yōu)化方面:

SIP系統(tǒng)級(jí)封裝與Underfill工藝:在高端車規(guī)級(jí)模組中,美格智能采用SIP(系統(tǒng)級(jí)封裝)技術(shù),將多顆芯片高密度集成。通過引入U(xiǎn)nderfill(底部填充)工藝,在芯片與基板間填充特殊配方的膠水,這不僅顯著增強(qiáng)了模組在振動(dòng)、冷熱沖擊環(huán)境下的機(jī)械可靠性,其填充材料本身也成為了輔助芯片散熱的重要路徑,能將熱量更均勻地傳導(dǎo)至模組基板,優(yōu)化整體散熱性能。


一體化散熱與結(jié)構(gòu)優(yōu)化:美格智能的高算力AI模組(如AI算力盒子)采用一體散熱設(shè)計(jì),確保在長(zhǎng)時(shí)間持續(xù)運(yùn)行下性能穩(wěn)定。在結(jié)構(gòu)上,通過優(yōu)化模組內(nèi)部布局和采用高熱導(dǎo)率材料,打造高效熱傳導(dǎo)路徑。例如,部分模組會(huì)集成屏蔽罩或散熱蓋板,與芯片表面緊密貼合,充當(dāng)“導(dǎo)熱橋”,將熱量快速導(dǎo)向模組外殼或設(shè)備的外部散熱系統(tǒng)。

推動(dòng)端側(cè)落地:以全場(chǎng)景AI模組賦能行業(yè)智能化升級(jí)

美格智能的技術(shù)理念不僅停留在理論層面,更通過一系列產(chǎn)品落地和實(shí)際用例實(shí)現(xiàn)了端側(cè)AI算力的高效利用,通過專注于端側(cè)AI算力的優(yōu)化與提升,形成了自己獨(dú)特的競(jìng)爭(zhēng)優(yōu)勢(shì)。


美格智能的高算力AI模組產(chǎn)品涵蓋入門級(jí)、中端、旗艦級(jí)多層次,對(duì)應(yīng)AI算力覆蓋0.2TOPS-100TOPS,能夠在各類邊緣計(jì)算終端、機(jī)器人、智能汽車域控制器等設(shè)備上執(zhí)行多種類型的端側(cè)計(jì)算任務(wù)。這種全面布局使得美格智能能夠根據(jù)不同的應(yīng)用場(chǎng)景需求,提供最合適的算力解決方案,避免“過度配置”或“配置不足”造成的算力浪費(fèi)。

美格智能在5G與AI融合方面也有深入布局,其推出的5G-A+Wi-Fi 7雙擎?zhèn)鬏敺桨钢С秩f兆速率與智能天線陣列,為端側(cè)AI應(yīng)用提供了高速、低延遲的連接保障。通過“本地AI引擎+云端大模型”雙軌架構(gòu),美格智能實(shí)現(xiàn)了從設(shè)備層到應(yīng)用層的全棧智能化升級(jí),這種端云協(xié)同架構(gòu)既利用了端側(cè)算力的高效性,又保留了云端算力的無限擴(kuò)展性。


在人形機(jī)器人、智能座艙、無人機(jī)、智能安防、智能家居等場(chǎng)景中,高效的端側(cè)算力正在發(fā)揮越來越重要的作用。未來,隨著AIGC與物聯(lián)網(wǎng)的進(jìn)一步融合,美格智能有望通過其“軟件+硬件”協(xié)同優(yōu)化的特色路徑,在加速人工智能產(chǎn)業(yè)發(fā)展的征程中扮演更為重要的角色。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11332

    瀏覽量

    225975
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136096
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    387

    瀏覽量

    21367
  • 美格智能
    +關(guān)注

    關(guān)注

    2

    文章

    331

    瀏覽量

    12453
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于openEuler平臺(tái)的CPUGPU與FPGA異構(gòu)加速實(shí)戰(zhàn)

    隨著 AI、視頻處理、加密和高性能計(jì)算需求的增長(zhǎng),單一 CPU 已無法滿足低延遲、高吞吐量的計(jì)算需求。openEuler 作為面向企業(yè)和云端的開源操作系統(tǒng),在 多樣
    的頭像 發(fā)表于 04-08 11:02 ?888次閱讀
    基于openEuler平臺(tái)的<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>與FPGA<b class='flag-5'>異構(gòu)</b>加速實(shí)戰(zhàn)

    天數(shù)智芯助力DeepLink異構(gòu)訓(xùn)推一體化升級(jí)

    當(dāng)前,通用人工智能發(fā)展駛?cè)肟燔嚨溃竽P蛯?duì)的需求呈現(xiàn)爆發(fā)式增長(zhǎng),異構(gòu)的高效協(xié)同成為釋放
    的頭像 發(fā)表于 03-26 09:30 ?456次閱讀
    天數(shù)智芯助力DeepLink<b class='flag-5'>異構(gòu)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>訓(xùn)推一體化升級(jí)

    邊緣AI臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價(jià)值

    推理在EP環(huán)境下僅需 10ms ,表明當(dāng)前200ms的瓶頸在于 數(shù)據(jù)預(yù)處理和流水線優(yōu)化 ,而非NPU本身不足[](https://hwcomputing.csdn.net
    發(fā)表于 03-10 14:19

    GPU 利用率<30%?這款開源智云平臺(tái)讓不浪費(fèi) 1%

    作為 AI 開發(fā)者,你是否早已受夠這些困境:花數(shù)百萬采購的 GPU 集群,利用率常年低于 30%,閑置如同燒錢;跨 CPU/GPU/
    的頭像 發(fā)表于 01-26 14:20 ?293次閱讀

    云端集中邊緣分布:邊緣智如何重塑網(wǎng)絡(luò)布局

    隨著大模型推理延遲進(jìn)入毫秒級(jí)時(shí)代,整個(gè)科技行業(yè)都意識(shí)網(wǎng)絡(luò)的規(guī)則正在被改寫。這場(chǎng)變革的核心,正是云端集中式計(jì)算向邊緣分布式
    的頭像 發(fā)表于 12-25 11:34 ?633次閱讀
    <b class='flag-5'>從</b>云端集中<b class='flag-5'>到</b>邊緣分布:邊緣智<b class='flag-5'>算</b>如何重塑<b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)布局

    AI硬件全景解析:CPU、GPUNPU、TPU的差異化之路,一文看懂!?

    CPU作為“通用基石”,支撐所有設(shè)備的基礎(chǔ)運(yùn)行;GPU憑借并行,成為AI訓(xùn)練與圖形處理的“主力”;TPU在Google生態(tài)中深耕云端大模型訓(xùn)練;
    的頭像 發(fā)表于 12-17 17:13 ?2357次閱讀
    AI硬件全景解析:<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>、<b class='flag-5'>NPU</b>、TPU的差異化之路,一文看懂!?

    基于米爾RK3576的環(huán)視實(shí)時(shí)性方案解析

    潛力,但其執(zhí)行的穩(wěn)定性是當(dāng)前能否商用的關(guān)鍵挑戰(zhàn)。方案潛力與價(jià)值: 一旦GPU性能穩(wěn)定,RK3576憑借其異構(gòu)計(jì)算架構(gòu)(CPU+GPU+NPU),能夠在一幀時(shí)間內(nèi)不僅完成環(huán)視合成,更能集成復(fù)雜的AI感知與預(yù)警功能。這使其從一個(gè)單純
    發(fā)表于 11-28 16:57

    湘軍,讓變成生產(chǎn)?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    國(guó)產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    反而壓到了310W。更有意思的是它的異構(gòu)架構(gòu):NPU+CPU+DVPP的組合,居然能同時(shí)扛住訓(xùn)練和推理場(chǎng)景,之前做自動(dòng)駕駛算法時(shí),用它跑模型時(shí)延直接降了20%。 但疑惑也有:這種
    發(fā)表于 10-27 13:12

    CPU GPU,渲染技術(shù)如何重塑游戲、影視與設(shè)計(jì)?

    渲染技術(shù)是計(jì)算機(jī)圖形學(xué)的核心內(nèi)容之一,它是將三維場(chǎng)景轉(zhuǎn)換為二維圖像的過程。渲染技術(shù)一直在不斷演進(jìn),最初的CPU渲染后來的GPU渲染,性能
    的頭像 發(fā)表于 09-01 12:16 ?1156次閱讀
    <b class='flag-5'>從</b> <b class='flag-5'>CPU</b> <b class='flag-5'>到</b> <b class='flag-5'>GPU</b>,渲染技術(shù)如何重塑游戲、影視與設(shè)計(jì)?

    智能安防邊緣計(jì)算的技術(shù)解析

    維度,剖析核心板如何推動(dòng)安防"被動(dòng)記錄""主動(dòng)決策"的升級(jí),并給出選型建議。 ? --- 一、核心板的硬件架構(gòu)創(chuàng)新** ? 1. 異構(gòu)計(jì)算架構(gòu):
    的頭像 發(fā)表于 06-26 11:56 ?799次閱讀

    異構(gòu)計(jì)算解決方案(兼容不同硬件架構(gòu))

    異構(gòu)計(jì)算解決方案通過整合不同類型處理器(如CPUGPU、NPU、FPGA等),實(shí)現(xiàn)硬件資源的高效協(xié)同與兼容,滿足多樣化計(jì)算需求。其核心技術(shù)
    的頭像 發(fā)表于 06-23 07:40 ?1085次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)應(yīng)用到原理

    。。) 原理學(xué)習(xí) 在「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書中,作者詳解了
    發(fā)表于 06-18 19:31

    美格智能攜手阿加犀,助力維田科技發(fā)布第二代智能植保機(jī)器人

    5月24日,美格智能攜手阿加犀,助力維田科技正式推出第二代智能植保機(jī)器人。該機(jī)器人搭載了美格智能基于QCS8550平臺(tái)研發(fā)設(shè)計(jì)的48TOPS
    的頭像 發(fā)表于 05-26 13:58 ?1319次閱讀
    <b class='flag-5'>美格</b><b class='flag-5'>智能</b>攜手阿加犀,助力維田科技發(fā)布第二代<b class='flag-5'>智能</b>植保機(jī)器人

    COMPUTEX 2025|從容器化車規(guī)級(jí)安全,美格智能200K DMIPS CPU模組打造智能座艙的“超級(jí)底座”

    首日,美格智能面向智能汽車領(lǐng)域的旗艦產(chǎn)品——SRM965智能座艙模組,憑借200KDMIPSCPU
    的頭像 發(fā)表于 05-20 12:02 ?1073次閱讀
    COMPUTEX 2025|從容器化<b class='flag-5'>到</b>車規(guī)級(jí)安全,<b class='flag-5'>美格</b><b class='flag-5'>智能</b>200K DMIPS <b class='flag-5'>CPU</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組打造<b class='flag-5'>智能</b>座艙的“超級(jí)底座”
    即墨市| 灌阳县| 丰台区| 图们市| 长泰县| 辽宁省| 庄河市| 平顶山市| 蕉岭县| 七台河市| 恭城| 年辖:市辖区| 西藏| 镇宁| 鄂伦春自治旗| 石棉县| 呼图壁县| 都匀市| 于都县| 阳信县| 大安市| 睢宁县| 普安县| 苍梧县| 江陵县| 泸溪县| 北安市| 贵德县| 开封县| 鹰潭市| 托克逊县| 瑞丽市| 辛集市| 曲水县| 固始县| 汝城县| 广河县| 阿鲁科尔沁旗| 老河口市| 梁平县| 天峻县|