近日,中國移動(dòng)即將發(fā)布自主研發(fā)的九天35B通用大模型,將憑借強(qiáng)大的語言理解、復(fù)雜推理與行業(yè)場景適配能力,成為央企自研大模型的標(biāo)桿之作。
作為中國移動(dòng)“AI能力聯(lián)合艦隊(duì)”核心算力伙伴,海光基于旗艦級(jí)AI訓(xùn)推一體全功能加速卡深算3號(hào),日前已完成九天35B模型全流程適配與推理驗(yàn)證,依托成熟的DTK軟件棧與高性能硬件加速能力,實(shí)現(xiàn)高性能、低顯存占用的穩(wěn)定運(yùn)行,為中移九天大模型規(guī)?;涞靥峁﹪a(chǎn)化高性能算力底座。
本次適配基于海光自研DTK(DCU Tool Kit)底層軟件工具棧與深度優(yōu)化的vLLM高效推理框架,高度打通九天35B模型推理全鏈路。海光DCU憑借第三代先進(jìn)GPGPU架構(gòu)強(qiáng)勁算力,搭載1.8TB/s高帶寬HBM顯存,配合混合精度計(jì)算能力,在保障模型精度的同時(shí),有效降低顯存占用、提升推理吞吐,完美匹配九天35B 大模型長文本處理、高并發(fā)響應(yīng)的核心需求。依托DAS(DCU AI Software Stack) AI軟件棧、CUTLASS開源算子模板庫與LightOP融合算子庫的全棧優(yōu)化,海光實(shí)現(xiàn)對(duì)注意力機(jī)制與長序列推理的深度適配,確保模型高效運(yùn)行。實(shí)測顯示,在標(biāo)準(zhǔn)推理場景下,深算3號(hào)推理延遲與顯存占用較同類國產(chǎn)方案顯著降低,充分滿足通信、政務(wù)、金融等行業(yè)對(duì)大模型低時(shí)延、高可靠的部署要求。
中移九天大模型作為中國移動(dòng)“九天”基座核心產(chǎn)品,具備高安全、高可控、全自主的央企特性,已通過生成式AI服務(wù)雙備案與A級(jí)安全認(rèn)證,廣泛適配數(shù)智化轉(zhuǎn)型場景。此次海光快速完成九天35B大模型預(yù)適配,不僅體現(xiàn)國產(chǎn)AI算力生態(tài)的成熟與響應(yīng)能力,也構(gòu)建了“國產(chǎn)DCU + 央企大模型”的全棧國產(chǎn)化方案,為中國移動(dòng)算網(wǎng)融合與AI能力規(guī)?;敵鎏峁╆P(guān)鍵支撐,助力千行百業(yè)智能化升級(jí)。
作為中國移動(dòng)深度生態(tài)伙伴,海光已深度參與移動(dòng)云智算中心、萬卡級(jí)集群建設(shè)。未來,海光將持續(xù)依托DCU系列產(chǎn)品與DTK全棧技術(shù)能力,與中移九天深化協(xié)同,共研大模型訓(xùn)練、推理與行業(yè)適配優(yōu)化,加速國產(chǎn)AI算力與央企大模型的深度融合,構(gòu)建自主可控、高效可靠的新一代AI基礎(chǔ)設(shè)施。
-
DCU
+關(guān)注
關(guān)注
0文章
22瀏覽量
3197 -
海光信息
+關(guān)注
關(guān)注
0文章
63瀏覽量
2750 -
大模型
+關(guān)注
關(guān)注
2文章
3835瀏覽量
5289
發(fā)布評(píng)論請(qǐng)先 登錄
海光信息DCU產(chǎn)品深度適配商湯科技SenseNova U1系列大模型
海光信息深算3號(hào)DCU深度適配騰訊混元Hy3 preview大模型
昆侖芯科技完成國移動(dòng)九天35B大模型極速適配
壁仞科技率先完成中國移動(dòng)九天35B大模型預(yù)適配
海光信息DCU產(chǎn)品全面適配中國移動(dòng)九天35B通用大模型
評(píng)論