日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

華為昇騰助力書生科學多模態(tài)大模型Intern-S2-Preview發(fā)布

華為數(shù)字中國 ? 來源:華為數(shù)字中國 ? 2026-05-18 17:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,上海人工智能實驗室(上海AI實驗室)開源新一代書生科學多模態(tài)大模型預覽版Intern-S2-Preview,以35B的參數(shù)規(guī)模在多個核心領域實現(xiàn)比肩萬億參數(shù)模型的能力,在綜合科學場景編程任務中達到同量級領先水平,在科學發(fā)現(xiàn)任務中超越Claude-Haiku-4.5、GPT5.4-Nano等主流閉源模型,進一步拓展了“可深度專業(yè)化通用模型”的能力邊界。昇騰Atlas 900 A3超節(jié)點為Intern-S2-Preview提供了算力支持,基于昇騰AI生態(tài),雙方團隊在訓練、推理與評測等關鍵環(huán)節(jié)實現(xiàn)了全流程協(xié)同優(yōu)化。

1e93eb1e-529a-11f1-90a1-92fbcf53809c.jpg

算法—系統(tǒng)—算力協(xié)同演進

提升訓推效率

Intern-S2-Preview模型能力釋放的背后,是算法、訓推系統(tǒng)與算力底座的協(xié)同演進?;跁N騰AI生態(tài),雙方團隊圍繞模型訓練、推理、RL等核心場景,在訓練框架、推理引擎以及多模態(tài)長序列訓練等關鍵方向上實現(xiàn)了深入的系統(tǒng)級優(yōu)化。

在訓練框架方面:

支持SP、chunk loss、activation offload、swap optimizer、虛擬內(nèi)存管理等眾多顯存優(yōu)化特性,使能多模態(tài)長序列模型訓練的穩(wěn)定運行。

重點圍繞TND變長輸入下的GDN進行了持續(xù)打磨。

通過將chunk indices前置計算,減少host和device的同步開銷。

與常見的GPU上的GDN chunk size 64不同,本次在NPU上使能了chunk size 128。對于昇騰架構,更大的chunk size(例如128)能提高矩陣單元(Cube)的FLOP利用率,從而加速GDN內(nèi)的多數(shù)計算步驟。

針對GDN中的關鍵算子,進一步引入Ascend C高性能實現(xiàn),在不同序列長度下自適應選擇tiling策略,并結合算子流水和算子間Transpose消除等手段聯(lián)合優(yōu)化,持續(xù)降低數(shù)據(jù)搬運與格式轉換開銷,提升長序列訓練中的有效計算占比,更充分釋放A3超節(jié)點的算力潛力。

在推理部署環(huán)節(jié):

針對Intern-S2-Preview的模型結構和A3超節(jié)點的硬件特點,對ViT和LLM部分進行差異化切分部署,結合cube效率和顯存需求聯(lián)合優(yōu)化prefill的chunk size,替換GMM和后處理算子親和寫法,最終有效支持了超長序列的rollout效率。

在強化學習方面:

RL在A3超節(jié)點上同步支持了token in token out、router replay和partial rollout異步訓練等關鍵特性。在解決rollout長尾阻塞問題的同時,維持了高精度的訓推一致性和RL訓練穩(wěn)定性。

Intern-S2-Preview也延續(xù)了Intern-S1-Pro在“算法—算力”一體化方向上的持續(xù)探索,基于XTuner訓練框架與LMDeploy推理引擎,雙方研發(fā)團隊圍繞訓練與推理一體化進行了聯(lián)合開發(fā)。在支持MTP RL訓練的基礎上,引入共享MTP權重計算方式,不僅有效緩解了訓練與推理階段不一致的問題,還顯著提升了draft token的接受率,從而進一步提升模型訓練穩(wěn)定性與推理效率。在多模態(tài)長序列訓練場景,針對35B模型視覺模塊耗時占比過大的問題,團隊進一步提出聯(lián)合視覺模塊與語言模塊近似FLOPs算力的Packing策略,通過離線模擬不同序列長度下視覺與語言模塊的算力占比,實現(xiàn)更合理的負載均衡,顯著緩解了負載不均衡導致的tgs下降問題,從而提升了多模態(tài)長序列場景下的整體訓練效率。

通過算法、系統(tǒng)策略與算力基礎設施的協(xié)同演進,Intern-S2-Preview在保持高智能密度的同時,實現(xiàn)了訓練效率、推理性能與部署成本之間的更優(yōu)平衡,也進一步驗證了“通專融合”路線在小參數(shù)、高智能方向上的潛力。

以任務Scaling激發(fā)模型潛力

以強化學習加速“通專融合”

將萬億參數(shù)規(guī)模的科學多模態(tài)大模型濃縮為高效、易用的基座模型,是一項極具挑戰(zhàn)的工作。其實現(xiàn)路徑的核心思路,來自上海AI實驗室對“通專融合”技術路線的持續(xù)探索。研究團隊發(fā)現(xiàn),模型能力進化并非僅依賴傳統(tǒng)的參數(shù)擴容與數(shù)據(jù)增量外,通過提升任務難度、豐富任務多樣性,亦可持續(xù)拉升模型能力上限,具備Scaling效應。

相較于Intern-S1-Pro,Intern-S2-Preview進一步將專業(yè)科學任務擴展為“全鏈路訓練”范式:每一個專業(yè)科學任務均配備從預訓練到后訓練的高質量數(shù)據(jù)與訓練策略,并依托穩(wěn)定高效的訓練基礎設施,實現(xiàn)多任務融合訓練。在這一過程中,當大量高難度、多樣化任務進行統(tǒng)一融合訓練時,小模型能夠在多項科學任務上達到萬億參數(shù)模型的表現(xiàn)水平。這其中的關鍵在于全鏈路的“通專融合”機制:若僅優(yōu)化單一訓練階段,往往會出現(xiàn)能力之間的“此消彼長”;而在全鏈路融合后,不同任務之間反而形成相互促進的協(xié)同效應,從而進一步釋放模型在復雜科學任務中的整體潛力。

強化學習是實現(xiàn)“通專融合”的核心動力之一,Intern-S2-Preview重點通過拓展強化學習的規(guī)模開展多方面探索:

引導模型利用思維鏈來完成生物多組學理解等專業(yè)科學任務,利用思維鏈的泛化性,實現(xiàn)以35B小參數(shù)模型比肩萬億參數(shù)模型的性能;

延長強化學習的訓練步長,結合更加高難度(如研究生級別)的學科推理問題和專業(yè)科學任務,使得小模型能夠在各類問題上得到充分訓練,最終融會貫通,具備跨域推理能力;

基于數(shù)據(jù)思維密度(IQPT,Intelligence Quality per token)理念,探索思維鏈折疊等創(chuàng)新算法,通過構建數(shù)據(jù)思維密度杠桿,撬動模型性能提升。其中,在數(shù)學推理任務中,Intern-S2-Preview以相同的單位智能,性能比肩最新8倍參數(shù)量模型(35B對比284B),實現(xiàn)性能與效率的雙重突破。

1ef97b28-529a-11f1-90a1-92fbcf53809c.png

科學能力持續(xù)升級

結構理解與生成性能超越主流閉源模型

Intern-S2-Preview以賦能科學發(fā)現(xiàn)為核心目標,聚焦更復雜的科學場景開展探索。以小分子結構空間建模能力為例,其作為模型精準認知分子、晶體等微觀結構的核心支撐,既決定了結構理解與生成的精度上限,也是適配復雜科研場景的重要前提。科研團隊在此前引入傅里葉位置編碼(FoPE)、重構時序編碼器等創(chuàng)新的基礎上,進一步強化該能力,并引入實數(shù)預測模塊,首次在開源通用大模型中實現(xiàn)了材料晶體結構生成能力。

1f5e0b74-529a-11f1-90a1-92fbcf53809c.png

為精準驗證這一能力,團隊選取MolecularIQ評測集開展專項測試——該評測集重點考察模型對分子內(nèi)部結構的空間建模與拓撲理解能力,相比傳統(tǒng)僅通過分子式構成即可完成的任務,挑戰(zhàn)性顯著提升。評測結果顯示:Intern-S2-Preview在MolecularIQ上取得57.26分,超過Gemini-3.1-Pro的41.33分。

如果說結構理解主要服務于科研中的分析與篩選環(huán)節(jié),那么結構生成則是推動科研創(chuàng)新的“創(chuàng)造性任務”。其中,材料晶體結構生成領域此前長期依賴專業(yè)模型,而Intern-S2-Preview不僅填補了開源通用大模型在該領域的空白,也是首個能給出思考過程的結構生成模型。該任務需要模型生成數(shù)十個高精度的空間坐標以描述材料晶體結構,GPT-5.5等閉源模型生成的結構通過率約為10%,而Intern-S2-Preview的通過率超40%,顯著提升了結構生成質量與可用性,為科研創(chuàng)新提供高效支撐。

通過上述創(chuàng)新,Intern-S2-Preview在無需依賴擴散模型的前提下,仍具備高精度坐標回歸的潛力,這不僅降低了相關任務的實現(xiàn)成本,更為各類坐標回歸類科研任務提供了全新的技術解決方案。

科學智能體能力升級

高效支撐復雜科研任務

得益于訓練階段引入系統(tǒng)化任務合成方法,Intern-S2-Preview通用智能體能力得到進一步提升。團隊依托開源社區(qū)技能倉庫與真實工具生態(tài),構建貼近實際應用場景的高質量智能體訓練數(shù)據(jù),重點強化模型對復雜任務的步驟拆解、技能調(diào)用與自主執(zhí)行能力,有效拓寬了從多輪對話到復雜任務規(guī)劃、自主落地執(zhí)行的能力邊界。

在真實沙盒環(huán)境長程任務求解場景中,Intern-S2-Preview在PinchBench等通用智能體評測基準中展現(xiàn)出穩(wěn)健的任務理解、工具調(diào)用、多步?jīng)Q策與狀態(tài)追蹤能力,能夠在動態(tài)環(huán)境中持續(xù)完成任務執(zhí)行,并根據(jù)環(huán)境反饋進行自我修正。同時,憑借持續(xù)增強的科學推理能力,Intern-S2-Preview在面向科學編程與算法求解的SciCode基準上表現(xiàn)優(yōu)異,位居同量級模型前列,具備強勁的科學代碼生成能力,可高效支撐科學計算、算法開發(fā)與科研腳本編寫等復雜科研任務。

自2023年書生大模型首次發(fā)布以來,上海AI實驗室已逐步構建起豐富的書生大模型家族。同時首創(chuàng)并開源了面向大模型研發(fā)與應用的全鏈路開源工具體系,包含訓練框架XTuner、部署推理框架LMDeploy、評測框架OpenCompass、高效文檔解析工具MinerU,形成覆蓋數(shù)十萬開發(fā)者參與的活躍開源社區(qū)。

自發(fā)布以來,Intern-S1多次登頂HuggingFace全球多模態(tài)榜單,累計下載量超過100萬次。其卓越的跨模態(tài)科學理解能力不僅為科研提供了高效工具,也通過開源降低了全球科研團隊邁入AGI for Science的門檻。未來,上海AI實驗室將繼續(xù)推動模型能力提升與科研范式創(chuàng)新,與全球合作伙伴共同構建更加開放、高效的科學AI生態(tài)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    41796

    瀏覽量

    302970
  • 開源
    +關注

    關注

    3

    文章

    4408

    瀏覽量

    46557
  • 大模型
    +關注

    關注

    2

    文章

    3848

    瀏覽量

    5289

原文標題:書生科學多模態(tài)大模型Intern-S2-Preview發(fā)布并開源,昇騰訓推全流程賦能“科學大腦”

文章出處:【微信號:HWS_yunfuwu,微信公眾號:華為數(shù)字中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    模態(tài)模型 前沿算法與實戰(zhàn)應用 第一季》精品課程簡介

    ;語境下會生成不同的向量表示。 音頻模態(tài) :Mel頻譜圖或Wav2Vec等模型將聲波轉換為時頻特征矩陣,捕捉音調(diào)、節(jié)奏等語音信息。 2. 跨模態(tài)
    發(fā)表于 05-01 17:46

    迅龍軟件亮相華為計算部件伙伴大會,蟬聯(lián)APN兩項大獎

    與實踐經(jīng)驗。 作為華為生態(tài)的核心伙伴之一,迅龍軟件受邀出席大會,并憑借在計算部件領域產(chǎn)品研發(fā)能力的持續(xù)深耕與突出價值貢獻, 再次榮獲
    的頭像 發(fā)表于 03-30 19:39 ?1818次閱讀
    迅龍軟件亮相<b class='flag-5'>華為</b>計算部件伙伴大會,蟬聯(lián)<b class='flag-5'>昇</b><b class='flag-5'>騰</b>APN兩項大獎

    【硬核發(fā)布310B算力盒上新賦能2026集創(chuàng)賽華強x賽道玩轉新創(chuàng)意!

    -TECHNOLOGICALPROGRESS-310BAIBOX上新全棧全場景AI高能效算力底座Part01基于310BAIBOX算力盒硬核
    的頭像 發(fā)表于 03-27 17:12 ?1453次閱讀
    【硬核<b class='flag-5'>發(fā)布</b>】<b class='flag-5'>昇</b><b class='flag-5'>騰</b>310B算力盒上新賦能2026集創(chuàng)賽華強x<b class='flag-5'>昇</b><b class='flag-5'>騰</b>賽道玩轉新創(chuàng)意!

    華為發(fā)布全新950PR,Atlas 350單卡算力接近3倍于H20

    電子發(fā)燒友網(wǎng)報道 近日,在中國合作伙伴大會2026上,華為發(fā)布并展出搭載全新950PR(Ascend 950PR)處理器的AI訓練推理加速卡Atlas 350。與前一代
    的頭像 發(fā)表于 03-24 09:08 ?6366次閱讀

    2026華為中國合作伙伴大會人工智能伙伴峰會圓滿落幕

    華為中國合作伙伴大會2026期間,以“與時代 共”為主題的人工智能伙伴峰會于深圳國際會展中心圓滿落幕。峰會現(xiàn)場聯(lián)合20家行業(yè)伙伴正
    的頭像 發(fā)表于 03-23 17:03 ?1785次閱讀

    華為深度適配智譜AI全新開源模型GLM-5

    ,在真實編程場景的使用體驗逼近Claude Opus 4.5,更擅長復雜系統(tǒng)工程與長程Agent任務。一直同步支持智譜GLM系列模型,此次GLM-5模型一經(jīng)開源
    的頭像 發(fā)表于 02-25 14:41 ?1524次閱讀
    <b class='flag-5'>華為</b><b class='flag-5'>昇</b><b class='flag-5'>騰</b>深度適配智譜AI全新開源<b class='flag-5'>模型</b>GLM-5

    香橙派系列開發(fā)板如何部署OpenClaw

    香橙派系列開發(fā)板解鎖專業(yè)級智能體,OpenClaw擁抱高算力未來 上兩篇文章我們給出了香橙派此芯及RK系列產(chǎn)品部署OpenClaw的教程,接下來我們將這只智能小龍蝦接入到系列開
    發(fā)表于 02-25 10:13

    AI+FPGA助力生態(tài)新篇章|2025AI技術研討會·杭州站成功舉辦

    中國·杭州2025年12月17日“華強筑鏈·萬里”華為&華強半導體2025AI技術研討會杭州站圓滿落幕。本次研討會由
    的頭像 發(fā)表于 12-24 08:05 ?897次閱讀
    AI+FPGA<b class='flag-5'>助力</b><b class='flag-5'>昇</b><b class='flag-5'>騰</b>生態(tài)新篇章|2025<b class='flag-5'>昇</b><b class='flag-5'>騰</b>AI技術研討會·杭州站成功舉辦

    商湯科技正式發(fā)布并開源全新模態(tài)模型架構NEO

    商湯科技正式發(fā)布并開源了與南洋理工大學S-Lab合作研發(fā)的全新模態(tài)模型架構 —— NEO,為日日新SenseNova
    的頭像 發(fā)表于 12-08 11:19 ?1232次閱讀
    商湯科技正式<b class='flag-5'>發(fā)布</b>并開源全新<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>模型</b>架構NEO

    國產(chǎn)AI芯片真能扛住“算力內(nèi)卷”?海思的這波操作藏了多少細節(jié)?

    反而壓到了310W。更有意思的是它的異構架構:NPU+CPU+DVPP的組合,居然能同時扛住訓練和推理場景,之前做自動駕駛算法時,用它跑模型時延直接降了20%。 但疑惑也有:這種算力密度下,散熱怎么解決?而且的生態(tài)適配速度能
    發(fā)表于 10-27 13:12

    華為與全球開發(fā)者共贏生態(tài)

    華為全聯(lián)接大會2025期間,華為計算業(yè)務總裁張迪煊發(fā)表了“以開發(fā)者為中心,加速自主創(chuàng)新,共贏
    的頭像 發(fā)表于 09-20 15:57 ?2229次閱讀

    軟通動力亮相福建計算產(chǎn)業(yè)發(fā)展大會

    近日,軟通動力與華為技術有限公司、同泰怡科技集團、百信信息技術有限公司及福建升騰資訊有限公司聯(lián)合主辦的“萬里 開創(chuàng)未來 共筑數(shù)智福建——福建
    的頭像 發(fā)表于 09-04 09:26 ?1003次閱讀

    中軟國際出席華為計算產(chǎn)業(yè)發(fā)展峰會

    今天,計算產(chǎn)業(yè)發(fā)展峰會在北京召開。作為人工智能產(chǎn)業(yè)的重要參與者與華為核心合作伙伴,中軟國際受邀出席本次峰會,與眾多AI領軍企業(yè)、合作伙伴、高校及科研機構代表齊聚一堂,共同見證華為
    的頭像 發(fā)表于 08-07 18:14 ?1818次閱讀

    中軟國際簽約成為華為模型一體機伙伴

    7月26日,2025世界人工智能大會(WAIC 2025)在上海世博展覽館拉開序幕。大會中,中軟國際與華為舉行了“大模型一體機伙伴合作”簽約儀式,華為
    的頭像 發(fā)表于 07-30 09:42 ?1784次閱讀
    中軟國際簽約成為<b class='flag-5'>華為</b><b class='flag-5'>昇</b><b class='flag-5'>騰</b>大<b class='flag-5'>模型</b>一體機伙伴

    華為開發(fā)者大會2025(HDC 2025)亮點:華為發(fā)布盤古大模型5.5 宣布新一代AI云服務上線

    HarmonyOS、AI云服務、盤古大模型等最新科技創(chuàng)新成果。 在主題演講中,華為常務董事、華為云計算CEO張平安宣布基于CloudMa
    的頭像 發(fā)表于 06-20 20:19 ?4762次閱讀
    <b class='flag-5'>華為</b>開發(fā)者大會2025(HDC 2025)亮點:<b class='flag-5'>華為</b>云<b class='flag-5'>發(fā)布</b>盤古大<b class='flag-5'>模型</b>5.5 宣布新一代<b class='flag-5'>昇</b><b class='flag-5'>騰</b>AI云服務上線
    锡林郭勒盟| 通江县| 兴业县| 通化县| 大埔区| 通渭县| 承德市| 营口市| 秦皇岛市| 磐石市| 芷江| 云南省| 板桥市| 北安市| 西充县| 博爱县| 湘潭县| 蕉岭县| 衡阳县| 京山县| 明水县| 天柱县| 光山县| 肥乡县| 辽源市| 宿州市| 华蓥市| 白河县| 砀山县| 平陆县| 福清市| 大洼县| 喜德县| 肥乡县| 唐海县| 南皮县| 安多县| 南木林县| 扎兰屯市| 潍坊市| 叶城县|