日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息發(fā)布源2.0基礎(chǔ)大模型,千億參數(shù)全面開源

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2023-11-28 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

11月27日,浪潮信息發(fā)布"源2.0"基礎(chǔ)大模型,并宣布全面開源。源2.0基礎(chǔ)大模型包括1026億、518億、21億等三種參數(shù)規(guī)模的模型,在編程、推理、邏輯等方面展示出了先進(jìn)的能力。

當(dāng)前,大模型技術(shù)正在推動(dòng)生成式人工智能產(chǎn)業(yè)迅猛發(fā)展,而基礎(chǔ)大模型的關(guān)鍵能力則是大模型在行業(yè)和應(yīng)用落地能力表現(xiàn)的核心支撐,但基礎(chǔ)大模型的發(fā)展也面臨著在算法、數(shù)據(jù)和算力等方面的諸多挑戰(zhàn)。源2.0基礎(chǔ)大模型則針對性地提出了新的改進(jìn)方法并獲得了能力的提升。

算法方面,源2.0提出并采用了一種新型的注意力算法結(jié)構(gòu):局部注意力過濾增強(qiáng)機(jī)制(LFA:Localized Filtering-based Attention)。LFA通過先學(xué)習(xí)相鄰詞之間的關(guān)聯(lián)性,然后再計(jì)算全局關(guān)聯(lián)性的方法,能夠更好地學(xué)習(xí)到自然語言的局部和全局的語言特征,對于自然語言的關(guān)聯(lián)語義理解更準(zhǔn)確、更人性,提升了模型的自然語言表達(dá)能力,進(jìn)而提升了模型精度。

wKgZomVkrZuAFWGyAACX2OTQDsk961.jpg


數(shù)據(jù)方面,源2.0通過使用中英文書籍、百科、論文等高質(zhì)量中英文資料,降低了互聯(lián)網(wǎng)語料內(nèi)容占比,結(jié)合高效的數(shù)據(jù)清洗流程,為大模型訓(xùn)練提供了高質(zhì)量的專業(yè)數(shù)據(jù)集和邏輯推理數(shù)據(jù)集。為了獲取中文數(shù)學(xué)數(shù)據(jù),我們清洗了從2018年至今約12PB的互聯(lián)網(wǎng)數(shù)據(jù),但僅獲取到了約10GB的數(shù)學(xué)數(shù)據(jù),投入巨大,收益較小。為了更高效地獲得相對匱乏的高質(zhì)量中文數(shù)學(xué)及代碼數(shù)據(jù)集,源2.0采用了基于大模型的數(shù)據(jù)生產(chǎn)及過濾方法,在保證數(shù)據(jù)的多樣性的同時(shí)也在每一個(gè)類別上提升數(shù)據(jù)質(zhì)量,獲取了一批高質(zhì)量的數(shù)學(xué)與代碼預(yù)訓(xùn)練數(shù)據(jù)。

wKgaomVkrZuAeYSmAADRtny3Qdk117.jpg


算力方面,源2.0采用了非均勻流水并行的方法,綜合運(yùn)用流水線并行+優(yōu)化器參數(shù)并行+數(shù)據(jù)并行的策略,讓模型在流水并行各階段的顯存占用量分布更均衡,避免出現(xiàn)顯存瓶頸導(dǎo)致的訓(xùn)練效率降低的問題,該方法顯著降低了大模型對芯片間P2P帶寬的需求,為硬件差異較大訓(xùn)練環(huán)境提供了一種高性能的訓(xùn)練方法。

wKgaomVlP6mALQxWAAM0Ok9OLqE815.jpg


源2.0作為千億級基礎(chǔ)大模型,在業(yè)界公開的評測上進(jìn)行了代碼生成、數(shù)學(xué)問題求解、事實(shí)問答方面的能力測試,測試結(jié)果顯示,源2.0在多項(xiàng)模型評測中,展示出了較為先進(jìn)的能力表現(xiàn)。

wKgZomVkrZ6Af_R2AABvvDO94lM918.jpg


源2.0采用全面開源策略,全系列模型參數(shù)和代碼均可免費(fèi)下載使用。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 半導(dǎo)體
    +關(guān)注

    關(guān)注

    339

    文章

    31310

    瀏覽量

    266917
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    25493
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3811

    瀏覽量

    5282
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    OpenClaw 全面接入DeepSeek-V4系列模型

    降低73%、KV緩存占用縮減90%的突破。V4-Pro則以1.6萬億總參數(shù)、490億激活參數(shù),在AgenticCoding評測中達(dá)開源模型最佳水平,Codeforces Rating突
    的頭像 發(fā)表于 04-28 09:29 ?664次閱讀

    小馬智行發(fā)布PonyWorld世界模型2.0

    4月10日,小馬智行正式發(fā)布其在物理AI領(lǐng)域的最新技術(shù)成果——PonyWorld世界模型2.0。
    的頭像 發(fā)表于 04-10 17:21 ?1189次閱讀

    浪潮信息直播發(fā)布業(yè)界首個(gè)企業(yè)級OpenClaw方案“企千蝦”

    月2日,浪潮信息直播發(fā)布業(yè)界首個(gè)企業(yè)級OpenClaw方案——「企千蝦」,為企業(yè)規(guī)?;渴稹⒐芾砗蛻?yīng)用OpenClaw,打造了安全、高效、易用的全鏈路方案。實(shí)操演示了「企千蝦」基于元腦服務(wù)器實(shí)現(xiàn)
    的頭像 發(fā)表于 04-05 17:44 ?2143次閱讀

    云知聲發(fā)布“山?!ぶ簟贝?b class='flag-5'>模型2.0,醫(yī)療AI加速落地驅(qū)動(dòng)業(yè)績高增長

    今年1月,云知聲正式發(fā)布其自研大模型“山?!ぶ簟?b class='flag-5'>2.0版本,并同步披露2025年度業(yè)績預(yù)告——全年?duì)I收預(yù)計(jì)同比增長超60%,凈利潤實(shí)現(xiàn)扭虧為盈。這一系列動(dòng)作不僅彰顯了云知聲在大模型
    發(fā)表于 02-06 10:28 ?1138次閱讀
    云知聲<b class='flag-5'>發(fā)布</b>“山?!ぶ簟贝?b class='flag-5'>模型</b><b class='flag-5'>2.0</b>,醫(yī)療AI加速落地驅(qū)動(dòng)業(yè)績高增長

    百度正式發(fā)布開源新一代文檔解析模型PaddleOCR-VL-1.5

    1 月 29 日,百度正式發(fā)布開源新一代文檔解析模型 PaddleOCR-VL-1.5。該模型以僅 0.9B 參數(shù)的輕量架構(gòu),在全球權(quán)威文
    的頭像 發(fā)表于 01-30 10:03 ?849次閱讀
    百度正式<b class='flag-5'>發(fā)布</b>并<b class='flag-5'>開源</b>新一代文檔解析<b class='flag-5'>模型</b>PaddleOCR-VL-1.5

    光庭信息與Epic Games在CES 2026發(fā)布3D HMI開發(fā)平臺UEA 2.0

    在CES 2026上,光庭信息與戰(zhàn)略合作伙伴 Epic Games 打造的UEA 2.0(UE for Automotive 2.0)正式發(fā)布。UEA
    的頭像 發(fā)表于 01-10 11:44 ?1139次閱讀

    今日看點(diǎn):小米正式發(fā)布開源模型 MiMo-V2-Flash;磷酸鐵鋰開啟漲價(jià)潮

    小米正式發(fā)布開源模型 MiMo-V2-Flash 近日小米正式發(fā)布開源模型 MiMo-V
    的頭像 發(fā)表于 12-17 09:42 ?4521次閱讀

    商湯科技正式發(fā)布開源全新多模態(tài)模型架構(gòu)NEO

    商湯科技正式發(fā)布開源了與南洋理工大學(xué)S-Lab合作研發(fā)的全新多模態(tài)模型架構(gòu) —— NEO,為日日新SenseNova 多模態(tài)模型奠定了新一代架構(gòu)的基石。
    的頭像 發(fā)表于 12-08 11:19 ?1207次閱讀
    商湯科技正式<b class='flag-5'>發(fā)布</b>并<b class='flag-5'>開源</b>全新多模態(tài)<b class='flag-5'>模型</b>架構(gòu)NEO

    成都匯陽投資關(guān)于大模型白熱化,應(yīng)用加速分化

    Gemini 2.5 Flash Image登頂 多主流圖像榜,Meta 也從 Midjourney 授權(quán) AI 圖像模型;視頻領(lǐng)域,阿里字節(jié)等刷新能力高度 ,谷歌將視頻模型推進(jìn)至實(shí)時(shí)交互通用世界模型階段。 ? ? ? ?De
    的頭像 發(fā)表于 09-09 09:30 ?1117次閱讀

    浪潮信息發(fā)布&quot;元腦SD200&quot;超節(jié)點(diǎn),面向萬億參數(shù)模型創(chuàng)新設(shè)計(jì)

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息發(fā)布面向萬億參數(shù)模型的超節(jié)點(diǎn)AI服務(wù)器"元腦SD200"。該產(chǎn)品基于浪潮信息創(chuàng)
    的頭像 發(fā)表于 08-08 22:17 ?797次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>&quot;元腦SD200&quot;超節(jié)點(diǎn),面向萬億<b class='flag-5'>參數(shù)</b>大<b class='flag-5'>模型</b>創(chuàng)新設(shè)計(jì)

    OpenAI發(fā)布2款開源模型

    OpenAI開源了兩款高性能權(quán)重語言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 發(fā)布了!我們做了一個(gè)開放模型
    的頭像 發(fā)表于 08-06 14:25 ?1174次閱讀

    萬億參數(shù)!元腦企智一體機(jī)率先支持Kimi K2大模型

    北京2025年7月21日 /美通社/ --?浪潮信息宣布元腦企智一體機(jī)已率先完成對Kimi K2 萬億參數(shù)模型的適配支持,并實(shí)現(xiàn)單用戶70 tokens/s的流暢輸出速度,為企業(yè)客戶高效部署
    的頭像 發(fā)表于 07-22 09:27 ?726次閱讀
    萬億<b class='flag-5'>參數(shù)</b>!元腦企智一體機(jī)率先支持Kimi K2大<b class='flag-5'>模型</b>

    【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】3、開源大語言模型部署

    , Gemma等開源模型。當(dāng)然,一些閉的(類似chatgpt, gemini)是不支持部署的。如下圖: 在端側(cè)部署大模型,個(gè)人認(rèn)為最大的好處:是可以避免因文本或圖片上傳而造成的
    發(fā)表于 07-19 15:45

    中國移動(dòng)攜手華為發(fā)布網(wǎng)絡(luò)運(yùn)行大模型2.0

    發(fā)布2.0版本是對1.0版本的全方位迭代升級,模型知識深度與廣度得到進(jìn)一步擴(kuò)展,用戶行為、業(yè)務(wù)趨勢、網(wǎng)絡(luò)狀態(tài)等融合信息得到統(tǒng)一關(guān)聯(lián),形成面向多類客群、多維粒度、多類場景的精細(xì)化分析能
    的頭像 發(fā)表于 07-01 15:32 ?1217次閱讀

    飛利信與浪潮信息達(dá)成戰(zhàn)略合作

    近日,2025年浪潮信息北京ISP戰(zhàn)略伙伴簽約授牌儀式成功舉辦。浪潮信息與北京飛利信電子技術(shù)有限公司等22家戰(zhàn)略合作伙伴達(dá)成簽約,其中將面向北京人工智能應(yīng)用大市場,在產(chǎn)品技術(shù)共創(chuàng)、行業(yè)場景深化及區(qū)域
    的頭像 發(fā)表于 06-24 17:37 ?1262次閱讀
    桦南县| 本溪| 收藏| 句容市| 公主岭市| 中江县| 莱州市| 子长县| 桃江县| 西峡县| 女性| 民县| 渭源县| 墨脱县| 彝良县| 平原县| 长兴县| 虹口区| 道真| 建平县| 长沙县| 潜山县| 新沂市| 贺州市| 盐城市| 华池县| 蒙城县| 黑龙江省| 拜城县| 石景山区| 东辽县| 西乌珠穆沁旗| 渭源县| 富顺县| 吴江市| 开远市| 达拉特旗| 嘉鱼县| 临汾市| 渝北区| 南康市|