校园春色综合网,激情性爰五月天

11月27日，浪潮信息發(fā)布"源2.0"基礎(chǔ)大模型，并宣布全面開源。源2.0基礎(chǔ)大模型包括1026億、518億、21億等三種參數(shù)規(guī)模的模型，在編程、推理、邏輯等方面展示出了先進(jìn)的能力。

當(dāng)前，大模型技術(shù)正在推動(dòng)生成式人工智能產(chǎn)業(yè)迅猛發(fā)展，而基礎(chǔ)大模型的關(guān)鍵能力則是大模型在行業(yè)和應(yīng)用落地能力表現(xiàn)的核心支撐，但基礎(chǔ)大模型的發(fā)展也面臨著在算法、數(shù)據(jù)和算力等方面的諸多挑戰(zhàn)。源2.0基礎(chǔ)大模型則針對性地提出了新的改進(jìn)方法并獲得了能力的提升。

算法方面，源2.0提出并采用了一種新型的注意力算法結(jié)構(gòu)：局部注意力過濾增強(qiáng)機(jī)制(LFA：Localized Filtering-based Attention)。LFA通過先學(xué)習(xí)相鄰詞之間的關(guān)聯(lián)性，然后再計(jì)算全局關(guān)聯(lián)性的方法，能夠更好地學(xué)習(xí)到自然語言的局部和全局的語言特征，對于自然語言的關(guān)聯(lián)語義理解更準(zhǔn)確、更人性，提升了模型的自然語言表達(dá)能力，進(jìn)而提升了模型精度。

數(shù)據(jù)方面，源2.0通過使用中英文書籍、百科、論文等高質(zhì)量中英文資料，降低了互聯(lián)網(wǎng)語料內(nèi)容占比，結(jié)合高效的數(shù)據(jù)清洗流程，為大模型訓(xùn)練提供了高質(zhì)量的專業(yè)數(shù)據(jù)集和邏輯推理數(shù)據(jù)集。為了獲取中文數(shù)學(xué)數(shù)據(jù)，我們清洗了從2018年至今約12PB的互聯(lián)網(wǎng)數(shù)據(jù)，但僅獲取到了約10GB的數(shù)學(xué)數(shù)據(jù)，投入巨大，收益較小。為了更高效地獲得相對匱乏的高質(zhì)量中文數(shù)學(xué)及代碼數(shù)據(jù)集，源2.0采用了基于大模型的數(shù)據(jù)生產(chǎn)及過濾方法，在保證數(shù)據(jù)的多樣性的同時(shí)也在每一個(gè)類別上提升數(shù)據(jù)質(zhì)量，獲取了一批高質(zhì)量的數(shù)學(xué)與代碼預(yù)訓(xùn)練數(shù)據(jù)。

算力方面，源2.0采用了非均勻流水并行的方法，綜合運(yùn)用流水線并行+優(yōu)化器參數(shù)并行+數(shù)據(jù)并行的策略，讓模型在流水并行各階段的顯存占用量分布更均衡，避免出現(xiàn)顯存瓶頸導(dǎo)致的訓(xùn)練效率降低的問題，該方法顯著降低了大模型對芯片間P2P帶寬的需求，為硬件差異較大訓(xùn)練環(huán)境提供了一種高性能的訓(xùn)練方法。

源2.0作為千億級基礎(chǔ)大模型，在業(yè)界公開的評測上進(jìn)行了代碼生成、數(shù)學(xué)問題求解、事實(shí)問答方面的能力測試，測試結(jié)果顯示，源2.0在多項(xiàng)模型評測中，展示出了較為先進(jìn)的能力表現(xiàn)。

源2.0采用全面開源策略，全系列模型參數(shù)和代碼均可免費(fèi)下載使用。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

半導(dǎo)體

半導(dǎo)體

+關(guān)注

關(guān)注
339

文章
31310

瀏覽量
266917
浪潮

浪潮

+關(guān)注

關(guān)注
1

文章
491

瀏覽量
25493
大模型

大模型

+關(guān)注

關(guān)注
2

文章
3811

瀏覽量
5282

日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

搜索歷史

浪潮信息發(fā)布源2.0基礎(chǔ)大模型，千億參數(shù)全面開源

評論