AI初創(chuàng)企業(yè)推MoE混合專家模型架構(gòu)新品abab 6.5

4 月 17 日，國內(nèi)人工智能初創(chuàng)公司 MiniMax 稀宇科技宣布推出采用混合專家模型架構(gòu)的 losoev 6.5 系列模型，其核心性能已接近 GPT-4、Claude-3 和 Gemini-1.5。

losoev 6.5 系列包含兩款模型：

losoev 6.5：擁有萬億級(jí)別的參數(shù)，可處理 200k tokens 的上下文長度；

losoev 6.5s：與 losoev 6.5 共享相同的訓(xùn)練技術(shù)和數(shù)據(jù)，但效率更高，同樣支持 200k tokens 的上下文長度，且能夠在 1 秒鐘內(nèi)處理近 3 萬字的文本。

自今年 1 月份推出國內(nèi)首款基于 MoE 架構(gòu)的 losoev 6 模型以來，MiniMax 通過優(yōu)化模型架構(gòu)、重建數(shù)據(jù)管道、改進(jìn)訓(xùn)練算法以及實(shí)施并行訓(xùn)練策略等手段，在加速模型擴(kuò)展方面取得了顯著進(jìn)展。

在 200k token 的范圍內(nèi)，官方對(duì) losoev 6.5 進(jìn)行了業(yè)內(nèi)常見的“大海撈針”測(cè)試，即將一句與原文無關(guān)的句子插入長文本中，然后通過自然語言詢問模型，觀察其能否準(zhǔn)確識(shí)別出這句話。經(jīng)過 891 次測(cè)試，losoev 6.5 均能準(zhǔn)確回答問題。

losoev 6.5 和 losoev 6.5s 模型將逐步應(yīng)用于 MiniMax 旗下的產(chǎn)品，如海螺 AI 和 MiniMax 開放平臺(tái)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

算法

算法

+關(guān)注

關(guān)注
23

文章
4812

瀏覽量
98686
人工智能

人工智能

+關(guān)注

關(guān)注
1821

文章
50436

瀏覽量
267429
模型

模型

+關(guān)注

關(guān)注
1

文章
3850

瀏覽量
52306

評(píng)論

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁

Hot 對(duì)比各家主流MCU指標(biāo)，國產(chǎn)MCU真的品質(zhì)不佳？
Hot 模擬信號(hào)和數(shù)字信號(hào)的區(qū)別和特點(diǎn)

New 方正電機(jī)成為小鵬汽車驅(qū)動(dòng)電機(jī)供應(yīng)商，總需求量預(yù)計(jì)達(dá)35萬臺(tái)
New 雷諾-吉利動(dòng)力總成合資企業(yè)HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

安森美10BASE-T1S芯片深度解析

安森美
10小時(shí)前

647 閱讀

液位傳感器選型，只看“能不能測(cè)到”就夠了嗎？

斯丹麥德電子
13小時(shí)前

816 閱讀

基于晶豐明源LKS32MC03x系列MCU的家用油煙機(jī)變頻控制解決方案

晶豐明源
15小時(shí)前

935 閱讀

修改QDMA仿真例子使數(shù)據(jù)通路指向NOC1

XILINX開發(fā)者社區(qū)
16小時(shí)前

1021 閱讀

基于RT-Thread的數(shù)字焊機(jī)與工業(yè)機(jī)器人通信網(wǎng)關(guān)設(shè)計(jì)|實(shí)戰(zhàn)案例

RT-Thread官方賬號(hào)
1天前

1032 閱讀

Primer Plus(第五版)中文版

24K純情
42.8 MB

免費(fèi)

0下載

基于openharmony適配移植的自動(dòng)垂直文本視圖案例

姚小熊27
0.18 MB

免費(fèi)

1下載

Vector Netflix主機(jī)性能監(jiān)視工具

楊火亭
0.28 MB

免費(fèi)

0下載

varnish-agent varnish配置管理工具

王軍
0.27 MB

2積分

1下載

SagerNet適用于Android的通用代理工具鏈

山中老虎
2.49 MB

5積分

34下載

【瑞薩RA2L1入門學(xué)習(xí)】+ RA-Eco-RA2L1-V2.0開發(fā)板文本輸出 Hello World

jf_84491108
4天前

965 閱讀

【瑞薩RA2L1入門學(xué)習(xí)】步進(jìn)電機(jī)驅(qū)動(dòng)

jf_07365693
8天前

2083 閱讀

R_IOPORT_Open

jf_91972191
10天前

2158 閱讀

【瑞薩RA2L1入門學(xué)習(xí)】+ RA-Eco-RA2L1-V2.0開發(fā)板自定義按鍵控制 LED

jf_84491108
9天前

2055 閱讀

【瑞薩RA2L1入門學(xué)習(xí)】+ RA-Eco-RA2L1-V2.0開發(fā)板概覽、環(huán)境搭建與TTL串口燒錄點(diǎn)燈

jf_84491108
12天前

2420 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

AI初創(chuàng)企業(yè)推MoE混合專家模型架構(gòu)新品abab 6.5

評(píng)論