近日,據(jù)報道,臉書母公司Meta為了提升其大模型Llama的性能,專門成立了四個研究小組,深入探索量化巨頭幻方量化旗下的國產(chǎn)大模型DeepSeek的工作原理。
據(jù)悉,Meta組建的這四個小組各有側重。其中,兩個小組致力于解析幻方量化如何降低DeepSeek模型的訓練和運行成本,以期從中汲取經(jīng)驗,優(yōu)化Meta自身的成本結構。第三個研究小組則聚焦于幻方量化訓練DeepSeek模型所使用的數(shù)據(jù),試圖揭示其數(shù)據(jù)選擇的獨特之處,為Meta的模型訓練提供新的思路。
而第四個小組的任務更為前沿,他們正在考慮如何基于DeepSeek模型的屬性,重構Meta的Llama模型,以期實現(xiàn)性能上的飛躍。這一舉措不僅展現(xiàn)了Meta對DeepSeek模型的高度重視,也體現(xiàn)了其在人工智能領域不斷探索、勇于創(chuàng)新的精神。
Meta此次組建的四大專研小組,無疑將為其在人工智能領域的發(fā)展注入新的動力。通過深入探索DeepSeek模型的工作原理,Meta有望在大模型研發(fā)方面取得更加顯著的進展,為用戶提供更加智能、高效的服務。
-
人工智能
+關注
關注
1821文章
50366瀏覽量
267047 -
模型
+關注
關注
1文章
3831瀏覽量
52285 -
Meta
+關注
關注
0文章
325瀏覽量
12502 -
DeepSeek
+關注
關注
2文章
855瀏覽量
3413
發(fā)布評論請先 登錄
云天勵飛完成DeepSeek-V4系列模型關鍵機制適配驗證
寒武紀Day 0適配DeepSeek-V4模型
壁仞科技壁礪166系列GPU產(chǎn)品率先支持DeepSeek-V4模型
Meta組建四大專研小組,深入探索DeepSeek模型
評論