據(jù)消息,OpenAI近日發(fā)布了一項重要研究報告。報告指出,DeepSeek和Kimi兩家機構(gòu)通過獨立研究,成功利用思維鏈學(xué)習(xí)方法,在數(shù)學(xué)解題與編程挑戰(zhàn)中顯著提升了模型的綜合表現(xiàn)。
Kimi的研究員Flood Sung在隨后的發(fā)文中詳細闡述了這一發(fā)現(xiàn)。他提到,長思維鏈的有效性在內(nèi)部實驗中已經(jīng)得到了驗證。在實際訓(xùn)練過程中,研究人員發(fā)現(xiàn)模型的表現(xiàn)會隨著訓(xùn)練的深入而不斷提升,并且token數(shù)也在不斷增加。這一現(xiàn)象表明,在強化訓(xùn)練的過程中,模型能夠自我涌現(xiàn),進一步提升其解題能力。
值得注意的是,就在1月20日,DeepSeek和Kimi在同一天發(fā)布了各自的推理模型R1和k1.5。這兩款模型的發(fā)布,無疑是對其研究成果的進一步驗證和展示。
此次DeepSeek與Kimi的研究不僅揭示了o1的秘密,更為人工智能領(lǐng)域的發(fā)展帶來了新的啟示。思維鏈學(xué)習(xí)方法的成功應(yīng)用,為提升AI模型的解題能力和編程能力提供了新的思路和方法。
-
人工智能
+關(guān)注
關(guān)注
1821文章
50366瀏覽量
267060 -
模型
+關(guān)注
關(guān)注
1文章
3831瀏覽量
52287 -
Kimi
+關(guān)注
關(guān)注
0文章
14瀏覽量
341 -
DeepSeek
+關(guān)注
關(guān)注
2文章
855瀏覽量
3414
發(fā)布評論請先 登錄
DeepSeek與Kimi揭示o1秘密,思維鏈學(xué)習(xí)方法顯成效
評論