日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

百度騰訊搶灘布局!DeepSeek-R1升級和開源背后,國產(chǎn)AI的逆襲之路

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2025-06-03 06:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/李彎彎)日前,DeepSeek官方宣布DeepSeek-R1模型已完成小版本試升級,當前版本為DeepSeek-R1-0528。次日,DeepSeek-R1-0528正式在Hugging Face平臺開源。用戶可通過官方網(wǎng)頁、App、小程序進入對話界面后,開啟“深度思考”功能體驗最新版本。API也已同步更新,調用方式不變。

DeepSeek-R1-0528編程能力提升最為顯著

DeepSeek-R1-0528仍然以2024年12月發(fā)布的DeepSeek V3 Base模型為基座,通過在后訓練過程中投入更多算力,顯著提升了模型的思維深度與推理能力。

官方稱,在數(shù)學、編程與通用邏輯等多個基準測評中,DeepSeek-R1-0528取得了當前國內所有模型中首屈一指的優(yōu)異成績,并且在整體表現(xiàn)上接近其他國際頂尖模型,如OpenAI的o3 高版本與o4 mini模型、Google的Gemini-2.5-Pro等。

在編程能力方面,DeepSeek-R1-0528能力的提升最為顯著。知名代碼測試平臺Live CodeBench顯示,新版本性能可以媲美OpenAIo3模型的高版本。據(jù)測試者反饋,DeepSeek-R1-0528能夠一次性生成超千行無Bug代碼,且在HTML/CSS/JS動態(tài)交互實現(xiàn)(如天氣卡片動畫、數(shù)據(jù)可視化)中更加精準。另外,在模擬物理碰撞的編程任務中,其表現(xiàn)優(yōu)于一些其他模型。它還能用Python 編寫將Word文檔中的圖片提取到固定路徑的小程序,在短時間內完成任務。

在復雜推理任務中,DeepSeek-R1-0528的表現(xiàn)也有顯著提升。在AIME 2025測試中,新版模型的準確率從舊版的70%提升至87.5%。這一提升得益于模型在解題過程中進行了更為詳盡和深入的思考,舊版模型平均每題使用12K tokens,而新版模型平均每題使用 23K tokens。此外,它還能正確回答“9.9 - 9.11 = ?”這類難倒其他頂流大模型的數(shù)字新難題。

創(chuàng)意寫作能力上,DeepSeek-R1-0528 輸出的文本更加自然,結構更有層次感,展現(xiàn)出了獨特的推理風格,不僅速度很快,而且進行了充分的思考。在舊版R1的基礎上,DeepSeek-R1-0528 針對議論文、小說、散文等文體進行了進一步優(yōu)化,能夠輸出篇幅更長、結構內容更完整的長篇作品,同時呈現(xiàn)出更加貼近人類偏好的寫作風格。

在其他能力方面,如幻覺改善,DeepSeek-R1-0528針對幻覺問題進行了優(yōu)化。與舊版相比,更新后的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了45~50%左右,能夠有效地提供更為準確、可靠的結果。

此外,DeepSeek-R1-0528 還支持工具調用功能,盡管不支持在 thinking 中進行工具調用,但在Tau-Bench測評中表現(xiàn)良好,與OpenAI o1-high相當。API方面,DeepSeek-R1-0528已同步更新,接口與調用方式保持不變,但增加了Function Calling 和JsonOutput的支持。

目前,百度智能云千帆大模型平臺正式上架了DeepSeek最新的R1-0528大模型。千帆模型開發(fā)平臺同步支持DeepSeek-R1最新版的批量推理、模型評估、推理日志挖掘分析以及模型蒸餾功能,全流程工具鏈支持企業(yè)構建自己的專屬大模型;千帆應用開發(fā)平臺上的企業(yè)級RAG、Agent、工作流、百度AI搜索組件等功能也完成對DeepSeek新模型全鏈路接入,支持企業(yè)基于DeepSeek-R1-0528定制專屬應用。文小言App也全面接入了DeepSeek最新模型。

騰訊旗下元寶、ima、搜狗輸入法、QQ瀏覽器等多款產(chǎn)品也已接入了 DeepSeek R1-0528版本。用戶打開元寶(電腦版、網(wǎng)頁版可搶先體驗)、ima、搜狗輸入法(Windows版?zhèn)冗厵冢?、QQ瀏覽器,選擇DeepSeek模型R1深度思考,即可免費不限量使用。

全球AI大模型技術能力持續(xù)突破

近些年,全球大模型技術能力持續(xù)突破,原生多模態(tài)大模型成為技術演進的重要方向,通過打通視覺、音頻、3D等模態(tài)數(shù)據(jù),實現(xiàn)端到端輸入輸出。例如,百度文心大模型4.5系列實現(xiàn)了文本、圖像和視頻的混合訓練,顯著提升了多模態(tài)理解能力。

基于長思維鏈的“慢思考”技術成為提升模型邏輯推理能力的關鍵。例如,OpenAI的o1模型通過強化學習和思維鏈技術,在STEM領域的推理能力顯著增強,并具備自我反思與錯誤修正能力。

模型參數(shù)量呈指數(shù)級增長,例如從GPT-2的15億參數(shù)躍升到GPT-4的數(shù)千億參數(shù)。同時,訓練數(shù)據(jù)集規(guī)模每八個月翻一番,推動了模型性能的持續(xù)提升。

目前全球各大模型呈現(xiàn)多元化競爭態(tài)勢,國內外模型在不同唯獨展開激烈競爭。從技術能力上來看,在國外,OpenAI的GPT系列(如GPT - 4)通過大規(guī)模訓練和計算資源,在生成文本和理解語言方面表現(xiàn)出色,具備強大的語言理解和生成能力,在復雜的文本生成和學術研究領域占據(jù)優(yōu)勢。Google的Gemini系列結合了Google Brain和DeepMind技術,追求極致的多模態(tài)和推理性能,在多模態(tài)支持方面具備最全面的能力,如原生支持文本、圖像、音頻、視頻和代碼等多種模態(tài)輸入輸出。

在國內,DeepSeek通過創(chuàng)新的算法優(yōu)化和高效的資源利用,提供了具備競爭力的選擇。其DeepSeek - R1模型在推理速度和計算資源消耗方面具有顯著優(yōu)勢,在推理能力、編程表現(xiàn)及交互體驗方面實現(xiàn)顯著突破,在數(shù)學、編程與通用邏輯等多個基準測評中取得了國內領先的成績。百度的文心大模型在自然語言處理、知識圖譜構建等方面技術成熟,廣泛應用于智能搜索、智能寫作、智能客服等領域。商湯科技專注于計算機視覺深度學習技術,在圖像識別、視頻分析等方面的技術實力強勁,其大模型在智能安防、智慧城市等領域有廣泛應用。

從應用場景上來看,國外GPT - 4適用于跨國智庫咨詢、新藥研發(fā)分子關系推理等場景。摩根士丹利使用GPT - 4.5生成投行報告,分析師效率提升70%。Gemini系列適用于跨境電商客服、全球輿情監(jiān)控等場景,沃爾瑪定制Gemini客服系統(tǒng),支持50種語言實時翻譯。

國內DeepSeek在智能客服、醫(yī)療健康等領域具有強大潛力。文心一言深度綁定政企市場,覆蓋98%部委合規(guī)標準,在國企流程自動化、醫(yī)療病歷結構化分析等場景有應用,如國家衛(wèi)健委疫情政策解讀報告生成。通義千問在電商場景表現(xiàn)突出,是電商場景霸主,在直播腳本生成、競品輿情分析準確率超90%,如天貓雙11自動生成百萬級個性化商品描述。

從生態(tài)方面來看,國外OpenAI憑借其強大的語言理解和生成能力,吸引了全球的開發(fā)者和企業(yè)。Google依托谷歌TPU算力壟斷和搜索數(shù)據(jù)優(yōu)勢,推動Gemini系列的發(fā)展。

國內百度匯聚了大量高端人才,平臺技術發(fā)展全面且快速,文心大模型在內部和外部應用方面雙向發(fā)力,積累了較多行業(yè)應用案例。阿里電商生態(tài)加持通義千問,使其與阿里云無縫集成,可一鍵調用云計算、支付、物流接口。騰訊整合微信、游戲生態(tài),調用微信社交語料,生成“網(wǎng)感”最強內容,在游戲NPC交互方面,實時生成劇情對話,玩家留存率提升25%。

寫在最后

可以預見,隨著產(chǎn)業(yè)鏈技術的不斷成熟,大模型將在更多行業(yè)得到廣泛應用,推動各行業(yè)的智能化發(fā)展。隨著生成式模型在圖像、視頻側的處理能力提升,疊加推理優(yōu)化帶來的降本,AI超級應用有望出現(xiàn),改變人機交互方式。從市場趨勢來看,全球大模型行業(yè)市場規(guī)模將持續(xù)擴大,頭部企業(yè)將鞏固地位,新興企業(yè)將尋求突破。開源社區(qū)、合作伙伴和應用開發(fā)者將成為生態(tài)競爭的關鍵。完善的生態(tài)系統(tǒng)將增強用戶粘性,促進技術創(chuàng)新。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    41315

    瀏覽量

    302691
  • 百度
    +關注

    關注

    9

    文章

    2389

    瀏覽量

    95237
  • DeepSeek
    +關注

    關注

    2

    文章

    855

    瀏覽量

    3413
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    瀚博半導體宣布深度參與百度飛槳黑客松生態(tài)活動

    近日,瀚博半導體正式宣布深度參與百度飛槳主辦的黑客松生態(tài)活動。面向全球開發(fā)者開放旗下載天系列加速卡開發(fā)環(huán)境,支持部署百度文心ERNIE-4.5 系列開源模型與PP-OCRv4 文檔理解模型,打造
    的頭像 發(fā)表于 04-11 09:41 ?697次閱讀

    百度智能云推出首個國產(chǎn)企業(yè)滿血版OpenClaw產(chǎn)品DuMate

    今天,首個國產(chǎn)企業(yè)滿血版OpenClaw——百度智能云DuMate(中文名:搭子)正式上線,全量開放。你的專屬AI搭子來了!
    的頭像 發(fā)表于 03-24 10:27 ?699次閱讀

    百度世界大會亮點 五年五芯 百度宣布打造最硬AI

    年,持續(xù)為行業(yè)搭建起交流前沿技術、碰撞創(chuàng)新思維、洞察未來趨勢的重要平臺。 今日(11月13日)Baidu World 2025在北京舉辦。在這里,可以體驗AI應用的價值涌現(xiàn),見證AI能力的創(chuàng)新爆發(fā)。 今年的百度世界2025以“效
    的頭像 發(fā)表于 11-13 15:47 ?1954次閱讀

    百度世界2025進行中 百度昆侖芯超節(jié)點亮相 性能巨幅提升

    思維、洞察未來趨勢的重要平臺。 今日(11月13日)Baidu World 2025在北京舉辦。在這里,可以體驗AI應用的價值涌現(xiàn),見證AI能力的創(chuàng)新爆發(fā)。 今年的百度世界2025以“效果涌現(xiàn)|
    的頭像 發(fā)表于 11-13 11:51 ?1498次閱讀

    DeepSeek R1 MTP在TensorRT-LLM中的實現(xiàn)與優(yōu)化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上創(chuàng)下了 DeepSeek-R1 推理性能的世界紀錄,Multi-Token Prediction (MTP) 實現(xiàn)了大幅提速
    的頭像 發(fā)表于 08-30 15:47 ?4731次閱讀
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> MTP在TensorRT-LLM中的實現(xiàn)與優(yōu)化

    百度智能云全面升級舸5.0和千帆4.0

    大會上,百度智能云全面升級AI計算平臺5.0、千帆企業(yè)AI開發(fā)平臺4.0兩大
    的頭像 發(fā)表于 08-30 09:18 ?2006次閱讀

    速看!EASY-EAI教你離線部署Deepseek R1大模型

    和自然語言推理等復雜任務。作為國產(chǎn)AI大數(shù)據(jù)模型的代表,憑借其卓越的推理能力和高效的文本生成技術,在全球人工智能領域引發(fā)廣泛關注。本文主要說明DeepSeek-R1
    的頭像 發(fā)表于 07-25 15:22 ?1599次閱讀
    速看!EASY-EAI教你離線部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大模型

    【「DeepSeek 核心技術揭秘」閱讀體驗】--全書概覽

    講解Deepseek的使用方法 第三章 深入剖析Deepseek-V3的模型架構、訓練框架、推理階段優(yōu)化、后訓練優(yōu)化等關鍵技術 第四章關于DeepSeek-R1的技術剖析 第五章 從宏觀角度分析
    發(fā)表于 07-21 00:04

    【「DeepSeek 核心技術揭秘」閱讀體驗】書籍介紹+第一章讀后心得

    DeepSeek-V3的MoE架構革新與DeepSeek-R1的強化學習突破,更揭開了中國大模型“五百萬美元創(chuàng)造GPT-4性能”的工程奇跡。 書中讓我們看到國產(chǎn)模型如何在架構設計、訓
    發(fā)表于 07-17 11:59

    信而泰×DeepSeekAI推理引擎驅動網(wǎng)絡智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢在于強大的推理引擎能力,融合了自然語言處理(
    發(fā)表于 07-16 15:29

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?直接發(fā)個安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度
    發(fā)表于 07-09 18:30

    Arm Neoverse N2平臺實現(xiàn)DeepSeek-R1滿血版部署

    頗具優(yōu)勢。Arm 攜手合作伙伴,在 Arm Neoverse N2 平臺上使用開源推理框架 llama.cpp 實現(xiàn) DeepSeek-R1 滿血版的部署,目前已可提供線上服務。
    的頭像 發(fā)表于 07-03 14:37 ?1453次閱讀
    Arm Neoverse N2平臺實現(xiàn)<b class='flag-5'>DeepSeek-R1</b>滿血版部署

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場景中的性能紀錄:在 GTC 2025
    的頭像 發(fā)表于 07-02 19:31 ?3622次閱讀
    NVIDIA Blackwell GPU優(yōu)化<b class='flag-5'>DeepSeek-R1</b>性能 打破<b class='flag-5'>DeepSeek-R1</b>在最小延遲場景中的性能紀錄

    【書籍評測活動NO.62】一本書讀懂 DeepSeek 全家桶核心技術:DeepSeek 核心技術揭秘

    2025年年初,DeepSeek 成為全球人工智能(AI)領域的焦點,其DeepSeek-V3 和DeepSeek-R1 版本在行業(yè)內引發(fā)了結構性震動。
    發(fā)表于 06-09 14:38

    百度地圖重磅發(fā)布地圖AI開放平臺

    近日,在WGDC25全球時空智能大會上,百度地圖重磅發(fā)布地圖AI開放平臺。百度地圖深耕20年的數(shù)據(jù)能力、引擎能力與AI技術全面開放,向開發(fā)者深度開放四大核心能力和五大場景解決方案。
    的頭像 發(fā)表于 05-26 11:26 ?2055次閱讀
    德惠市| 综艺| 大荔县| 年辖:市辖区| 阿坝| 卓尼县| 慈利县| 邢台市| 云龙县| 汝南县| 绍兴县| 昔阳县| 勃利县| 筠连县| 宜君县| 克什克腾旗| 岚皋县| 宁南县| 凤冈县| 扎囊县| 延长县| 仁布县| 错那县| 揭西县| 建平县| 久治县| 延长县| 青浦区| 图木舒克市| 西乡县| 庐江县| 达州市| 北安市| 玉山县| 绵阳市| 营山县| 舞阳县| 方正县| 久治县| 横峰县| 夏河县|