日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepSeek開源Engram:讓大模型擁有"過目不忘"的類腦記憶

jf_28571263 ? 來源:jf_28571263 ? 作者:jf_28571263 ? 2026-01-14 16:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2026年1月13日凌晨,DeepSeek突然發(fā)布由創(chuàng)始人梁文鋒署名的新論文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》,并同步開源記憶模塊Engram。這一機(jī)制通過可擴(kuò)展查找結(jié)構(gòu),讓大模型實(shí)現(xiàn)O(1)時(shí)間復(fù)雜度的"條件反射式"記憶檢索,被業(yè)界視為破解Transformer效率瓶頸的關(guān)鍵鑰匙。

傳統(tǒng)Transformer的"記憶困境"

當(dāng)前大語(yǔ)言模型面臨三大結(jié)構(gòu)性問題:注意力計(jì)算的O(n2)復(fù)雜度在長(zhǎng)序列下成為瓶頸;所有知識(shí)隱式存儲(chǔ)在參數(shù)中,檢索常識(shí)需激活整個(gè)網(wǎng)絡(luò);早期層負(fù)擔(dān)過重,既要做語(yǔ)義理解又要承擔(dān)知識(shí)檢索。這種"低效的反復(fù)計(jì)算"導(dǎo)致算力浪費(fèi),尤其在知識(shí)調(diào)用、代碼補(bǔ)全等需要高頻查表的任務(wù)中表現(xiàn)突出。

Engram的"雙通道記憶"設(shè)計(jì)

DeepSeek從神經(jīng)科學(xué)汲取靈感:人腦分為程序性記憶(騎自行車)和陳述性記憶(回憶電話號(hào)碼)。Engram將這一機(jī)制映射到模型架構(gòu)中——條件記憶負(fù)責(zé)快速查表,注意力負(fù)責(zé)靈活推理,兩者協(xié)同構(gòu)成"稀疏性的新軸"。

技術(shù)實(shí)現(xiàn)上,Engram采用哈希N-Gram嵌入機(jī)制:對(duì)輸入Token序列進(jìn)行連續(xù)N個(gè)詞的切片,通過哈希算法映射到可擴(kuò)展的靜態(tài)查找表。這種方法是確定性且O(1)時(shí)間復(fù)雜度的,無論存儲(chǔ)多少萬億記憶片段,檢索速度恒定,算力消耗極低。同時(shí),輕量化門控機(jī)制會(huì)根據(jù)當(dāng)前上下文判斷是否啟用查表結(jié)果,避免生硬注入。

實(shí)測(cè)數(shù)據(jù):性能提升超預(yù)期

DeepSeek在同等參數(shù)和算力條件下進(jìn)行嚴(yán)格對(duì)比測(cè)試(均為38億激活參數(shù),2620億訓(xùn)練Token):

知識(shí)密集型任務(wù) :MMLU提升3分,CMMLU提升4.0分,TriviaQA提升1.9分

通用推理與代碼 :BBH大幅提升5.0分,HumanEval代碼生成提升3.0分,數(shù)學(xué)任務(wù)MATH提升2.4分

長(zhǎng)上下文能力 :Multi-Query NIAH準(zhǔn)確率從84.2躍升至97.0,Variable Tracking從77.0提升到89.0

更關(guān)鍵的是,Engram讓模型早期層不再做"苦力活",第5層的表征即可達(dá)到基線模型第12層的水平,有效深度增加一倍,省下的層數(shù)用于更復(fù)雜的推理。

行業(yè)意義:DeepSeek V4的前奏

梁文鋒連續(xù)署名兩篇論文(mHC架構(gòu)與Engram),預(yù)示DeepSeek V4的技術(shù)輪廓日漸清晰。如果說mHC是底層架構(gòu)創(chuàng)新,Engram則是在架構(gòu)層面做"分工重構(gòu)"。這種"存算分離"設(shè)計(jì),完美契合算力受限環(huán)境下的性價(jià)比路線——在同等算力下實(shí)現(xiàn)更強(qiáng)性能。

對(duì)行業(yè)而言,開源Engram的價(jià)值在于:它提供了第一個(gè)可微分、可訓(xùn)練、原生嵌入模型結(jié)構(gòu)的記憶增強(qiáng)方案,讓開發(fā)者無需從零構(gòu)建。從代碼補(bǔ)全到醫(yī)療知識(shí)庫(kù),從多語(yǔ)言翻譯到法律條文檢索,O(1)查找式記憶將為垂直領(lǐng)域大模型帶來35-45%的吞吐量提升和25-35%的成本降低。

效率革命的"陽(yáng)謀"

DeepSeek此舉既是技術(shù)突破,更是戰(zhàn)略卡位。當(dāng)行業(yè)陷入"算力軍備競(jìng)賽",它選擇用架構(gòu)創(chuàng)新打破硬約束。Engram的巧妙在于不挑戰(zhàn)Transformer根基,而是增強(qiáng)其薄弱環(huán)節(jié),與MoE形成"計(jì)算-記憶"雙稀疏,實(shí)現(xiàn)1+1>2。

但挑戰(zhàn)同樣存在:哈希沖突率如何控制?靜態(tài)記憶表更新機(jī)制是否成熟?在創(chuàng)意生成等需要強(qiáng)泛化場(chǎng)景下,Engram是否會(huì)產(chǎn)生"記憶固化"副作用?這些都需要大規(guī)模實(shí)戰(zhàn)檢驗(yàn)。

Engram的開源,標(biāo)志著大模型優(yōu)化從"參數(shù)競(jìng)賽"轉(zhuǎn)向"架構(gòu)效率"。當(dāng)梁文鋒將"記憶痕跡"這一神經(jīng)科學(xué)概念注入AI,我們看到的不僅是性能數(shù)字的提升,更是中國(guó)AI企業(yè)在技術(shù)路線上從追隨到并跑的自信。若DeepSeek V4搭載Engram如期上線,或?qū)⒆C明:在算力受限時(shí)代,聰明的架構(gòu)設(shè)計(jì)比野蠻的參數(shù)量堆砌更具長(zhǎng)期價(jià)值。這場(chǎng)記憶革命,才剛剛開始。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41315

    瀏覽量

    302691
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3797

    瀏覽量

    5278
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    855

    瀏覽量

    3413
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    從"替代人力"到"智能協(xié)同":履帶式巡檢機(jī)器人的產(chǎn)業(yè)躍遷

    2026年的工業(yè)智能化轉(zhuǎn)型浪潮中,一個(gè)顯著的趨勢(shì)正在形成——工業(yè)巡檢機(jī)器人正從單純的"人力替代工具"升級(jí)為具備感知、決策與協(xié)同能力的"智能體"。
    的頭像 發(fā)表于 02-05 10:42 ?458次閱讀

    選EtherCAT模塊,別只看價(jià)格,先看"體檢報(bào)告"

    ±8kV靜電、±2kV浪涌、-42℃極寒、1500V高壓—這不是極限運(yùn)動(dòng),而是DPort-ECT模塊的出廠"必修課"。本文詳解工業(yè)級(jí)EtherCAT從站如何通過嚴(yán)苛測(cè)試關(guān)
    的頭像 發(fā)表于 02-04 11:46 ?521次閱讀
    選EtherCAT模塊,別只看價(jià)格,先看&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;體檢報(bào)告&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    機(jī)械臂越復(fù)雜越&amp;amp;quot;卡頓&amp;amp;quot;?別讓控制器拖了后腿

    工業(yè)機(jī)器人動(dòng)作越復(fù)雜,傳統(tǒng)控制器越&quot;卡頓&quot;?ZMC900E用4核A55跑Linux算軌跡,3核R5F硬件級(jí)專管EtherCAT通信,實(shí)現(xiàn)±1.5μs微秒級(jí)抖動(dòng),破解高算力與硬實(shí)
    的頭像 發(fā)表于 02-02 11:40 ?792次閱讀
    機(jī)械臂越復(fù)雜越&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;卡頓&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?別讓控制器拖了后腿

    L3試點(diǎn)落地,和芯星通如何成為車企突圍的&amp;amp;quot;隱形守護(hù)者&amp;amp;quot;?

    當(dāng)長(zhǎng)安汽車與北汽極狐拿到中國(guó)首批L3級(jí)自動(dòng)駕駛準(zhǔn)入許可的那一刻,整個(gè)產(chǎn)業(yè)鏈等待多年的&quot;靴子&quot;終于落地。在這個(gè)責(zé)任主體從駕駛員轉(zhuǎn)向車企的關(guān)鍵轉(zhuǎn)折下,系統(tǒng)可靠性成為真正的&quot
    的頭像 發(fā)表于 01-04 12:03 ?788次閱讀
    L3試點(diǎn)落地,和芯星通如何成為車企突圍的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;隱形守護(hù)者&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    &amp;quot;Access violation&amp;quot; 錯(cuò)誤,復(fù)位位置,重新打印

    &quot;Access violation&quot; 錯(cuò)誤
    的頭像 發(fā)表于 11-08 07:16 ?779次閱讀

    南柯電子|現(xiàn)場(chǎng)解決EMC電磁輻射干擾:&amp;quot;雷區(qū)&amp;quot;90%的人栽在接地

    南柯電子|現(xiàn)場(chǎng)解決EMC電磁輻射干擾:&quot;雷區(qū)&quot;90%的人栽在接地
    的頭像 發(fā)表于 09-25 09:38 ?794次閱讀

    智慧路燈的&amp;amp;quot;智慧&amp;amp;quot;從何而來?一文讀懂單燈控制器工作原理

    燈控制器&quot;中。什么是單燈控制器?單燈控制器,顧名思義,就是為每一盞路燈配備的智能控制終端。它相當(dāng)于路燈的&quot;大腦&quot;,通過接收指令、執(zhí)行操作、反饋狀態(tài),傳統(tǒng)
    的頭像 發(fā)表于 08-29 20:08 ?912次閱讀
    智慧路燈的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;智慧&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;從何而來?一文讀懂單燈控制器工作原理

    光耦合器:電子世界的 &amp;quot;光橋梁&amp;quot;

    在現(xiàn)代電子設(shè)備的復(fù)雜電路中,信號(hào)的傳輸與隔離至關(guān)重要。就像城市交通中需要橋梁來跨越障礙、連接不同區(qū)域一樣,電子電路里也需要一座 &quot;橋梁&quot; 來實(shí)現(xiàn)信號(hào)的安全、高效傳輸,同時(shí)避免
    的頭像 發(fā)表于 08-22 16:58 ?1192次閱讀

    浪潮信息發(fā)布&amp;quot;元SD200&amp;quot;超節(jié)點(diǎn),面向萬億參數(shù)大模型創(chuàng)新設(shè)計(jì)

    擴(kuò)展支持64路本土GPU芯片。元SD200可實(shí)現(xiàn)單機(jī)內(nèi)運(yùn)行超萬億參數(shù)大模型,并支持多個(gè)領(lǐng)先大模型機(jī)內(nèi)同時(shí)運(yùn)行及多智能體實(shí)時(shí)協(xié)作與按需調(diào)用,目前已率先實(shí)現(xiàn)商用。在實(shí)際評(píng)測(cè)中,元SD2
    的頭像 發(fā)表于 08-08 22:17 ?791次閱讀
    浪潮信息發(fā)布&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;元<b class='flag-5'>腦</b>SD200&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;超節(jié)點(diǎn),面向萬億參數(shù)大<b class='flag-5'>模型</b>創(chuàng)新設(shè)計(jì)

    精密設(shè)備的&amp;amp;quot;電力保鏢&amp;amp;quot;:優(yōu)比施UPS如何守護(hù)數(shù)據(jù)與硬件安全?

    一、用戶痛點(diǎn):精密設(shè)備的&quot;斷電恐懼癥&quot;在數(shù)據(jù)中心、醫(yī)療實(shí)驗(yàn)室、工業(yè)控制等場(chǎng)景中,精密電子設(shè)備對(duì)電源的依賴已達(dá)到&quot;零容忍&quot;級(jí)別:數(shù)據(jù)安全危機(jī):服務(wù)
    的頭像 發(fā)表于 07-25 09:00 ?1137次閱讀
    精密設(shè)備的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;電力保鏢&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;:優(yōu)比施UPS如何守護(hù)數(shù)據(jù)與硬件安全?

    Modbus RTU通訊協(xié)議:瑞銀電能表的&amp;quot;普通話&amp;quot;指南

    Modbus RTU協(xié)議就像工業(yè)設(shè)備間的&quot;普通話&quot;,不同品牌的電能表、傳感器等設(shè)備能夠順暢&quot;交流&quot;
    的頭像 發(fā)表于 07-18 18:30 ?2332次閱讀
    Modbus RTU通訊協(xié)議:瑞銀電能表的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;普通話&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;指南

    地?zé)岚l(fā)電環(huán)網(wǎng)柜局放監(jiān)測(cè)設(shè)備:清潔能源電網(wǎng)的&amp;amp;quot;安全衛(wèi)士&amp;amp;quot;

    文章由山東華科信息技術(shù)有限公司提供在&quot;雙碳&quot;目標(biāo)驅(qū)動(dòng)下,地?zé)岚l(fā)電作為穩(wěn)定基荷電源,其電網(wǎng)接入設(shè)備的可靠性至關(guān)重要。環(huán)網(wǎng)柜作為地?zé)犭娬九c主網(wǎng)連接的關(guān)鍵節(jié)點(diǎn),其內(nèi)部絕緣缺陷可能引發(fā)
    的頭像 發(fā)表于 07-16 10:15 ?715次閱讀
    地?zé)岚l(fā)電環(huán)網(wǎng)柜局放監(jiān)測(cè)設(shè)備:清潔能源電網(wǎng)的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;安全衛(wèi)士&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    為什么GNSS/INS組合被譽(yù)為導(dǎo)航界的&amp;amp;quot;黃金搭檔&amp;amp;quot;?

    解決方案。而ER-GNSS/MINS-05低成本組合導(dǎo)航系統(tǒng)的出現(xiàn),更是這一&quot;黃金組合&quot;走進(jìn)了更廣泛的應(yīng)用場(chǎng)景,高性能導(dǎo)航不再昂貴。
    的頭像 發(fā)表于 07-09 17:12 ?1195次閱讀
    為什么GNSS/INS組合被譽(yù)為導(dǎo)航界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黃金搭檔&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    人形機(jī)器人為什么要定制? ——揭秘工業(yè)場(chǎng)景的&amp;quot;千面需求&amp;quot;

    核心洞察:標(biāo)準(zhǔn)化機(jī)器人難以破解工業(yè)場(chǎng)景的&quot;需求碎片化&quot;困局。富唯智能通過?&quot;五大模塊柔性架構(gòu)+零代碼中樞&quot;?,為?人形機(jī)器人為什么要定制?提供了
    的頭像 發(fā)表于 06-10 17:19 ?1538次閱讀
    人形機(jī)器人為什么要定制? ——揭秘工業(yè)場(chǎng)景的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;千面需求&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    倉(cāng)儲(chǔ)界的&amp;quot;速效救心丸&amp;quot;,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān)實(shí)戰(zhàn)案例

    實(shí)戰(zhàn)案例,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān),倉(cāng)儲(chǔ)界的&quot;速效救心丸&quot;
    的頭像 發(fā)表于 05-11 10:32 ?932次閱讀
    倉(cāng)儲(chǔ)界的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;速效救心丸&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān)實(shí)戰(zhàn)案例
    广南县| 江口县| 龙州县| 贺兰县| 和田县| 巴塘县| 阿巴嘎旗| 佛学| 当雄县| 青铜峡市| 甘南县| 响水县| 龙岩市| 肥西县| 墨江| 绍兴市| 唐山市| 仁寿县| 安丘市| 乌拉特中旗| 二连浩特市| 嘉荫县| 建瓯市| 常德市| 工布江达县| 南城县| 朔州市| 云和县| 东丽区| 佳木斯市| 徐汇区| 华宁县| 和龙市| 沧州市| 镇巴县| 中超| 阳谷县| 汤原县| 集贤县| 辽中县| 普兰店市|