日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型遭遇算力墻,探索超級應(yīng)用的發(fā)展路徑

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2025-02-10 17:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近,開源中國 OSCHINA、Gitee 與 Gitee AI

90c46f16-e788-11ef-9310-92fbcf53809c.png

全文如下:

大模型撞上 “算力墻”,超級應(yīng)用的探尋之路

文 / 傅聰

近日,大模型教父 Sam Altman 在 Reddit 上的評論透露出 GPT-5 難產(chǎn)的隱憂,直言有限的算力約束讓 OpenAI 面臨迭代優(yōu)先級的艱難抉擇,在通往 AGI 的道路上一路高歌猛進的領(lǐng)頭羊似乎撞上了“算力墻”。

除此之外,能耗、資金,難以根除的幻覺,有限的知識更新速率、有限的上下文寬度、高昂的運營成本等等,都讓外界對大模型的發(fā)展憂心忡忡。面對棘手的困境與難題,大模型的未來,又該何去何從呢?

下一代 “明星產(chǎn)品”

“算力墻”下,模型效果邊際收益遞減,訓(xùn)練和運營成本高昂,在這個時間節(jié)點,最好的 AI 產(chǎn)品會是什么?奧特曼、蓋茨、小扎、吳恩達、李彥宏等一眾大佬給出了一致的答案 —— 智能體(AI Agent)。

2025,將會是智能體元年。

什么是智能體?目前業(yè)界一致認可的公式是“智能體 = LLM + 記憶 + 規(guī)劃 + 工具”:

90eefc36-e788-11ef-9310-92fbcf53809c.png

大模型充當智能體的“大腦”,負責(zé)對任務(wù)進行理解、拆解、規(guī)劃,并調(diào)用相應(yīng)工具以完成任務(wù)。同時,通過記憶模塊,它還能為用戶提供個性化的服務(wù)。

智能體為什么是“算力墻”前 AI 產(chǎn)品的最優(yōu)解決方案?這一問題的底層邏輯包含兩個方面。

1. LLM 是目前已知最好的智能體底層技術(shù)。

智能體作為學(xué)術(shù)術(shù)語由來已久,從上世紀的“符號、專家系統(tǒng)”【1】,到十年前風(fēng)頭無兩的強化學(xué)習(xí)(代表作 AlphaGo【3】),再到現(xiàn)在的 LLM,agent 底層技術(shù)經(jīng)歷了三個大的階段。

符號系統(tǒng)的缺點在于過于依賴人工定義的“符號”和“邏輯”,強化學(xué)習(xí)苦于訓(xùn)練數(shù)據(jù)的匱乏和“模態(tài)墻”,而 LLM 一次性解決這些問題。

人類語言就是一種高度抽象、跨模態(tài)、表達力充分的符號系統(tǒng),同時它作為知識的載體,自然地存在大量數(shù)據(jù)可用于訓(xùn)練,還蘊含了人類的思維模式。

在此基礎(chǔ)上訓(xùn)練得到的 LLM,自然具備被誘導(dǎo)出類人思考的潛力。在 COT(思維鏈)【4】、TOT(思維樹)【5】等技術(shù)的加持下,大模型正在學(xué)習(xí)拆解自己的“思維”,OpenAI 的 o1 就是典型案例,強化了推理能力的同時,也大大緩解了幻覺問題。

2. 大模型做不到的,“現(xiàn)存工具”強勢補位。

無法持續(xù)更新的知識庫,可以通過 RAG(Retrieval Augmented Generation,檢索增強生成)來解決。

RAG 的出現(xiàn),讓各界越來越深刻地認識到,大模型沒必要存儲那么多知識,只需要如何使用搜索引擎這個外部工具即可。大模型可以在搜索結(jié)果上做進一步的信息篩選和優(yōu)化,而搜索引擎彌補了大模型的知識缺陷,實現(xiàn)了 1+1>=2 的效果。

RAG 可以被理解為智能體的最簡單形式。未來的智能體可以實現(xiàn)多種工具的混合使用,甚至多智能體協(xié)作,這不是猜想,我們已經(jīng)在學(xué)術(shù)界看到了驚艷的早期方案【6,7】。

“四把鑰匙”解鎖潛力

1. 領(lǐng)域模型小型化、平臺化會成為新趨勢。

“算力墻”是一方面因素,但基座模型的趨同化和運營成本是源動力。GPT、Claude、Gemini 雖然各有所長,但實際體驗越來越讓大家分不出差異,基座模型作為智能體核心,決定了智能體效果下限,人人訓(xùn)練基座的可能性越來越低,“基座服務(wù)化”很可能是最合理的商業(yè)模式。

甚至,在錯誤不敏感的應(yīng)用領(lǐng)域,出現(xiàn)一個開源、無商業(yè)限制的基座的可能性也很高。小應(yīng)用開發(fā)商很可能很容易獲得一個低成本 serving 的“量化小基座”。

“7B” 是一個 magic number!無論是 RAG 里的向量表征模型,還是文生圖、文本識別(OCR)、語音合成(TTS)、人臉識別等等垂直領(lǐng)域,一個 1B~7B 的小模型已經(jīng)可以滿足很多生產(chǎn)、應(yīng)用需要,并且效果也在逐步推高【8,9,10】。這些模型,作為智能體的“三頭六臂”,不需要太“大”。

同時,從學(xué)術(shù)角度來講,各種領(lǐng)域?qū)S媚P偷募夹g(shù)最優(yōu)解也在逐漸趨同。應(yīng)用開發(fā)者越來越不需要了解模型的底層技術(shù),只需要懂得如何設(shè)計自己應(yīng)用的任務(wù)流,懂一點點 COT 系列的 prompt engineering 的技巧,就可以利用 Maas(Model as a service)、Aaas(Agent as a service)這樣的平臺,如玩樂高一般搭建自己的 AI 云原生應(yīng)用。

2. 算力層深挖定制化、低能耗的可能性,但固化 transformer 可能不是最優(yōu)解

雖說智能體不需要太大的模型,但其運營成本(模型推理計算成本)仍然較高。在短時間內(nèi),算力、能源仍然會是大模型領(lǐng)域令人頭疼的高墻。

根據(jù)報告【1】,能源消耗將會是 2030 模型 scaling 最卡脖子的因素。也就是說,在算力到達瓶頸之前,首先可能會出現(xiàn)電能供應(yīng)不足甚至交不起電費的問題。因此,算力層可以根據(jù)大模型底層技術(shù)的特性,產(chǎn)出針對性的芯片,尤其是加速運算和降低能耗。這是未來 AI 芯片領(lǐng)域的最優(yōu)競爭力。

那么,把 transformer “焊死”到板子上就是最佳方案嗎?我知道你很急,但你先別急。大模型底層框架還存在底層路線之爭。

我們知道,Transformer 架構(gòu)呈現(xiàn)了 O (n2) 的理論計算復(fù)雜度,這里的 n 指的是大模型輸入序列的 token 數(shù)量,但其前任語言模型擔(dān)當 RNN 只有 O (n) 的理論計算復(fù)雜度。

最近,以 Mamba、RWKV 為代表的類 RNN 結(jié)構(gòu)死灰復(fù)燃,公開挑戰(zhàn) transformer 地位。更有最新研究【13】從理論上表明,RNN 對比 Transformer 的表達力,只差一個 in-context-retrieval。在這個方向的持續(xù)投入下,我們很可能會迎接一個介于 RNN 和 Transformer 之間的“新王”。

90fab940-e788-11ef-9310-92fbcf53809c.png

因此,算力層短時間內(nèi)的主題仍然是“半通用化”“高算力”“低能耗”。

3. 合成數(shù)據(jù)驅(qū)動新產(chǎn)業(yè)鏈

早有機構(gòu)預(yù)測,人類社會可利用訓(xùn)練數(shù)據(jù)會在 2026 年耗盡。這可能還是一個樂觀估計。光頭哥 Tibor Blaho 還曾爆料,OpenAI 用于訓(xùn)練“獵戶座“的數(shù)據(jù)中,已經(jīng)包含了由 GPT-4 和 O1 產(chǎn)出的合成數(shù)據(jù)。

這不僅是因為自然存在的高質(zhì)量文本的匱乏,還因為智能體所需的數(shù)據(jù)很可能需要顯式地蘊含任務(wù)思考和規(guī)劃的拆解信息。然而,針對合成數(shù)據(jù)的問題,學(xué)術(shù)界早有預(yù)警,模型可能會在合成數(shù)據(jù)上的持續(xù)訓(xùn)練中崩壞【14】。

9112ce18-e788-11ef-9310-92fbcf53809c.png

這是因為合成數(shù)據(jù)往往攜帶“錯誤”和“幻覺”,在一些冷門的知識上尤甚。因此,合成數(shù)據(jù)的實用秘訣是“去粗取精”,需要一定程度的“人機協(xié)同”。在如何構(gòu)造大批量、高質(zhì)量的合成數(shù)據(jù),讓智能體能夠在持續(xù)地與用戶的交互中自我優(yōu)化而不是劣化,將會成為眾多無機器學(xué)習(xí)技術(shù)背景的開發(fā)者的頭號難題。

因此,面向數(shù)據(jù)進行定制化合成、評估、測試、標注、人機協(xié)同的“純數(shù)據(jù)”產(chǎn)業(yè),有可能會走上越來越重要的位置,不僅僅是服務(wù)于基座模型廠商。

4. 多模態(tài)對齊很可能給基座模型帶來質(zhì)的提升

最新研究發(fā)現(xiàn),在沒有預(yù)先約束和約定下,不同模態(tài)領(lǐng)域的最強模型正在向著某個世界模型認知領(lǐng)域收縮【15】,AI 模型對不同概念的數(shù)字化表達(向量表征)會逐步趨同,構(gòu)建對這個世界的統(tǒng)一認知。這也符合我們?nèi)祟悓κ澜绲恼J知:人類通過語言文字這種符號,將不同模態(tài)的信號統(tǒng)一地表達,并在腦中構(gòu)建了某種受限于當前科技水平的統(tǒng)一模型,這是人類意識、社會溝通的前提。

912a2676-e788-11ef-9310-92fbcf53809c.png

從這個角度理解,多模態(tài)大模型很可能是通向真正 AGI 的必經(jīng)之路。將多模態(tài)信號統(tǒng)一對齊,是智能體與這個世界“無障礙”交互的前提,換個新潮的詞匯,就是我們期待的“具身智能”。

誰不想擁有一臺自己專屬的“Javis” 呢?而多模態(tài)大模型的突破,也同樣依賴前文所述的算力和數(shù)據(jù)上的沉淀。

參考文獻 【1】https://epoch.ai/blog/can-ai-scaling-continue-through-2030 【2】Newell, A., & Simon, H. A. (1956). The Logic Theory Machine – A Complex Information Processing System. IRE Transactions on Information Theory, 2(3), 61-79. 【3】Silver, David, et al. "Mastering the game of Go with deep neural networks and tree search." nature 529.7587 (2016): 484-489. 【4】 Wei, Jason, et al. "Chain-of-thought prompting elicits reasoning in large language models." Advances in neural information processing systems 35 (2022): 24824-24837. 【5】Yao, Shunyu, et al. "Tree of thoughts: Deliberate problem solving with large language models." Advances in Neural Information Processing Systems 36 (2024). 【6】Karpas, Ehud, et al. "MRKL Systems: A modular, neuro-symbolic architecture that combines large language models, external knowledge sources and discrete reasoning." arXiv preprint arXiv:2205.00445 (2022). 【7】Schick, Timo, et al. "Toolformer: Language models can teach themselves to use tools." Advances in Neural Information Processing Systems 36 (2024). 【8】https://huggingface.co/spaces/mteb/leaderboard 【9】https://github.com/deep-floyd/IF 【10】https://developer.nvidia.com/blog/pushing-the-boundaries-of-speech-recognition-with-nemo-parakeet-asr-models/ 【11】Mamba:?Linear-time sequence modeling?with?selective state spaces 【12】Peng, Bo, et al. "Rwkv: Reinventing rnns for the transformer era." arXiv preprint arXiv:2305.13048 (2023). 【13】Wen, Kaiyue, Xingyu Dang, and Kaifeng Lyu. "Rnns are not transformers (yet): The key bottleneck on in-context retrieval." arXiv preprint arXiv:2402.18510 (2024). 【14】AI Models Collapse When Trained on Recursively Generated Data’ 【15】The Platonic Representation Hypothesis

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41370

    瀏覽量

    302741
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3805

    瀏覽量

    5280
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    350

    瀏覽量

    1397

原文標題:大模型撞上“算力墻”,超級應(yīng)用的探尋之路

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI卡殼“三堵墻”?破局突圍,也許只差一個時頻同步方案!

    作為數(shù)字經(jīng)濟的新“石油",AI正迎來指數(shù)級增長,但、存儲、通信
    的頭像 發(fā)表于 04-28 14:21 ?1w次閱讀
    AI<b class='flag-5'>算</b><b class='flag-5'>力</b>卡殼“三堵墻”?破局突圍,也許只差一個時頻同步方案!

    天數(shù)智芯助力DeepLink異構(gòu)訓(xùn)推一體化升級

    當前,通用人工智能發(fā)展駛?cè)肟燔嚨?,?b class='flag-5'>模型對的需求呈現(xiàn)爆發(fā)式增長,異構(gòu)的高效協(xié)同成為釋放
    的頭像 發(fā)表于 03-26 09:30 ?462次閱讀
    天數(shù)智芯助力DeepLink異構(gòu)<b class='flag-5'>算</b><b class='flag-5'>力</b>訓(xùn)推一體化升級

    從訓(xùn)練到推理:大模型需求的新拐點已至

    在大模型產(chǎn)業(yè)發(fā)展的早期階段,行業(yè)焦點主要集中在大模型訓(xùn)練所需的投入。一個萬億參數(shù)大模型的訓(xùn)練
    的頭像 發(fā)表于 02-05 16:07 ?1059次閱讀
    從訓(xùn)練到推理:大<b class='flag-5'>模型</b><b class='flag-5'>算</b><b class='flag-5'>力</b>需求的新拐點已至

    華為榮獲服務(wù)商互聯(lián)能力成熟度模型參編證書

    在2025互聯(lián)網(wǎng)大會期間,互聯(lián)網(wǎng)服務(wù)論壇在成都成功舉辦。論壇現(xiàn)場舉行了《服務(wù)商互聯(lián)能
    的頭像 發(fā)表于 12-31 11:50 ?850次閱讀

    華為AI WAN解決方案推動互聯(lián)網(wǎng)高質(zhì)量發(fā)展

    2025互聯(lián)網(wǎng)大會隆重召開。本次大會以“‘蓉’合新智 賦未來”為主題,匯聚行業(yè)翹楚共同探討互聯(lián)網(wǎng)
    的頭像 發(fā)表于 12-25 15:17 ?789次閱讀

    應(yīng)對端側(cè)AI、內(nèi)存、功耗“三堵墻”困境,安謀科技Arm China “周易”X3給出技術(shù)錦囊

    AI大模型正加速從云端向邊緣與端側(cè)滲透,然而,、內(nèi)存、功耗等卻成了制約其規(guī)?;涞氐摹案邏Α?。專為AI計算而生的神經(jīng)網(wǎng)絡(luò)處理器(NPU),成為破關(guān)鍵。安謀科技Arm China“
    的頭像 發(fā)表于 12-18 13:45 ?553次閱讀
    應(yīng)對端側(cè)AI<b class='flag-5'>算</b><b class='flag-5'>力</b>、內(nèi)存、功耗“三堵墻”困境,安謀科技Arm China “周易”X3給出技術(shù)錦囊

    湘軍,讓變成生產(chǎn)?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    存儲超級周期來襲,得瑞領(lǐng)新以PCIe 5.0錨定AI存賽道

    當AI大模型與智產(chǎn)業(yè)進入爆發(fā)式增長期,存儲作為“釋放的核心基石”,正迎來技術(shù)革新與場景適配的雙重變革。得瑞誠邀各界伙伴蒞臨MTS2026,共話AI存儲創(chuàng)新機遇,共探智
    的頭像 發(fā)表于 11-24 14:46 ?386次閱讀

    中科曙光亮相2025中國超級大會

    11月8日,第七屆中國超級大會在北京召開。中科曙光作為常務(wù)理事成員單位加入“九源智能計算系統(tǒng)生態(tài)聯(lián)合體”,并攜手中國信通院重磅發(fā)布《2025中國
    的頭像 發(fā)表于 11-08 16:57 ?4105次閱讀

    硅芯科技:AI突破,新型堆疊EDA工具持續(xù)進化

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)先進封裝是突破危機的核心路徑。2.5D/3D Chiplet異構(gòu)集成可破解內(nèi)存、功耗與面積
    的頭像 發(fā)表于 10-31 09:16 ?1.3w次閱讀
    硅芯科技:AI<b class='flag-5'>算</b><b class='flag-5'>力</b>突破,新型堆疊EDA工具持續(xù)進化

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升還是智力

    體現(xiàn)在: 1、收益遞減 大模型的基礎(chǔ)的需要極大的,這首先源于昂貴的高性能AI芯片,然后是寶貴的電力、水等與環(huán)境相關(guān)的資源。 收益遞減體現(xiàn)在: ①模型大小 ②訓(xùn)練數(shù)據(jù)量 ③訓(xùn)練算法的
    發(fā)表于 09-14 14:04

    科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型

    模型輕量化部署方案。用戶通過遠程平臺預(yù)置的模型鏡像與AI工具,僅需50%的GPU即可解
    的頭像 發(fā)表于 07-30 21:44 ?1080次閱讀

    一文看懂AI集群

    最近這幾年,AI浪潮席卷全球,成為整個社會的關(guān)注焦點。大家在討論AI的時候,經(jīng)常會提到AI集群。AI的三要素,是、算法和數(shù)據(jù)。而AI
    的頭像 發(fā)表于 07-23 12:18 ?1986次閱讀
    一文看懂AI<b class='flag-5'>算</b><b class='flag-5'>力</b>集群

    云XR(AR/VR)底座關(guān)鍵特征與技術(shù)路徑

    云XR(AR/VR)底座是支撐擴展現(xiàn)實技術(shù)規(guī)?;涞氐暮诵幕A(chǔ)設(shè)施,當前發(fā)展呈現(xiàn)以下關(guān)鍵特征與技術(shù)路徑: 一、
    的頭像 發(fā)表于 06-19 08:10 ?921次閱讀
    云XR(AR/VR)<b class='flag-5'>算</b><b class='flag-5'>力</b>底座關(guān)鍵特征與技術(shù)<b class='flag-5'>路徑</b>

    華為助力湖北移動打造“九州”互聯(lián)網(wǎng)區(qū)域標桿

    數(shù)字經(jīng)濟時代,是關(guān)鍵新質(zhì)生產(chǎn),中國移動“九州”互聯(lián)網(wǎng)是促進
    的頭像 發(fā)表于 05-13 16:11 ?1003次閱讀
    尖扎县| 湖南省| 邵阳县| 兰考县| 罗山县| 建始县| 女性| 滦南县| 文成县| 本溪| 沈阳市| 旺苍县| 五河县| 双桥区| 阳春市| 兰坪| 房产| 蒲城县| 五指山市| 泸定县| 晋宁县| 泰来县| 扎囊县| 海宁市| 曲周县| 阿尔山市| 岐山县| 慈利县| 禄劝| 永和县| 安西县| 广德县| 古浪县| 乐清市| 榆中县| 西乌珠穆沁旗| 兰考县| 永修县| 海门市| 满城县| 松原市|