青青青青青精品,亚洲影院青青草色,久久视频一区二区

過年期間沉迷休息，心懷愧疚地?zé)o視了讀者催我們寫DeepSeek的要求。后來我發(fā)現(xiàn)，這催更不僅適用于科技博主，比如在一個(gè)跟AI毫無關(guān)系的搞笑博主評(píng)論區(qū)里，我看見有網(wǎng)友說，“你怎么還不講DeepSeek？他血洗美國(guó)股市，干碎了美國(guó)人的幻想。那些歐美科技公司全都坐不住了”。

接下來這種“熱情”愈演愈烈。什么“科技巨頭全報(bào)廢了”“AGI馬上實(shí)現(xiàn)”“普通人再不學(xué)DeepSeek就晚了”，種種言論層出不窮。甚至還有DeepSeek受到境外大規(guī)模網(wǎng)絡(luò)攻擊，各大科技公司頂尖高手聯(lián)手隱跡江湖的中國(guó)紅客出手相救的爽文劇情。

輿論場(chǎng)到這里愈發(fā)離譜了起來。談到DeepSeek，我們好像會(huì)自動(dòng)陷入某種彌散性的狂熱情緒。其中當(dāng)然有DeepSeek足夠出色的原因，有近幾年AI大熱的加持，但很難否認(rèn)的是，其中也有地緣因素的推動(dòng)。很多人迫切需要一個(gè)“歪果仁怕了、服了”的故事，在科技領(lǐng)域尤其如此。

為了迎合這種情緒，媒體與公眾人物傾向于推波助瀾。比如將對(duì)DeepSeek的討論，推到哲學(xué)、國(guó)運(yùn)、歷史走向的高度。而這些討論又會(huì)在流量的折射與層層斷章取義之下被無盡放大，很快讓一款A(yù)I模型承受了它本不該承受的地位、責(zé)任與期待。這就是所謂的“推上神壇”。

但神壇之上風(fēng)景并不好。因?yàn)橐酝?jīng)驗(yàn)提醒我們，往往下一步就是“傷仲永”“泡沫破裂”等輿論反噬。對(duì)于初露鋒芒的DeepSeek與研發(fā)團(tuán)隊(duì)來說，這種走向應(yīng)該是弊大于利的。

因此我們想要討論一下，目前階段可以基于哪些共識(shí)來客觀討論DeepSeek。或者說，不妨試著拆掉輿論神壇，還原一個(gè)更真實(shí)也更樸素的DeepSeek。

不妨先釋放一個(gè)“爆論”。那就是跟社交媒體發(fā)散的觀點(diǎn)截然不同，DeepSeek其實(shí)并沒有完成從0到1的核心技術(shù)突破。

DeepSeek大火之后，其研發(fā)團(tuán)隊(duì)與科技產(chǎn)業(yè)相關(guān)人士都在討論中國(guó)AI不能只是跟隨，必須完成從0到1。這個(gè)觀點(diǎn)絕對(duì)正確，但目前的DeepSeek可能還不能成為這個(gè)觀點(diǎn)的作證。

所謂核心技術(shù)突破，應(yīng)該是主要技術(shù)路徑的變化，或者達(dá)成效果的巨大升級(jí)。而DeepSeek目前最讓人經(jīng)驗(yàn)的技術(shù)能力，一個(gè)是R1模型帶火的思維鏈推理過程，另一個(gè)是其聯(lián)網(wǎng)檢索的RAG效果表現(xiàn)出色。

但這兩條技術(shù)路徑都不是DeepSeek開創(chuàng)的。思維鏈的興起一般認(rèn)為是OpenAI發(fā)布的o1模型。去年9月o1模型公布后，全球主流大模型紛紛跟進(jìn)了思維鏈、推理大模型等能力。各家名稱不同，但整體技術(shù)路線是非常一致的。DeepSeek確實(shí)把思維鏈的過程更完整、詳細(xì)展示了出來，但其實(shí)也很容易看到其中大模型幻覺還很嚴(yán)重。

而在聯(lián)網(wǎng)檢索方面，其他廠商也早有布局，也就是所謂的RAG檢索－增強(qiáng)－生成機(jī)制。這項(xiàng)技術(shù)最開始是為了解決大模型不具備實(shí)時(shí)信息的問題，并且?guī)椭C正大模型幻覺。早在2023年，百度發(fā)布文心一言時(shí)，RAG就已經(jīng)是其核心能力的組成部分。

但要注意的是，沒有從0到1的創(chuàng)新，不等于沒有創(chuàng)新。DeepSeek在模型能力的優(yōu)化上做了大量開拓性工作，比如通過GRPO算法讓模型更加高效。或許可以說，DeepSeek集成了業(yè)界主流的，被驗(yàn)證過的技術(shù)路線。在其基礎(chǔ)上完成了模型優(yōu)化、能力加強(qiáng)與用戶體驗(yàn)升級(jí)。

我們總是渴望從0到1，總是期待石破天驚。但客觀來看，第一步和第一萬步，邁出的距離是一樣的。

那么，DeepSeek真正引發(fā)全球關(guān)注的價(jià)值在哪里？在短短一個(gè)春節(jié)的發(fā)酵之后，可能很多人都忘記了它最早出圈的原因是通過軟件和架構(gòu)創(chuàng)新，用非常低的算力成本完成了DeepSeek-V3模型的訓(xùn)練。

DeepSeek-V3是我們今天用到的R1模型的基礎(chǔ)模型。在研發(fā)團(tuán)隊(duì)發(fā)表的論文中，可以看到其僅僅使用了550萬美元的算力訓(xùn)練成本就完成了6710億參數(shù)大模型的訓(xùn)練。即使這項(xiàng)統(tǒng)計(jì)僅僅局限于基礎(chǔ)模型訓(xùn)練的算力成本這一項(xiàng)，沒有包含后續(xù)應(yīng)用模型的強(qiáng)化學(xué)習(xí)、模型推理，以及人才成本、綜合成本等項(xiàng)目，但也是毫無疑問顛覆了大模型訓(xùn)練的主流成本模型。

而最終DeepSeek實(shí)現(xiàn)的效果，也基本達(dá)到了o1為代表的主流大模型水平。雖然在模型效果上很難說有全面的超越，但其確實(shí)以軟件算法的革新實(shí)現(xiàn)了硬件成本的下降。讓低成本模型的效果不差于高成本，讓開源模型的效果追趕閉源模型。

而DeepSeek“降低AI算力成本”的突破，又恰好發(fā)生在全球主流AI玩家囤積高端GPU，以此筑造產(chǎn)業(yè)護(hù)城河，以及美國(guó)對(duì)中國(guó)禁售高端AI芯片，希望以此打壓中國(guó)AI的關(guān)鍵節(jié)點(diǎn)上。于是也就有了DeepSeek實(shí)現(xiàn)AI民主化，甚至助力打破地緣科技?jí)艛嗟囊馕叮瑥亩a(chǎn)生了一款中國(guó)AI大模型讓整個(gè)美國(guó)股市遭遇震蕩的戲劇性一幕。

DeepSeek實(shí)現(xiàn)的訓(xùn)練效率提升與訓(xùn)練成本下降，在特殊的產(chǎn)業(yè)環(huán)境與國(guó)際環(huán)境下造成了連鎖反應(yīng)。但問題是很多平時(shí)不關(guān)注AI的朋友，可能并不知道AI大模型算力越大效果越好的Scaling Laws，也不知道算力壟斷和禁售的背景信息，只知道短視頻上說DeepSeek橫空出世，歪果仁都慌了、怕了。這種缺乏前因后果的聯(lián)想，給DeepSeek憑空造出了一座不應(yīng)屬于它的神壇。

推而廣之，我們很多人都喜歡那些天才式的、戲劇化的創(chuàng)新。但在現(xiàn)實(shí)中，往往只有通過工程化能力，不斷調(diào)優(yōu)，降本，提效，技術(shù)創(chuàng)新才有應(yīng)用和普及的可能。

比如我們都知道愛迪生發(fā)明了電燈，但容易忽略大規(guī)模電網(wǎng)實(shí)現(xiàn)了電力成本的極大下降。如果每家都要自己發(fā)電，那世界將一片漆黑。

“我們把成本打下來了?！?/p>

這句有點(diǎn)荒誕、俗套，略帶反諷意味的話，其實(shí)才是中國(guó)產(chǎn)業(yè)化能力的縮影。

我們也不妨大大方方承認(rèn)，包括DeepSeek在內(nèi)的中國(guó)AI，在未來很長(zhǎng)一段時(shí)間里最擅長(zhǎng)的就是把成本給狠狠打下來。

DeepSeek爆火之后，很多人都說這是技術(shù)的巨大勝利。預(yù)言AI的崛起會(huì)讓人文學(xué)科和人文工作喪失價(jià)值。甚至“DeepSeek來了，學(xué)文科還有意義嗎？”登上了熱搜。

但如果我們多使用DeepSeek，仔細(xì)分析它與其他模型的區(qū)別，會(huì)發(fā)現(xiàn)一個(gè)相反的觀點(diǎn)：DeepSeek恰好證明了文科與人文能力，在AI時(shí)代有多么的重要。

我們隨機(jī)問一些人，對(duì)DeepSeek的使用體驗(yàn)是怎樣的。他們應(yīng)該會(huì)說跟DeepSeek對(duì)話感覺更有人味。

但這種人味，在很大程度上并不是理解、推理等AI技術(shù)層面的“人味”，而是模型在對(duì)話過程中展露出來了大量的幽默感、網(wǎng)感，以及更加符合年輕群體的對(duì)話習(xí)慣。還有就是DeepSeek具有相對(duì)更精妙的修辭能力，優(yōu)美的文筆，還有不錯(cuò)的綜合人文素養(yǎng)。

這些能力，讓DeepSeek更貼近年輕用戶的對(duì)話習(xí)慣和審美需求，并且能夠給出更有話題度和傳播度的回答。但問題是，這些能力其實(shí)都與技術(shù)的關(guān)系不大，而是很大程度上與訓(xùn)練語料的選取等人文能力緊密相關(guān)。

比如說，你讓DeepSeek寫首詩，它能夠?qū)懗鑫乃嚽嗄隉釔鄣恼Z調(diào)與修辭。但其他主流國(guó)內(nèi)大模型，也能寫得平仄工整、辭藻華麗，但一眼看去就是酷似打油詩的“老干體”。

再比如，讓DeepSeek預(yù)測(cè)一些未來趨勢(shì)之類的問題，它的回答會(huì)特別類似網(wǎng)絡(luò)科幻小說。雖然經(jīng)不起推敲，但就是能讓年輕人有種非常厲害，特別燃的感覺。

這些優(yōu)點(diǎn)的來源不是技術(shù)，而是在于研發(fā)團(tuán)隊(duì)的年輕化、高審美，并且重視模型訓(xùn)練過程中的人文要素。反觀很多主流大模型，由于最終聽取匯報(bào)的領(lǐng)導(dǎo)層普遍是大于45歲，缺乏人文學(xué)科背景的中年男士，最終導(dǎo)致大模型對(duì)話也是班味十足，打起官腔來一套又一套。與其說年輕人在支持DeepSeek，不如說年輕人在支持自己的話語權(quán)和審美權(quán)。

順便一提，DeepSeek的另一個(gè)人文優(yōu)勢(shì)，是它目前還有些“百無禁忌”。然而監(jiān)管的鐵拳雖遲但到，大家不必對(duì)AI的犀利和大膽有任何幻想。

DeepSeek以一種很巧妙的方式，實(shí)現(xiàn)了用戶對(duì)話體驗(yàn)更好，傳播效果更優(yōu)秀。這些在技術(shù)層面之外，或許能夠引起AI公司對(duì)產(chǎn)品體驗(yàn)的反思，以及對(duì)人文能力的重視。

如果我們狂吹DeepSeek的技術(shù)，導(dǎo)致對(duì)其人文體驗(yàn)的忽略，那其實(shí)也挺可惜的。

綜合以上這些側(cè)面，我們可以拼湊出一個(gè)比較完整，且不帶神圣光暈效果的DeepSeek：

它是一次綜合的突破。這種突破由技術(shù)創(chuàng)新，人文素養(yǎng)、開源和低成本策略等要素所構(gòu)成，并且在特殊的產(chǎn)業(yè)周期與國(guó)際環(huán)境背景下被發(fā)酵。

DeepSeek不是石破天驚的技術(shù)革命，但它足夠成熟，足夠有新意。這也在某種程度上解釋了，為什么歐美的AI大佬與專家，對(duì)其比較一致的觀點(diǎn)是“令人印象深刻”。

DeepSeek沒有一步登天，我們也不必幻想一步登天。

它就是前進(jìn)了一大步，而我們也足可為邁出了這一步而自信和驕傲。

我也十分反對(duì)中國(guó)只有DeepSeek的言論。事實(shí)上，中國(guó)有清晰的AI產(chǎn)業(yè)格局，有堅(jiān)實(shí)的自主化AI軟硬件體系，有數(shù)十萬AI開發(fā)者，有非常積極的AI政策導(dǎo)向。這些都是更多DeepSeek的土壤。有這些因素在，我十分篤定地認(rèn)為會(huì)有更多DeepSeek出現(xiàn)在這里。直到AI工業(yè)革命的開啟，直到AGI的曙光。

何不把DeepSeek帶下神壇？理性從容地看待它，用好它，用好中國(guó)AI事業(yè)的一切造物，才是AI在中國(guó)真正成熟的表現(xiàn)。

王陽明說，山高萬仞，只登一步。DeepSeek這一步有它的意義，邁出這一步后，也不妨停下來聽聽山風(fēng)，淺斟低唱一番。但也要清醒地知道，我們還在山間。

休息好了，高興夠了，也只有一件事要做。那就是邁出下一步。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
91

文章
41315

瀏覽量
302691
Agi

Agi

+關(guān)注

關(guān)注
0

文章
104

瀏覽量
10858
大模型

大模型

+關(guān)注

關(guān)注
2

文章
3797

瀏覽量
5278
DeepSeek

DeepSeek

+關(guān)注

關(guān)注
2

文章
855

瀏覽量
3413

日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

搜索歷史

何必把DeepSeek推上神壇？

評(píng)論