日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

垂直大模型競爭,能突破數(shù)據(jù)“卡點”嗎?

科技云報到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2023-05-19 14:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

科技云報道原創(chuàng)。

AI大模型火遍全球,中國產(chǎn)業(yè)也激發(fā)了對人工智能應(yīng)用的新熱情。

隨著各大廠商參與競逐,市場正在分化為通用與垂直兩大路徑,兩者在參數(shù)級別、應(yīng)用場景、商業(yè)模式等方面差異已逐步顯現(xiàn)。

企業(yè)涌入垂直大模型賽道

通用AI大模型像ChatGPT,能夠處理各種領(lǐng)域和場景的自然語言,但由于需要巨大的計算資源和數(shù)據(jù)量,已經(jīng)成為國內(nèi)外大廠的重點項目。

這類企業(yè)往往有著強大的技術(shù)團隊和資金支持,且有著自己的場景和流量優(yōu)勢。比如百度、阿里、騰訊、字節(jié)、華為等,在搜索、社交、電商、辦公等領(lǐng)域都有著自己的通用AI大模型。

相較之下,創(chuàng)業(yè)公司、細(xì)分領(lǐng)域企業(yè)很難在這樣的競爭中獲得先發(fā)優(yōu)勢或者差異化優(yōu)勢。

而垂直AI大模型只關(guān)注某個特定的領(lǐng)域或者場景,它能夠利用行業(yè)的數(shù)據(jù)和知識,提供更精準(zhǔn)和高效的解決方案,更好地滿足用戶在某個領(lǐng)域或者場景下的需求和期待,如:醫(yī)療、金融、教育等。

同時,它可以利用一些開源或者閉源的通用AI大模型作為基礎(chǔ),然后在其上進行指令微調(diào)(instruction tuning),來適應(yīng)自己的目標(biāo)領(lǐng)域或者場景。

因此,它的參數(shù)規(guī)模比通用大模型低一個量級,如果讓數(shù)據(jù)飛輪和模型訓(xùn)練能夠很好結(jié)合,在某些特定領(lǐng)域甚至比通用大模型的效果更好、成本更低。

在這樣的背景下,越來越多的企業(yè)加入了垂直大模型的賽道。

5月18日,深信服發(fā)布國內(nèi)首個自研安全大模型,成為安全領(lǐng)域GPT技術(shù)應(yīng)用首秀;

5月5日,學(xué)而思宣布正在進行自研數(shù)學(xué)大模型的研發(fā),命名為MathGPT,面向全球數(shù)學(xué)愛好者和科研機構(gòu);

3月,達(dá)觀數(shù)據(jù)公布正在開發(fā)曹植系統(tǒng),專注于金融、政務(wù)、制造等垂直領(lǐng)域的大語言模型。

明確的商業(yè)化落地場景和更低的算力成本,為各類企業(yè)打開了進軍垂直大模型的大門。

垂直大模型的考驗

垂直大模型的優(yōu)勢在于不夠大:算力不夠大、算法難度低,但并不代表垂直大模型誰都能做。

眾所周知,AI大模型三要素:算力、算法、數(shù)據(jù),都是喂養(yǎng)AI的“飼料”。

先說算力。

大模型之所以“大”,就是因為參數(shù)眾多和數(shù)據(jù)量龐大。AI大模型所需要的計算量,大致上相當(dāng)于參數(shù)量與數(shù)據(jù)量的乘積。

過去5年,AI大模型的參數(shù)量幾乎每年提升一個數(shù)量級,例如GPT-4參數(shù)量是GPT-3的16倍,達(dá)到1.6萬億個。

隨著圖像、音視頻等多模態(tài)數(shù)據(jù)的引入,大模型的數(shù)據(jù)量也在飛速膨脹。這意味著想要玩轉(zhuǎn)大模型,必須擁有大算力。

而一套垂直大模型的訓(xùn)練和推理成本,做個參考,在數(shù)字人垂類技術(shù)場景中,可以做到比Open AI同參數(shù)規(guī)模的模型低一個量級,像啟元世界的戰(zhàn)略總監(jiān)王思捷就曾提到:先構(gòu)建更小的垂類模型(比如百億參數(shù)、十億參數(shù)),讓數(shù)據(jù)飛輪和模型訓(xùn)練能夠很好結(jié)合,垂類模型在某些領(lǐng)域可能比Open AI的效果更好成本更低。

即便垂直大模型在算力要求上已遠(yuǎn)遠(yuǎn)低于通用大模型,但對算力基礎(chǔ)設(shè)施的投入依然會阻擋部分小公司的入局。

再說算法。

在三要素中,算法的研發(fā)難度相對較低,每家公司都有自己實現(xiàn)大模型的路徑算法,且有眾多開源項目可作為參考,中國公司最容易縮短甚至抹平差距。

最后說數(shù)據(jù)。

高質(zhì)量的數(shù)據(jù)是助力AI訓(xùn)練與調(diào)優(yōu)的關(guān)鍵,足夠多、足夠豐富的數(shù)據(jù),是AI大模型的根基。

OpenAI此前披露,為了AI像人類那樣流暢交談,研發(fā)人員給GPT-3.5提供多達(dá)45TB的文本語料,相當(dāng)于472萬套中國“四大名著”。這些語料的來源包括維基百科、網(wǎng)絡(luò)文章、書籍期刊等,甚至還將代碼開源平臺Github納入其中。

但是聚焦到細(xì)分行業(yè),數(shù)據(jù)的獲取就沒那么容易了。

興業(yè)證券公開表示,要訓(xùn)練專業(yè)的行業(yè)大模型,優(yōu)質(zhì)的行業(yè)數(shù)據(jù)、公共數(shù)據(jù)至關(guān)重要。

就國內(nèi)數(shù)據(jù)市場而言,據(jù)發(fā)改委官方批露,我國政府?dāng)?shù)據(jù)資源占全國數(shù)據(jù)資源的比重超過3/4,但開放規(guī)模不足美國的10%,個人和企業(yè)可以利用的規(guī)模更是不及美國的7%。

而行業(yè)數(shù)據(jù)更是非常核心的私域數(shù)據(jù),私域數(shù)據(jù)量越大,質(zhì)量越高,就越有價值。

比如,一個醫(yī)療公司擁有大量醫(yī)療數(shù)據(jù)、病例數(shù)據(jù),那么它就能開發(fā)出醫(yī)療垂直大模型類的產(chǎn)品。同理,建筑行業(yè)的項目數(shù)據(jù)、金融行業(yè)的用戶畫像數(shù)據(jù)、海運行業(yè)的船位數(shù)據(jù)等,都是賦能垂直大模型的關(guān)鍵。

但是這些私域數(shù)據(jù)都攥在企業(yè)自己手中,而且為了數(shù)據(jù)安全和合規(guī),絕大部分機構(gòu)是要本地化部署才會嘗試大模型訓(xùn)練,很難想象企業(yè)會把自己的核心數(shù)據(jù)拿給別人去訓(xùn)練。

此外,如何合理地給數(shù)據(jù)打上分級標(biāo)簽、做好標(biāo)注也非常重要。數(shù)據(jù)分級分類能夠幫助產(chǎn)品提效,而高精度的標(biāo)注數(shù)據(jù)能夠進一步提升大模型的專業(yè)表現(xiàn)。

但現(xiàn)階段垂直行業(yè)想要獲取高精度標(biāo)注數(shù)據(jù)的成本較高,而在公開數(shù)據(jù)庫中,行業(yè)專業(yè)數(shù)據(jù)也較少,因此對垂直大模型的建構(gòu)提出了很高的要求。

總體而言,想要做好垂直大模型,數(shù)據(jù)的重要性,遠(yuǎn)超過算力和算法。

數(shù)據(jù),已成為企業(yè)突破垂直大模型的“卡點”。

手握行業(yè)數(shù)據(jù)領(lǐng)先一步

垂類大模型講求應(yīng)用與場景先行的邏輯,而在國內(nèi)更是強調(diào)產(chǎn)業(yè)側(cè)的價值。

一方面,在當(dāng)前中國的智能化浪潮下,產(chǎn)業(yè)側(cè)數(shù)字化革新本就有廣闊的市場需求;另一方面,在toB生態(tài)下,基于垂直應(yīng)用的實踐也有利于形成數(shù)據(jù)飛輪與場景飛輪。

而這一切的前提,是推出垂類大模型的公司在該行業(yè)已建立技術(shù)壁壘與護城河,即“人無我有”的競爭優(yōu)勢。

如此看來,在垂直行業(yè)深耕多年的企業(yè)或?qū)⒂懈蟮内A面。

這類企業(yè)在數(shù)據(jù)層面、大模型以及知識圖譜方面都有較為深厚的積累,對于大模型的優(yōu)化更具優(yōu)勢。同時,它們對于to B客戶需求和落地場景有很深的理解,能夠更好地保證垂直大模型產(chǎn)品的可信和可靠,滿足企業(yè)級對于安全可控合規(guī)的需求。

目前,已有一些垂類大模型在金融、教育、醫(yī)藥、營銷等場景中得到試煉。

例如,彭博社利用自身豐富的金融數(shù)據(jù)源,基于開源的GPT-3框架再訓(xùn)練,開發(fā)出了金融專屬大模型BloombergGPT;

網(wǎng)易有道則面向教育場景,推出自研的類ChatGPT模型“子曰”;

在ChatGPT發(fā)布后僅幾周,谷歌公布了一個專門用于回答醫(yī)療保健相關(guān)問題的大型醫(yī)用語言模型Med-PaLM......

相信隨著越來越多企業(yè)入局,垂直大模型在各個行業(yè)和細(xì)分領(lǐng)域中將大量涌現(xiàn)。而那些能將一個垂直領(lǐng)域做專、做透,用高質(zhì)量的數(shù)據(jù)持續(xù)優(yōu)化模型,跑通商業(yè)閉環(huán),構(gòu)建起產(chǎn)業(yè)生態(tài)的企業(yè),最終將把價值鏈做到足夠長。

【關(guān)于科技云報道】

專注于原創(chuàng)的企業(yè)級內(nèi)容行家——科技云報道。成立于2015年,是前沿企業(yè)級IT領(lǐng)域Top10媒體。獲工信部權(quán)威認(rèn)可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7356

    瀏覽量

    95107
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41685

    瀏覽量

    302922
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1605

    瀏覽量

    10411
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3835

    瀏覽量

    5289
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    零基礎(chǔ)手寫大模型資料2026

    的梯度按比例縮放,確保訓(xùn)練過程平穩(wěn)。例如在BERT訓(xùn)練中,全局梯度范數(shù)超過閾值時,會統(tǒng)一乘以閾值/范數(shù)進行裁剪。 3. 分布式訓(xùn)練:突破單機限制 當(dāng)模型參數(shù)超過單機內(nèi)存時,需采用數(shù)據(jù)并行或模型
    發(fā)表于 05-01 17:44

    AI Ceph 分布式存儲教程資料大模型學(xué)習(xí)資料2026

    在人工智能的浪潮中,算力、算法與數(shù)據(jù)被譽為三駕馬車。然而,隨著大模型(LLM)參數(shù)量突破萬億級別,數(shù)據(jù)集規(guī)模膨脹至 PB 乃至 EB 級別,傳統(tǒng)的存儲架構(gòu)已難以支撐這場算力競賽的“糧草
    發(fā)表于 05-01 17:35

    AI大模型微調(diào)企業(yè)項目實戰(zhàn)課

    取非結(jié)構(gòu)化文本,通過去重、脫敏,最終轉(zhuǎn)化為符合大模型閱讀習(xí)慣的“指令-回復(fù)”對。幾千條高質(zhì)量、無矛盾的垂直行業(yè)數(shù)據(jù),其效果遠(yuǎn)勝于幾萬條從網(wǎng)上爬取的劣質(zhì)問答。 第二步:精準(zhǔn)手術(shù)——參數(shù)高效微調(diào)(PEFT
    發(fā)表于 04-16 18:48

    九天菜菜大模型agent智能體開發(fā)實戰(zhàn)2026一月班

    、蒙特洛樹搜索等關(guān)鍵技術(shù),將復(fù)雜任務(wù)拆解為可執(zhí)行的子步驟,并根據(jù)實時反饋動態(tài)調(diào)整策略。工具使用模塊讓 Agent 突破模型固有局限,能夠調(diào)用搜索引擎、數(shù)據(jù)庫、代碼解釋器等外部工具,
    發(fā)表于 04-15 16:04

    設(shè)計黨必看!解決大文件頓+數(shù)據(jù)安全痛

    作為設(shè)計行業(yè)從業(yè)者,想必都被GB級PSD/AI文件折磨過:多人協(xié)同訪問時加載半天、傳統(tǒng)存儲頻繁頓,熱數(shù)據(jù)與冷數(shù)據(jù)混存效率低,數(shù)據(jù)安全還時刻提心吊膽。 最近實測鐵威馬專為企業(yè)打造的解決
    的頭像 發(fā)表于 03-31 16:52 ?159次閱讀
    設(shè)計黨必看!解決大文件<b class='flag-5'>卡</b>頓+<b class='flag-5'>數(shù)據(jù)</b>安全痛<b class='flag-5'>點</b>

    云知聲成功中標(biāo)全國首個省級醫(yī)保垂直模型項目

    2026年開年,智慧醫(yī)保領(lǐng)域迎來里程碑式突破——云知聲智能科技股份有限公司成功中標(biāo)全國首個省級醫(yī)保垂直模型項目“江蘇省醫(yī)保垂直模型及智能
    的頭像 發(fā)表于 01-23 17:16 ?878次閱讀

    英泰斯特獲評2025年武漢市垂直行業(yè)優(yōu)秀模型

    2025年12月15日,武漢市經(jīng)濟和信息化局發(fā)布《2025年武漢市垂直行業(yè)模型擬認(rèn)定名單》,英泰斯特自主研發(fā)的“智能車聯(lián)網(wǎng)故障預(yù)警大模型”,憑借其領(lǐng)先的技術(shù)創(chuàng)新性和廣泛的應(yīng)用前景成功入選,并獲評優(yōu)秀
    的頭像 發(fā)表于 12-22 11:17 ?908次閱讀

    安森美垂直GaN技術(shù)賦功率器件應(yīng)用未來

    在傳統(tǒng)橫向結(jié)構(gòu)的GaN器件中,電流沿芯片表面流動。而垂直 GaN 的 GaN 層生長在氮化鎵襯底上,其獨特結(jié)構(gòu)使電流直接從芯片頂部流到底部,而不是僅在表面流動。這種垂直電流路徑讓器件能夠承受更高的電壓和更大的電流,從而實現(xiàn)更高
    的頭像 發(fā)表于 12-04 09:28 ?2108次閱讀
    安森美<b class='flag-5'>垂直</b>GaN技術(shù)賦<b class='flag-5'>能</b>功率器件應(yīng)用未來

    安森美入局垂直GaN,GaN進入高壓時代

    電子發(fā)燒友網(wǎng)綜合報道 近日,安森美發(fā)布器垂直GaN功率半導(dǎo)體技術(shù),憑借 GaN-on-GaN 專屬架構(gòu)與多項性能突破,為全球高功率應(yīng)用領(lǐng)域帶來革命性解決方案,重新定義了行業(yè)在效、緊湊性與耐用性上
    的頭像 發(fā)表于 11-10 03:12 ?7912次閱讀

    安森美推出垂直氮化鎵功率半導(dǎo)體

    隨著全球能源需求因 AI 數(shù)據(jù)中心、電動汽車以及其他高能耗應(yīng)用而激增,安森美(onsemi)推出垂直氮化鎵(vGaN)功率半導(dǎo)體,為相關(guān)應(yīng)用的功率密度、效和耐用性樹立新標(biāo)桿。這些突破
    的頭像 發(fā)表于 10-31 13:56 ?2403次閱讀

    端到端語音交互數(shù)據(jù) 精準(zhǔn)賦語音大模型進階

    在語音大模型從“識別”向“懂語境”跨越的關(guān)鍵階段,高質(zhì)量場景化語音數(shù)據(jù)已成為制約技術(shù)突破的核心瓶頸。傳統(tǒng)語音識別數(shù)據(jù)集采用孤立標(biāo)注,在語音
    的頭像 發(fā)表于 09-11 17:17 ?866次閱讀

    模型工具的 “京東答案”

    隨著大模型技術(shù)的迅猛發(fā)展,AI工具已成為重要的輔助生產(chǎn)力工具和工作伙伴。它能夠顯著提升工作效率、幫助解決業(yè)務(wù)痛,甚至通過知識延展與智能協(xié)同,幫助團隊突破傳統(tǒng)認(rèn)知邊界。掌握大
    的頭像 發(fā)表于 08-25 16:09 ?716次閱讀

    垂直GaN迎來新突破!

    電子發(fā)燒友網(wǎng)綜合報道 最近垂直GaN功率器件又迎來新進展。7月10日,廣東致CEO黎子蘭博士,在瑞典舉辦的全球氮化物半導(dǎo)體頂尖會議ICNS(國際氮化物半導(dǎo)體會議)上發(fā)表邀請報告,首次報道了廣東致
    發(fā)表于 07-22 07:46 ?5185次閱讀
    <b class='flag-5'>垂直</b>GaN迎來新<b class='flag-5'>突破</b>!

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】第三章:探索 DeepSeek - V3 技術(shù)架構(gòu)的奧秘

    融入 Transformer,通過替換 FFN 層、多機多訓(xùn)練等策略,試圖拓展模型能力。看到模型容量因?qū)<覕?shù)量增加而擴展,處理更復(fù)雜任務(wù),讓我感受到創(chuàng)新的潛力。但同時,通信成本高、
    發(fā)表于 07-20 15:07

    數(shù)據(jù)標(biāo)注與大模型的雙向賦:效率與性能的躍升

    ??在人工智能蓬勃發(fā)展的時代,大模型憑借其強大的學(xué)習(xí)與泛化能力,已成為眾多領(lǐng)域創(chuàng)新變革的核心驅(qū)動力。而數(shù)據(jù)標(biāo)注作為大模型訓(xùn)練的基石,為大模型性能提升注入關(guān)鍵動力,是
    的頭像 發(fā)表于 06-04 17:15 ?2323次閱讀
    <b class='flag-5'>數(shù)據(jù)</b>標(biāo)注與大<b class='flag-5'>模型</b>的雙向賦<b class='flag-5'>能</b>:效率與性能的躍升
    和林格尔县| 庆安县| 全椒县| 岑溪市| 张家港市| 滦南县| 武邑县| 雷波县| 崇礼县| 襄樊市| 屏山县| 宽城| 中超| 贡山| 河间市| 许昌县| 乐清市| 宣恩县| 紫金县| 灵宝市| 阜阳市| 锦屏县| 堆龙德庆县| 普安县| 龙州县| 额济纳旗| 乌什县| 抚州市| 唐山市| 佛坪县| 嘉义县| 侯马市| 济源市| 华池县| 嘉黎县| 绥化市| 蓬安县| 深州市| 中西区| 阜平县| 开化县|