日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

LLM之外的性?xún)r(jià)比之選,小語(yǔ)言模型

E4Life ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2024-06-03 05:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群



電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))大語(yǔ)言模型的風(fēng)靡給AI應(yīng)用創(chuàng)造了不少機(jī)會(huì),無(wú)論是效率還是創(chuàng)意上,大語(yǔ)言模型都帶來(lái)了前所未有的表現(xiàn),這些大語(yǔ)言模型很快成為大型互聯(lián)網(wǎng)公司或者AI應(yīng)用公司的殺手級(jí)產(chǎn)品。然而在一些對(duì)實(shí)時(shí)性要求較高的應(yīng)用中,比如AI客服、實(shí)時(shí)數(shù)據(jù)分析等,大語(yǔ)言模型并沒(méi)有太大的優(yōu)勢(shì)。

在動(dòng)輒萬(wàn)億參數(shù)的LLM下,硬件需求已經(jīng)遭受了不小的挑戰(zhàn)。所以面對(duì)一些相對(duì)簡(jiǎn)單的任務(wù),規(guī)模較小的小語(yǔ)言模型(SLM)反而更加適合。尤其是在端側(cè)的本地AI模型,在低功耗算力有限的邊緣AI芯片支持下,小語(yǔ)言模型反而更適合發(fā)揮最高性能,而不是促使硬件一味地去追求更大規(guī)模模型的支持。

微軟Phi

2023年,微軟推出了一個(gè)基于Transformer架構(gòu)的小語(yǔ)言模型Phi-1,該模型只有13億參數(shù),且主要專(zhuān)注于基礎(chǔ)的Python編程,實(shí)現(xiàn)文本轉(zhuǎn)代碼。整個(gè)模型僅僅用到8塊A100 GPU,耗時(shí)四天訓(xùn)練完成的。

這也充分說(shuō)明了小語(yǔ)言模型的靈活性,在LLM普遍需要成百上千塊GPU,花費(fèi)數(shù)十乃至上百天的時(shí)間完成模型的訓(xùn)練時(shí),SLM卻只需要千分之一的資源,就可以針對(duì)特定的任務(wù)打造適合的模型。

近日,微軟對(duì)Phi模型進(jìn)行了全面更新,推出了Phi-3-mini、Phi-3-small和Phi-3-medium三個(gè)版本。其中Phi3-mini是一個(gè)38億參數(shù)的小語(yǔ)言模型,同步推出的Phi-3-small和Phi-3-medium分別為70億參數(shù)和140億參數(shù)的模型。

Phi-3-mini有支持4K和128K兩個(gè)上下文長(zhǎng)度的版本,也是這個(gè)規(guī)模的模型中,第一個(gè)支持到最高128K上下文長(zhǎng)度的版本,微軟聲稱(chēng)其性能甚至超過(guò)不少70億參數(shù)的大模型。通過(guò)在搭載A16芯片的iPhone 14上測(cè)試,在純粹的設(shè)備端離線運(yùn)行下,Phi-3-mini可以做到12 token每秒的速度。

谷歌Gemma


在Gemini模型獲得成功后,基于大語(yǔ)言模型框架Gemini,谷歌也開(kāi)發(fā)了對(duì)應(yīng)的輕量小語(yǔ)言模型Gemma。Gemma分為20億參數(shù)和70億參數(shù)的版本,其中20億參數(shù)的Gemma可以在移動(dòng)設(shè)備和筆記本電腦上運(yùn)行,而70億參數(shù)的版本則可以擴(kuò)展至小型服務(wù)器上。雖然資源占用不高,但Gemma在各項(xiàng)基準(zhǔn)測(cè)試中,依然可以與更大規(guī)模的模型相媲美,比如130億參數(shù)的Llama-2等。

此外,谷歌不僅提供了預(yù)訓(xùn)練版本的Gemma,也支持通過(guò)額外的訓(xùn)練來(lái)實(shí)現(xiàn)模型調(diào)優(yōu),用于修改Gemma模型的行為,提高其在特定任務(wù)上的表現(xiàn),比如通過(guò)人類(lèi)語(yǔ)言互動(dòng)進(jìn)行訓(xùn)練,提高聊天機(jī)器人中響應(yīng)式對(duì)話輸入的表現(xiàn)等。

?
Gemma與Llama-2的性能對(duì)比/谷歌


在對(duì)運(yùn)行設(shè)備的要求上,Gemma自然比不上大哥Gemini,但谷歌與英偉達(dá)合作,針對(duì)從數(shù)據(jù)中心到云端再到RTX AI PC的GPU都進(jìn)行了優(yōu)化,這樣一來(lái)不僅具有廣泛的跨設(shè)備兼容性,也能確保擴(kuò)展性和高性能的雙重優(yōu)勢(shì)。

寫(xiě)在最后


小語(yǔ)言模型的出現(xiàn)為行業(yè)帶來(lái)了新的選擇,尤其是在大多數(shù)大模型應(yīng)用還是在不斷燒錢(qián)的當(dāng)下,小語(yǔ)言模型加速落地的同時(shí),也提供了訓(xùn)練成本更低的解決方案。但與此同時(shí),小語(yǔ)言模型的缺陷依然不可忽視,比如其規(guī)模注定了無(wú)法存儲(chǔ)足夠的“事實(shí)性知識(shí)”,其次這類(lèi)小語(yǔ)言模型很難做到多語(yǔ)言支持。但我們必須認(rèn)清小語(yǔ)言模型的存在并不是為了替代大語(yǔ)言模型,而是提供一個(gè)更加靈活的模型方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3831

    瀏覽量

    52285
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3796

    瀏覽量

    5276
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    350

    瀏覽量

    1397
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    7GHz全能性?xún)r(jià)比:安捷倫N9322C頻譜儀使用手記

    7GHz全能性?xún)r(jià)比:安捷倫N9322C頻譜儀
    的頭像 發(fā)表于 04-17 16:17 ?105次閱讀
    7GHz全能<b class='flag-5'>性?xún)r(jià)比</b><b class='flag-5'>之</b><b class='flag-5'>選</b>:安捷倫N9322C頻譜儀使用手記

    解讀大型語(yǔ)言模型的偏見(jiàn)

    在一項(xiàng)新的研究中,研究人員發(fā)現(xiàn)了LLM中某種偏見(jiàn)的根本原因,為更準(zhǔn)確、更可靠的AI系統(tǒng)鋪平了道路。研究表明,大型語(yǔ)言模型LLM)往往傾向于過(guò)分強(qiáng)調(diào)文檔或?qū)υ掗_(kāi)頭和結(jié)尾的信息,而相對(duì)忽
    的頭像 發(fā)表于 04-15 14:44 ?733次閱讀
    解讀大型<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>模型</b>的偏見(jiàn)

    芯盾時(shí)代如何破局LLM供應(yīng)鏈漏洞危機(jī)

    隨著人工智能技術(shù)進(jìn)入 2026 年的爆發(fā)期,大語(yǔ)言模型LLM)已不再是實(shí)驗(yàn)室里的原型,而是支撐企業(yè)核心業(yè)務(wù)的“數(shù)字引擎”。然而,LLM的強(qiáng)大高度依賴(lài)于全球化的AI生態(tài)。從海量的互聯(lián)網(wǎng)
    的頭像 發(fā)表于 02-04 16:53 ?1433次閱讀

    什么是大模型,智能體...?大模型100問(wèn),快速全面了解!

    一、概念篇1.什么是大模型?大模型是指參數(shù)規(guī)模巨大(通常達(dá)到數(shù)十億甚至萬(wàn)億級(jí)別)、使用海量數(shù)據(jù)訓(xùn)練而成的人工智能模型。2.什么是大語(yǔ)言模型
    的頭像 發(fā)表于 02-02 16:36 ?1151次閱讀
    什么是大<b class='flag-5'>模型</b>,智能體...?大<b class='flag-5'>模型</b>100問(wèn),快速全面了解!

    廣和通發(fā)布端側(cè)情感對(duì)話大模型FiboEmo-LLM

    9月,廣和通正式發(fā)布自主研發(fā)的端側(cè)情感對(duì)話大模型FiboEmo-LLM。該模型專(zhuān)注于情感計(jì)算與自然語(yǔ)言交互融合,致力于為AI玩具、智能陪伴設(shè)備等終端場(chǎng)景提供“情感理解-情感響應(yīng)”一體化
    的頭像 發(fā)表于 09-26 13:37 ?2044次閱讀

    藍(lán)牙云屏:功能強(qiáng)大,性?xún)r(jià)比?

    藍(lán)牙云屏:功能強(qiáng)大,性?xún)r(jià)比? 在儀器儀表行業(yè),想要在嚴(yán)格控制成本的同時(shí)保證設(shè)備功能強(qiáng)大,往往是一件兩難的事情。要么為了控制成本犧牲功能,導(dǎo)致產(chǎn)品競(jìng)爭(zhēng)力不足;要么為了豐富功能增加成本,使產(chǎn)品失去
    的頭像 發(fā)表于 09-25 17:12 ?730次閱讀
    藍(lán)牙云屏:功能強(qiáng)大,<b class='flag-5'>性?xún)r(jià)比</b><b class='flag-5'>之</b><b class='flag-5'>選</b>?

    RK3506開(kāi)發(fā)板Linux開(kāi)發(fā)板極致性?xún)r(jià)比

    RK3506開(kāi)發(fā)板Linux開(kāi)發(fā)板極致性?xún)r(jià)比瑞芯微RK3506開(kāi)發(fā)板,3核Cortex-A7@1.5GHz+Cortex-M0,Linux+RT-Thread系統(tǒng)支持,128MB超大
    的頭像 發(fā)表于 09-11 16:26 ?3928次閱讀
    RK3506開(kāi)發(fā)板Linux開(kāi)發(fā)板極致<b class='flag-5'>性?xún)r(jià)比</b><b class='flag-5'>之</b><b class='flag-5'>選</b>

    米爾RK3576部署端側(cè)多模態(tài)多輪對(duì)話,6TOPS算力驅(qū)動(dòng)30億參數(shù)LLM

    加載 → 圖片預(yù)處理 → 用戶(hù)交互 → 推理輸出”的核心流程,支持圖文一體的多模態(tài)對(duì)話,適配多輪問(wèn)答、視覺(jué)問(wèn)答等典型場(chǎng)景。 具體運(yùn)行機(jī)制可拆解為以下步驟:1. 模型初始化首先加載大語(yǔ)言模型L
    發(fā)表于 09-05 17:25

    3萬(wàn)字長(zhǎng)文!深度解析大語(yǔ)言模型LLM原理

    我們正在參加全球電子成就獎(jiǎng)的評(píng)選,歡迎大家?guī)臀覀兺镀薄x謝支持本文轉(zhuǎn)自:騰訊技術(shù)工程作者:royceshao大語(yǔ)言模型LLM的精妙之處在于很好地利用數(shù)學(xué)解決了工業(yè)場(chǎng)景的問(wèn)題,筆者基于過(guò)往工程經(jīng)驗(yàn)
    的頭像 發(fā)表于 09-02 13:34 ?3620次閱讀
    3萬(wàn)字長(zhǎng)文!深度解析大<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>模型</b><b class='flag-5'>LLM</b>原理

    基于米爾瑞芯微RK3576開(kāi)發(fā)板的Qwen2-VL-3B模型NPU多模態(tài)部署評(píng)測(cè)

    關(guān)鍵詞:瑞芯微 RK3576、NPU(神經(jīng)網(wǎng)絡(luò)處理器)、端側(cè)小語(yǔ)言模型(SLM)、多模態(tài) LLM、邊緣 AI 部署、開(kāi)發(fā)板、RKLLM隨著大語(yǔ)言
    發(fā)表于 08-29 18:08

    Votee AI借助NVIDIA技術(shù)加速方言小語(yǔ)種LLM開(kāi)發(fā)

    了精準(zhǔn)的方言及小語(yǔ)種大語(yǔ)言模型 (LLM)。此舉成功解決了數(shù)據(jù)稀缺、語(yǔ)言復(fù)雜及計(jì)算效率等挑戰(zhàn),為全球數(shù)以百萬(wàn)計(jì)、缺乏數(shù)字化資源的語(yǔ)言使用者提
    的頭像 發(fā)表于 08-20 14:21 ?1043次閱讀

    如何在魔搭社區(qū)使用TensorRT-LLM加速優(yōu)化Qwen3系列模型推理部署

    TensorRT-LLM 作為 NVIDIA 專(zhuān)為 LLM 推理部署加速優(yōu)化的開(kāi)源庫(kù),可幫助開(kāi)發(fā)者快速利用最新 LLM 完成應(yīng)用原型驗(yàn)證與產(chǎn)品部署。
    的頭像 發(fā)表于 07-04 14:38 ?2461次閱讀

    歐洲借助NVIDIA Nemotron優(yōu)化主權(quán)大語(yǔ)言模型

    NVIDIA 正攜手歐洲和中東的模型構(gòu)建商與云提供商,共同優(yōu)化主權(quán)大語(yǔ)言模型 (LLM),加速該地區(qū)各行業(yè)采用企業(yè)級(jí) AI。
    的頭像 發(fā)表于 06-12 15:42 ?1404次閱讀

    LM Studio使用NVIDIA技術(shù)加速LLM性能

    隨著 AI 使用場(chǎng)景不斷擴(kuò)展(從文檔摘要到定制化軟件代理),開(kāi)發(fā)者和技術(shù)愛(ài)好者正在尋求以更 快、更靈活的方式來(lái)運(yùn)行大語(yǔ)言模型LLM)。
    的頭像 發(fā)表于 06-06 15:14 ?1480次閱讀
    LM Studio使用NVIDIA技術(shù)加速<b class='flag-5'>LLM</b>性能

    使用瑞薩MPU芯片RZ/V2H部署DeepSeek-R1模型

    DeepSeek大語(yǔ)言模型LLM)可用于理解人類(lèi)語(yǔ)言的交互方式,思考,并給出合適的回應(yīng)。
    的頭像 發(fā)表于 05-15 14:40 ?1160次閱讀
    使用瑞薩MPU芯片RZ/V2H部署DeepSeek-R1<b class='flag-5'>模型</b>
    陆丰市| 禹州市| 龙川县| 桃源县| 曲水县| 通城县| 泰和县| 介休市| 威信县| 上饶县| 隆安县| 深圳市| 涞水县| 阳曲县| 兴海县| 平舆县| 扬中市| 惠州市| 阳春市| 于都县| 滨海县| 白玉县| 新乡县| 高清| 辉南县| 民勤县| 丽水市| 呼图壁县| 宝丰县| 咸丰县| 兴义市| 黎平县| 杭锦旗| 佳木斯市| 老河口市| 那曲县| 耒阳市| 本溪| 扶绥县| 高唐县| 永登县|