日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

可商用多語(yǔ)言聊天LLM開(kāi)源,性能直逼GPT-4

OSC開(kāi)源社區(qū) ? 來(lái)源:OSC開(kāi)源社區(qū) ? 2023-05-25 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

SambaNova 與 Together 兩家公司合作開(kāi)源了可商用的 BLOOMChat,一個(gè) 1760 億參數(shù)的多語(yǔ)言聊天大語(yǔ)言模型 (LLM)。由 BLOOM (176B) 在助理式的對(duì)話數(shù)據(jù)集上進(jìn)行指導(dǎo)調(diào)整,并支持多種語(yǔ)言的對(duì)話、問(wèn)題回答和生成性答案。

根據(jù)介紹,BLOOMChat 是一個(gè)新的、開(kāi)放的、多語(yǔ)言的聊天 LLM。SambaNova 和 Together 使用 SambaNova 獨(dú)特的可重構(gòu)數(shù)據(jù)流架構(gòu)在 SambaNova DataScale 系統(tǒng)上訓(xùn)練了 BLOOMChat;其建立在 BigScience 組織的 BLOOM 之上,并在 OpenChatKit、Dolly 2.0 和 OASST1 的 OIG 上進(jìn)行了微調(diào)。目前,BLOOM 已經(jīng)是最大的多語(yǔ)言開(kāi)放模型,在 46 種語(yǔ)言上進(jìn)行了訓(xùn)練。

在針對(duì)英語(yǔ)、中文、法語(yǔ)、阿拉伯語(yǔ)、西班牙語(yǔ)、印度語(yǔ)這 6 種語(yǔ)言的評(píng)測(cè)中,GPT-4 的勝率為 54.75%,BLOOMChat 的勝率為 45.25%,稍弱于 GPT-4。但與其它 4 種主流的開(kāi)源聊天 LLM 相比,BLOOMChat 在 65.92% 的時(shí)間內(nèi)表現(xiàn)更優(yōu)。且在使用 BLOOMChat 進(jìn)行跨語(yǔ)言 NLP 任務(wù)的初步研究中,BLOOMChat 在 WMT 翻譯基準(zhǔn)中的表現(xiàn)要優(yōu)于其他 BLOOM 變體和主流開(kāi)源聊天模型。

“我們確實(shí)想指出,與我們比較的這些模型中,有些并不適合多語(yǔ)言環(huán)境。但由于開(kāi)源社區(qū)中沒(méi)有替代品,所以才有了現(xiàn)在的比較。我們的研究結(jié)果表明,使用正確的技術(shù),可以在開(kāi)源 LLM 之上構(gòu)建以實(shí)現(xiàn)強(qiáng)大的多語(yǔ)言聊天功能。我們希望我們的研究結(jié)果和 BLOOMChat checkpoint 的發(fā)布能夠?yàn)殚_(kāi)源社區(qū)的持續(xù)討論做出貢獻(xiàn),并激發(fā) LLM 領(lǐng)域的進(jìn)一步發(fā)展。”

項(xiàng)目團(tuán)隊(duì)使用定性和定量措施來(lái)評(píng)估了 BLOOMChat 的多語(yǔ)言聊天能力以及跨語(yǔ)言任務(wù)能力。共做了 3 種不同場(chǎng)景的實(shí)驗(yàn)測(cè)評(píng),評(píng)測(cè)了英語(yǔ)、中文、阿拉伯語(yǔ)、法語(yǔ)、西班牙語(yǔ)和印度語(yǔ)。

實(shí)驗(yàn)一:人類偏好排序

旨在將 BLOOMChat 模型在多種語(yǔ)言中的聊天能力與現(xiàn)有的開(kāi)源模型以及選定的封閉源模型進(jìn)行比較。使用了 “OpenAssistant Conversations”附錄 E 中的 22 個(gè)英文問(wèn)題作為基準(zhǔn)。首先讓一些人類志愿者將這 22 個(gè)英文問(wèn)題手動(dòng)翻譯成他們各自的母語(yǔ);然后讓另一組不同的志愿者,在匿名的前提下評(píng)價(jià)每個(gè)模型所給出的回答。

將 BLOOMChat 與 OpenAssistant-30B、LLaMA-Adapter-V2-65B 和 BLOOMZ (176B) 三種開(kāi)源模型進(jìn)行了比較:

586afb58-fa9a-11ed-90ce-dac502259ad0.png

51 名志愿者在所有模型和 6 種語(yǔ)言中共提交了 1158 次比較。如上圖所示,BLOOMChat (65.92%) 明顯優(yōu)于其它幾個(gè)開(kāi)源模型。

與GPT-4 相比:

587f9e14-fa9a-11ed-90ce-dac502259ad0.png

實(shí)驗(yàn)二:模型質(zhì)量評(píng)估

此實(shí)驗(yàn)旨在驗(yàn)證 BLOOMChat 生成的多種語(yǔ)言文本的質(zhì)量。

5894d23e-fa9a-11ed-90ce-dac502259ad0.png

81.8% 的回答被歸類為 “正確” 或 “可接受但有輕微缺陷”。盡管只在英語(yǔ)數(shù)據(jù)集上進(jìn)行了微調(diào),但 BLOOMChat 在每種語(yǔ)言中都獲得了超過(guò) 70% 的 “正確” 或 “可接受” 評(píng)級(jí)。

實(shí)驗(yàn)三:WMT 翻譯任務(wù)

為了初步了解模型解決跨語(yǔ)言 NLP 任務(wù)的能力,評(píng)估了模型在 WMT 翻譯任務(wù)上的翻譯能力。

58b8ddbe-fa9a-11ed-90ce-dac502259ad0.png

總體而言,BLOOMChat 在翻譯任務(wù)中的表現(xiàn)明顯優(yōu)于其他 BLOOM 變體和開(kāi)源聊天模型,但和 GPT-4 還有一定差距。

此外,BLOOMChat 團(tuán)隊(duì)也坦承了一些該模型的局限性:

BLOOMChat 有時(shí)可能會(huì)生成聽(tīng)起來(lái)合理但事實(shí)不正確或與主題無(wú)關(guān)的回復(fù)信息。

BLOOMChat 可能在單個(gè)回復(fù)中無(wú)意間切換語(yǔ)言,影響輸出的連貫性和可理解性。

BLOOMChat 可能會(huì)產(chǎn)生重復(fù)的短語(yǔ)或句子,導(dǎo)致回復(fù)內(nèi)容缺乏吸引力和有效信息。

BLOOMChat 在生成代碼或解決復(fù)雜數(shù)學(xué)問(wèn)題方面的性能可能會(huì)受到限制。

BLOOMChat 可能無(wú)意中生成含有不適當(dāng)或有害內(nèi)容的回復(fù)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    4368

    瀏覽量

    46473
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    575

    瀏覽量

    11345
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26264
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    350

    瀏覽量

    1397

原文標(biāo)題:可商用多語(yǔ)言聊天LLM開(kāi)源,性能直逼GPT-4

文章出處:【微信號(hào):OSC開(kāi)源社區(qū),微信公眾號(hào):OSC開(kāi)源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    GT20L24F6Y標(biāo)準(zhǔn)點(diǎn)陣多國(guó)語(yǔ)言字庫(kù)芯片:開(kāi)啟多語(yǔ)言顯示新境界

    GT20L24F6Y標(biāo)準(zhǔn)點(diǎn)陣多國(guó)語(yǔ)言字庫(kù)芯片:開(kāi)啟多語(yǔ)言顯示新境界 在當(dāng)今全球化的時(shí)代,多語(yǔ)言顯示需求變得越來(lái)越普遍。無(wú)論是消費(fèi)電子設(shè)備、工業(yè)控制界面還是公共信息展示系統(tǒng),都需要支持多種語(yǔ)言
    的頭像 發(fā)表于 04-28 15:40 ?84次閱讀

    GT32L24F0210標(biāo)準(zhǔn)點(diǎn)陣多國(guó)語(yǔ)言字庫(kù)芯片:多語(yǔ)言顯示的理想之選

    GT32L24F0210標(biāo)準(zhǔn)點(diǎn)陣多國(guó)語(yǔ)言字庫(kù)芯片:多語(yǔ)言顯示的理想之選 在電子設(shè)備設(shè)計(jì)中,支持多國(guó)語(yǔ)言顯示是滿足全球市場(chǎng)需求的關(guān)鍵。上海高通半導(dǎo)體有限公司推出的GT32L24F0210標(biāo)準(zhǔn)點(diǎn)陣多國(guó)
    的頭像 發(fā)表于 04-28 14:30 ?159次閱讀

    GT32L24A180標(biāo)準(zhǔn)點(diǎn)陣中外文字庫(kù)芯片:多語(yǔ)言顯示的理想之選

    GT32L24A180標(biāo)準(zhǔn)點(diǎn)陣中外文字庫(kù)芯片:多語(yǔ)言顯示的理想之選 在電子設(shè)備的設(shè)計(jì)中,文字顯示是一個(gè)關(guān)鍵的功能。無(wú)論是消費(fèi)電子、工業(yè)控制還是智能終端,都需要準(zhǔn)確、清晰地顯示各種語(yǔ)言文字。上海高
    的頭像 發(fā)表于 04-28 14:20 ?134次閱讀

    京東多語(yǔ)言質(zhì)量解決方案

    一、業(yè)界多語(yǔ)言面臨的通用挑戰(zhàn)是什么 做這個(gè)事之前,我們先看看業(yè)界做了什么。 ??阿里巴巴全球化測(cè)試技術(shù)介紹? ??螞蟻全球化無(wú)線端質(zhì)量解決方案? ??談?wù)?b class='flag-5'>多語(yǔ)言測(cè)試? 總結(jié)下來(lái),需要面臨3個(gè)通用
    的頭像 發(fā)表于 01-13 16:18 ?1120次閱讀
    京東<b class='flag-5'>多語(yǔ)言</b>質(zhì)量解決方案

    【產(chǎn)品介紹】Questa One Sim軟件

    優(yōu)勢(shì)與平臺(tái)支持優(yōu)勢(shì)行業(yè)領(lǐng)先的高性能多語(yǔ)言仿真器用于測(cè)性設(shè)計(jì)(DFT)向量驗(yàn)證的最快仿真器高性能、高容量的集成調(diào)試環(huán)境覆蓋率加速功能,助力更快實(shí)現(xiàn)覆蓋率收斂智能編譯(SmartComp
    的頭像 發(fā)表于 11-17 10:39 ?1377次閱讀
    【產(chǎn)品介紹】Questa One Sim軟件

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    部署熱門開(kāi)源模型的應(yīng)用場(chǎng)景,框架已支持 GPT-OSS、DeepSeek、Llama 2 及 Llama 3 等主流模型的端到端部署;另一方面,框架將部署功能封裝為擴(kuò)展的 Python 框架;同時(shí)
    的頭像 發(fā)表于 10-21 11:04 ?1462次閱讀

    阿里巴巴國(guó)際站關(guān)鍵字搜索 API 實(shí)戰(zhàn):3 步搞定多語(yǔ)言適配 + 限流破局,詢盤量提升 40%

    跨境電商API開(kāi)發(fā)常陷合規(guī)、多語(yǔ)言、限流等坑。本文詳解從國(guó)際合規(guī)(GDPR/CCPA)到參數(shù)優(yōu)化、數(shù)據(jù)結(jié)構(gòu)化及區(qū)域化搜索的全鏈路方案,附Python代碼模板與緩存重試架構(gòu),助力提升調(diào)用成功率至99%+,精準(zhǔn)詢盤增長(zhǎng)42%。
    的頭像 發(fā)表于 10-20 14:44 ?2007次閱讀

    速賣通全球運(yùn)營(yíng)利器:商品詳情接口多語(yǔ)言 + 合規(guī) + 物流適配技術(shù)全解析

    速賣通全球化適配是跨境成功關(guān)鍵!本文詳解2025最新接口方案,涵蓋多語(yǔ)言智能翻譯、合規(guī)自動(dòng)校驗(yàn)、物流精準(zhǔn)推薦與性能優(yōu)化四大模塊,助力商家提升轉(zhuǎn)化率30%+,降低風(fēng)險(xiǎn),提效80%。附實(shí)操代碼與新手三步走策略,適合所有想出海的賣家。
    的頭像 發(fā)表于 10-16 09:30 ?752次閱讀
    速賣通全球運(yùn)營(yíng)利器:商品詳情接口<b class='flag-5'>多語(yǔ)言</b> + 合規(guī) + 物流適配技術(shù)全解析

    Dynamo 0.4在NVIDIA Blackwell上通過(guò)PD分離將性能提升4

    近期,OpenAI 的 gpt-oss、月之暗面的 Kimi K2 等多個(gè)新的前沿開(kāi)源模型相繼問(wèn)世,標(biāo)志著大語(yǔ)言模型 (LLM) 創(chuàng)新浪潮的加速。近日發(fā)布的 Dynamo 0.4 提供
    的頭像 發(fā)表于 08-22 15:59 ?1691次閱讀
    Dynamo 0.4在NVIDIA Blackwell上通過(guò)PD分離將<b class='flag-5'>性能</b>提升<b class='flag-5'>4</b>倍

    訊飛星辰MaaS平臺(tái)率先上線OpenAI最新開(kāi)源模型

    8月6日凌晨,OpenAI 時(shí)隔六年再次回歸開(kāi)源,發(fā)布兩款全新的大語(yǔ)言模型:gpt-oss-120b和gpt-oss-20b,性能與o
    的頭像 發(fā)表于 08-13 16:43 ?1962次閱讀

    EASY EAl Orin Nano(RK3576) whisper語(yǔ)音識(shí)別訓(xùn)練部署教程

    1Whisper簡(jiǎn)介Whisper是OpenAI開(kāi)源的,識(shí)別語(yǔ)音識(shí)別能力已達(dá)到人類水準(zhǔn)自動(dòng)語(yǔ)音識(shí)別系統(tǒng)。Whisper作為一個(gè)通用的語(yǔ)音識(shí)別模型,它使用了大量的多語(yǔ)言和多任務(wù)的監(jiān)督數(shù)據(jù)來(lái)訓(xùn)練,能夠在
    的頭像 發(fā)表于 07-25 15:21 ?1014次閱讀
    EASY EAl Orin Nano(RK3576) whisper語(yǔ)音識(shí)別訓(xùn)練部署教程

    如何在魔搭社區(qū)使用TensorRT-LLM加速優(yōu)化Qwen3系列模型推理部署

    TensorRT-LLM 作為 NVIDIA 專為 LLM 推理部署加速優(yōu)化的開(kāi)源庫(kù),幫助開(kāi)發(fā)者快速利用最新 LLM 完成應(yīng)用原型驗(yàn)證與產(chǎn)
    的頭像 發(fā)表于 07-04 14:38 ?2472次閱讀

    LM Studio使用NVIDIA技術(shù)加速LLM性能

    隨著 AI 使用場(chǎng)景不斷擴(kuò)展(從文檔摘要到定制化軟件代理),開(kāi)發(fā)者和技術(shù)愛(ài)好者正在尋求以更 快、更靈活的方式來(lái)運(yùn)行大語(yǔ)言模型(LLM)。
    的頭像 發(fā)表于 06-06 15:14 ?1484次閱讀
    LM Studio使用NVIDIA技術(shù)加速<b class='flag-5'>LLM</b><b class='flag-5'>性能</b>

    GPT-5即將面市 性能遠(yuǎn)超GPT-4

    行業(yè)芯事
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2025年06月04日 13:38:23

    中科曙光DeepAI深算智能引擎全面支持Qwen3

    日前,Qwen3正式發(fā)布并全部開(kāi)源8款混合推理模型。作為Qwen系列中的最新一代大型語(yǔ)言模型,Qwen3在推理、指令遵循、工具調(diào)用、多語(yǔ)言能力等方面實(shí)現(xiàn)全面增強(qiáng)。
    的頭像 發(fā)表于 05-06 15:17 ?1371次閱讀
    林周县| 金堂县| 华坪县| 农安县| 越西县| 蓬溪县| 南木林县| 台北市| 镇雄县| 临泉县| 特克斯县| 醴陵市| 怀集县| 东莞市| 偃师市| 胶州市| 遂宁市| 凤冈县| 宁远县| 屯昌县| 郓城县| 辽源市| 襄樊市| 潞城市| 三穗县| 洛浦县| 盐山县| 西峡县| 鹿邑县| 嘉祥县| 惠州市| 墨脱县| 黔西县| 德安县| 玉山县| 阜新市| 马鞍山市| 河曲县| 南岸区| 芦山县| 开江县|