日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息發(fā)布“源”Yuan-EB助力RAG檢索精度新高

浪潮AIHPC ? 來(lái)源:浪潮AIHPC ? 2024-11-26 13:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,浪潮信息發(fā)布 “源”Yuan-EB(Yuan-embedding-1.0,嵌入模型),在C-MTEB榜單中斬獲檢索任務(wù)第一名,以78.41的平均精度刷新大模型RAG檢索最高成績(jī),將基于元腦企智EPAI為構(gòu)建企業(yè)知識(shí)庫(kù)提供更高效、精準(zhǔn)的知識(shí)向量化能力支撐,助力用戶(hù)使用領(lǐng)先的RAG技術(shù)加速企業(yè)知識(shí)資產(chǎn)的價(jià)值釋放。

2a0c093e-a659-11ef-93f3-92fbcf53809c.png

“源”Yuan-EB 在HuggingFace的C-MTEB榜單中排名第一

Yuan-EB(版本號(hào)Yuan-embedding-1.0) 是專(zhuān)為增強(qiáng)中文文本檢索能力而設(shè)計(jì)的嵌入模型(也稱(chēng)Embedding模型),在 “源2.0” 大模型的工作基礎(chǔ)上,創(chuàng)新性地采用了“源2.0-M32”大模型進(jìn)行數(shù)據(jù)重寫(xiě)與合成,并通過(guò)索引技術(shù)、樣本排序等系列方法完成高質(zhì)量微調(diào)數(shù)據(jù)集構(gòu)建,能夠有效提升RAG系統(tǒng)的檢索精度。

C-MTEB是目前業(yè)內(nèi)最權(quán)威的嵌入模型測(cè)試榜單。其中,檢索任務(wù)(Retrieval)是檢索增強(qiáng)生成(RAG)場(chǎng)景下最為重要、應(yīng)用最廣泛的任務(wù)能力,考察的是Embedding模型從大量的數(shù)據(jù)集中找到并返回與給定查詢(xún)最相關(guān)或最匹配的信息的過(guò)程?!霸础盰uan-EB基于該任務(wù)提供的醫(yī)療、新聞、電商、娛樂(lè)等8個(gè)中文文本數(shù)據(jù)集,實(shí)現(xiàn)了業(yè)界領(lǐng)先的海量文本檢索精度。

2a18dba0-a659-11ef-93f3-92fbcf53809c.png

C-MTEB榜單Retrieval任務(wù)提供8個(gè)測(cè)試數(shù)據(jù)集

“源” Yuan-EB 助力RAG檢索精度新高

嵌入模型在RAG流程中扮演著關(guān)鍵角色,它能夠?qū)?fù)雜的高維數(shù)據(jù)(例如文本、圖像或音頻)轉(zhuǎn)換為機(jī)器可理解的向量形式,直接決定了RAG檢索的精準(zhǔn)性和效率。

2a3da4ee-a659-11ef-93f3-92fbcf53809c.png

“源”Yuan-EB通過(guò)數(shù)據(jù)準(zhǔn)備與模型微調(diào)兩個(gè)方面的技術(shù)創(chuàng)新,實(shí)現(xiàn)了模型精度的大幅提升:

■ 在數(shù)據(jù)方面,基于“源2.0”微調(diào)階段的問(wèn)答數(shù)據(jù)進(jìn)行清洗與篩選,構(gòu)建問(wèn)題(query)與文本(corpus)數(shù)據(jù)集;使用“源2.0-M32”對(duì)C-MTEB 訓(xùn)練數(shù)據(jù)進(jìn)行重寫(xiě)與合成,通過(guò)索引技術(shù)與排序模型進(jìn)行高效的難負(fù)樣本提取,完成大規(guī)模難負(fù)例樣本挖掘,形成高質(zhì)量微調(diào)數(shù)據(jù)集;

■ 在微調(diào)方面,通過(guò)兩個(gè)階段的領(lǐng)先微調(diào)方法實(shí)現(xiàn)模型能力提升。第一階段,使用各個(gè)領(lǐng)域(醫(yī)療、新聞、長(zhǎng)文本、娛樂(lè)等方向)的大規(guī)模數(shù)據(jù)進(jìn)行對(duì)比學(xué)習(xí)訓(xùn)練;第二階段,采用“源2.0-M32”生成的合成數(shù)據(jù)進(jìn)一步微調(diào),并使用MRL方法完成“源”Yuan-EB訓(xùn)練;

“源”Yuan-EB為用戶(hù)提供了大模型企業(yè)知識(shí)庫(kù)應(yīng)用開(kāi)發(fā)的最優(yōu)模型選擇,能夠在 RAG流程的多個(gè)方面起到顯著的精度提升,包括信息檢索的準(zhǔn)確性、處理大規(guī)模數(shù)據(jù)的效率、消除語(yǔ)義歧義、降低計(jì)算成本、增強(qiáng)對(duì)長(zhǎng)文檔的處理能力以及模型魯棒性等,最大化提升RAG流程的整體性能和應(yīng)用效果。

元腦企智EPAI集成“源”Yuan-EB,加速知識(shí)庫(kù)構(gòu)建與性能提升

目前,“源”Yuan-EB已經(jīng)在開(kāi)源社區(qū)和企業(yè)大模型開(kāi)發(fā)平臺(tái)元腦企智EPAI中全面開(kāi)放下載。用戶(hù)可以在元腦企智EPAI平臺(tái)中快速使用“源”Yuan-EB,并結(jié)合EPAI自研的多階段RAG技術(shù),零代碼、低成本地基于企業(yè)數(shù)據(jù)構(gòu)建大模型知識(shí)庫(kù)應(yīng)用。

企業(yè)大模型開(kāi)發(fā)平臺(tái)“元腦企智”EPAI(Enterprise Platform of AI),是浪潮信息為企業(yè)AI大模型落地應(yīng)用打造的高效、易用、安全的端到端開(kāi)發(fā)平臺(tái),提供數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、知識(shí)檢索、應(yīng)用框架等系列工具,支持調(diào)度多元算力和多模算法,幫助企業(yè)高效開(kāi)發(fā)部署生成式AI應(yīng)用、打造智能生產(chǎn)力。

元腦企智EPAI已經(jīng)支持超過(guò)13種類(lèi)型文檔的信息識(shí)別與提取,結(jié)合創(chuàng)新的多級(jí)混合檢索策略,有效提升元腦企智EPAI在管理、解析、檢索知識(shí)庫(kù)與生成內(nèi)容方面的最終效果,幫助企業(yè)用戶(hù)實(shí)現(xiàn)基于私有數(shù)據(jù)、行業(yè)數(shù)據(jù)下的精準(zhǔn)檢索、精準(zhǔn)問(wèn)答,確保專(zhuān)業(yè)場(chǎng)景下大模型生成內(nèi)容的準(zhǔn)確性和可靠性,加速大模型創(chuàng)新力釋放。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    25490
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    4375

    瀏覽量

    46475
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3805

    瀏覽量

    5280

原文標(biāo)題:浪潮信息發(fā)布“源”Yuan-EB,刷新大模型RAG檢索精度紀(jì)錄!

文章出處:【微信號(hào):浪潮AIHPC,微信公眾號(hào):浪潮AIHPC】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    高質(zhì)量RAG系統(tǒng)的五個(gè)核心設(shè)計(jì)要點(diǎn)

    檢索增強(qiáng)生成(Retrieval-Augmented Generation, RAG)已成為構(gòu)建大模型應(yīng)用的標(biāo)準(zhǔn)架構(gòu)。然而,大多數(shù)RAG系統(tǒng)在設(shè)計(jì)初期會(huì)因?yàn)楹雎院诵脑O(shè)計(jì)原則而在實(shí)際部署中暴露嚴(yán)重問(wèn)題。本文從工程實(shí)踐角度出發(fā),梳理
    的頭像 發(fā)表于 04-24 14:42 ?202次閱讀

    浪潮信息直播發(fā)布業(yè)界首個(gè)企業(yè)級(jí)OpenClaw方案“企千蝦”

    月2日,浪潮信息直播發(fā)布業(yè)界首個(gè)企業(yè)級(jí)OpenClaw方案——「企千蝦」,為企業(yè)規(guī)?;渴稹⒐芾砗蛻?yīng)用OpenClaw,打造了安全、高效、易用的全鏈路方案。實(shí)操演示了「企千蝦」基于元腦服務(wù)器實(shí)現(xiàn)
    的頭像 發(fā)表于 04-05 17:44 ?2132次閱讀

    精度5V參考電壓AD586:設(shè)計(jì)與應(yīng)用解析

    精度5V參考電壓AD586:設(shè)計(jì)與應(yīng)用解析 在電子設(shè)計(jì)領(lǐng)域,高精度的電壓參考是許多電路穩(wěn)定運(yùn)行的關(guān)鍵。今天,我們就來(lái)深入探討一下ADI公司的AD586這款高
    的頭像 發(fā)表于 03-29 14:50 ?244次閱讀

    RAG、MCP與智能體:大模型落地的三道關(guān)

    天生局限。RAG的思路很簡(jiǎn)單:用戶(hù)提問(wèn)時(shí),先從知識(shí)庫(kù)里檢索相關(guān)內(nèi)容,再讓模型基于這些資料生成答案。 數(shù)據(jù)分片是關(guān)鍵第一步 。文檔切太碎,上下文割裂;切太整,檢索不精準(zhǔn)。技術(shù)手冊(cè)按章節(jié)切,問(wèn)答對(duì)按條目切,不同類(lèi)型策略不同。分片后生
    的頭像 發(fā)表于 03-19 13:55 ?157次閱讀

    RAG(檢索增強(qiáng)生成)原理與實(shí)踐

    思想 RAG的核心思想非常直觀:在生成答案之前,先從知識(shí)庫(kù)中檢索相關(guān)信息,然后將這些信息作為上下文提供給大語(yǔ)言模型,讓模型基于這些\"參考資料\"來(lái)生成更準(zhǔn)確的回答。 這就像是讓AI在
    發(fā)表于 02-11 12:46

    Elektrobit EB civion平臺(tái)助力SDV 2.0智能座艙開(kāi)發(fā)

    基于此,Elektrobit推出EB civion——一套專(zhuān)為SDV 2.0設(shè)計(jì)的智能座艙工程化工具鏈與開(kāi)發(fā)平臺(tái),助力行業(yè)實(shí)現(xiàn)從研發(fā)到量產(chǎn)的高效一體化轉(zhuǎn)型。
    的頭像 發(fā)表于 01-26 10:05 ?2231次閱讀

    發(fā)布元服務(wù)填寫(xiě)審核信息與聯(lián)系方式

    填寫(xiě)審核信息 登錄AppGallery Connect,點(diǎn)擊“APP與元服務(wù)”。 選擇要發(fā)布的元服務(wù)。 左側(cè)導(dǎo)航選擇“應(yīng)用上架 > 版本信息”下待發(fā)布的版本。 進(jìn)入“應(yīng)用審核
    發(fā)表于 12-01 14:30

    元服務(wù)發(fā)布配置開(kāi)發(fā)者服務(wù)信息

    您作為開(kāi)發(fā)者的相關(guān)信息將面向元服務(wù)發(fā)布區(qū)域的用戶(hù)公開(kāi),其中客服聯(lián)系方式可能會(huì)提供給用戶(hù),用于咨詢(xún)相關(guān)問(wèn)題。 登錄AppGallery Connect,點(diǎn)擊“APP與元服務(wù)”。 選擇要發(fā)布的元服務(wù)
    發(fā)表于 10-31 17:58

    RAG實(shí)踐:一文掌握大模型RAG過(guò)程

    RAG(Retrieval-Augmented Generation,檢索增強(qiáng)生成), 一種AI框架,將傳統(tǒng)的信息檢索系統(tǒng)(例如數(shù)據(jù)庫(kù))的優(yōu)勢(shì)與生成式大語(yǔ)言模型(LLM)的功能結(jié)合在一
    的頭像 發(fā)表于 10-27 18:23 ?1724次閱讀
    <b class='flag-5'>RAG</b>實(shí)踐:一文掌握大模型<b class='flag-5'>RAG</b>過(guò)程

    浪潮信息發(fā)布&quot;元腦SD200&quot;超節(jié)點(diǎn),面向萬(wàn)億參數(shù)大模型創(chuàng)新設(shè)計(jì)

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息發(fā)布面向萬(wàn)億參數(shù)大模型的超節(jié)點(diǎn)AI服務(wù)器"元腦SD200"。該產(chǎn)品基于浪潮信息創(chuàng)新研發(fā)的多主機(jī)低延遲內(nèi)存語(yǔ)義通信架構(gòu),以開(kāi)放系統(tǒng)設(shè)計(jì)向上
    的頭像 發(fā)表于 08-08 22:17 ?795次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>&quot;元腦SD200&quot;超節(jié)點(diǎn),面向萬(wàn)億參數(shù)大模型創(chuàng)新設(shè)計(jì)

    上海貝嶺發(fā)布第三代高精度基準(zhǔn)電壓

    BLR3XX系列是上海貝嶺推出的第三代高精度基準(zhǔn)電壓。具有高輸出精度、低功耗、低噪聲以及低溫度系數(shù)的特性。
    的頭像 發(fā)表于 07-10 17:48 ?1428次閱讀
    上海貝嶺<b class='flag-5'>發(fā)布</b>第三代高<b class='flag-5'>精度</b>基準(zhǔn)電壓<b class='flag-5'>源</b>

    飛利信與浪潮信息達(dá)成戰(zhàn)略合作

    近日,2025年浪潮信息北京ISP戰(zhàn)略伙伴簽約授牌儀式成功舉辦。浪潮信息與北京飛利信電子技術(shù)有限公司等22家戰(zhàn)略合作伙伴達(dá)成簽約,其中將面向北京人工智能應(yīng)用大市場(chǎng),在產(chǎn)品技術(shù)共創(chuàng)、行業(yè)場(chǎng)景深化及區(qū)域
    的頭像 發(fā)表于 06-24 17:37 ?1259次閱讀

    使用 llm-agent-rag-llamaindex 筆記本時(shí)收到的 NPU 錯(cuò)誤怎么解決?

    使用 conda create -n ov-nb-demos python=3.11 創(chuàng)建運(yùn)行 llm-agent-rag-llamaindex notebook 的環(huán)境。 執(zhí)行“創(chuàng)建
    發(fā)表于 06-23 06:26

    軟通動(dòng)力發(fā)布智慧園區(qū)RAG解決方案

    近日,鯤鵬昇騰開(kāi)發(fā)者大會(huì)2025(KADC 2025)在北京正式啟幕。軟通動(dòng)力作為鯤鵬路線堅(jiān)定的擁護(hù)者與實(shí)踐者,受邀出席大會(huì),正式發(fā)布軟通動(dòng)力智慧園區(qū)RAG(Retrieval Augmented Generation 檢索增強(qiáng)
    的頭像 發(fā)表于 05-29 10:00 ?1049次閱讀
    軟通動(dòng)力<b class='flag-5'>發(fā)布</b>智慧園區(qū)<b class='flag-5'>RAG</b>解決方案
    通州区| 特克斯县| 衢州市| 富锦市| 民乐县| 夏河县| 赤壁市| 蕉岭县| 清流县| 那曲县| 木兰县| 汪清县| 手游| 江达县| 枣强县| 精河县| 余姚市| 东明县| 萨嘎县| 马公市| 太原市| 西乌珠穆沁旗| 丰镇市| 巩留县| 靖安县| 玛曲县| 麻栗坡县| 洱源县| 宝兴县| 潍坊市| 进贤县| 甘泉县| 湛江市| 韩城市| 汕头市| 泸州市| 昔阳县| 龙泉市| 恩施市| 贵阳市| 鄂温|