日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型外掛知識(shí)庫優(yōu)化-大模型輔助向量召回

深度學(xué)習(xí)自然語言處理 ? 來源:NLP工作站 ? 2023-09-08 16:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

寫在前面

大模型時(shí)代,通常采用向量召回的方式從文檔庫里召回和用戶問題相關(guān)的文檔片段,輸入到LLM中來增強(qiáng)模型回答質(zhì)量。

但是很多時(shí)候,用戶的問題是十分口語化的,描述的也比較模糊,這樣會(huì)影響向量召回的質(zhì)量,進(jìn)而影響模型回答效果。今天給大家?guī)硪黄獊碜詰?zhàn)士金大佬(@知乎戰(zhàn)士金)的博文-大模型輔助向量召回。接下來分享兩篇通過大模型的能力增強(qiáng)召回效果的文章,這兩篇文章的內(nèi)容都已經(jīng)加入了langchain的標(biāo)準(zhǔn)組件,易用性還是比較好的,但是都有一些特定的使用場景。

Paper1:https://arxiv.org/abs/2212.10496
Paper2:https://arxiv.org/abs/2305.06983
知乎:https://zhuanlan.zhihu.com/p/653808554

HYDE

HYDE論文-Precise Zero-Shot Dense Retrieval without Relevance Labels,文章中強(qiáng)調(diào)了該文章主要適用于Zero-Shot場景。Zero-Shot指的是模型沒有見過某個(gè)場景(或者某個(gè)數(shù)據(jù)集)的數(shù)據(jù),就應(yīng)用于該場景,和用數(shù)據(jù)訓(xùn)練模型以及在語言模型上下文中加入示例相對(duì)應(yīng)。Zero-Shot體現(xiàn)了模型的遷移能力,我猜大部分同學(xué)都是在zero shot場景上使用向量化模型的,比如從網(wǎng)上下載個(gè)向量化模型權(quán)重,直接在自己的業(yè)務(wù)場景上用。其實(shí),如果自己的業(yè)務(wù)場景有數(shù)據(jù),微調(diào)一下向量化模型,在對(duì)應(yīng)業(yè)務(wù)場景下召回率能提升不少。

既然論文題目強(qiáng)調(diào)了zero-shot,論文看的比較多的同學(xué)一定能馬上反應(yīng)過來,是不是在非zero shot(比如微調(diào)向量化模型)的場景下這方法效果就很一般呢?文章作者也給出了實(shí)驗(yàn)結(jié)果,該方法在結(jié)合微調(diào)過的向量化模型時(shí),效果就沒那么好了,非常依賴打輔助的LLM的能力。如果您有微調(diào)向量化模型的能力,這部分就可以跳過了。再強(qiáng)調(diào)一下,這篇文章是篇純討論召回的文章,最后的衡量指標(biāo)也是nDCG和召回率這些指標(biāo),使用LLM單純是為了提高召回效果的。

langchain鏈接:https://python.langchain.com/docs/use_cases/question_answering/how_to/hyde

論文思路非常簡單:

  • Step1:用LLM根據(jù)用戶query生成k個(gè)“假答案”。(大模型生成答案采用sample模式,保證生成的k個(gè)答案不一樣,不懂LLM生成答案原理的同學(xué)可以看我這篇文章。此時(shí)的回答內(nèi)容很可能是存在知識(shí)性錯(cuò)誤,因?yàn)槿绻芑卮鹫_,那就不需要召回補(bǔ)充額外知識(shí)了對(duì)吧。不過不要緊,我們知識(shí)想通過大模型去理解用戶的問題,生成一些“看起來”還不錯(cuò)的假答案)
  • Step2:利用向量化模型,將生成的k的假答案和用戶的query變成向量。
  • Step3:根據(jù)如下公式,將k+1個(gè)向量取平均:其中dk為第k個(gè)生成的答案,q為用戶問題,f為向量化操作。

a9bb10c4-4e1e-11ee-a25d-92fbcf53809c.png

  • Step4:利用融合向量v從文檔庫中召回答案。融合向量中既有用戶問題的信息,也有想要答案的模式信息,可以增強(qiáng)召回效果。

接下來我們從論文中挑一個(gè)比較重要的實(shí)驗(yàn)結(jié)果進(jìn)行討論。測(cè)試集為TREC DL19/20數(shù)據(jù)集,向量化模型使用的是Contriever模型,原始的該模型并未在TREC DL19/20數(shù)據(jù)集上訓(xùn)練過。模型有上標(biāo)FT指的是向量化模型在TREC DL相關(guān)的數(shù)據(jù)集上微調(diào)過的。黃框標(biāo)出來的是未使用hyde技術(shù)的baseline結(jié)果。綠框標(biāo)出來的是未微調(diào)的向量化模型使用hyde技術(shù)的實(shí)驗(yàn)結(jié)果。紅框標(biāo)出來的是微調(diào)過的向量化模型使用hyde技術(shù)的實(shí)驗(yàn)結(jié)果。

a9d458ae-4e1e-11ee-a25d-92fbcf53809c.png

實(shí)驗(yàn)指標(biāo)為NDCG@10,可以發(fā)現(xiàn),對(duì)于沒有微調(diào)過的向量戶化模型(zero shot場景),hyde還是非常有用的,并且隨著使用的LLM模型的增大,效果不斷變好(因?yàn)長LM的回答質(zhì)量提高了)。非常有意思的一點(diǎn)是是對(duì)于微調(diào)過的向量化模型,如果使用比較小的LLM生成假答案(小于52B參數(shù)量),hdye技術(shù)甚至?xí)碡?fù)面影響。

因?yàn)轭I(lǐng)域微調(diào)過的向量化模型性能已經(jīng)不錯(cuò)了,NDCG@10指標(biāo)能達(dá)到60多,LLM生成的假答案的知識(shí)性錯(cuò)誤帶來的負(fù)面影響大于回答模式信息帶來的正面影響。所以向量化模型模型還是能微調(diào)就微調(diào)吧。

FLARE

和上一篇文章相比,F(xiàn)LARE論文比較新一點(diǎn),評(píng)估的指標(biāo)是直接看最后LLM的回答效果的,而非是向第一篇文章那樣只討論召回準(zhǔn)確率。這篇文章涉及到針對(duì)同一個(gè)問題的多次召回,因此比較適合長文本回答。如果您所面對(duì)的場景大部分問題用一兩句話就能回答,那收益就不是太大了。

langchain鏈接:https://python.langchain.com/docs/use_cases/question_answering/how_to/flare

對(duì)于大模型外掛知識(shí)庫,大家通常的做法是根據(jù)用戶query一次召回文檔片段,讓模型生成答案。只進(jìn)行一次文檔召回在長文本生成的場景下效果往往不好,生成的文本過長,更有可能擴(kuò)展出和query相關(guān)性較弱的內(nèi)容,如果模型沒有這部分知識(shí),容易產(chǎn)生模型幻覺問題。一種解決思路是隨著文本生成,多次從向量庫中召回內(nèi)容。

有三種常用的多次召回策略:

  • a. 每生成固定的n個(gè)token就召回一次。
  • b. 每生成一個(gè)完整的句子就召回一次。
  • c. 將用戶query一步步分解為子問題,需要解答當(dāng)前子問題時(shí)候,就召回一次。

已有的多次召回方案比較被動(dòng),召回文檔的目的是為了得到模型不知道的信息,a、b策略并不能保證不需要召回的時(shí)候不召回,需要召回的時(shí)候觸發(fā)召回。c.方案需要設(shè)計(jì)特定的prompt工程,限制了其通用性。作者在本文里提出了兩種更主動(dòng)的多次召回策略,讓模型自己決定啥時(shí)候觸發(fā)召回操作。

策略1

通過設(shè)計(jì)prompt以及提供示例的方式,讓模型知道當(dāng)遇到需要查詢知識(shí)的時(shí)候,提出問題,并按照格式輸出,和toolformer的模式類似。提出問題的格式為[Serch(“模型自動(dòng)提出的問題”)](稱其為主動(dòng)召回標(biāo)識(shí))。利用模型生成的問題去召回答案。召回出答案后,將答案放到用戶query的前邊,然后去掉主動(dòng)召回標(biāo)識(shí)之后,繼續(xù)生成。當(dāng)下一次生成主動(dòng)召回標(biāo)識(shí)之后,將上一次召回出來的內(nèi)容從prompt中去掉。下圖展示了生成拜登相關(guān)答案時(shí),觸發(fā)多次召回的例子,分別面對(duì)拜登在哪上學(xué)和獲得了什么學(xué)位的知識(shí)點(diǎn)上進(jìn)行了主動(dòng)召回標(biāo)識(shí)的生成。

a9edc5b4-4e1e-11ee-a25d-92fbcf53809c.png

該方法也存在一些缺陷:

  • 1.LLM不愿意生成主動(dòng)召回標(biāo)識(shí)。解決方法:對(duì)"["對(duì)應(yīng)的logit乘2,增加生成"["的概率,"["為主動(dòng)召回標(biāo)識(shí)的第一個(gè)字,進(jìn)而促進(jìn)主動(dòng)召回標(biāo)識(shí)的生成。
  • 2.過于頻繁的主動(dòng)召回可能會(huì)影響生成質(zhì)量。解決方法:在剛生成一次主動(dòng)召回標(biāo)識(shí)、得到召回后的文檔、去掉主動(dòng)召回標(biāo)識(shí)之后,接下來生成的幾個(gè)token禁止生成"["。
  • 3.不微調(diào)該方案不太可靠,很難通過few shot的方式讓模型生成這種輸出模式。

策略2

策略1存在的第3點(diǎn)缺陷比較知名。因此作者提出了另外一個(gè)策略。該策略基于一個(gè)假設(shè):模型生成的詞對(duì)應(yīng)該的概率能夠表現(xiàn)生成內(nèi)容的置信度。(傳統(tǒng)的chatgpt接口是用不了策略2的,因?yàn)榈貌坏缴擅總€(gè)詞的概率。)

分為4個(gè)步驟:

  • Step0:根據(jù)用戶的query,進(jìn)行第一次召回,讓模型生成答案。
  • Step1:之后,每生成64個(gè)token,用NLTK工具包從64個(gè)token里邊找到第一個(gè)完整句子,當(dāng)作“假答案”,扔掉多余的token。(和第一篇文章思想一樣,利用LLM生成符合回答模式的“假答案”)
  • Step2:如果“假答案”里有任意一個(gè)token對(duì)應(yīng)的概率,低于某一閾值,那么就利用這個(gè)句子進(jìn)行向量召回。觸發(fā)召回的“假答案”很可能包含事實(shí)性錯(cuò)誤,降低召回準(zhǔn)確率。設(shè)計(jì)了兩種方法解決這個(gè)問題。方法1:將“假答案”中生成概率低于某一閾值的token扔掉(低概率的token很有可能存在錯(cuò)誤信息),然后再進(jìn)行向量召回。方法2:利用大模型能力,對(duì)“假答案”中置信度低的內(nèi)容進(jìn)行提問,生成一個(gè)問題,用生成的問題進(jìn)行向量召回。
  • Step3:利用召回出來的文本,重新生成新的“真答案”,然后進(jìn)行下一個(gè)句子的生成。

依然針對(duì)拜登的問題,下圖給出了例子。

aa0ce066-4e1e-11ee-a25d-92fbcf53809c.png

接下來介紹一下實(shí)驗(yàn)結(jié)果。先聲明一下,這篇文章用的召回器(向量化模型)是BM25,2009年被提出,基于統(tǒng)計(jì)學(xué)的原理,屬于一種詞袋模型,效果一般。筆者認(rèn)為,如果用一些效果更好的基于神經(jīng)網(wǎng)絡(luò)的召回器,本文提出的方法提升就沒那么大了。

召回器榜單:
中文:https://github.com/FlagOpen/FlagEmbedding/tree/master/C_MTEB
英文:MTEB Leaderboard - a Hugging Face Space by mteb

多次召回方案在更加開放的任務(wù)類型上提升比較小。如果是召回并回答一些模型不知道的垂類知識(shí),F(xiàn)LARE效果提升應(yīng)該是還不錯(cuò)的。

aa1c49d4-4e1e-11ee-a25d-92fbcf53809c.png

作者證明了用生成”假答案“進(jìn)行召回(Next)效果比用前一句進(jìn)行召回效果更好(印證了HYDE觀點(diǎn))。

aa2a976e-4e1e-11ee-a25d-92fbcf53809c.png

當(dāng)一個(gè)句子里生成的所有單詞的概率都大于一個(gè)閾值t時(shí),才不觸發(fā)召回文檔。當(dāng)t=0%時(shí),不觸發(fā)召回文檔;t=100%時(shí),每次都觸發(fā)召回。下圖展示了不同的t的情況下LLM回答效果??梢园l(fā)現(xiàn)t過大或者過小都不是最好的。總體上來看t=50%比較好。

aa3e377e-4e1e-11ee-a25d-92fbcf53809c.png

總結(jié)

分享的這兩篇文章都需要多次調(diào)用LLM,來增強(qiáng)召回,雖然在一些場景下比較有效,不過開銷感覺有點(diǎn)太大了。其實(shí)最簡單有效的提高召回效果的方式就是在自己業(yè)務(wù)的數(shù)據(jù)集上微調(diào)一下向量化模型。



聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 向量
    +關(guān)注

    關(guān)注

    0

    文章

    55

    瀏覽量

    12068
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26264
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3797

    瀏覽量

    5279

原文標(biāo)題:大模型外掛知識(shí)庫優(yōu)化-大模型輔助向量召回

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于訓(xùn)練階段使用知識(shí)庫+KNN檢索相關(guān)信息輔助學(xué)習(xí)方法

    上面收的引入知識(shí)庫+KNN的方法,緩解了模型參數(shù)需要強(qiáng)記憶訓(xùn)練樣本的問題。此外,文中還通過KNN檢索結(jié)果來指導(dǎo)模型的學(xué)習(xí)過程。
    的頭像 發(fā)表于 10-09 17:33 ?2549次閱讀

    模型卷價(jià)格,向量數(shù)據(jù)“卷”什么?

    被大模型“帶飛”這一年,向量數(shù)據(jù)才剛剛寫下序言
    的頭像 發(fā)表于 05-23 09:24 ?2993次閱讀
    大<b class='flag-5'>模型</b>卷價(jià)格,<b class='flag-5'>向量</b>數(shù)據(jù)<b class='flag-5'>庫</b>“卷”什么?

    【實(shí)操文檔】在智能硬件的大模型語音交互流程中接入RAG知識(shí)庫

    非常明顯的短板。盡管這些模型在理解和生成自然語言方面有極高的性能,但它們?cè)谔幚韺I(yè)領(lǐng)域的問答時(shí),卻往往不能給出明確或者準(zhǔn)確的回答。 這時(shí)就需要接一個(gè)專有知識(shí)庫來滿足產(chǎn)品專有和專業(yè)知識(shí)的回復(fù)需求,理論
    發(fā)表于 09-29 17:12

    【「基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化」閱讀體驗(yàn)】+Embedding技術(shù)解讀

    引入外部知識(shí)庫來增強(qiáng)生成模型的能力。而Embedding在 Embedding模型將用戶的問題和文檔中的文本轉(zhuǎn)換為向量表示,這是RAG系統(tǒng)
    發(fā)表于 01-17 19:53

    【「基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化」閱讀體驗(yàn)】RAG基本概念

    的RAG應(yīng)用架構(gòu)具備清晰的分層設(shè)計(jì)。知識(shí)庫構(gòu)建層,著重于將各類非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行有效處理,轉(zhuǎn)化為計(jì)算機(jī)能夠理解的形式,通過向量化編碼技術(shù)為數(shù)據(jù)賦予數(shù)字特征,并建立動(dòng)態(tài)索引以便快速查詢更新。檢索增強(qiáng)層,采用
    發(fā)表于 02-08 00:22

    《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀心得3——RAG架構(gòu)與部署本地知識(shí)庫

    應(yīng)用。第六章深入探討了RAG架構(gòu)的工作原理,該技術(shù)通過在推理過程中實(shí)時(shí)檢索和注入外部知識(shí)來增強(qiáng)模型的生成能力。RAG架構(gòu)的核心是檢索器和生成器兩大模塊,檢索器負(fù)責(zé)從知識(shí)庫中找到與當(dāng)前查詢相關(guān)的文檔片段,生成器
    發(fā)表于 03-07 19:49

    開發(fā)知識(shí)庫測(cè)試添加知識(shí)庫

    文檔類型的知識(shí)要等待數(shù)據(jù)校驗(yàn)完成后才能上架 可以點(diǎn)擊知識(shí)名稱查看知識(shí)詳情 等待后端處理完成可以點(diǎn)擊知識(shí)列表的上架 在智能體中知識(shí)庫的位置點(diǎn)
    發(fā)表于 03-06 15:07

    領(lǐng)域知識(shí)庫的研究與設(shè)計(jì)

    領(lǐng)域知識(shí)庫的構(gòu)建有利于知識(shí)的檢索和共享。分析了領(lǐng)域知識(shí)庫應(yīng)具備的條件,指出構(gòu)建領(lǐng)域知識(shí)庫的有效方法;介紹了構(gòu)建知識(shí)庫的一般步驟,并設(shè)計(jì)出領(lǐng)域
    發(fā)表于 08-29 14:39 ?0次下載

    NXP NFC知識(shí)庫

    NXP NFC知識(shí)庫
    發(fā)表于 12-30 17:32 ?49次下載

    本體知識(shí)庫的模塊與保守?cái)U(kuò)充

    模塊化是軟件工程的一種方法,近年來被引入到本體領(lǐng)域,用以支持本體的重用和本體的整合。已有的工作沒有討論同時(shí)含有TBox和ABox的本體知識(shí)庫的模塊化的相關(guān)問題。在定義本體知識(shí)庫的模塊和知識(shí)庫的保守
    發(fā)表于 11-24 09:58 ?0次下載

    借助亞馬遜云科技大語言模型等多種服務(wù)打造下一代企業(yè)知識(shí)庫

    /算法/軟件工程師的人力投入和包括硬件在內(nèi)的物力投入。其次,為了進(jìn)一步提高搜索準(zhǔn)確率,如何引導(dǎo)用戶搜索描述更加準(zhǔn)確和充分利用用戶行為優(yōu)化搜索引擎也是常見的用戶痛點(diǎn)。此外,如何根據(jù)企業(yè)知識(shí)庫直接給出用戶提問的答案
    的頭像 發(fā)表于 11-02 11:22 ?1405次閱讀
    借助亞馬遜云科技大語言<b class='flag-5'>模型</b>等多種服務(wù)打造下一代企業(yè)<b class='flag-5'>知識(shí)庫</b>

    如何基于亞馬遜云科技LLM相關(guān)工具打造知識(shí)庫

    背景 本篇將為大家闡述亞馬遜云科技大語言模型下沉到具體行業(yè)進(jìn)行場景以及實(shí)施案例的介紹,是亞馬遜云科技官方《基于智能搜索和大模型打造企業(yè)下一代知識(shí)庫》系列的第四篇博客。感興趣的小伙伴可以進(jìn)入官網(wǎng)深入
    的頭像 發(fā)表于 11-23 17:53 ?2189次閱讀
    如何基于亞馬遜云科技LLM相關(guān)工具打造<b class='flag-5'>知識(shí)庫</b>

    如何手?jǐn)]一個(gè)自有知識(shí)庫的RAG系統(tǒng)

    用于自然語言處理任務(wù),如文本生成、問答系統(tǒng)等。 我們通過一下幾個(gè)步驟來完成一個(gè)基于京東云官網(wǎng)文檔的RAG系統(tǒng) 數(shù)據(jù)收集 建立知識(shí)庫 向量檢索 提示詞與模型 數(shù)據(jù)收集 數(shù)據(jù)的收集再整個(gè)RAG實(shí)施過程中無疑是最耗人工的,涉及到收集、
    的頭像 發(fā)表于 06-17 14:59 ?1627次閱讀

    科技云報(bào)到:大模型時(shí)代下,向量數(shù)據(jù)的野望

    科技云報(bào)到:大模型時(shí)代下,向量數(shù)據(jù)的野望
    的頭像 發(fā)表于 10-14 17:18 ?978次閱讀

    用騰訊ima和Deepseek建立個(gè)人微信知識(shí)庫

    ---基于騰訊混元大模型或Deepseek-r推理模型的個(gè)人知識(shí)庫。大模型是通才,知識(shí)庫是專家大模型
    的頭像 發(fā)表于 02-25 17:33 ?2593次閱讀
    用騰訊ima和Deepseek建立個(gè)人微信<b class='flag-5'>知識(shí)庫</b>
    镇江市| 平远县| 云梦县| 闵行区| 留坝县| 黔南| 黄石市| 祥云县| 新平| 安多县| 新巴尔虎左旗| 霍林郭勒市| 庐江县| 郎溪县| 博兴县| 恭城| 贵定县| 北票市| 岳阳县| 三原县| 安泽县| 绥滨县| 苍梧县| 石林| 天津市| 秦安县| 兰坪| 屯门区| 八宿县| 灵川县| 鄂伦春自治旗| 舞阳县| 称多县| 外汇| 洱源县| 上蔡县| 桐梓县| 吴忠市| 乡宁县| 东莞市| 榕江县|