日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

LangChain:為你定制一個(gè)專屬的GPT

阿爾法工場(chǎng)研究院 ? 來(lái)源:阿爾法工場(chǎng)研究院 ? 2023-04-24 11:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)語(yǔ):用戶可以利用LangChain的模塊來(lái)改善大語(yǔ)言模型的使用,通過(guò)輸入自己的知識(shí)庫(kù)來(lái)“定制化”自己的大語(yǔ)言模型。

LLM(大語(yǔ)言模型) 是一項(xiàng)變革性的技術(shù),它將人類的各類知識(shí)和邏輯能力打包進(jìn)入了一個(gè)體積龐大的模型當(dāng)中。

但是通常來(lái)說(shuō),包括當(dāng)前公認(rèn)效果最好的LLM GPT-4都會(huì)有一個(gè)問(wèn)題——事實(shí)問(wèn)題錯(cuò)誤,也常被稱之為幻覺(jué)?;糜X(jué)(Hallucination),或者說(shuō)人工智能幻覺(jué)是人工智能的自信反應(yīng)。

當(dāng)模型輸出欺騙性數(shù)據(jù)的傾向時(shí),其使用的的訓(xùn)練數(shù)據(jù)并不能證明輸出的合理性。人工智能幻覺(jué)的危險(xiǎn)之處之一是模型的輸出看起來(lái)是正確的,其實(shí)它本質(zhì)上是錯(cuò)誤的。

基于這種前提條件下,若是直接將LLM利用于生產(chǎn)環(huán)境中(例如客服答疑,新形式文檔等)時(shí),那么事實(shí)幻覺(jué)就可能會(huì)造成極其嚴(yán)重的影響。

但是通過(guò)LangChain,我們可以通過(guò)將其它計(jì)算資源和自有的知識(shí)庫(kù)結(jié)合。依托于當(dāng)前的各類產(chǎn)品,在整合了當(dāng)前的語(yǔ)料資源庫(kù)后,各類LLM都會(huì)進(jìn)入到一個(gè)新的實(shí)用化發(fā)展階段。

LangChain介紹

LangChain是一個(gè)用于開(kāi)發(fā)基于語(yǔ)言模型的應(yīng)用程序開(kāi)發(fā)框架。總的來(lái)說(shuō),LangChain是一個(gè)鏈接面向用戶程序和LLM之間的一個(gè)中間層。

它在 2023 年 3 月獲得了 Benchmark Capital 的 1000 萬(wàn)美元種子輪融資,在近期又拿到了紅杉2000-2500萬(wàn)美金的融資,估值已經(jīng)提升到了2億美金左右。

LangChain 可以輕松管理與語(yǔ)言模型的交互,將多個(gè)組件鏈接在一起,并集成額外的資源,例如 API 和數(shù)據(jù)庫(kù)。其組件包括了模型(各類LLM),提示模板(Prompts),索引,代理(Agent),記憶等等。

當(dāng)前GitHub上的熱門項(xiàng)目Auto-GPT和Babyagi所使用的鏈?zhǔn)剿伎寄芰Χ际怯蒐angChain啟發(fā)而來(lái)。

0bb89c10-df25-11ed-bfe3-dac502259ad0.png

LangChain項(xiàng)目主頁(yè)圖

LangChain工作流程

本次重點(diǎn)介紹LangChain搭配自有的知識(shí)庫(kù)讓LLM發(fā)揮更大功能的流程。

在缺少了上下文的情況下,即使是目前公認(rèn)最頂級(jí)的LLM GPT-4也無(wú)法回答部分需要特定領(lǐng)域的知識(shí)。

而要是想僅用自有知識(shí)庫(kù)來(lái)訓(xùn)練出LLMs又是不可能的,這個(gè)時(shí)候最好的方法就是利用LangChain的模塊來(lái)改善LLM的使用,通過(guò)輸入自己的知識(shí)庫(kù)來(lái)“定制化”自己的LLM。

Question Answering over specific documents是一個(gè)寫在LangChain主頁(yè)的主推功能。翻譯過(guò)來(lái)就是 基于特定文檔的問(wèn)答 。

1.準(zhǔn)備自定義數(shù)據(jù)

準(zhǔn)備好需要LLM學(xué)習(xí)的內(nèi)容,它可以是一個(gè)純文本文件或者其他類型的文本(不同類型的文本需要不同的文檔加載器)。

2.拆分文檔

一般來(lái)講,每個(gè)文檔都是由復(fù)雜長(zhǎng)短句、多種語(yǔ)法結(jié)合寫作而成的。在進(jìn)行輸入之前,就必須對(duì)這些文字進(jìn)行解構(gòu)處理。

對(duì)于英文LangChain一般會(huì)使用RecursiveCharacterTextSplitter處理。由于中文的復(fù)雜性,會(huì)使用到j(luò)ieba等處理工具預(yù)處理中文語(yǔ)句。

3.文本嵌入(Embeddings)

處理完文本之后,就可以對(duì)文本進(jìn)行嵌入(Embeddings)了。通過(guò)調(diào)用OpenAI的Embeddings API將文本向量化。在這步處理之后,文本就已經(jīng)不再是文字,而是以向量化存儲(chǔ)的信息。

再使用一個(gè)開(kāi)源的Embeddings數(shù)據(jù)庫(kù)ChromaDB保存Embeddings數(shù)據(jù),就可以達(dá)到使用數(shù)據(jù)長(zhǎng)期存儲(chǔ)和快速調(diào)用。

0be7ed76-df25-11ed-bfe3-dac502259ad0.jpg

圖:將原文本嵌入

4.使用鏈(Chain)對(duì)矢量數(shù)據(jù)庫(kù)進(jìn)行問(wèn)答

在擁有了嵌入數(shù)據(jù)之后,我們就可以利用LangChain的強(qiáng)大鏈功能來(lái)執(zhí)行我們的問(wèn)答。這時(shí)就可以通過(guò)自然語(yǔ)言對(duì)于文檔內(nèi)容進(jìn)行提問(wèn)了。

0bfcdeb6-df25-11ed-bfe3-dac502259ad0.jpg

通過(guò)LangChain回答問(wèn)題/完成任務(wù)

LangChain可能的應(yīng)用場(chǎng)景

當(dāng)前的AI熱潮吸引了很多人,而除了ChatGPT這類問(wèn)答還有New Bing這種搜索服務(wù)外,并沒(méi)有什么可以將LLM商業(yè)化的案例。甚至可以說(shuō)只有New Bing才是目前唯一一個(gè)成功的商業(yè)化案例。

LangChain為所有人提供了一個(gè)新的商業(yè)化方案。此前有將LLM導(dǎo)入客服軟件中應(yīng)用的方案,但是由于LLM容易出現(xiàn)事實(shí)幻覺(jué)而無(wú)法實(shí)施。

同時(shí),將所需內(nèi)容通過(guò)Prompt導(dǎo)入LLM的想法也由于LLM的對(duì)話(Context)輸入限制而不可能實(shí)施。LangChain則通過(guò)將數(shù)據(jù)向量化避免了使用輸入限制,從而將所需內(nèi)容導(dǎo)入LLM進(jìn)行問(wèn)答。

當(dāng)下的人工成本逐漸提升,例如淘寶客服等人工密集型產(chǎn)業(yè)的成本逐步提升。當(dāng)前的智能問(wèn)答距離可用仍有較遠(yuǎn)的距離。

通過(guò)已經(jīng)預(yù)訓(xùn)練好的LLM是一個(gè)快速降本增效的方案?;诿總€(gè)產(chǎn)品的數(shù)據(jù),可以將數(shù)據(jù)引入LLM中,讓LLM接替客服工作,準(zhǔn)確、快速的回答客戶的定制化問(wèn)題,同時(shí)語(yǔ)氣貼合自然口吻,避免了情緒化工作。

基于文檔的工作還可以在各類公司培訓(xùn)和智能化文檔方面提供作用。很多產(chǎn)品文檔隨著時(shí)間的積累變得越來(lái)越復(fù)雜,多層跳轉(zhuǎn)也會(huì)讓人學(xué)習(xí)起來(lái)效率低下且不適。

此時(shí)基于LangChain就可以將文檔重新梳理,輸出為大綱類,在使用的時(shí)候可以隨時(shí)通過(guò)問(wèn)答的形式將內(nèi)容輸出。類似于新員工培訓(xùn)和產(chǎn)品說(shuō)明書等等場(chǎng)景都可以有所應(yīng)用。這就極大的拓寬了文字類LLM的使用場(chǎng)景。

0c24a89c-df25-11ed-bfe3-dac502259ad0.png

基于LangChain的問(wèn)答

除了直接與人交互的方面外,還可以導(dǎo)入特定領(lǐng)域的知識(shí)庫(kù),實(shí)時(shí)更新LLM的內(nèi)容,讓LLM的知識(shí)時(shí)刻處于最新的狀態(tài)。依賴于此,LangChain除了可以完成自然語(yǔ)言文檔搜索外,還可以基于及時(shí)的資源進(jìn)行快速開(kāi)發(fā)。

0c482632-df25-11ed-bfe3-dac502259ad0.jpg

導(dǎo)入資源后LangChain開(kāi)發(fā)出的網(wǎng)頁(yè)

當(dāng)前LangChain的局限性

目前,由于整個(gè)AI生態(tài)還處于一種快速發(fā)展期,各類工具和平臺(tái)還沒(méi)有完全成熟,因此LangChain的各類鏈和模塊的定制性和功能都還不夠強(qiáng)大。對(duì)于有高性能場(chǎng)景需求和定制化任務(wù)的可能需要自己重新修改。

事實(shí)合法性也是未來(lái)需要解決的一個(gè)痛點(diǎn)。LLM的各類越獄層出不窮。雖然在引入了嵌入之后LLM只會(huì)對(duì)文檔內(nèi)容進(jìn)行問(wèn)答,但是仍然需要有一套額外的監(jiān)督系統(tǒng)防止出現(xiàn)任何非法的回答。

同時(shí)當(dāng)前LangChain還有使用難度較高等問(wèn)題。目前的各類AI工具都面臨著普通用戶無(wú)法輕松駕馭等等的問(wèn)題,而LangChain的問(wèn)題更盛。

普通產(chǎn)品或者開(kāi)發(fā)者的上手學(xué)習(xí)成本較高,使用起來(lái)難度很大。這一切都需要社區(qū)和商業(yè)資本的共同投入才有可能解決。

結(jié)語(yǔ)

LangChain是當(dāng)前眾多的AGI實(shí)驗(yàn)性工具的基石項(xiàng)目?;阪湥–hain)的LLM調(diào)用思維勢(shì)必會(huì)貫穿未來(lái)LLM的發(fā)展生態(tài)。

提前關(guān)注AI發(fā)展動(dòng)向,關(guān)注LangChain的開(kāi)發(fā)進(jìn)度,會(huì)對(duì)未來(lái)的AI應(yīng)用落地有極大的幫助。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41349

    瀏覽量

    302735
  • 數(shù)據(jù)庫(kù)
    +關(guān)注

    關(guān)注

    7

    文章

    4086

    瀏覽量

    68572
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    374

    瀏覽量

    16988

原文標(biāo)題:LangChain:為你定制一個(gè)專屬的GPT

文章出處:【微信號(hào):alpworks,微信公眾號(hào):阿爾法工場(chǎng)研究院】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    GPT-5震撼發(fā)布:AI領(lǐng)域的重大飛躍

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)2025年8月8日凌晨1點(diǎn),OpenAI以場(chǎng)長(zhǎng)達(dá)1小時(shí)的線上發(fā)布會(huì)正式推出GPT-5。這場(chǎng)被業(yè)界稱為“AI進(jìn)化分水嶺”的發(fā)布,終結(jié)了長(zhǎng)達(dá)兩年的技術(shù)猜測(cè),更以多維度性能
    的頭像 發(fā)表于 08-09 07:44 ?1w次閱讀
    <b class='flag-5'>GPT</b>-5震撼發(fā)布:AI領(lǐng)域的重大飛躍

    非標(biāo)定制直線模組適用于哪些行業(yè)?看完目了然

    非標(biāo)定制直線模組,是針對(duì)標(biāo)準(zhǔn)模組無(wú)法滿足的特殊行程、負(fù)載、精度、速度、安裝空間、工況環(huán)境等需求,進(jìn)行專屬設(shè)計(jì)、定制化生產(chǎn)的線性運(yùn)動(dòng)單元。相比標(biāo)準(zhǔn)模組,它更靈活、更貼合設(shè)備工藝,以下行業(yè)因工藝特殊性
    的頭像 發(fā)表于 04-28 11:27 ?86次閱讀
    非標(biāo)<b class='flag-5'>定制</b>直線模組適用于哪些行業(yè)?看完<b class='flag-5'>一</b>目了然

    瑞薩RA系列FSP庫(kù)開(kāi)發(fā)實(shí)戰(zhàn)指南之使用GPT輸入捕獲進(jìn)行脈寬和周期測(cè)量實(shí)驗(yàn)

    一個(gè)實(shí)驗(yàn)使用了GPT的輸出功能,本次實(shí)驗(yàn)要使用GPT的輸入功能,通過(guò)GPT的輸入捕獲進(jìn)行脈寬和周期測(cè)量。其測(cè)量的原理如下圖所示。
    的頭像 發(fā)表于 04-24 10:49 ?6152次閱讀
    瑞薩RA系列FSP庫(kù)開(kāi)發(fā)實(shí)戰(zhàn)指南之使用<b class='flag-5'>GPT</b>輸入捕獲進(jìn)行脈寬和周期測(cè)量實(shí)驗(yàn)

    請(qǐng)教RTD GPT 配置問(wèn)題

    ) RTD版本如下圖: 我在我的項(xiàng)目中包含個(gè) GPT。我希望它從 0 到 5000 計(jì)數(shù)并重新開(kāi)始。我面臨的問(wèn)題是似乎沒(méi)有辦法配置這個(gè)上限。這是
    發(fā)表于 04-15 08:32

    FastAPI+LangChain打造智能招聘系統(tǒng)

    ?未來(lái)招聘不再人工:FastAPI+LangChain 的經(jīng)濟(jì)價(jià)值與影響 AI 自動(dòng)化招聘的技術(shù)背景 隨著人工智能技術(shù)的迅速發(fā)展,企業(yè)招聘流程正在經(jīng)歷深刻變革。傳統(tǒng)的招聘模式依賴人力資源部門通過(guò)簡(jiǎn)歷
    的頭像 發(fā)表于 04-14 14:26 ?176次閱讀

    專屬“數(shù)字員工”已到崗!迅RK3588系列開(kāi)發(fā)板適配OpenClaw

    專屬“數(shù)字員工”已到崗!迅RK3588系列開(kāi)發(fā)板適配OpenClaw
    的頭像 發(fā)表于 03-11 11:02 ?788次閱讀
    <b class='flag-5'>你</b>的<b class='flag-5'>專屬</b>“數(shù)字員工”已到崗!迅<b class='flag-5'>為</b>RK3588系列開(kāi)發(fā)板適配OpenClaw

    專屬“數(shù)字員工”已到崗!迅RK3588系列適配OpenClaw

    專屬“數(shù)字員工”已到崗!迅RK3588系列適配OpenClaw
    的頭像 發(fā)表于 02-27 15:33 ?843次閱讀
    <b class='flag-5'>你</b>的<b class='flag-5'>專屬</b>“數(shù)字員工”已到崗!迅<b class='flag-5'>為</b>RK3588系列適配OpenClaw

    [工具討論] 如果有款國(guó)產(chǎn)圖形化配置工具STM32Cube,支持所有內(nèi)核和廠商MCU,會(huì)用嗎?

    涉及多家廠商芯片時(shí),要在多個(gè)工具間切換 如果有款這樣的工具 我們想和大家討論個(gè)假設(shè)性問(wèn)題: 如果有款國(guó)產(chǎn)的圖形化配置工具,具備以下特性,
    發(fā)表于 01-26 10:30

    定制灌封膠_特殊場(chǎng)景灌封膠定制化服務(wù)流程與案例

    什么是灌封膠定制化? 灌封膠定制化是指根據(jù)客戶具體的應(yīng)用場(chǎng)景、工作環(huán)境、性能要求(如耐溫、耐腐蝕、耐老化、導(dǎo)熱、阻燃等)以及產(chǎn)品結(jié)構(gòu),量身研發(fā)和生產(chǎn)專屬配方的灌封膠產(chǎn)品。不同于通用型產(chǎn)品,定制
    的頭像 發(fā)表于 11-25 01:21 ?452次閱讀
    <b class='flag-5'>定制</b>灌封膠_特殊場(chǎng)景灌封膠<b class='flag-5'>定制</b>化服務(wù)流程與案例

    IoT設(shè)備賬號(hào)歸屬操作秘籍:專屬固件全攻略來(lái)啦!

    。 ? 、創(chuàng)建項(xiàng)目 首先,需要登錄,并進(jìn)入IoT管理頁(yè)面。 點(diǎn)擊【新建項(xiàng)目】,創(chuàng)建個(gè)項(xiàng)目,以便后續(xù)將設(shè)備歸屬到此項(xiàng)目中來(lái)管控。 二、歸屬設(shè)備 接下來(lái)開(kāi)始進(jìn)行歸屬操作,首先點(diǎn)擊【專屬
    的頭像 發(fā)表于 11-14 16:45 ?1150次閱讀
    IoT設(shè)備賬號(hào)歸屬操作秘籍:<b class='flag-5'>專屬</b>固件全攻略來(lái)啦!

    專屬固件助力IoT設(shè)備賬號(hào)歸屬變更:詳細(xì)操作說(shuō)明!

    順利完成操作。 ? 、創(chuàng)建項(xiàng)目 首先,需要登錄,并進(jìn)入IoT管理頁(yè)面。 點(diǎn)擊【新建項(xiàng)目】,創(chuàng)建個(gè)項(xiàng)目,以便后續(xù)將設(shè)備歸屬到此項(xiàng)目中來(lái)管控。 二、歸屬設(shè)備 接下來(lái)開(kāi)始進(jìn)行歸屬操作,首先點(diǎn)擊【
    的頭像 發(fā)表于 11-14 16:41 ?495次閱讀
    <b class='flag-5'>專屬</b>固件助力IoT設(shè)備賬號(hào)歸屬變更:詳細(xì)操作說(shuō)明!

    GPT-5.1發(fā)布 OpenAI開(kāi)始拼情商

    問(wèn)題。 Sam Altman 發(fā)文稱GPT-5.1是次不錯(cuò)的模型升級(jí)。 GPT-5.1 Instant:ChatGPT 最常用的模型,更溫暖、更智能,也更善于遵循指令的模型。 GPT
    的頭像 發(fā)表于 11-13 15:49 ?848次閱讀

    【RA4M2-SENSOR】3、使用GPT定時(shí)器-PWM輸出

    的信息 */ R_GPT_InfoGet(&g_timer2_ctrl, &info); /* 獲得計(jì)時(shí)器個(gè)周期需要的計(jì)數(shù)次數(shù) */ uint32_t
    發(fā)表于 09-01 15:20

    杰和N150處理器體機(jī)主板,企業(yè)定制專屬出口方案

    行業(yè)背景:“不出海,就出局”,對(duì)于投身體機(jī)電腦海外業(yè)務(wù)的企業(yè)而言,精準(zhǔn)把握市場(chǎng)特性,提供契合需求的產(chǎn)品解決方案,是搶占市場(chǎng)份額的關(guān)鍵所在。杰和科技依托深厚的技術(shù)積淀與豐富的行業(yè)經(jīng)驗(yàn),合作伙伴定制
    的頭像 發(fā)表于 07-31 13:44 ?1969次閱讀
    杰和N150處理器<b class='flag-5'>一</b>體機(jī)主板,<b class='flag-5'>為</b>企業(yè)<b class='flag-5'>定制</b><b class='flag-5'>專屬</b>出口方案

    【重磅】企業(yè)版華秋DFM&amp;華秋CAM正式發(fā)布!離線審查+定制開(kāi)發(fā)+專屬護(hù)航

    深度工藝審查規(guī)則 ,且更多工藝審查規(guī)則和企業(yè)版專屬高階功能持續(xù)新增中 3、企業(yè)級(jí)專屬服務(wù) ◆ 輕量 定制開(kāi)發(fā) (最快3天交付企業(yè)專用規(guī)則庫(kù)) ◆ 代建元件庫(kù)服務(wù):元件庫(kù)600萬(wàn)+,支持代建服務(wù)
    發(fā)表于 06-11 16:02
    万宁市| 肇源县| 潞城市| 吉首市| 鄱阳县| 金塔县| 建宁县| 台北县| 孝义市| 辽宁省| 鹤庆县| 宜兰市| 哈巴河县| 永嘉县| 克山县| 新沂市| 景谷| 深水埗区| 刚察县| 芦山县| 德州市| 左云县| 措勤县| 垣曲县| 华坪县| 阳曲县| 云梦县| 嘉黎县| 塔河县| 宁南县| 平定县| 新化县| 南部县| 那曲县| 辽阳县| 安泽县| 仲巴县| 大悟县| 榆社县| 兴仁县| 如东县|