日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾集成顯卡+ChatGLM3大語言模型的企業(yè)本地AI知識庫部署

英特爾物聯(lián)網(wǎng) ? 來源:英特爾物聯(lián)網(wǎng) ? 2024-03-29 11:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

在當今的企業(yè)環(huán)境中,信息的快速獲取和處理對于企業(yè)的成功至關(guān)重要。為了滿足這一需求,我們可以將RAG技術(shù)與企業(yè)本地知識庫相結(jié)合,以提供實時的、自動生成的信息處理和決策支持。這將有助于企業(yè)更好地應對快速變化的市場環(huán)境,提高企業(yè)的競爭力和創(chuàng)新能力。

企業(yè)本地知識庫是一個集中存儲和管理企業(yè)內(nèi)部知識的系統(tǒng)。它包含了企業(yè)的歷史數(shù)據(jù)、經(jīng)驗教訓、最佳實踐、流程文檔、產(chǎn)品信息等。企業(yè)本地知識庫是企業(yè)智慧的結(jié)晶,對于企業(yè)的運營和發(fā)展具有重要意義。

將RAG技術(shù)與企業(yè)本地知識庫相結(jié)合,可以為企業(yè)帶來以下幾個方面的優(yōu)勢:

1

實時性

RAG技術(shù)可以實時地從企業(yè)本地知識庫中提取相關(guān)信息,并生成用戶所需的內(nèi)容。這意味著用戶可以快速地獲取到最新的知識和信息,而不需要花費大量時間去查找和整理。

2

自動化

RAG技術(shù)可以自動地處理和生成內(nèi)容,減少了人工干預的需求。這不僅可以提高企業(yè)的效率,還可以減少人為錯誤的發(fā)生。

3

個性化和定制化

RAG技術(shù)可以根據(jù)用戶的需求和偏好,生成個性化的內(nèi)容。通過與企業(yè)本地知識庫的結(jié)合,可以提供更加精準和有針對性的信息,滿足不同用戶的需求。

4

知識共享和傳承

企業(yè)本地知識庫是一個集中存儲和共享知識的平臺。通過與RAG技術(shù)的結(jié)合,可以將這些知識快速地傳遞給需要的用戶,促進知識的共享和傳承。

1

RAG簡介

RAG - Retrieval-Augmented Generation(檢索增強生成)是一種先進的自然語言處理(NLP)技術(shù),它結(jié)合了信息檢索(Retrieval)和神經(jīng)網(wǎng)絡生成(Generation)兩種方法,以提升模型在生成文本時的準確性和相關(guān)性。在傳統(tǒng)的生成模型中,模型依據(jù)自身學習到的知識庫生成文本。然而,這種方法受限于模型訓練時所接觸到的數(shù)據(jù)范圍,特別是在處理未見的、需要實時查找新信息的場景時,可能無法生成最新或最準確的內(nèi)容。

RAG模型通過引入一個檢索組件,在接收到輸入問題或任務后,首先從大規(guī)模預定義的知識庫(如網(wǎng)頁、文檔集合或其他結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù)源)中檢索與任務相關(guān)的信息片段。然后,檢索到的信息作為額外的上下文輸入,與原始輸入一起傳遞給生成模型。生成模型在此基礎上,利用檢索到的信息以及自身的語言模型能力,生成更為精確、詳盡且與現(xiàn)實世界信息保持同步的回答或文本內(nèi)容。

簡單來說,RAG模型就是在傳統(tǒng)生成模型的基礎上增加了一個動態(tài)獲取外部知識的能力,這樣既保留了大模型生成連貫文本的優(yōu)點,又解決了由于模型記憶限制導致的知識更新和準確性不足的問題,尤其適用于問答系統(tǒng)、對話系統(tǒng)及需要實時更新信息的自然語言處理任務。

504d318a-ece7-11ee-a297-92fbcf53809c.png

2

OpenVINO Notebook簡介

OpenVINO Notebooks是一套以Jupyter Notebook為載體的開源交互式編程教程和示例代碼合集,由英特爾公司開發(fā)和維護。這套資源專為使用 OpenVINO 工具套件的開發(fā)者設計,旨在幫助他們更快地理解和掌握如何利用 OpenVINO 進行深度學習模型的優(yōu)化與推理及實際部署AI在各式業(yè)務應用場景里面。

50752faa-ece7-11ee-a297-92fbcf53809c.png

3

部署平臺簡介

算力魔方是一款可以DIY的迷你主機,采用了抽屜式設計,后續(xù)組裝、升級、維護只需要拔插模塊。通過選擇計算模塊的版本,再搭配不同額 IO 模塊可以組成豐富的配置,適應不同場景。性能不夠時,可以升級計算模塊提升算力, 如需要顯卡可加上顯卡, IO 接口不匹配時,可以更換 IO 模塊調(diào)整功能,而無需重構(gòu)整個系統(tǒng)。本文在帶有英特爾12代酷睿i7-1265U芯片組里的銳炬 Xe集成顯卡+RAM 32GB的算力魔方上完成驗證。

4

在集成顯卡上部署RAG

4.1

搭建OpenVINO Notebooks開發(fā)環(huán)境

第一步:請使用下面的命令克隆存儲庫創(chuàng)建并激活名為“openvino_env”的虛擬環(huán)境

git clone https://github.com/openvinotoolkit/openvino_notebooks.git
cd openvino_notebooks
conda create -n openvino_env python=3.9

50b015a2-ece7-11ee-a297-92fbcf53809c.png

第二步:請使用下面的命令激活虛擬環(huán)境并安裝依賴包,并啟動Jupyter Notebooks

conda activate openvino_env
pip install -r requirements.txt

511c6d4c-ece7-11ee-a297-92fbcf53809c.png

jupyter lab notebooks

5143f5f6-ece7-11ee-a297-92fbcf53809c.png

4.2

下載模型到本地

請使用命令將ChatGLM3 6B和text2vec模型下載到本地

git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

51638e98-ece7-11ee-a297-92fbcf53809c.png

git clone https://www.modelscope.cn/Jerry0/text2vec-large-chinese.git

5179773a-ece7-11ee-a297-92fbcf53809c.png

4.3

運行254-rag-chatbot程序

請運行Notebooks里面的代碼模塊, 注意!! 國內(nèi)用戶請勿運行模塊1,從模塊2開始一步步運行代碼到NNCF模塊,模型壓縮選擇int4并按照下圖一及二圖修改notebooks 254里的代碼引導程序指定對應的模型路徑完成ChatGLM3-6b模型int 4量化及部署

519b22c2-ece7-11ee-a297-92fbcf53809c.png

圖一

51b0f96c-ece7-11ee-a297-92fbcf53809c.png

圖二

text2vec-large-chinese 模型部署

51d88414-ece7-11ee-a297-92fbcf53809c.png

運行結(jié)果,如下所示:本地知識庫已成功加入ChatGLM 6B模型里并精確回答問題

51f27da6-ece7-11ee-a297-92fbcf53809c.png

運行視頻.avi

5

總結(jié)

將RAG技術(shù)與企業(yè)本地知識庫相結(jié)合,可以為企業(yè)提供實時、自動化、個性化和定制化的信息處理和決策支持。這將有助于企業(yè)更好地應對快速變化的市場環(huán)境,提高企業(yè)的競爭力和創(chuàng)新能力。

利用OpenVINO 工具套件簡單易用,僅需三步即可在算力魔方完成開發(fā)環(huán)境搭建及模型的INT4量化且在英特爾集成顯卡上的部署實現(xiàn)RAG企業(yè)本地知識庫部署。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10327

    瀏覽量

    181153
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5610

    瀏覽量

    124661
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3805

    瀏覽量

    5282
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    118

    瀏覽量

    818

原文標題:英特爾集成顯卡+ChatGLM3大語言模型的企業(yè)本地AI知識庫部署 | 開發(fā)者實戰(zhàn)

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI工作站本地養(yǎng)龍蝦!英特爾雙芯混合算力,告別云端Token焦慮

    4月23日,英特爾公司在北京舉辦新一代AI工作站平臺發(fā)布會,英特爾中國區(qū)技術(shù)部總經(jīng)理高宇宣布,面向AI工作站,英特爾推出兩大重磅產(chǎn)品:
    的頭像 發(fā)表于 04-26 16:27 ?1.1w次閱讀
    <b class='flag-5'>AI</b>工作站<b class='flag-5'>本地</b>養(yǎng)龍蝦!<b class='flag-5'>英特爾</b>雙芯混合算力,告別云端Token焦慮

    AI模型微調(diào)企業(yè)項目實戰(zhàn)課

    作畫上表現(xiàn)優(yōu)異,但一旦面對企業(yè)內(nèi)部特定的專業(yè)術(shù)語、復雜的業(yè)務流程或私有的行業(yè)知識庫,往往會表現(xiàn)出令人失望的“幻覺”與外行。 更致命的是數(shù)據(jù)安全邊界。將涉及財務、法務、客戶隱私的敏感數(shù)據(jù)直接上傳給第三方
    發(fā)表于 04-16 18:48

    開發(fā)知識庫測試添加知識庫

    文檔類型的知識要等待數(shù)據(jù)校驗完成后才能上架 可以點擊知識名稱查看知識詳情 等待后端處理完成可以點擊知識列表的上架 在智能體中知識庫的位置點
    發(fā)表于 03-06 15:07

    鴻蒙智能體開發(fā)知識庫---創(chuàng)建知識庫

    在小藝智能體平臺頁面,通過【工作空間】-【知識庫】-【新建知識庫】,進入新建知識庫流程。 若勾選【授權(quán)知識庫用于知識問答,授權(quán)后該
    發(fā)表于 03-06 10:18

    AI基礎設施中部署語言模型的三大舉措

    文:Gartner研究副總裁周玲中國企業(yè)機構(gòu)已逐步在生產(chǎn)環(huán)境中運行或者計劃運行大語言模型,但在AI基礎設施的生產(chǎn)部署與高效運營方面仍面臨諸多
    的頭像 發(fā)表于 02-09 16:28 ?573次閱讀
    在<b class='flag-5'>AI</b>基礎設施中<b class='flag-5'>部署</b>大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>的三大舉措

    英特爾創(chuàng)新引領AI NAS:軟硬結(jié)合引領本地數(shù)據(jù)智慧管理與多場景創(chuàng)新應用

    展示面向中小企業(yè)、消費者和專業(yè)用戶,賦能新場景、加速產(chǎn)品落地的最新技術(shù)方案。會上,綠聯(lián)、極空間、鐵威馬、暢網(wǎng)、飛牛等AI NAS 廠商,發(fā)布和展示了一系列基于英特爾? 酷睿? Ultra處理器和
    的頭像 發(fā)表于 12-12 15:45 ?758次閱讀
    <b class='flag-5'>英特爾</b>創(chuàng)新引領<b class='flag-5'>AI</b> NAS:軟硬結(jié)合引領<b class='flag-5'>本地</b>數(shù)據(jù)智慧管理與多場景創(chuàng)新應用

    發(fā)力圖形工作站和AI推理市場,英特爾大顯存GPU亮相灣芯展

    英特爾發(fā)布了面向?qū)I(yè)的銳炫Pro B50和B60。這兩款顯卡比較RTX2000和5660Ti,有哪些性能上的優(yōu)勢?在支持AI推理工作站和大模型部署
    的頭像 發(fā)表于 10-22 13:40 ?1.2w次閱讀
    發(fā)力圖形工作站和<b class='flag-5'>AI</b>推理市場,<b class='flag-5'>英特爾</b>大顯存GPU亮相灣芯展

    本地部署openWebUI + ollama+DeepSeek 打造智能知識庫并實現(xiàn)遠程訪問

    。 DeepSeek 作為一個開源的大語言模型,我們可以通過 ZeroNews + openWebUI + ollama的方式,輕松的在本地私有化部署 DeepSeek,不受網(wǎng)絡攻擊影
    的頭像 發(fā)表于 09-10 16:41 ?5545次閱讀
    <b class='flag-5'>本地</b><b class='flag-5'>部署</b>openWebUI + ollama+DeepSeek 打造智能<b class='flag-5'>知識庫</b>并實現(xiàn)遠程訪問

    英特爾可變顯存技術(shù)讓32GB內(nèi)存筆記本流暢運行Qwen 30B大模型

    英特爾? 酷睿? Ultra 200H處理器和32GB內(nèi)存的AI PC上,英特爾可變顯存技術(shù)(Intel Variable VRAM Technology)可以將VRAM分配比例從57%提升到87%1
    的頭像 發(fā)表于 08-14 15:39 ?2042次閱讀

    硬件與應用同頻共振,英特爾Day 0適配騰訊開源混元大模型

    今日,騰訊正式發(fā)布新一代混元開源大語言模型。英特爾憑借在人工智能領域的全棧技術(shù)布局,現(xiàn)已在英特爾? 酷睿? Ultra 平臺上完成針對該模型
    的頭像 發(fā)表于 08-07 14:42 ?1567次閱讀
    硬件與應用同頻共振,<b class='flag-5'>英特爾</b>Day 0適配騰訊開源混元大<b class='flag-5'>模型</b>

    主控CPU全能選手,英特爾至強6助力AI系統(tǒng)高效運轉(zhuǎn)

    2025年3月,英偉達發(fā)布了DGX B300 AI加速計算平臺。2025年5月,英特爾發(fā)布了三款全新英特爾至強6性能核處理器,其中一款6776P被用作是DGX B300的主控CPU,這
    的頭像 發(fā)表于 06-27 11:44 ?1062次閱讀
    主控CPU全能選手,<b class='flag-5'>英特爾</b>至強6助力<b class='flag-5'>AI</b>系統(tǒng)高效運轉(zhuǎn)

    英特爾發(fā)布邊緣AI控制器與邊緣智算一體機,創(chuàng)造“AI新視界”

    處理器的邊緣 AI 控制器 和 基于英特爾銳炫 ? 顯卡的邊緣智算一體機 ,為工業(yè)AI的規(guī)?;涞刈⑷霃妱艅恿Α?英特爾與諾達佳聯(lián)合發(fā)布邊緣
    發(fā)表于 06-24 17:50 ?1584次閱讀
    <b class='flag-5'>英特爾</b>發(fā)布邊緣<b class='flag-5'>AI</b>控制器與邊緣智算一體機,創(chuàng)造“<b class='flag-5'>AI</b>新視界”

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    B60和英特爾銳炫Pro B50 GPU,AI加速器產(chǎn)品—英特爾Gaudi 3 AI加速器。 英特爾
    的頭像 發(fā)表于 05-21 00:57 ?7807次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾銳炫Pro B60和
    的頭像 發(fā)表于 05-20 12:27 ?5715次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準專業(yè)用戶和AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3 AI
    發(fā)表于 05-20 11:03 ?1932次閱讀
    德州市| 乌兰察布市| 咸丰县| 韶关市| 策勒县| 都兰县| 邻水| 陇南市| 茶陵县| 南溪县| 博客| 芜湖县| 彩票| 安康市| 冕宁县| 长乐市| 山丹县| 安丘市| 望谟县| 报价| 凤城市| 本溪市| 鸡泽县| 芦溪县| 固安县| 偃师市| 新昌县| 喀什市| 平武县| 大宁县| 柞水县| 信丰县| 普兰县| 南康市| 银川市| 澎湖县| 张家港市| 德格县| 庄浪县| 江口县| 吉安县|