日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenVINO? 賦能千元級(jí)『哪吒』AI開發(fā)套件大語言模型 | 開發(fā)者實(shí)戰(zhàn)

研揚(yáng)科技AAEON ? 2024-01-06 08:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

以下文章來源于英特爾物聯(lián)網(wǎng) ,作者武卓

作者:英特爾AI軟件布道師 武卓 博士

人工智能的飛速發(fā)展中,大語言模型,如Stable-Zephyr-3b,已成為研究和應(yīng)用的熱點(diǎn)。這些模型以其強(qiáng)大的文本理解和生成能力在多個(gè)領(lǐng)域大放異彩。然而,大多數(shù)高性能模型通常需要昂貴的計(jì)算資源,使得它們的應(yīng)用受限于有限的環(huán)境。本文將探討在OpenVINO的賦能下,如何在不足千元的AI開發(fā)板上部署Stable-Zephyr-3b模型,構(gòu)建聊天機(jī)器人,成為實(shí)現(xiàn)AI無處不在愿景的重要組成部分之一。

Stable Zephyr 3B是一個(gè)先進(jìn)的大語言模型,擁有30億參數(shù),它在多個(gè)語言處理任務(wù)上顯示出了優(yōu)異的性能。這個(gè)模型特別是在大小相對(duì)較小的情況下,比許多流行模型都要出色,這表明了它高效的參數(shù)使用和強(qiáng)大的學(xué)習(xí)能力。該模型的訓(xùn)練靈感來自于HugginFaceH4的Zephyr 7B訓(xùn)練管道,這是一個(gè)專注于高效訓(xùn)練和性能優(yōu)化的系統(tǒng)。Stable Zephyr 3B是在混合的數(shù)據(jù)集上進(jìn)行訓(xùn)練的,包括了公開可用的數(shù)據(jù)集和通過直接偏好優(yōu)化(DPO)技術(shù)生成的合成數(shù)據(jù)集。DPO是一種優(yōu)化技術(shù),它直接在模型的偏好上施加約束,以產(chǎn)生更高質(zhì)量的數(shù)據(jù)供模型學(xué)習(xí)。

該模型的性能評(píng)估是基于MT Bench和Alpaca Benchmark,這兩個(gè)基準(zhǔn)都是在業(yè)界公認(rèn)的,用以衡量語言模型在多種任務(wù)上的效能。通過這些嚴(yán)格的評(píng)估,Stable Zephyr 3B展現(xiàn)了其在理解和生成語言方面的卓越能力。更多關(guān)于模型的架構(gòu)、訓(xùn)練過程、使用的數(shù)據(jù)集以及在各項(xiàng)評(píng)估中的表現(xiàn)的信息可以在模型卡片中找到。

此文使用了研揚(yáng)科技針對(duì)邊緣AI行業(yè)開發(fā)者推出了哪吒(Nezha)開發(fā)套件以信用卡大?。?5 x 56mm)的開發(fā)板-哪吒(Nezha)為核心,哪吒采用Intel N97處理器(Alder Lake-N),最大睿頻3.6GHz,IntelUHD Graphics內(nèi)核GPU,可實(shí)現(xiàn)高分辨率顯示;板載LPDDR5內(nèi)存、eMMC存儲(chǔ)及TPM 2.0,配備GPIO接口,支持Windows和Linux操作系統(tǒng),這些功能和無風(fēng)扇散熱方式相結(jié)合,為各種應(yīng)用程序構(gòu)建高效的解決方案,適用于如自動(dòng)化、物聯(lián)網(wǎng)網(wǎng)關(guān)、數(shù)字標(biāo)牌和機(jī)器人等應(yīng)用。

要在這些資源有限的設(shè)備上運(yùn)行如Stable-Zephyr-3b這樣的大型模型,模型的壓縮和優(yōu)化是關(guān)鍵。借助OpenVINO提供的模型優(yōu)化工具NNCF,可以將模型量化壓縮為INT4精度的模型,從而可以大幅度減少模型的大小和計(jì)算需求,而保持相對(duì)較高的性能。接下來,就讓我們通過我們常用的OpenVINO Notebooks倉(cāng)庫(kù)中關(guān)于Stable Zephyr 3B模型的Jupyter Notebook代碼和拆解,來進(jìn)一步了解具體步驟吧。(Jupyter notebook代碼地址:

https://github.com/openvinotoolkit/openvino_notebooks/tree/main/notebooks/273-stable-zephyr-3b-chatbot )

第一步:安裝相應(yīng)工具包

為了方便模型轉(zhuǎn)換步驟和模型性能評(píng)估,我們將使用llm_bench(https://github.com/openvinotoolkit/openvino.genai/tree/master/llm_bench/python )工具,該工具提供了一種統(tǒng)一的方法來估計(jì)大語言模型(LLM)的性能。它基于由Optimum-Intel提供的管道,并允許使用幾乎相同的代碼來估計(jì)Pytorch和OpenVINO模型的性能。

首先git clone llm_bench所在的代碼倉(cāng)庫(kù):

from pathlibimport Path

import sys

genai_llm_bench = Path("openvino.genai/llm_bench/python")

ifnot genai_llm_bench.exists():

!git clone https://github.com/openvinotoolkit/openvino.genai.git


sys.path.append(str(genai_llm_bench))

并進(jìn)行相關(guān)Python包的安裝:

%pip uninstall -q -y optimum-intel optimum

%pip install -q --extra-index-url https://download.pytorch.org/whl/cpu -r ./openvino.genai/llm_bench/python/requirements.txt

%pip uninstall -q -y openvino openvino-dev openvino-nightly

%pip install -q openvino-nightly


第二步:將模型轉(zhuǎn)換為OpenVINO IR格式,并利用NNCF將模型權(quán)重壓縮為INT4精度
llm_bench提供了一個(gè)轉(zhuǎn)換腳本,用于將大語言模型轉(zhuǎn)換為與Optimum-Intel兼容的OpenVINO IR格式。它還允許使用NNCF將模型權(quán)重壓縮為INT8或INT4精度。要啟用INT4的權(quán)重壓縮,我們應(yīng)該使用--compress_weights 4BIT_DEFAULT 參數(shù)。權(quán)重壓縮算法旨在壓縮模型的權(quán)重,并可用于優(yōu)化大模型的占用空間和性能。與INT8壓縮相比,INT4壓縮進(jìn)一步提高了性能,但會(huì)引入輕微的預(yù)測(cè)質(zhì)量下降。

model_path = Path("stable-zephyr-3b/pytorch/dldt/compressed_weights/OV_FP16-4BIT_DEFAULT")


convert_script = genai_llm_bench / "convert.py"


!python $convert_script --model_id stabilityai/stable-zephyr-3b --precision FP16 --compress_weights 4BIT_DEFAULT --output stable-ze

第三步:評(píng)估模型性能

openvino.genai / llm_bench / python / benchmark.py腳本允許在特定輸入提示上估計(jì)文本生成管道的推理,給定最大生成分詞的數(shù)量。模型性能評(píng)估以時(shí)延為主。

benchmark_script = genai_llm_bench /"benchmark.py"


!python $benchmark_script -m $model_path -ic512 -p"Tell me story about cats"

運(yùn)行結(jié)果如下:

wKgaomWyIQ6AGxQ-AAS7PdK1uEA461.png

第四步:應(yīng)用狀態(tài)變換來自動(dòng)處理模型狀態(tài)

Stable Zephyr是一種自回歸的解碼器變換器模型,它通過緩存先前計(jì)算的隱藏狀態(tài)來優(yōu)化生成過程和內(nèi)存使用,避免每次生成新令牌時(shí)重復(fù)計(jì)算。隨著模型和注意力塊的增大,處理長(zhǎng)序列的緩存策略可能對(duì)內(nèi)存系統(tǒng)構(gòu)成挑戰(zhàn)。因此,OpenVINO提出了一種轉(zhuǎn)換策略,將緩存邏輯內(nèi)置于模型中以降低內(nèi)存消耗并優(yōu)化性能。您可以通過在轉(zhuǎn)換步驟中使用--stateful標(biāo)志添加有狀態(tài)轉(zhuǎn)換來估計(jì)模型性能。

stateful_model_path = Path("stable-zephyr-3b-stateful/pytorch/dldt/compressed_weights/OV_FP16-4BIT_DEFAULT")
!python $convert_script --model_id stabilityai/stable-zephyr-3b --precision FP16 --compress_weights 4BIT_DEFAULT --output stable-zephyr-3b-stateful --force_convert --stateful

第五步:利用Optimum-Intel加載模型并在基于Gradio搭建的用戶界面上運(yùn)行模型
同樣地,這個(gè)模型也可以用Optimum-Intel工具包里定義的OVModelForCausalLM 流水線來加載模型和運(yùn)行推理,代碼如下:

from utils.ov_model_classesimport register_normalized_configs

from optimum.intel.openvinoimport OVModelForCausalLM

from transformers import AutoConfig


# Load model into Optimum Interface

register_normalized_configs()


ov_model = OVModelForCausalLM.from_pretrained(model_path, compile=False, config=AutoConfig.from_pretrained(stateful_model_path, trust_remote_code=True), stateful=True)

和我們的很多大預(yù)言模型和生成式AI的Notebook示例代碼一樣,在這個(gè)Notebook中,我們也提供了基于Gradio編寫的用戶友好的使用界面。最終在我們的哪吒開發(fā)板上運(yùn)行該模型的推理。

整個(gè)的步驟就是這樣!現(xiàn)在就開始跟著我們提供的代碼和步驟,動(dòng)手試試用OpenVINO在哪吒開發(fā)板上運(yùn)行基于大語言模型的聊天機(jī)器人吧。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41326

    瀏覽量

    302722
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50367

    瀏覽量

    267064
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    118

    瀏覽量

    818
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Vibe Coding AI全棧開發(fā)實(shí)戰(zhàn)

    ”或“直覺編程”,它并非某種具體的編程語言或框架,而是一種融合了AI輔助開發(fā)、直覺化編程和高效迭代的實(shí)戰(zhàn)思維方式。在這種模式下,開發(fā)者不再需
    發(fā)表于 04-15 16:02

    5G智能物聯(lián)網(wǎng)課程之人工智能開發(fā)(SC171開發(fā)套件V2-FAS)

    ://bbs.elecfans.com/jishu_2510649_1_1.html 大模型實(shí)戰(zhàn)(SC171開發(fā)套件V2-FAS) https://bbs.elecfans.com/jishu_2510652_1_1.html
    發(fā)表于 02-11 14:59

    模型實(shí)戰(zhàn)(SC171開發(fā)套件V2-FAS)

    模型實(shí)戰(zhàn)(SC171開發(fā)套件V2-FAS) 序列 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 工程源碼 1 大語言模型(Qwen3)案
    發(fā)表于 02-11 14:57

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V2-FAS)

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V2-FAS) 序列 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack
    發(fā)表于 02-11 11:44

    SC171開發(fā)套件V3 技術(shù)資料 2026版

    /jishu_2509050_1_1.html AI功能(SC171開發(fā)套件V3)2026版 https://bbs.elecfans.com/jishu_2509052_1_1.html 大模型
    發(fā)表于 01-15 12:13

    模型實(shí)戰(zhàn)(SC171開發(fā)套件V3)2026版

    模型實(shí)戰(zhàn)(SC171開發(fā)套件V3)2026版 序列 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 工程源碼 1 火山引擎大模型調(diào)試指南 6分53秒 https://t.elecfa
    發(fā)表于 01-15 12:05

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版 序列 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack
    發(fā)表于 01-15 10:31

    SC171開發(fā)套件V3 技術(shù)資料 2026版

    ://bbs.elecfans.com/jishu_2509052_1_1.html 大模型實(shí)戰(zhàn)(SC171開發(fā)套件V3)2026版 https://bbs.elecfans.com/jishu_2509055_1_1.html
    發(fā)表于 01-09 10:03

    DA14535 USB開發(fā)套件硬件解析:開啟低功耗藍(lán)牙開發(fā)新征程

    DA14535 USB開發(fā)套件硬件解析:開啟低功耗藍(lán)牙開發(fā)新征程 在當(dāng)今的電子設(shè)備開發(fā)領(lǐng)域,低功耗藍(lán)牙技術(shù)因其廣泛的應(yīng)用前景和高效的性能表現(xiàn),受到了眾多開發(fā)者的青睞。Renesas的D
    的頭像 發(fā)表于 12-29 11:00 ?1226次閱讀

    探秘 CYSBSYSKIT - DEV - 01 快速物聯(lián)網(wǎng)連接開發(fā)者套件

    探秘 CYSBSYSKIT - DEV - 01 快速物聯(lián)網(wǎng)連接開發(fā)者套件 引言 在物聯(lián)網(wǎng)迅猛發(fā)展的今天,快速、高效地實(shí)現(xiàn)物聯(lián)網(wǎng)連接是開發(fā)者們追求的目標(biāo)。CYSBSYSKIT - DEV - 01
    的頭像 發(fā)表于 12-21 15:35 ?917次閱讀

    瑞芯微RV1126B開發(fā)套件評(píng)測(cè)大賽正式開賽!

    大賽簡(jiǎn)介EASYEAI靈眸科技正式啟動(dòng)2025年首屆“瑞芯微RV1126B開發(fā)套件評(píng)測(cè)大賽”,以“硬核實(shí)踐,未來”為主題,面向開發(fā)者開放價(jià)值835
    的頭像 發(fā)表于 10-27 09:12 ?3039次閱讀
    瑞芯微RV1126B<b class='flag-5'>開發(fā)套件</b>評(píng)測(cè)大賽正式開賽!

    128 秒殺千元配置!明遠(yuǎn)智睿 H618 核心板,讓開發(fā)者告別開發(fā)困境?

    在嵌入式開發(fā)領(lǐng)域,開發(fā)者們常常面臨著 “高成本與低效率” 的雙重困境。想要一款性能達(dá)標(biāo)、接口豐富的核心板,預(yù)算動(dòng)輒就要上千元,對(duì)于小型團(tuán)隊(duì)或個(gè)人開發(fā)者來說,無疑是一筆不小的負(fù)擔(dān);即便咬
    的頭像 發(fā)表于 10-24 17:53 ?1372次閱讀

    NVIDIA Jetson AGX Thor開發(fā)者套件重磅發(fā)布

    開發(fā)者與未來創(chuàng)造們,準(zhǔn)備好迎接邊緣AI的史詩級(jí)革新了嗎?NVIDIA以顛覆性技術(shù)再次突破極限,正式推出Jetson AGX Thor開發(fā)者
    的頭像 發(fā)表于 08-28 14:31 ?1801次閱讀

    NVIDIA Jetson AGX Thor開發(fā)者套件概述

    NVIDIA Jetson AGX Thor 開發(fā)者套件為您提供出色的性能和可擴(kuò)展性。它由 NVIDIA Blackwell GPU和128 GB 顯存提供動(dòng)力支持,提供高達(dá) 2070 FP4
    的頭像 發(fā)表于 08-11 15:03 ?2104次閱讀

    時(shí)識(shí)科技推出XyloAudio 3神經(jīng)形態(tài)開發(fā)套件

    時(shí)識(shí)科技(SynSense)推出的XyloAudio 3神經(jīng)形態(tài)開發(fā)套件,為邊緣AI音頻處理樹立全新效標(biāo)桿!基于類腦計(jì)算技術(shù),XyloAudio 3專為實(shí)時(shí)聲音檢測(cè)與分類場(chǎng)景打造,以超低功耗(<1毫瓦)和毫秒
    的頭像 發(fā)表于 05-15 15:07 ?1538次閱讀
    時(shí)識(shí)科技推出XyloAudio 3神經(jīng)形態(tài)<b class='flag-5'>開發(fā)套件</b>
    开封县| 特克斯县| 怀安县| 龙门县| 庆云县| 霍邱县| 沈丘县| 新昌县| 牡丹江市| 广西| 三亚市| 邢台市| 阳朔县| 呼伦贝尔市| 义马市| 天祝| 绥化市| 彰化县| 成都市| 苗栗县| 杭州市| 美姑县| 南皮县| 灵武市| 绥化市| 万载县| 准格尔旗| 伊川县| 云阳县| 毕节市| 玉龙| 景泰县| 闵行区| 汤阴县| 高青县| 新余市| 太仓市| 和政县| 黄浦区| 万全县| 扶沟县|