日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾OpenVINO 2025.0正式發(fā)布

英特爾物聯(lián)網(wǎng) ? 來源:OpenVINO 中文社區(qū) ? 2025-02-21 10:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:OpenVINO 中文社區(qū)

作者:

武卓英特爾 OpenVINO 布道師

生成式AI(GenAI)在模型質(zhì)量與應(yīng)用范圍上持續(xù)爆發(fā)式增長,DeepSeek 等頂尖模型已引發(fā)行業(yè)熱議,這種勢頭預(yù)計將在 2025年延續(xù)。本次更新聚焦性能提升、更多生成式AI 模型的支持,并針對英特爾神經(jīng)處理單元(NPU)推出關(guān)鍵優(yōu)化。讓我們來一探究竟吧!

新增圖像生成場景與模型支持

OpenVINO 2025.0 版本正式支持FLUX.1 圖像生成模型(含Dev與Schnell變體),可在英特爾 CPU/GPU 上通過 GenAI 流水線運(yùn)行。開發(fā)者現(xiàn)可通過 Optimum-Intel 導(dǎo)出 Flux 模型,并結(jié)合 Text2ImagePipeline 生成圖像。針對 Flux 模型對精度變化非常敏感的特點(diǎn),我們進(jìn)行了深度優(yōu)化,確保圖像生成性能與準(zhǔn)確度兼得。

LoRA適配器:模型定制利器

自前期版本起,OpenVINO 已支持基于 Safetensor 文件的LoRA 低秩適配技術(shù),無需重新編譯即可動態(tài)切換 LoRA 適配器,從而快速方便的生成不同定制化風(fēng)格的圖像。本次更新進(jìn)一步擴(kuò)展至 Flux 模型家族,開發(fā)者可直接從 Hugging Face Hub 下載適配器,通過 GenAI 的 Text2ImagePipeline 快速實(shí)現(xiàn)風(fēng)格定制。

示例:

LoRA 增強(qiáng)的 FLUX.1-Dev 圖像生成效果


展示了 INT8 量化版 FLUX.1-dev 模型在應(yīng)用 Yarn 風(fēng)格 LoRA 前后的對比(提示詞:"albert einstein, yarn art style",初始種子=420,迭代次數(shù)=20):

新場景支持:Image2Image 與 Inpainting

新增Image2ImageInpainting流水線(預(yù)覽版),解鎖更可控的創(chuàng)作方式:

Image2Image:以圖像+文本為輸入生成新圖像,提升結(jié)果可控性;

Inpainting:通過掩碼圖像替換輸入圖像的指定區(qū)域,支持局部內(nèi)容再生。

兩種流水線均兼容 LoRA 適配器,滿足定制化需求。

文本生成場景優(yōu)化

本次新版本在 LLMPipeline API 中引入了對提示詞查找解碼的預(yù)覽支持,這是對推測解碼的簡化,它在輸入提示詞本身中用直接查找機(jī)制取代了傳統(tǒng)的草稿模型。這有助于在具有高相似性的請求的情況下顯著減少生成延遲。例如,通過對一組文檔的問答可以觀察到性能優(yōu)勢,因?yàn)榇鸢笇⒏鶕?jù)作為提示詞本身一部分的文檔來生成。

如我們的示例所示,只需對 LLMPipeline 中的代碼進(jìn)行很小的修改,即可啟用此功能??偨Y(jié)來說,您需要將提示查找作為流水線中的一個參數(shù)啟用,并修改生成配置以添加兩個重要參數(shù):在提示詞中查找多少 token 數(shù)以及匹配后取多少 token 數(shù)。

生成過程中的內(nèi)存使用是運(yùn)行應(yīng)用的一個重要考慮因素,因?yàn)?LLM 權(quán)重非常占用內(nèi)存。KV Cache 代表了額外的內(nèi)存消耗,并且可能會增長得相當(dāng)大。我們引入了 KV Cache 的壓縮作為一種減少內(nèi)存消耗的技術(shù),在這個版本中,我們默認(rèn)在 CPU 上啟用它。為了確保壓縮的準(zhǔn)確性,我們引入了非對稱 INT8 壓縮,被證明是總體來說最準(zhǔn)確的壓縮方式。如果需要,INT4 壓縮也可作為進(jìn)一步減少內(nèi)存消耗的選項(xiàng)。在未來的版本中,我們計劃啟用更多的壓縮技術(shù),請持續(xù)關(guān)注。

另外,我們一直在努力支持和驗(yàn)證最新的模型,包括 Mistral-7B-Instruct-v0.2、Qwen2.5,當(dāng)然我們也支持基于 LLama 和 Qwen 架構(gòu)的 DeepSeek 蒸餾模型。您可以探索我們的新的使用 DeepSeek-R1 蒸餾模型進(jìn)行 LLM 推理的 Notebook 代碼示例,并查看下面與英特爾 酷睿 Ultra 200V GPU 上的 DeepSeek-R1-Llama-8b 模型的對話:

https://github.com/openvinotoolkit/openvino_notebooks/tree/latest/notebooks/deepseek-r1

通過 torch.compile

支持英特爾 NPU

2025.0 版本首次實(shí)現(xiàn) NPU 加速支持,開發(fā)者可通過 PyTorch 的 torch.compile 接口調(diào)用英特爾 NPU 算力。OpenVINO 作為 torch.compile 生態(tài)系統(tǒng)中的編譯器已經(jīng)面世一段時間了。它已經(jīng)在 CPU 和 GPU 上得到支持,并且在性能方面非常接近原生 OpenVINO 推理。在 2025.0 版本中,我們將推出對 Intel NPU 作為推理設(shè)備的預(yù)覽支持。這包括對 TorchVision、Timm 和 TorchBench 存儲庫中的300多個模型的支持。

啟用方式非常簡單,只需要增加如下兩行代碼:

b6c39f82-ef73-11ef-9310-92fbcf53809c.png

結(jié)果因模型而異,因此建議您嘗試使用自己的模型以查看性能的提升情況。同時我們建議在英特爾 酷睿 Ultra Series 2 及更高版本的平臺上使用此功能。

總結(jié)

隨著我們迎來激動人心的新一年,生成式AI的潛力繼續(xù)重塑我們的創(chuàng)造、工作和創(chuàng)新方式。

借助 OpenVINO 2025.0,我們提供了更多的模型覆蓋、更快的推理性能和擴(kuò)展的英特爾 NPU 支持。這只是一個開始——今年我們?nèi)暧媱澃l(fā)布更多版本,請繼續(xù)關(guān)注即將到來的更新!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10326

    瀏覽量

    181143
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136105
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3831

    瀏覽量

    52289
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    118

    瀏覽量

    818

原文標(biāo)題:開發(fā)者實(shí)戰(zhàn)|OpenVINO? 2025.0正式發(fā)布!DeepSeek支持、FLUX.1圖像生成、英特爾? NPU加速全面升級

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI工作站本地養(yǎng)龍蝦!英特爾雙芯混合算力,告別云端Token焦慮

    4月23日,英特爾公司在北京舉辦新一代AI工作站平臺發(fā)布會,英特爾中國區(qū)技術(shù)部總經(jīng)理高宇宣布,面向AI工作站,英特爾推出兩大重磅產(chǎn)品:英特爾
    的頭像 發(fā)表于 04-26 16:27 ?1.1w次閱讀
    AI工作站本地養(yǎng)龍蝦!<b class='flag-5'>英特爾</b>雙芯混合算力,告別云端Token焦慮

    釋放極致游戲性能!英特爾酷睿Ultra 200S Plus發(fā)布

    英特爾酷睿Ultra 200S Plus的內(nèi)容創(chuàng)作性能至高可達(dá)同類產(chǎn)品的兩倍,游戲性能平均提升 15%。其中,酷睿 Ultra 7 270K Plus 是英特爾迄今最快的臺式機(jī)游戲處理器。 最新發(fā)布
    的頭像 發(fā)表于 03-19 13:13 ?445次閱讀

    吉方工控亮相2025英特爾技術(shù)創(chuàng)新與產(chǎn)業(yè)生態(tài)大會

    2025年11月19日至20日,由英特爾公司主辦的年度重磅盛會——2025英特爾技術(shù)創(chuàng)新與產(chǎn)業(yè)生態(tài)大會(Intel Connection)暨英特爾行業(yè)解決方案大會(Edge Industry Summit)在重慶悅來國際會議中心
    的頭像 發(fā)表于 11-24 16:57 ?789次閱讀

    英特爾舉辦行業(yè)解決方案大會,共同打造機(jī)器人“芯”動脈

    11月19日,在2025英特爾行業(yè)解決方案大會上,英特爾展示了基于英特爾? 酷睿? Ultra平臺的最新邊緣AI產(chǎn)品及解決方案,并預(yù)覽了針對邊緣側(cè)的英特爾? 酷睿? Ultra處理器(
    的頭像 發(fā)表于 11-19 21:51 ?7159次閱讀
    <b class='flag-5'>英特爾</b>舉辦行業(yè)解決方案大會,共同打造機(jī)器人“芯”動脈

    美國政府將入股英特爾?

    據(jù)彭博社報道稱,特朗普政府正在與芯片制造商英特爾進(jìn)行談判,希望美國政府入股這家陷入困境的公司,隨后該公司股價周四上漲 7% 。 英特爾是唯一一家有能力在美國本土生產(chǎn)最快芯片的美國公司,盡管包括臺灣
    的頭像 發(fā)表于 08-17 09:52 ?1283次閱讀

    硬件與應(yīng)用同頻共振,英特爾Day 0適配騰訊開源混元大模型

    今日,騰訊正式發(fā)布新一代混元開源大語言模型。英特爾憑借在人工智能領(lǐng)域的全棧技術(shù)布局,現(xiàn)已在英特爾? 酷睿? Ultra 平臺上完成針對該模型的第零日(Day 0)部署與性能優(yōu)化。值得一提的是, 依托
    的頭像 發(fā)表于 08-07 14:42 ?1563次閱讀
    硬件與應(yīng)用同頻共振,<b class='flag-5'>英特爾</b>Day 0適配騰訊開源混元大模型

    使用英特爾? NPU 插件C++運(yùn)行應(yīng)用程序時出現(xiàn)錯誤:“std::Runtime_error at memory location”怎么解決?

    使用OpenVINO?工具套件版本 2024.4.0 構(gòu)建C++應(yīng)用程序 使用英特爾? NPU 插件運(yùn)行了 C++ 應(yīng)用程序 遇到的錯誤: Microsoft C++ exception: std::runtime_error at memory location
    發(fā)表于 06-25 08:01

    英特爾發(fā)布邊緣AI控制器與邊緣智算一體機(jī),創(chuàng)造“AI新視界”

    在2025北京機(jī)器視覺展覽會(VisionChina)以“AI 視界:英特爾推動智能制造革新浪潮”為主題的英特爾論壇中,英特爾與諾達(dá)佳聯(lián)合發(fā)布了 基于
    發(fā)表于 06-24 17:50 ?1583次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>發(fā)布</b>邊緣AI控制器與邊緣智算一體機(jī),創(chuàng)造“AI新視界”

    無法將Openvino? 2025.0與onnx運(yùn)行時Openvino? 執(zhí)行提供程序 1.16.2 結(jié)合使用,怎么處理?

    使用OpenVINO?與英特爾 i5-8500 CPU 和超核處理器 630 iGPU 一起部署模型。 使用了 Microsoft.ML.OnnxRuntime.OpenVino
    發(fā)表于 06-24 06:31

    為什么無法通過“pip install openvino-dev==2025.0.0”安裝 2025.0 OpenVINO??

    通過“pip install openvino-dev==2025.0.0OpenVINO? 2025.0 安裝。 收到的錯誤: ERROR: No matching distribution found for
    發(fā)表于 06-23 08:13

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    2025年6月19日,上?!?在MWC 25上海期間,英特爾展示了一幅由英特爾銳炫? Pro B系列GPU所驅(qū)動的“實(shí)時響應(yīng)、安全高效、成本可控”的邊緣AI圖景。 英特爾客戶端計算事業(yè)部邊緣計算
    的頭像 發(fā)表于 06-20 17:32 ?1083次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro B系列,邊緣AI的“智能引擎”

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    電子發(fā)燒友原創(chuàng)? 章鷹 5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾
    的頭像 發(fā)表于 05-21 00:57 ?7803次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅<b class='flag-5'>發(fā)布</b>新一代GPU,圖形和AI性能躍升3.4倍

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾銳炫Pro B60和
    的頭像 發(fā)表于 05-20 12:27 ?5713次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅<b class='flag-5'>發(fā)布</b>新一代GPU,圖形和AI性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準(zhǔn)專業(yè)用戶和AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3 AI加速器機(jī)架級和PCIe部署方案 ? 2025 年 5 月 19 日,北京 ——今日
    發(fā)表于 05-20 11:03 ?1931次閱讀

    Intel OpenVINO? Day0 實(shí)現(xiàn)阿里通義 Qwen3 快速部署

    本文將以 Qwen3-8B 為例,介紹如何利用 OpenVINO 的 Python API 在英特爾平臺(GPU, NPU)Qwen3 系列模型。
    的頭像 發(fā)表于 05-11 11:36 ?1917次閱讀
    Intel <b class='flag-5'>OpenVINO</b>? Day0 實(shí)現(xiàn)阿里通義 Qwen3 快速部署
    广宗县| 包头市| 高雄县| 宁津县| 甘德县| 神池县| 玉田县| 白城市| 江口县| 镇康县| 兴安县| 湘乡市| 塘沽区| 寿光市| 嘉定区| 南丹县| 卓尼县| 平顶山市| 治县。| 平定县| 岑溪市| 汉源县| 石阡县| 弥勒县| 荔波县| 福州市| 抚州市| 龙江县| 衡阳市| 沛县| 临高县| 凌海市| 花莲市| 鄂尔多斯市| 新密市| 宁都县| 剑川县| 平远县| 芦山县| 宝丰县| 托克逊县|