日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

成本打到6萬以下 手把手教你用4路銳炫? 顯卡+至強? W跑DeepSeek

話說科技 ? 來源:話說科技 ? 作者:話說科技 ? 2025-03-05 11:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

憑借卓越性能表現(xiàn)與先天開源優(yōu)勢,DeepSeek正迅速成為全球擴展大模型應(yīng)用實踐的一大“圓心”。作為英特爾GPU領(lǐng)域的重要布局,英特爾銳炫?顯卡既是游戲黨與視頻生產(chǎn)力工作者的新歡,也可用作計算卡,對DeepSeek提供加速支持,為企業(yè)用戶部署相關(guān)AI應(yīng)用提供一條全新的高價性比實現(xiàn)路徑。具體來說,就是與英特爾? 至強? 可擴展處理器或英特爾? 至強? W處理器搭配,以多卡配置的型態(tài)來運行和加速DeepSeek推理任務(wù)。

本文將在DeepSeek-R1- Distill-Qwen-32B推理場景下,以面向企業(yè)級應(yīng)用且成本最低可控制在5-6萬元人民幣的4 路英特爾銳炫? A770顯卡 + 至強? W處理器的解決方案為例,詳細(xì)闡述搭建硬件環(huán)境、配置驅(qū)動與軟件、優(yōu)化參數(shù)設(shè)置等步驟,手把手教大家部署和配置這一方案。

1. 軟硬件安裝配置與初始化

1.1 硬件安裝配置

硬件配置

處理器:英特爾? 至強? W 處理器(可選20核/24核/28核/32核)

內(nèi)存:8 x 32GB DDR5-3200

存儲:2TB M.2 固態(tài)盤

電源:≥2000瓦

GPU:4 x英特爾銳炫? A770顯卡

BIOS:設(shè)置Re-Size BAR Support為[Enabled]

wKgZPGfHw42AGHr-AAu-1HmO40M110.png

圖. 安裝4路英特爾銳炫? A770顯卡的AI工作站

在BIOS設(shè)置中,將Re-Size BAR Support設(shè)為[Enabled]

wKgZPGfHw46AMt6iAAEL3ji2k6k738.png

1.2 軟件安裝配置

軟件配置

操作系統(tǒng):Ubuntu22.04.1 LTS

內(nèi)核:6.5.0 - 35 - general

驅(qū)動程序:23.43.27642.67

vLLM Serving:intelanalytics/ipex-llm-serving-xpu:b11

安裝操作系統(tǒng)Ubuntu22.04.1 LTS(鏡像文件可訪問https://old-releases.ubuntu.com/releases/22.04.1/ubuntu-22.04.1-desktop-amd64.iso獲?。?。

進行硬件驗證,你要為每塊 GPU 顯卡都配備足額功耗來保證其工作正常。安裝完操作系統(tǒng)后,可通過以下命令檢查英特爾銳炫? A770顯卡是否正常加載:

~$ lspci | grep 56a0

18:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

36:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

54:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

cc:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

在確保 APT 網(wǎng)絡(luò)已連接,且你的賬號已具有 sudo 權(quán)限的情況下,需嚴(yán)格按以下步驟安裝驅(qū)動程序:

~$ wget -qO - https://repositories.intel.com/gpu/intel-graphics.key | sudo gpg --yes --dearmor --output /usr/share/keyrings/intel-graphics.gpg

~$ echo "deb [arch=amd64,i386 signed-by=/usr/share/keyrings/intel-graphics.gpg] https://repositories.intel.com/gpu/ubuntu jammy/lts/2350 unified" | sudo tee /etc/apt/sources.list.d/intel-gpu-jammy.list

~$ sudo apt update

如果內(nèi)核版本不是6.5.0-35,則通過以下命令安裝6.5.0-35版本:

~$ sudo apt-get install -y linux-image-6.5.0-35-generic linux-headers-6.5.0-35-generic linux-modules-6.5.0-35-generic linux-modules-extra-6.5.0-35-generic

~$ sudo apt install intel-i915-dkms

~$ sudo vim /etc/default/grub

GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 6.5.0-35-generic"

~$ sudo update-grub

~$ sudo reboot

然后通過以下命令安裝計算、媒體和顯示運行時庫:

~$ sudo apt install -y intel-opencl-icd intel-level-zero-gpu level-zero intel-media-va-driver-non-free libmfx1 libmfxgen1 libvpl2 libegl-mesa0 libegl1-mesa libegl1-mesa-dev libgbm1 libgl1-mesa-dev libgl1-mesa-dri libglapi-mesa libgles2-mesa-dev libglx-mesa0 libigdgmm12 libxatracker2 mesa-va-drivers mesa-vdpau-drivers mesa-vulkan-drivers va-driver-all vainfo hwinfo clinfo

通過以下命令將當(dāng)前用戶添加到 render 組:

~$ sudo gpasswd -a $(USER) render

~$ sudo newgrp render

驅(qū)動程序安裝完成后,建議使用以下命令進行驗證:

~$ clinfo | grep "Driver Version"

Driver Version 23.43.27642.67

1.3 在英特爾? 至強? W平臺上設(shè)置GPU的HDMI顯示

首先禁用 ast 卡:

~$ sudo vim /etc/modprobe.d/blacklist.conf

在文件底部添加“blacklist ast”:

~$ sudo update-initramfs -u

然后將窗口系統(tǒng)配置為wayland模式:

~$ sudo vim /etc/gdm3/custom.conf

將WaylandEnable設(shè)置為true:

wKgZO2fHw4-AOC_4AAAgJTuM9jg404.png

完成后更新初始RAM文件系統(tǒng)(initramfs)并重啟系統(tǒng),然后將HDMI線插入第一塊英特爾銳炫? A770顯卡即可完成顯示終端設(shè)置。

]# sudo update-initramfs -u

~$ sudo reboot

1.4 監(jiān)控工具xpu-smi安裝

可根據(jù)xpumanager repo安裝用于監(jiān)控和管理 XPU設(shè)備狀態(tài)信息的xpu-smi 工具。下載xpumanager并執(zhí)行以下命令:

~$ wgethttps://github.com/intel/xpumanager/releases/download/V1.2.27/xpu-smi_1.2.27_20240103.051106.5eeb3f13.u22.04_amd64.deb--no-check-certificate

~$ sudo apt install ./xpu-smi_1.2.27_20240103.051106.5eeb3f13.u22.04_amd64.deb

~$ xpu-smi discovery

結(jié)果顯示如下:

wKgZO2fHw5CAcfYQAADviP_iAj0890.png

大模型服務(wù)與聊天機器人演示

2.1容器(Docker)安裝及服務(wù)設(shè)置

用戶可通過 Docker,在英特爾銳炫? A770顯卡上使用 IPEX-LLM開展 vLLM 服務(wù)。Docker的安裝可參考:https://docs.docker.com/engine/install/ubuntu/

通過以下命令,設(shè)置CPU主頻至最大睿頻,并將顯卡鎖頻至2.4GHz:

~$ apt-get install linux-tools-6.5.0-35-generic linux-cloud-tools-6.5.0-35-generic

# Query max turbo frequency, like W3445, Max Turbo Frequency is 4.8GHz:

~$ sudo cpupower frequency-set -d 4.8GHz

~$ sudo xpu-smi config -d 0 -t 0 --frequencyrange 2400,2400

~$ sudo xpu-smi config -d 1 -t 0 --frequencyrange 2400,2400

~$ sudo xpu-smi config -d 2 -t 0 --frequencyrange 2400,2400

~$ sudo xpu-smi config -d 3 -t 0 --frequencyrange 2400,2400

2.2 安裝并啟動vLLM服務(wù)

下載并安裝以下vllm版本:

~$ docker pull intelanalytics/ipex-llm-serving-xpu:2.2.0-b11

從https://hf-mirror.com下載LLM模型到本地文件夾中(例如:/home/worker/LLM)。

從https://hf-mirror.com/collections/deepseek-ai/deepseek-r1-678e1e131c0169c0bc89728d下載蒸餾版模型。

wKgZPGfHw5GAA95DAAJ8my7FPPA204.png

將以下腳本放入/home/intel/Demo-4xArc中的 bachkend-ipex-docker.sh文件(以下操作都以DeepSeek-R1-Distill-Qwen-32B版為例):

wKgZO2fHw5GAVGAGAABx5A9-3lI967.png

將以下腳本放入vllm-deepseek-r1-distill-qwen-32b-openaikey.sh文件:

wKgZPGfHw5KAUn4eAAY3plxtWuk287.png

然后啟動容器和vLLM 服務(wù):

~$ sudo bash backend-ipex-docker.sh

~$ docker exec -it ipex-llm-b11 bash

~$ cd workspace & bash vllm-deepseek-r1-distill-qwen-32b-openaikey.sh

如下日志表明DeepSeek推理服務(wù)已啟動成功:

wKgZPGfHw5OAaXMwAAArL-UyUOg414.png

2.3 使用Chatbox AI進行性能測試

開發(fā)者可以在本地使用Chatbox AI進行LLM推理性能測試。如DeepSeek推理服務(wù)IP為192.168.10.110,在Windows PowerShell中執(zhí)行以下命令并輸入密碼,將遠程服務(wù)端口映射到本地:

wKgZO2fHw5SAKLFEAAA_3nNPbvY942.png

User> ssh -L 8001:localhost:8001 worker@192.168.10.110

打開Chatbox AI的Url(https://web.chatboxai.app/)

wKgZPGfHw5WAQmqGAACvpgvp-c0606.png

選擇 “User My Own API Key / Local Model”,點擊 “Add Custom Provider”,并根據(jù)下圖所示進行配置,手動輸入DeepSeek整流的模型名稱等信息:

wKgZPGfHw5aAPzgTAADoFFZOiA0842.png

wKgZO2fHw5eAIf6oAACqUPTFf5g816.png

由此,使用者可以在Chatbox AI中向大語言模型提問,測試其推理性能:

wKgZPGfHw5eAPmZWAAOGjab0Hg4253.png

vllm服務(wù)日志能夠顯示當(dāng)前的性能狀況,如圖中所示,基于多路英特爾銳炫? A770顯卡的推理服務(wù)一直有著30+ tokens/s的性能表現(xiàn)。

wKgZO2fHw5mAGn9fAAD7RUF11R8241.png

創(chuàng)新不止步:全新24GB銳炫? 顯卡與滿血版DeepSeek R1方案正在路上

本部署指南雖然是圍繞4路英特爾銳炫? A770顯卡的方案展開,且以DeepSeek-R1-Distill-Qwen-32B版為例,但我們的實踐探索并未局限于此。

一方面,該解決方案可對DeepSeek各個蒸餾版提供同樣靈活的支持。使用者可通過調(diào)整輸入模型名稱,以及設(shè)定并行使用的顯卡數(shù)量來進行調(diào)整(使用--tensor-parallel-size參數(shù)來控制)。

wKgZPGfHw5mAL76eAALHfNKD7Ws072.jpg

另一方面,多路英特爾銳炫?顯卡 + 英特爾? 至強? 可擴展處理器 /至強? W處理器方案的關(guān)鍵目標(biāo),還是鎖定在DeepSeek- R1-671B這一性能巔峰版本上,其配置與優(yōu)化方法很快就會與大家見面。預(yù)計其技術(shù)路徑會同時覆蓋基于KTransformer,能更充分發(fā)揮至強? 處理器內(nèi)置AI加速技術(shù)AMX潛能的方案,以及GPU配置密度更高的單機16路英特爾銳炫? 顯卡的方案。

另一個值得期待的進展,就是專為生產(chǎn)力應(yīng)用打造的新一代英特爾銳炫? 顯卡 B580 24G顯存版本也正向我們走來,其4張卡即可提供96GB的顯存容量,意味著用戶可在單機中更輕松地部署更大參數(shù)量的DeepSeek服務(wù)(例如DeepSeek- R1-671B版本),進而能在實戰(zhàn)中以較低的成本和較為便捷的部署方式,開啟不縮水的DeepSeek服務(wù)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 顯卡
    +關(guān)注

    關(guān)注

    17

    文章

    2523

    瀏覽量

    71730
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    855

    瀏覽量

    3416
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    射頻頭壞了只能扔?手把手教你維修排查TNC插頭,干貨值得收藏!

    射頻接頭壞了只能剪掉重做?未必!本文由電蜂優(yōu)選(elecbee)專家親授,深度拆解 TNC 插頭的維修排查全流程。從中心針偏移糾偏、氧化層化學(xué)清理到組裝式接頭的無損重組,手把手教你如何通過 VNA
    的頭像 發(fā)表于 04-14 17:12 ?169次閱讀
    射頻頭壞了只能扔?<b class='flag-5'>手把手</b><b class='flag-5'>教你</b>維修排查TNC插頭,干貨值得收藏!

    手把手教你選家電電源芯片:隔離 vs 非隔離全解析(附實測設(shè)計要點 + DIY 避坑指南)

    本文看點 ? 隔離 vs 非隔離電源核心差異,一眼看懂怎么選 ? 芯茂微4 款熱門芯片實測參數(shù) + 手把手設(shè)計要點 ? 8 類家電 / DIY 項目選型推薦,直接抄作業(yè) ? 紋波超標(biāo)、溫升過
    的頭像 發(fā)表于 04-14 14:40 ?287次閱讀
    <b class='flag-5'>手把手</b><b class='flag-5'>教你</b>選家電電源芯片:隔離 vs 非隔離全解析(附實測設(shè)計要點 + DIY 避坑指南)

    手把手教你學(xué)51單片機-C語言版

    ,沒有專業(yè)的人員帶領(lǐng)大家入門。 基于這些原因,我們編寫了這本《手把手教你學(xué)51單片機-C語言版》(第3版),并且配套了相關(guān)的視頻教程、電子教案、源代碼和實驗開發(fā)板(詳情瀏覽青島金思特電子有限公司網(wǎng)站獲取
    發(fā)表于 03-05 11:47

    從0到1,10+年資深LabVIEW專家,手把手教你攻克機器視覺+深度學(xué)習(xí)(5000分鐘實戰(zhàn)課)

    “告別檢測系統(tǒng)能力缺陷!10+年LabVIEW視覺資深專家手把手教你:5000+分鐘高清教程(含工具、算法原理、實戰(zhàn)操作、項目優(yōu)化全流程講解)”——從傳統(tǒng)視覺算法→深度學(xué)習(xí)建?!I(yè)級部署"
    的頭像 發(fā)表于 12-02 08:07 ?789次閱讀
    從0到1,10+年資深LabVIEW專家,<b class='flag-5'>手把手</b><b class='flag-5'>教你</b>攻克機器視覺+深度學(xué)習(xí)(5000分鐘實戰(zhàn)課)

    迅為Hi3403開發(fā)板極速啟航 | 手把手帶你玩轉(zhuǎn)核心例程,輕松上手AI視覺!

    迅為Hi3403開發(fā)板極速啟航 | 手把手帶你玩轉(zhuǎn)核心例程,輕松上手AI視覺!
    的頭像 發(fā)表于 11-19 13:56 ?1890次閱讀
    迅為Hi3403開發(fā)板極速啟航 | <b class='flag-5'>手把手</b>帶你玩轉(zhuǎn)核心例程,輕松上手AI視覺!

    【迅為RK3568開發(fā)板NPU實戰(zhàn)】別再閑置你的NPU!手把手教你玩轉(zhuǎn)RKNN-Toolkit2 的使用

    【迅為RK3568開發(fā)板NPU實戰(zhàn)】別再閑置你的NPU!手把手教你玩轉(zhuǎn)RKNN-Toolkit2 的使用
    的頭像 發(fā)表于 11-11 14:21 ?1572次閱讀
    【迅為RK3568開發(fā)板NPU實戰(zhàn)】別再閑置你的NPU!<b class='flag-5'>手把手</b><b class='flag-5'>教你</b>玩轉(zhuǎn)RKNN-Toolkit2 的使用

    【RK3568 NPU實戰(zhàn)】別再閑置你的NPU!手把手帶你迅為資料通Android AI檢測Demo,附完整流程與效果

    【RK3568 NPU實戰(zhàn)】別再閑置你的NPU!手把手帶你迅為資料通Android AI檢測Demo,附完整流程與效果
    的頭像 發(fā)表于 11-10 15:58 ?1272次閱讀
    【RK3568 NPU實戰(zhàn)】別再閑置你的NPU!<b class='flag-5'>手把手</b>帶你<b class='flag-5'>用</b>迅為資料<b class='flag-5'>跑</b>通Android AI檢測Demo,附完整流程與效果

    成本開源!手把手教你用樂鑫科技ESP32-P4開發(fā)板制作電腦監(jiān)測屏!

    你是否也遇到過這些困擾:電腦突然變得異??D,程序無響應(yīng)?想知道電腦狀態(tài),卻懶得每次都打開任務(wù)管理器?想要實時監(jiān)控系統(tǒng)性能,又沒有合適的工具?別擔(dān)心!今天我們教你一個簡單又低成本的方法——
    的頭像 發(fā)表于 11-04 18:05 ?946次閱讀
    低<b class='flag-5'>成本</b>開源!<b class='flag-5'>手把手</b><b class='flag-5'>教你用</b>樂鑫科技ESP32-P<b class='flag-5'>4</b>開發(fā)板制作電腦監(jiān)測屏!

    手把手教你AT指令A(yù)PN設(shè)置:專網(wǎng)連接零門檻!

    無論你的技術(shù)背景如何,本教程都將以手把手的方式,拆解AT指令A(yù)PN設(shè)置的全流程。專網(wǎng)連接不再是門檻,即刻開啟自主配置之旅! APN是設(shè)備連接到運營商網(wǎng)絡(luò)的“身份證” ——當(dāng)設(shè)備插入SIM卡并注冊到
    的頭像 發(fā)表于 09-04 14:40 ?1424次閱讀
    <b class='flag-5'>手把手</b><b class='flag-5'>教你</b>AT指令A(yù)PN設(shè)置:專網(wǎng)連接零門檻!

    汽車軟件團隊必看:基于靜態(tài)代碼分析工具Perforce QAC的ISO 26262合規(guī)實踐

    ISO 26262合規(guī)指南,從ASIL分級到工具落地,手把手教你用靜態(tài)代碼分析(Perforce QAC)實現(xiàn)高效合規(guī)。
    的頭像 發(fā)表于 08-07 17:33 ?1344次閱讀
    汽車軟件團隊必看:基于靜態(tài)代碼分析工具Perforce QAC的ISO 26262合規(guī)實踐

    RT-Thread Nano硬核移植指南:手把手實現(xiàn)VGLite圖形驅(qū)動適配 | 技術(shù)集結(jié)

    VGLite是NXP提供的輕量級2D圖形API,本文將手把手帶你實現(xiàn)VGLite圖形驅(qū)動適配RT-Thread。文章分為上、下兩篇,將手把手教您移植。上篇對RT-ThreadNano內(nèi)核與Finsh組件進行移植,下篇則教您改寫SDK中的VGLite代碼以將其適配到RT-T
    的頭像 發(fā)表于 07-17 14:40 ?3661次閱讀
    RT-Thread Nano硬核移植指南:<b class='flag-5'>手把手</b>實現(xiàn)VGLite圖形驅(qū)動適配 | 技術(shù)集結(jié)

    【教程】零基礎(chǔ)!手把手教你使用STM32F4進行E22-400T22S編程通信

    零基礎(chǔ)搭建本次實驗將會使用到的軟件是Keil和STM32CubeMX,沒有這兩個軟件沒有請在網(wǎng)上自行下載。本章節(jié)零基礎(chǔ)手把手教會你搭建最快捷、最簡單的STM32代碼
    的頭像 發(fā)表于 07-03 19:32 ?1869次閱讀
    【教程】零基礎(chǔ)!<b class='flag-5'>手把手</b><b class='flag-5'>教你</b>使用STM32F<b class='flag-5'>4</b>進行E22-400T22S編程通信

    【精選直播】手把手教你做PC第十二課:WIFI 驅(qū)動框架適配

    手把手教你做PC》系列直播課再度開播!《KaihongOS筆記本電腦開發(fā)實戰(zhàn)第十二課:WIFI驅(qū)動框架適配》將于07月02日19:00開播↑掃碼入群,領(lǐng)課程講義資料包↑深開鴻資深工程師親臨直播間
    的頭像 發(fā)表于 07-01 08:08 ?743次閱讀
    【精選直播】<b class='flag-5'>手把手</b><b class='flag-5'>教你</b>做PC第十二課:WIFI 驅(qū)動框架適配

    手把手教你如何調(diào)優(yōu)Linux網(wǎng)絡(luò)參數(shù)

    在高并發(fā)網(wǎng)絡(luò)服務(wù)場景中,Linux內(nèi)核的默認(rèn)網(wǎng)絡(luò)參數(shù)往往無法滿足需求,導(dǎo)致性能瓶頸、連接超時甚至服務(wù)崩潰。本文基于真實案例分析,從參數(shù)解讀、問題診斷到優(yōu)化實踐,手把手教你如何調(diào)優(yōu)Linux網(wǎng)絡(luò)參數(shù),支撐百萬級并發(fā)連接。
    的頭像 發(fā)表于 05-29 09:21 ?1223次閱讀

    正點原子Linux系列全新視頻教程來啦!手把手教你MP257開發(fā)板,讓您輕松入門!

    正點原子Linux系列全新視頻教程來啦!手把手教你MP257開發(fā)板,讓您輕松入門! 一、視頻觀看 正點原子手把手教你學(xué)STM32MP257-第1期:https://www.bilib
    發(fā)表于 05-16 10:42
    四子王旗| 定日县| 阳西县| 南阳市| 广东省| 崇左市| 会理县| 雅江县| 琼结县| 中江县| 鹰潭市| 永登县| 钦州市| 明光市| 环江| 桂东县| 门头沟区| 兴海县| 左贡县| 四平市| 桃江县| 钟祥市| 闻喜县| 岳普湖县| 偃师市| 平度市| 顺义区| 增城市| 合阳县| 汉沽区| 廊坊市| 马山县| 楚雄市| 丰原市| 余江县| 甘洛县| 岳阳市| 交口县| 崇仁县| 民勤县| 仙游县|