蜜桃人妻一区二区三区,337p大胆亚洲,日韩熟女无码

一、OrangePi Kunpeng Pro簡介

OrangePi Kunpeng Pro是一款香橙派聯(lián)合華為精心打造的高性能板卡，搭載了鯤鵬處理器，可提供8TOPS INT8計(jì)算能力，板卡設(shè)計(jì)很精致，板載資源也非常多：

?擁有以太網(wǎng)、Wi-Fi+藍(lán)牙功能，提供多種可選擇的網(wǎng)絡(luò)接入方式。

? 2個(gè)USB3.0 Host、1個(gè)支持USB3.0的Type-C 接口：可接入鼠標(biāo)、鍵盤、USB攝像頭等設(shè)備，方便板卡操作。

? 2個(gè)HDMI接口、1 個(gè) MIPI DSI 2 Lane接口，提供兩種顯示方案。

?引出了40 pin 擴(kuò)展口，可擴(kuò)展UART、I2C、SPI、PWM 和 GPIO 等接口功能。板卡完整接口如下圖所示：

板卡擴(kuò)展出的功能很多，能夠滿足很多應(yīng)用場景和行業(yè)的開發(fā)需求，本文將描述使用OrangePi Kunpeng Pro來部署AI大模型，記錄分析模型運(yùn)行期間板卡的狀態(tài)和模型運(yùn)行效果。

二、環(huán)境搭建

（1）首先取出板卡，為板卡接入一個(gè)HDMI顯示屏、一個(gè)無線藍(lán)牙鼠標(biāo)、一個(gè)有線鍵盤，接著接通電源，完成后如下圖所示：

（2）隨后板卡將自動啟動運(yùn)行openEuler操作系統(tǒng)，接著我們進(jìn)入終端：

（3）查看下存儲容量：

從上圖可知目前可用容量很大，可滿足小量級離線模型的存儲。

板卡運(yùn)行openEuler非常流暢，使用體驗(yàn)感非常好。

（4）選擇網(wǎng)絡(luò)接入方式，本文使用Wifi接入。

（5）更改CPU為AI CPU

從上圖中可知目前板卡有3個(gè)AI CPU和1個(gè)control CPU。

接著就進(jìn)行模型運(yùn)行環(huán)境搭建和模型部署了。

三、模型運(yùn)行環(huán)境搭建

(1)下載Ollama用于啟動并運(yùn)行大型語言模型

由于在線下載Ollama速度較慢，故而使用手動方式安裝Ollama，首先從下列地址下載Ollama：

https://ollama.com/download/ollama-linux-arm64

完成后將其通過ssh方式傳輸?shù)桨蹇?。接著將其重名為ollama，便于命令操作，然后將ollama復(fù)制到/usr/bin目錄中并賦予可執(zhí)行權(quán)限：

sudochmod+x/usr/bin/ollama

(2)配置ollama系統(tǒng)服務(wù)

使用以下命令創(chuàng)建ollama服務(wù)描述文件：

sudotouch/etc/systemd/system/ollama.service

并在文件中編輯如下內(nèi)容：

[Unit]
Description=OllamaService
After=network-online.target

[Service]
ExecStart=/usr/bin/ollamaserve
User=root
Group=root
Restart=always
RestartSec=3

[Install]
WantedBy=default.target

(3)啟動ollama服務(wù)

使用下述命令啟動ollama服務(wù)：

sudosystemctldaemon-reload
sudosystemctlenableollama

(4)啟動ollama

使用下述命令啟動ollama:

sudosystemctlstartollama

(5)查看ollama運(yùn)行狀態(tài)

使用如下命令查看ollama運(yùn)行狀態(tài)：

systemctlstatusollama.service

從上圖可知目前ollama啟動成功。

四、模型部署

通過上述第三小節(jié)的步驟后，Ollama模型運(yùn)行環(huán)境就搭建完成，本小節(jié)將部署五個(gè)模型：1.8b的qwen、2b的gemma、3.8b的phi3、4b的qwen和7b的llama2，測試OrangePi Kunpeng Pro運(yùn)行模型的實(shí)際效果。模型細(xì)節(jié)如下表所示：

序號	模型	參數(shù)	描述
1	qwen	1.8b	Qwen是阿里云開發(fā)的大型語言模型，1.8b，1.1GB
2	gemma	2b	Gemma是由Google DeepMind構(gòu)建的一系列輕量級的開放模型，大小1.7GB
3	phi3	3.8b	phi3是微軟開發(fā)的開放AI模型系列，3.8b為Mini系列，大小2.4GB
4	qwen	4b	Qwen是阿里云開發(fā)的大型語言模型，4b，大小2.3GB
5	llama2	7b	Llama 2是由Meta平臺公司發(fā)行的基礎(chǔ)語言模型，大小3.8GB

(1)部署1.8b的qwen

使用ollama run qwen:1.8b部署1.8b的qwen模型：