瑞薩電子宣布推出針對(duì)人工智能(AI)、機(jī)器學(xué)習(xí)(ML)應(yīng)用以及實(shí)時(shí)分析的RA8P1微控制器(MCU)產(chǎn)品群。該系列MCU通過將1GHz Arm Cortex-M85和250MHz Cortex-M33 CPU核心與Arm EthosTM-U55神經(jīng)處理單元(NPU)相結(jié)合,從而樹立MCU性能的新標(biāo)桿。作為瑞薩電子深度合作伙伴,RT-Thread已率先完成對(duì)該芯片的適配支持。本文將詳解如何快速移植RT-Thread,帶大家一起體驗(yàn)M85!

目錄
芯片介紹
RT-Thread 移植
測(cè)試結(jié)果
總結(jié)
1
芯片介紹

從數(shù)據(jù)手冊(cè)上看出 RA8P1 是一顆雙核異構(gòu)的芯片,由大核Cortex-M85+小核Cortex-M33組成。在此基礎(chǔ)上額外集成了 NPU 運(yùn)算單元,專門用于加速機(jī)器學(xué)習(xí)推論所設(shè)計(jì)。
主頻上,M85主核心竟然達(dá)到了1GHZ,這個(gè)速度是以往系列都沒有的主頻,一個(gè)字“快”,
M33 從核心主頻是 250MHZ,同時(shí) RA8P1 有64KB的數(shù)據(jù)+指令Cache,其中我手上這顆R7KA8P1KFLCAC芯片: CPU0 和 CPU1對(duì)應(yīng)的 I/D Caches 和 C/S Caches 容量各 32KB。
外設(shè)接口上,RA8P1最多的支持10路SCI外設(shè)接口(可以靈活配置成UART,SPI,I2C),OSPI x 2可以拓展外擴(kuò)最高8線 的 Hyperam,flash 等存儲(chǔ)器件。
人機(jī)交互接口上,和RA8D1一樣支持 MIPI-DSI,GLCDC 可以二選一搭配 MIPI/RGB 接口的屏幕使用。
除CEU(數(shù)字?jǐn)z像頭接口)外,視頻輸入接口新增MIPI-CSI外設(shè),顯著提升攝像頭數(shù)據(jù)帶寬,確保AI處理場(chǎng)景下前置輸入帶寬的穩(wěn)定性。

在網(wǎng)絡(luò)接口上,RA8P1支持L3以太網(wǎng)交換機(jī)模塊(ESWM),允許連接到網(wǎng)絡(luò)的各種設(shè)備進(jìn)行數(shù)據(jù)交換和相互通信。其支持多協(xié)議接口,它能夠在同一網(wǎng)絡(luò)或不同網(wǎng)絡(luò)接口協(xié)議之間自主路由幀數(shù)據(jù),適用于網(wǎng)關(guān)應(yīng)用。

2
RT-Thread 移植
讓我們快速移植 RT-Thread體驗(yàn)下:
參考RT-Thread文檔中心針對(duì)RA系列的BSP制作教程+Vision Board SDK倉(cāng)庫(kù),由于RA8P1的啟動(dòng)方式是大核先啟動(dòng),那么我們可以先以單核方式快速移植RTT,這里不多加贅述。
下載E2Studio即可快速體驗(yàn)裸機(jī)開發(fā);
將 RT-Thread 源碼加入工程,加入設(shè)備驅(qū)動(dòng)框架對(duì)接層;
運(yùn)行 RT-Thread 的基本條件是Systick時(shí)鐘和串口驅(qū)動(dòng),對(duì)于RT-Thread中已經(jīng)實(shí)現(xiàn)的非常完善;
外設(shè)上在FSP中只需要配置一個(gè)通訊的串口即可

正式開始移植
在移植過程中可以用過E2Studio進(jìn)行針對(duì)多核進(jìn)行調(diào)試仿真,體驗(yàn)下來也是比較流暢的:

如果想要啟動(dòng)從核(M33)可以直接調(diào)用FSP封裝好的庫(kù)函數(shù):

至此RT-Thread已經(jīng)正常的運(yùn)行起來了:

在BSP根目錄下啟動(dòng)env工具:RT-Thread具有完善的軟件生態(tài),我們可以快速的針對(duì)芯片進(jìn)行性能測(cè)試,那么有請(qǐng)第一個(gè)軟件包登場(chǎng):CoreMark

使用env 配置工具在軟件包倉(cāng)庫(kù)中使能COREMARK軟件包,通過pkgs --update拉取到本地項(xiàng)目中參與構(gòu)建:

設(shè)置 corkmark 運(yùn)算迭代次數(shù)為:80000(按需設(shè)置,對(duì)于性能較強(qiáng)的芯片需要增加次數(shù))

在hal_entry.c中,執(zhí)行 coremark 程序進(jìn)行跑分測(cè)試:

初步使用O0等級(jí)優(yōu)化測(cè)試結(jié)果:

什么M85內(nèi)核才區(qū)區(qū)500分?這和理想中的分?jǐn)?shù)天差地別了,接下來開始進(jìn)行優(yōu)化:
1 開啟Dcache和Icache:

qemu-system-riscv32 -machine smartl -nographic -kernel rtthread.elf -cpu e906fd -gdb tcp::23333-S
2 修改測(cè)試區(qū)域內(nèi)存為DTCM段:

3
測(cè)試結(jié)果
CPU0:Cortex-M85 儲(chǔ)存介質(zhì):MRAM(磁阻式隨機(jī)存取內(nèi)存)
編譯器版本 : GCC13.2.1
編譯參數(shù):-mfloat-abi=hard -mfpu=fpv5-sp-d16Ofast
Coremark分?jǐn)?shù):4896.132056

CPU1:Cortex-M33
儲(chǔ)存介質(zhì):MRAM(磁阻式隨機(jī)存取內(nèi)存)
編譯器版本 : GCC13.2.1
編譯參數(shù):-mfloat-abi=hard -mfpu=fpv5-sp-d16Ofast
Coremark分?jǐn)?shù):570.356473

以上的測(cè)試結(jié)果是使用GCC工具鏈進(jìn)行編譯,更換成 ARMCLANG/LLVM 工具鏈跑分可能還會(huì)提升一些。
4
總結(jié)
RA8P1芯片搭載雙核異構(gòu)M85和M33內(nèi)核,相較前代RA8系列在主頻、帶寬及外設(shè)接口方面實(shí)現(xiàn)顯著性能提升,并集成Ethos-U55 NPU的32位AI加速微控制器(MCU)。
該芯片在語(yǔ)音、視覺及實(shí)時(shí)分析AI場(chǎng)景中表現(xiàn)出色,性能強(qiáng)勁。后續(xù)計(jì)劃移植RP-Msglite組件,結(jié)合RT-Thread在RA8P1上實(shí)現(xiàn)雙核間高效數(shù)據(jù)通信,充分釋放雙核性能潛力。
-
微控制器
+關(guān)注
關(guān)注
49文章
8890瀏覽量
165876 -
芯片
+關(guān)注
關(guān)注
463文章
54463瀏覽量
469645 -
內(nèi)核
+關(guān)注
關(guān)注
4文章
1476瀏覽量
43098 -
瑞薩電子
+關(guān)注
關(guān)注
39文章
2987瀏覽量
74530
發(fā)布評(píng)論請(qǐng)先 登錄
分享四款使用瑞薩RA8M1 MCU或RA8D1 MCU的成功產(chǎn)品組合解決方案
瑞薩電子RA8P1系列32位AI MCU介紹
瑞薩Cortext-M85內(nèi)核RA8系列單片機(jī)的串口輸出實(shí)現(xiàn)方法
1 GHz Arm? Cortex?-M85 MCU上部署AI模型
【瑞薩AI挑戰(zhàn)賽】手寫數(shù)字識(shí)別模型在RA8P1 Titan Board上的部署
RT-Thread支持瑞薩全新超高性能Arm? Cortex?-M85 MCU
瑞薩電子宣布推出RA8D1微控制器(MCU)產(chǎn)品群
Cortex-M85內(nèi)核單片機(jī)如何快速上手
瑞薩電子RA家族推出RA8系列高算力通用MCU
AI MCU# 瑞薩RA8T1搭載 Helium 和 TrustZone 的電機(jī)控制MCU 詳細(xì)介紹
貿(mào)澤開售Renesas Electronics RA8P1微控制器 為先進(jìn)AI提供高CPU性能
RT-Thread首款A(yù)I硬件搶先曝光!——RA8P1 Titan Board
正式上市: Cortex-M85 RA8P1 Titan Board重新定義,邊緣AI的性能邊界 | 產(chǎn)品動(dòng)態(tài)
【直播預(yù)告】RT-Thread帶你首發(fā)體驗(yàn):基于瑞薩RA8P1 MCU的Titan Board | 問學(xué)直播
RA8P1部署ai模型指南:從訓(xùn)練模型到部署?|?本周六
地表最強(qiáng)M85內(nèi)核芯片-RA8P1測(cè)評(píng) | 技術(shù)集結(jié)
評(píng)論