資料介紹
描述
在過去的幾年里,我一直在StreamLogic開發(fā)工具,旨在讓在邊緣構(gòu)建和部署計算機(jī)視覺變得更加容易。我最喜歡的目標(biāo)平臺之一是來自 tinyVision.ai的Vision FPGA SoM :
很小的吧?在中心,您可以看到來自 HiMax Imaging 的小型、低功耗且價格低廉的相機(jī)模塊。我一直在尋找我可能針對此平臺的新應(yīng)用程序。
幾個月前,在一位商業(yè)伙伴提到他們使用無人機(jī)的一個農(nóng)業(yè)用例后,我退出了無人機(jī)。無人機(jī)是 tinyML 的一個很好的用例;它們需要大量傳感器數(shù)據(jù),并且對尺寸、重量和功率敏感。我對無人機(jī)幾乎一無所知,但我整個周末都在嘗試定位和研究開源無人機(jī)。在周末結(jié)束之前,我購買了一架無人機(jī):Holybro 的QAV250 套件。
這架無人機(jī)沒有預(yù)先組裝,并且是新手,幾個月前,我擁有所有正確的零件并將其從地面上取下來。但是,讓我們跳到故事的結(jié)尾。一旦我開始真正駕駛無人機(jī),我就意識到 GPS 定位是多么的不準(zhǔn)確。使用自動駕駛儀執(zhí)行自主任務(wù)時,您可能會發(fā)現(xiàn)您的無人機(jī)遠(yuǎn)離計劃的飛行路徑。這在飛行和著陸中都非常危險。就在那時,我想出了這個項目的想法。
目標(biāo)很簡單:使用自動駕駛儀安全著陸無人機(jī)。這有兩個部分:1)在預(yù)期的表面上著陸(在我的例子中是人行道)和 2)避免表面上的任何意外障礙物。為了實現(xiàn)這一點,我提出了一種計算機(jī)視覺算法來檢測無人機(jī)降落時應(yīng)該何時以及向哪個方向移動。
算法設(shè)計
我的解決方案在高層次上非常簡單。向下的攝像頭安裝在無人機(jī)的底部。當(dāng)無人機(jī)緩慢下降著陸時,它會捕捉圖像進(jìn)行分析。首先,將無人機(jī)正下方的平方米確定為著陸點。其次,還對八個方向(北、東北、東、東南、南、西南、西、西北)的附近站點進(jìn)行評級。最后,如果附近任何一個站點的評分明顯優(yōu)于當(dāng)前站點,則無人機(jī)的位置將沿相應(yīng)方向調(diào)整。
這是從我的無人機(jī)拍攝的示例圖像:

如果我們繼續(xù)前進(jìn),中間的黑色方塊就是當(dāng)前的著陸點。它周圍的標(biāo)記方塊是評估可能的方向變化的候選站點。顯然,如果我們要降落在人行道上,我們想在這種情況下向東南移動。
嗯,這是高水平,但您可能仍然想知道 1)您如何知道一米的大小以及 2)您如何評價它?第一個很簡單,無人機(jī)已經(jīng)有一個高度傳感器,所以你可以估計無人機(jī)的高度。鑒于高度、一些相機(jī)規(guī)格和一些代數(shù),計算當(dāng)前圖像的每米像素數(shù) (PPM) 非常簡單。在這種情況下,它的計算結(jié)果為 PPM = 168 / H。
對于第二個問題,這就是計算機(jī)視覺的用武之地。我們需要能夠?qū)D像進(jìn)行任意裁剪,并獲得關(guān)于該圖像是無障礙路面的可能性的定量分?jǐn)?shù)。實際值在這里并不重要,只要我們可以比較兩個分?jǐn)?shù)來確定哪個更好。可以手工制作算法,但我選擇訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò) (CNN) 來生成分?jǐn)?shù)。
下一節(jié)將討論我是如何訓(xùn)練 CNN 的,但讓我們看一下上圖的輸出:

此圖顯示當(dāng)前著陸點(標(biāo)記為 C)和所有 8 個方向的候選點的得分。毫無疑問,東南部是希望的贏家。
機(jī)器學(xué)習(xí)
如上所述,我選擇使用 CNN 為候選著陸點生成定量分?jǐn)?shù)。具體來說,全卷積網(wǎng)絡(luò)(FCN)。這些與其他 CNN 的不同之處在于它們不以密集或全局池化層結(jié)束。最后一個卷積層的激活圖是網(wǎng)絡(luò)輸出。正如您將看到的,這非常適合此應(yīng)用程序。
訓(xùn)練 FCN 有不同的方法,但我選擇先構(gòu)建分類器 CNN,然后將其轉(zhuǎn)換為 FCN。讓我們先看看我是如何構(gòu)建分類器的。
我想創(chuàng)建一個分類器,將小圖像塊分類為好或壞。但首先,我需要數(shù)據(jù)。自然地,我花了很多時間在互聯(lián)網(wǎng)上搜索一些公共數(shù)據(jù)集。不幸的是,沒有什么真正適合我的任務(wù)。我需要創(chuàng)建自己的數(shù)據(jù)集,但是如何創(chuàng)建?最后,我創(chuàng)建了自己的電池供電圖像記錄器。

圖像記錄器每秒捕獲圖像并將它們寫入 SD 卡。這使我能夠在著陸期間從我的無人機(jī)收集圖像,如下所示:

手頭有許多圖像,我創(chuàng)建了三個不同類別的補(bǔ)丁數(shù)據(jù)集:
- 地面(非人行道)
- 路面
- 未知(人行道邊緣/非人行道)
我最初收集了大約 2,000 個補(bǔ)丁。然后我花了很多時間嘗試訓(xùn)練一個淺層網(wǎng)絡(luò)(2 個卷積層),但沒有取得多大成功。我嘗試了許多數(shù)據(jù)增強(qiáng)和網(wǎng)絡(luò)結(jié)構(gòu)都無濟(jì)于事。網(wǎng)絡(luò)總是會在驗證集上生成隨機(jī)結(jié)果或做出恒定的選擇 (:sigh:)。
除了獲取更多數(shù)據(jù)外,別無他法。所以,我從我的圖像中收集了大約 1, 800 個補(bǔ)丁。Bingo,大約有 4, 800 個補(bǔ)丁,訓(xùn)練表現(xiàn)良好,經(jīng)過一些實驗,我的網(wǎng)絡(luò)達(dá)到了 88% 的準(zhǔn)確率。這是最終的網(wǎng)絡(luò):
model = Sequential([
layers.Input(shape=(tgt_width,tgt_height,3)),
layers.Conv2D(10, 5, strides=2, padding='valid', activation='relu'),
layers.Conv2D(3, 3, padding='valid'),
layers.GlobalAveragePooling2D(),
])
這個模型只有 1, 033 個參數(shù)!
有關(guān)完整的訓(xùn)練過程,請參閱training.ipynb代碼存儲庫中的 Jupyter 筆記本。
全卷積網(wǎng)絡(luò)
有了地面補(bǔ)丁分類器,是時候?qū)⑵滢D(zhuǎn)換為我們可以應(yīng)用于整個圖像的 FCN。查看上面的網(wǎng)絡(luò),您可以看到通過移除 GlobalAveragePooling2D 層,我們最終得到了一個僅包含卷積層的網(wǎng)絡(luò)。它接受任何圖像大小并生成比例大小的激活圖。FCN 的結(jié)果實際上與以滑動窗口方式將補(bǔ)丁分類器應(yīng)用于圖像中的所有補(bǔ)丁相同。輸出圖中每個位置的激活值是輸入圖像中相應(yīng)位置的補(bǔ)丁的分類器結(jié)果。
這真的有效嗎?我們來看一下。這是示例圖像的渲染和 FCN 的相應(yīng)輸出:

右圖顯示了路面類的 FCN 輸出。將正確圖像中的值與候選站點相加,可以得出該站點的分?jǐn)?shù)。
這是呈現(xiàn)相同數(shù)據(jù)的另一種方法:

在這張圖片中,我用一個紅色正方形覆蓋了原始圖像,其透明度是路面類輸出的倒數(shù)(即越有可能是路面,越透明)。查看目標(biāo)著陸點,紅色越多,得分越低。
創(chuàng)建 FCN 并將權(quán)重從訓(xùn)練的分類器轉(zhuǎn)移到 FCN 的所有詳細(xì)信息都在evaluation.ipynb代碼存儲庫的 Python 筆記本中。
量化
我對網(wǎng)絡(luò)進(jìn)行了量化,以使用 8 位權(quán)重和 8 位激活來獲得更好的運行時性能。您可以遵循 Tensorflow 文檔中描述的標(biāo)準(zhǔn)程序,但我使用了我自己的方法,該方法具有更簡單的量化模型。該過程在README代碼存儲庫中進(jìn)行了詳細(xì)說明。
這是量化網(wǎng)絡(luò)的輸出示例:

這與原始網(wǎng)絡(luò)的輸出幾乎沒有區(qū)別:

硬件構(gòu)建
我已經(jīng)有了一個帶有 Vision FPGA SoM 的硬件堆棧和一個來自Battery-powered Image Logger項目的微控制器。不幸的是,結(jié)果證明微控制器太小了。計算 FCN 中每一層的輸入/輸出激活圖的大小,我們發(fā)現(xiàn)我們需要 48KB 的緩沖區(qū)空間。幸運的是,還有另一個符合要求的 Feather 板。
Feather M4 Express 不僅速度更快,而且擁有高達(dá) 192KB 的 RAM!該項目不需要 SD 卡,因此我們的構(gòu)建只是堆疊在 Feather M4 Express 上的 Vision FPGA SoM 板。

體積小、重量輕、電池供電!
執(zhí)行
從框圖中您可以看到 FPGA 被用作相機(jī)模塊和微控制器之間的橋梁。

FPGA 將捕獲的圖像以圖像傳感器的原始格式(即拜耳濾波器圖像)傳遞給微控制器。FPGA 的預(yù)構(gòu)建編程文件在代碼庫中提供。
這讓微控制器的任務(wù)是:
- 將圖像從 Bayer 轉(zhuǎn)換為 RGB 格式
- 將圖像下采樣到 80x80
- 執(zhí)行 FCN 推理
- 對目標(biāo)站點區(qū)域求和
所有這些任務(wù)的源代碼都包含在sketch代碼存儲庫的文件夾中。我將在這里對代碼做一些評論。
完整的原始圖像超過 100KB,雖然這個 MCU 有 192KB,但我不想不必要地浪費空間。下采樣的圖像只需要 20KB。您將在從 FPGA 讀取圖像的循環(huán)中看到,它在讀取時執(zhí)行拜耳轉(zhuǎn)換和下采樣,一次一個塊,因此我們只需要為下采樣圖像提供足夠的空間。
這個網(wǎng)絡(luò)沒有使用 CNN 框架,而是非常簡單,以至于我實現(xiàn)了自己的卷積和激活函數(shù)。這些在gndnet.cpp文件中定義。如果您有興趣了解有關(guān)卷積如何工作的更多信息,它的編寫方式非常簡單。我并不太擔(dān)心性能,但這些可能會被 ARM神經(jīng)網(wǎng)絡(luò)庫中的函數(shù)取代以獲得更好的性能。
結(jié)果
著陸算法與無人機(jī)飛行控制器的集成超出了此概念驗證的范圍。目標(biāo)是設(shè)計和訓(xùn)練算法,證明其有效性并獲得一些性能數(shù)據(jù)。
從質(zhì)量上看,該算法看起來不錯。它已在用于培訓(xùn)的站點以及未用于培訓(xùn)的站點的測試圖像上進(jìn)行了評估。結(jié)果非常令人鼓舞。當(dāng)然,要投入生產(chǎn),人們可能希望對來自多個站點的數(shù)據(jù)進(jìn)行訓(xùn)練。
在性能方面,從圖像捕獲到分?jǐn)?shù)計算的整個過程大約是 525 毫秒。這意味著略低于 2 FPS。這可能會起作用,因為無人機(jī)確實以相當(dāng)慢的速度下降。但是,這很容易得到改善。例如,如果將 Bayer 轉(zhuǎn)換和下采樣功能移至 FPGA,則時間會縮短到 200 毫秒多一點。那將超過 4 FPS,這絕對足夠了。
- 折疊無人機(jī)開源構(gòu)建
- 自動送貨無人機(jī)開源分享
- 自主無人機(jī)交付和充電系統(tǒng)開源分享
- 無人機(jī)mavimg開源分享
- Arduino無人機(jī)開源分享
- 迷你無人機(jī)開源分享
- 無人機(jī)滑降著陸控制系統(tǒng)的設(shè)計與實現(xiàn) 5次下載
- 如何對無人機(jī)視覺導(dǎo)航中的圖像處理的姿態(tài)進(jìn)行解算 6次下載
- 使用機(jī)器視覺實現(xiàn)無人機(jī)著陸技術(shù)的詳細(xì)資料說明 16次下載
- 無人機(jī)和無人機(jī)控制方法及無人機(jī)遠(yuǎn)程操控系統(tǒng)方法說明 74次下載
- 基于機(jī)載視覺引導(dǎo)的無人機(jī)自主循跡研究 18次下載
- 無人機(jī)技術(shù)之無人機(jī)開源系統(tǒng)教學(xué)PPT下載 29次下載
- 無人機(jī)偵測和反制系統(tǒng) 30次下載
- 無人機(jī)著陸滑跑數(shù)學(xué)模型與糾偏控制 11次下載
- 小型無人機(jī)數(shù)據(jù)鏈與自主飛控系統(tǒng)設(shè)計
- 使用 Betaflight 和樹莓派實現(xiàn) FPV 無人機(jī)自主飛行! 4k次閱讀
- 無人機(jī)中超聲波原理 3.1k次閱讀
- Percepto Robotics宣布Sparrow無人機(jī)機(jī)器視覺算法 5.3k次閱讀
- 美國陸軍計劃采用微波系統(tǒng)驅(qū)趕空中無人機(jī) 4.2k次閱讀
- 即使沒有GPS網(wǎng)絡(luò)覆蓋 無人機(jī)也可以精準(zhǔn)落地 7k次閱讀
- 怎樣使無人機(jī)安全飛行?無人機(jī)飛行需要掌握什么安全知識 1.8w次閱讀
- 新疆為什么禁飛無人機(jī)_新疆無人機(jī)禁飛區(qū)域 6w次閱讀
- 水下無人機(jī)的用途和優(yōu)勢有哪些 1w次閱讀
- 水下無人機(jī)原理分析 1.5w次閱讀
- nixie微型無人機(jī)的功能介紹_nixie微型無人機(jī)多少錢 1.4w次閱讀
- 微型無人機(jī)發(fā)展前景_無人機(jī)發(fā)展趨勢 9k次閱讀
- 中國有哪些軍用無人機(jī)_國內(nèi)軍用無人機(jī)排名 11.6w次閱讀
- 大疆無人機(jī)如何在禁飛區(qū)起飛 15.7w次閱讀
- 中國無人機(jī)技術(shù)型號種類介紹 3.8w次閱讀
- 電動無人機(jī)和油動無人機(jī)性能的對比 3.2k次閱讀
下載排行
本周
- 1矽力杰 Silergy SY7215A 同步升壓調(diào)節(jié)器 規(guī)格書 Datasheet 佰祥電子
- 1.12 MB | 5次下載 | 免費
- 2HT81696H 內(nèi)置升壓的30W立體聲D類音頻功放數(shù)據(jù)手冊
- 1.21 MB | 1次下載 | 免費
- 3HTA6863 3W超低噪聲超低功耗單聲道D類音頻功率放大器數(shù)據(jù)手冊
- 0.87 MB | 次下載 | 免費
- 4南芯 Southchip SC8802C 充電控制器 規(guī)格書 Datasheet 佰祥電子
- 88.16 KB | 次下載 | 免費
- 5矽力杰 Silergy SY7065 同步升壓轉(zhuǎn)換器 規(guī)格書 Datasheet 佰祥電子
- 910.67 KB | 次下載 | 免費
- 6矽力杰 Silergy SY7066 同步升壓轉(zhuǎn)換器 規(guī)格書 Datasheet 佰祥電子
- 989.14 KB | 次下載 | 免費
- 7WD6208A產(chǎn)品規(guī)格書
- 631.24 KB | 次下載 | 免費
- 8NB685 26 V,12 A,低靜態(tài)電流,大電流 同步降壓變換器數(shù)據(jù)手冊
- 1.64 MB | 次下載 | 2 積分
本月
- 1EMC PCB設(shè)計總結(jié)
- 0.33 MB | 12次下載 | 免費
- 2PD取電芯片 ECP5702規(guī)格書
- 0.88 MB | 5次下載 | 免費
- 3矽力杰 Silergy SY7215A 同步升壓調(diào)節(jié)器 規(guī)格書 Datasheet 佰祥電子
- 1.12 MB | 5次下載 | 免費
- 4氮化鎵GaN FET/GaN HEMT 功率驅(qū)動電路選型表
- 0.10 MB | 3次下載 | 免費
- 5PD取電芯片,可取5/9/12/15/20V電壓ECP5702數(shù)據(jù)手冊
- 0.88 MB | 3次下載 | 免費
- 6SY50655 用于高輸入電壓應(yīng)用的偽固定頻率SSR反激式穩(wěn)壓器英文資料
- 1.01 MB | 3次下載 | 免費
- 7怎么為半導(dǎo)體測試儀選擇精密放大器
- 0.65 MB | 2次下載 | 免費
- 8SY52341 次級側(cè)同步整流英文手冊
- 0.94 MB | 2次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233095次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191469次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183360次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81606次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費下載
- 0.02 MB | 73832次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論