前言:想要寫出一篇引人入勝的文章?我們特意為您整理了目標檢測分類系統(tǒng)設(shè)計探究范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:隨著科技水平的不斷發(fā)展,機器代替人進行簡單而繁瑣的工作是發(fā)展趨勢。綜合考慮能夠適用于各種不同場面的分類工作的潛力,本文設(shè)計了一種能夠通過攝像頭與機械臂對圖像物品進行捕捉、抓取和分類的一體式智能交互機器人。
關(guān)鍵詞:視覺跟蹤;圖像識別;物品分類;深度學(xué)習;YOLOv3
1引言
目前,目標檢測算法主要包括傳統(tǒng)目標檢測技術(shù)和深度學(xué)習目標檢測技術(shù)。傳統(tǒng)的識別技術(shù)主要采用滑動窗口實現(xiàn)圖片內(nèi)目標搜索,檢測精度較低,具有較差的魯棒性。YOLOv3是一種快速、準確的深度學(xué)習目標檢測技術(shù)[1-2],在檢測速度與檢測精度方面具有較好的綜合性能,因此被廣泛應(yīng)用于近景目標檢測。本文提出一種基于樹莓派的智能交互機器人控制系統(tǒng)設(shè)計,通過樹莓派搭載攝像頭構(gòu)成機器人的視覺交互系統(tǒng),利用YOLOv3進行目標識別,將深度學(xué)習算法與智能交互機器人技術(shù)相結(jié)合,具有一定的創(chuàng)新性和研究價值。
2系統(tǒng)整體設(shè)計
2.1系統(tǒng)主體結(jié)構(gòu)
系統(tǒng)主體結(jié)構(gòu)包括以下部分:樹莓派攝像頭、樹莓派、STM32系統(tǒng)板、六舵機械臂、穩(wěn)壓模塊、驅(qū)動模塊、電機、車模。
2.2工作原理
系統(tǒng)的整體控制結(jié)構(gòu)如圖1所示。樹莓派通過YOLOv3識別攝像頭讀取的圖片,識別物體所在位置并通過串口發(fā)送給STM32。STM32單片機再控制小車進行運動,通過多次的識別及運動后,當物體所在位置在機械臂可以捕捉的范圍內(nèi)時,小車停止運動,控制機械臂對其進行捕捉。捕捉成功后,機械臂再把物體擺放在給定的分類區(qū),完成一次捕捉分類任務(wù)。
3系統(tǒng)結(jié)構(gòu)設(shè)計
智能交互機器人由車體、直流電機與驅(qū)動模塊、控制與信息處理裝置、機械臂等部分組成,機械臂采用舵機驅(qū)動,機械結(jié)構(gòu)如圖2所示。機器人的總體結(jié)構(gòu)設(shè)計目標如下:(1)在無人為外界因素干預(yù)的情況下,智能交互機器人能高效地自主運行。(2)智能交互機器人的機械結(jié)構(gòu)和控制系統(tǒng)采用模塊化設(shè)計,便于拆卸、修理和維護。(3)機械臂的設(shè)計采用串聯(lián)結(jié)構(gòu),不同關(guān)節(jié)不會相互影響,可以完成較好的傳動精度和傳動穩(wěn)定的設(shè)計要求。大扭矩舵機保證轉(zhuǎn)動精度,單舵機控制單關(guān)節(jié),使得機械臂動作簡單,控制容易。(4)通過PWM同時驅(qū)動四臺直流電機可對電機進行直接控制。輸入信號采用光耦合進行隔離,且具有欠壓保護功能。同時設(shè)計了靜電泄放回路,充分滿足電機驅(qū)動要求。(5)主控采用STM32F103微處理和樹莓派4B,可以滿足系統(tǒng)的控制需要。(6)車體采用鋁制底盤,絕緣性較好,重心低,載重能力強,保證智能交互機器人機械結(jié)構(gòu)的小巧輕便以及在運行時性能的穩(wěn)定。
4系統(tǒng)軟件設(shè)計
4.1軟件流程
程序流程圖如圖3所示。系統(tǒng)軟件設(shè)計采用模塊化程序設(shè)計方法,包括系統(tǒng)初始化程序、攝像頭識別程序、機械臂控制程序和灰度循跡程序。樹莓派開機后首先進行系統(tǒng)初始化操作,然后運行相應(yīng)程序文件。STM32單片機控制直流電機通過灰度循跡來到目標識別區(qū),隨后樹莓派運行基于YOLOv3的深度學(xué)習圖像識別算法依次識別目標物體。當檢測到目標物體后,樹莓派通過串口發(fā)送抓取命令,控制機械臂完成抓取動作,并將物品擺放在預(yù)定分類區(qū)域,隨后智能交互機器人回到初始位置。
4.2串口與機械臂控制程序設(shè)計
樹莓派與STM32單片機之間采用串口通信進行數(shù)據(jù)收發(fā),樹莓派識別出目標位置信息并以字符串的形式通過串口發(fā)送給STM32單片機。通過不同的指令完成車體不同的動作,實現(xiàn)上下位機的通訊與系統(tǒng)協(xié)調(diào)工作。智能交互機器人的機械臂由6個舵機構(gòu)成,分別控制機械臂的關(guān)節(jié)1到關(guān)節(jié)5以及底盤。機械臂的動作控制依靠PWM控制舵機角度完成,通過STM32編程使得I/O口輸出的PWM波占空比持續(xù)變化,進而使機械臂完成指定動作。
4.3YOLOv3目標檢測算法
YOLOv3是一種快速、準確的深度學(xué)習目標檢測技術(shù),在檢測速度與檢測精度方面具有較好的綜合性能。在進行圖像特征提取時,YOLOv3運用了Darknet網(wǎng)絡(luò)結(jié)構(gòu)[3]。它與殘差網(wǎng)絡(luò)的工作原理相似,都是在層與層之間安排了快捷鏈路。YOLOv3進行目標識別時采用不同尺度的3個特征圖,包括32倍降采樣、16倍降采樣以及8倍降采樣,在多尺度featuremap上的檢測與SSD類似。YOLOv3通過route層把淺層特征調(diào)用起來,將4次下采樣后得到的淺層featuremap與16倍降采樣得到的featuremap進行拼接,在深度學(xué)習網(wǎng)絡(luò)的同時學(xué)習深層和淺層特征,具有更好的表達效果。YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)如4所示[4]。YOLOv3通過多尺度檢測[5-6],顯著提高了mAP及小型物體的檢測精度,并且通過殘差網(wǎng)絡(luò)形成了更深的網(wǎng)絡(luò)層次。如果采用COCOmAP50作為評估指標,YOLOv3的表現(xiàn)相當驚人。它的檢測速度是其他模型的很多倍。實際識別效果圖如5所示。
5結(jié)束語
本文研究的智能交互機器人主要運用了YOLOv3深度學(xué)習算法,通過算法自動檢測出圖片中物體的位置,分類出邊界框的物體的類別信息。主要運用在對貨物進行合理的分類擺放,把各種不同的貨物準確地擺放到合適的區(qū)域。通過該深度學(xué)習,系統(tǒng)不僅可以使機器人能夠適用于各種不同的場景,而且YOLO算法的準確性以及高速也能夠帶來很大的便利。
作者:楊炅坤 黃景林 陳玥名 朱胤愷 羅宇昊 單位:中國計量大學(xué)機電工程學(xué)院