公務員期刊網 精選范文 計算機視覺的展望范文

計算機視覺的展望精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺的展望主題范文,僅供參考,歡迎閱讀并收藏。

計算機視覺的展望

第1篇:計算機視覺的展望范文

關鍵詞:計算機圖形學;計算機視覺;可視化技術

中圖分類號:TM862 文獻標識碼:A 文章編號:1671-2064(2017)01-0054-02

計算機圖形學、計算機視覺以及可視化技術三者均是計算機領域重要組成部分,要做好計算機知識,就要先學好計算機圖形學,但計算機圖形學學習相對枯燥,尤其是算法教學難以理解,為解決這一問題,計算機視覺與可視化技術被應用到計算機圖形學中??梢?,三者之間存在一定的聯(lián)系,因此,有必要對計算機圖形學、計算機視覺以及可視化技術展開研究。

1 計算機圖形學概述

1.1 計算機圖形學目的

所謂的計算機圖形學實際上就是怎樣利用計算機表示圖形,并利用計算機完成圖形計算與處理,而這一過程的實現需要得到相關算法的支持。學習計算機圖形學的目的是利用計算機技術為人們呈現既帶有美感又不缺真實的圖形(如下圖1所示),為實現這一目標,就需要按照圖形的要求創(chuàng)設合適的場景,并在一些光照模型的作用下,做好光照效果設計,在這一過程中需要計算機圖形學能夠與其他計算機技術相配合。經過計算機圖形學出來的圖像,多會以數字圖像的方式展示出來,總的來說,計算機圖形學與圖像處理之間存在著一定的聯(lián)系[1]。計算機圖形學的涉及范圍相對寬泛,不僅有圖形硬件設計,還包括動畫制作,虛擬現實等多個部分。此外,計算機圖形學在動畫制作中的應用頻率也很高,如45分鐘一集的動畫影片中,85%的畫面都需要用算機圖形學來完成,由此可見,計算機圖形學的應用頻率極高,并在動畫制作中發(fā)揮著不可替代的作用。因此,應重視計算機圖形學的應用。

1.2 計算機圖形學應用

隨著計算機圖形學的發(fā)展,它被應用到各個領域中,并發(fā)揮著重要作用。首先,在計算機輔助設計與制造中的應用,這是計算機圖形學應用最多的領域,在計算機圖形學被應用以后,不僅可以設計出更精準的圖形,還能做好人機交互設計,強化修改能力。計算機圖形學還被應用到三維形體重建中,利用該技術可以將原理的二維信息轉化為三維信息,如在某次工程圖紙設計中就應用了計算機圖形學,經過一系列的處理以后,三維形體逐漸形成,最終實現了重建。其次,在醫(yī)學領域中的應用。計算機圖形學在醫(yī)學領域中的應用多以計算可視化的形式展示出來,如在腦部手術中,醫(yī)生為看清患處真實情況,經常需要利用在可視化技術的作用下將復雜的數據轉化為圖像,這時就體現了計算機圖形學在其中的應用[2]。再者,在計算機動畫中的應用,人們看到的動畫影片就是計算機圖形學作用的結果,以動畫人物的行走為例,為保證動畫人物的行走與自然人不存在過大差異,就需要應用大量的計算機技術,并在計算機圖形學的作用下完成設計。最后,在計算機藝術中的應用。計算機圖形學在計算機藝術中也有廣泛應用,它不僅可以用于藝術制作,很多場景都是通過計算機圖形學來完成的,現階段,一些人正在利用計算機圖形學創(chuàng)設人體模擬系統(tǒng),其目的是讓已故人士再次出現在熒屏上,這一目標的實現就需要得到計算機圖形學的支持。

2 計算機視覺技術

2.1 計算機視覺技術含義

所謂的計算機視覺技術,實際上就是用計算機取代人眼做識別、跟蹤以及測量等,同時也兼顧圖形處理,其目的是讓圖像在計算機被處理以后更適于識別。對于計算機視覺技術來說,意在實現人工智能,主要是從圖像與多維數據等方面實現人工智能系統(tǒng)設計[3]。計算機視覺是一種在相關理論與模型基礎上發(fā)展起來的視覺系統(tǒng),其主要構成部分有以下幾種:

(1)程序控制,這一點主要體現在機器人設計上;(2)事件檢測,多體現在圖像監(jiān)測上;(3)信息組織,主要體現在圖像數據庫等方面。計算機視覺三個階段如圖2所示,通過觀察圖1可以發(fā)現,計算機視覺存在于圖像處理始終,從早期處理直到后期結束都存在,最終實現了3D描述,可見,計算機視覺具有十分重要的作用[4]。

2.2 計算機視覺技術的應用

現階段,現代社會已經進入信息化時代,計算機技術也被應用到各個領域,并發(fā)揮著重要作用。計算機視覺的應用促使計算機實現了智能化,在該技術的支持下,計算機可以像人一樣透過視覺看待世界萬物,且具有良好的適應能力,但這一目標的實現還需要很長時間,需要一系列的努力才能實現?,F階段,計算機視覺應用最多的就是車輛視覺導航,然而,這種導航還沒有實現完全自主導航,這也是需要進一步研究的地方。計算機視覺技術的適應性較好,特別適合在工業(yè)領域應用,即便是存在電子在干擾或溫度變化較大的地方都能很好的運行,其整體效果也不會受到影響,再者,計算機視覺技術的嵌入性較好,成本相對較低,尤其適合在PC方案中使用,同時,具有一定的非接觸能力,能夠獲取大量信息,且不受距離限制,總的來說,計算機視覺技術總體效果較好,適合利用在各種工業(yè)環(huán)境中應用,因此,應重視計算機視覺技術的應用[5]。同時計算機視覺還被應用到移動機器人設計中,主要是利用小波模板展示人體形態(tài),然后做圖像掃描,這樣就可以順利完成小波變換,進而了解到人的存在。同樣,將計算機視覺應用到機器人設計上,可以自動檢測出正在行動的人或車輛,而無法檢測到靜止的人,之所以會出現這樣情況,主要是由于其中采用率步態(tài)分析法。

3 可視化技術

3.1 可視化技術含義

可視化技術是一種綜合了計算機圖形學與圖像處理于一體的技術,它可以將復雜的數據轉化為圖像并在屏幕上展示出來。在可視化技術中,融合了以上兩種技術的特點,并在多個領域都有應用,隨著可視化技術的應用,不僅有效實現了數據表示,還強化了數據處理能力,更對數據決策分析有一定作用[6]?,F階段,虛擬現實技術已經成為可視化技術主要發(fā)展方向。

3.2 可視化技術的應用

首先,在計算機圖形學教學中的應用,計算機圖形學相對枯燥,相關知識也很抽象,不便于學生理解,在計算機圖形學中最重要的部分是曲線曲面,而這些曲線曲面多是與數學模型有關,具有一定的抽象性,學生理解難度較大,以往教師只能通過一系列的公式演算幫助學生理解,盡管這樣依然難以讓學生掌握曲線變化情況,學生依舊無法正確理解。為減少這種情況的發(fā)生,可視化技術被應用到計算機圖形學教學中,教師將抽象的知識用動畫的形式展示出來,學生只要觀看動畫,拖動一定的控制點就可以了解到曲線變化情況,這樣一來不僅增加了教學趣味性,學生也可以隨意變動曲線,讓復雜的知識變得簡單,深化學生對計算機圖形學知識的深度理解,同時,利用可視化技術在一定條件下,還可以完成代碼編譯,如在Actoin ScriPt中做編譯,這樣也可以增強學生的理解能力[7]。

其次,在醫(yī)學領域中的應用。醫(yī)學領域對于可視化技術的應用主要體現在放射治療與矯正手術上。通過可視化技術可以屏幕上看到手術整個過程,并將原來細節(jié)部位放大,手術醫(yī)生觀察的更加細致,手術成功幾率也會大幅度提升,患者生命也能得到保證(如圖3所示)。如在對某名患者進行身體檢查的過程中需要應用到可視化技術,由于通過檢查會獲得大量數據,而這些數據又相對復雜,但在可視化技術下就可以通過圖表、曲線圖或立柱圖的方式展示出來,經過可視化技術的作用,了解到患者的血糖為5.6mmol/L,醫(yī)生可以根這一數據做出診斷,而不必再分析這些數據。據不完全統(tǒng)計,80%的醫(yī)療檢查工作都是需要利用可視化技術。

地質勘探是我國最重要的工作之一,由于多數礦藏都深埋地下,即便使用探測儀受多種因素影響也無法了解到實際礦藏情況,這就需要應用到可視化技術,在可視化技術的作用下,相關工作人員可以了解到地下有無礦藏,如果存在礦藏,相關工作人員也可以了解到礦藏所在位置與實際儲備量,進而為礦藏開采奠定基礎。如在地質勘探中,相關工作人員利用可視化技術做地形圖整理,然后從中提取地形數據,再用CATIA做導入,這樣就可以完成地形模型創(chuàng)建,這樣就完成了三維地質模型創(chuàng)建工作,同時在相關工作臺的影響下,還可以完成地形數據導入,進而生成一定的地形云點,如果其中存在錯誤,可視化技術也可以將其中的錯誤內容刪除,這些都是可視化技術所帶來的好處[8]。由此可見,可視化技術已經成為地質勘探中不缺少的技術。

最后,在氣象預報中的應用(如圖4所示)。利用可視化技術能夠將數據轉化為圖像,通過觀察圖像就可以了解到云層變化情況,同時也能了解到實際風力大小與風走向等,氣象預報人員就可以根據圖像做出精準分析,需要了解氣象變化的人也能了解到現實情況,如果氣象條件惡劣,相關工作人員也可以及時做出工作調整,減少危險事件的發(fā)生。據不完全統(tǒng)計,可視化技術在氣象預報中的應用頻率高達100%,由此挽回的經濟損失高達13.2億元,可見,可視化技術在氣象預報中的應用十分有必要,因此,應重視可視化技術在氣象預報中的應用。

4 結語

通過以上研究得知,計算機圖形學、計算機視覺以及可視化技術三者各具特色,三者間也存在一定的關系,尤其是可視化技術綜合了前兩者的特點,并融合了其他技術,在很多領域中都有應用??梢暬夹g是現階段應用最多的一種技術,在計算機圖形學教學中也有應用,并發(fā)揮著不可替代的作用。本文分析了計算機圖形學、計算機視覺以及可視化技術的含義與應用,希望能為相關人士帶來有效參考,正確利用這些技術。

參考文獻:

[1]陳敏雅,金旭東.淺談計算機圖形學與圖形圖像處理技術[J].長春理工大學學報,2011(01):138-139+146.

[2]柳海蘭.淺談計算機圖形學的發(fā)展及應用[J].電腦知識與技術,2010(33):9551-9552.

[3]滑瑞朋.計算機圖形學的應用及研究[J].山西科技,2012(05):37-38+45.

[4]劉濤,仲曉春,孫成明,郭文善,陳瑛瑛,孫娟.基于計算機視覺的水稻葉部病害識別研究[J].中國農業(yè)科學,2014(04):664-674.

[5]關然,徐向民,羅雅愉,苗捷,裘索.基于計算機視覺的手勢檢測識別技術[J].計算機應用與軟件,2013(01):155-159+164.

[6]許志杰,王晶,劉穎,范九倫.計算機視覺核心技術現狀與展望[J].西安郵電學院學報,2012(06):1-8.

第2篇:計算機視覺的展望范文

關鍵詞:果品;無損檢測;品質

我國水果產量居世界第一,果品出口成為我國外貿的重要組成部分。但是我國大多數農產品國際市場競爭力弱,出口價格低廉。其中品質因素是重要原因之一,這是由于檢測技術、評判標準等限制,所以對果品進行合適的品質檢測對提高經濟效益和市場競爭力具有重要意義。對農產品品質的無損檢測,已引起國內外廣泛關注。

所謂無損檢測,又稱非破壞檢測,是不破壞被檢對象卻能評價其品質的方法。它利用自身力學、光學、電學及聲學等物理性質對評價對象品質進行非破壞檢測,并按照一定標準進行分級分選的新興技術,廣泛應用于工業(yè)和農業(yè)。農業(yè)中的無損檢測技術是利用農產品的物理性質如光學性質、聲學性質、電磁學性質和熱學性質等的變化而實現。目前,無損檢測技術主要包括:近紅外技術、聲學檢測技術、軟X射線技術、計算機視覺技術、核磁共振檢測技術、力學特性檢測技術等。

1.果品無損檢測技術

1.1新型可見、近紅外光譜無損檢測技術

可見、近紅外光譜法是農產品內部成分無損檢測的有效方法,是利用農產品吸收、散射、反射和透射光的特性,進而確定內部成分的方法。近紅外分析技術作為一種高新分析技術,能改造我國傳統(tǒng)農業(yè),提高農產品質量,尤其是農產品加工的質量控制,將產生巨大作用。為改造我國的傳統(tǒng)行業(yè),企業(yè)迫切需要對原料進行質量監(jiān)測、生產過程監(jiān)控的設備和技術。國際經驗來看,近紅外技術是首選。

韓東海等[1]利用柑橘正常及損傷部位在紫外光源下的差異發(fā)射性,可有效確定柑橘損傷果。Slaugther DC[2]鑒于近紅外和可見光的分光光度技術,建立完好的桃及油桃內部品質的無損關系式,能夠預測完好無損的桃與油桃的山梨糖醇含量、蔗糖和可溶性固形物等。Lammertyn J[3]通過研究近紅外光譜和可見光譜對紅玉蘋果質量的無損測量,進而得到雙叉光纖記錄的反射光譜與蘋果參數之間的關系。Ali Moghimi[4]等用近紅外光譜技術結合化學計量學建立獼猴桃SSC和pH的校正模型,比較多元散射校正、變量標準化、中值濾波和一階導數光譜預處理對所建獼猴桃SSC和pH校正模型的影響,表明變量標準化結合中值濾波和一階倒數預處理光譜后,用PCR-PLS法建立的SSC和pH的校正模型精度較高。

目前,分光檢測技術在果蔬品質檢測中的應用廣泛,因為這種方法具有適應性強、高檢測靈敏度、人體無害性、靈活使用性、成本低廉和自動化易實現性等優(yōu)勢。利用這種技術能自動分級果品,而合理的分級標準,便于果品深加工和遠銷售。近紅外光譜的研究雖起步較晚,但是其應用廣,特別是在農產品的品質檢測和分級領域取得較大的進展,開發(fā)應用前景廣闊。

1.2聲學無損檢測技術

聲學無損檢測技術是利用果品聲學特性與內部組織變化的關系,例如結構、成分、物理狀態(tài)等物化特性信息來檢測果品品質。聲學特性是指在聲波作用下農產品的反射、散射和吸收特性、衰減系數和傳播速度及其本身的聲阻抗與固有頻率等,它們均反映聲波與農產品相互作用的規(guī)律,這些特性隨農產品內部組織變化而變化。一般使用低能超聲波來檢測,因為低能超聲波在被檢測物中傳播不會引起物理或化學特性變化。超聲方法檢測果品品質始于近年,國內外研究集中針對水果成熟度、硬度和內部質量缺陷等無損檢測。

與光學、電學及其他無損檢測技術相比,聲學無損檢測技術具有適應性強、投資較低、操作簡便快捷等有死,特別適用于在線檢測,在農產品檢測領域應用前景良好[5]。

1.3軟X射線技術

適用性極強的X射線成像能夠與圖像識別、人工智能、現代通信技術等相聯(lián)系。若待檢測物體的密度和厚度不同,則不同的透射X射線量產生。鑒于分析穿透量,進而判斷果品內部品質。軟X射線擁有巨大優(yōu)勢,特別是在農產品的內部品質檢測上,因軟X射線具有穿透物料的特性,所以檢測那種易損壞的農產品,能無損檢測內部的品質。所需X射線強度方面,農產品檢測弱于工業(yè),所以稱為低能X射線或軟X射線。這種X射線成像技術來檢測農產品內部品質方法已經受到研究者關注,例如基于X射線成像技術的檢測核桃果核與果肉厚度,基于X射線圖像的評價牛肉嫩度,以及評價紅毛丹內部品質等。韓東海[6]用X射線來檢測柑橘皺皮果,結果表明射線與激光分析法在果實品質檢測中的可行性。然而目前國內此方面的技術開發(fā)較落后,期待學者們進一步的研究和探索。

1.4計算機視覺技術

伴隨專業(yè)化的圖像處理技術以及下降的計算機硬件成本和高速度特性,計算機視覺技術對農產品品質自動識別和分級的應用日益廣泛。計算機視覺技術即以各種成象系統(tǒng)代替視覺器官作為輸入敏感手段,借助于計算機替代大腦完成處理和解釋。計算機視覺的最終研究目標是使計算機可以像人一樣,通過視覺觀察來理解世界,具有自主適應環(huán)境的能力。

基于機器視覺的果品無損檢測的技術,一般是借助于CCD攝像頭獲取果品圖像,圖像信息輸入計算機,進而應用檢測方法和算法得到果品在大小、缺陷、外部損傷、內部品質等方面的特質值,從而來分級果品[7]。這種方法通常是由CCD攝像頭、配備圖像采集卡的計算機、光照系統(tǒng)和專用圖像處理軟件組成。在一定光源照射情況下,利用CCD攝像頭得到水果形狀、顏色、缺陷等視覺方面的圖像信息,憑借圖像采集卡轉換為數字信號傳輸到電腦,分隔圖像、提取特征值,從而得到特征值參數和水果顏色、質量狀況、破損程度等品質指標間模型關系,進而確定內外品質等級。這種方法快速、準確、無損,使用一次能同時檢測多項品質指標,方便設計自動分級流水線,自動識別水果外在品質(外形、缺陷、顏色、大小等)和內在品質(成熟度、堅實度、含糖量、含水率等),因此具有廣闊的應用前景[8]。

我國利用計算機視覺系統(tǒng),檢測農產品品質和分類農產品的研究方法開展較晚,始于20世紀90年代,但逐漸受到重視。與國際先進水平相比,在農業(yè)領域的應用我國計算機視覺技術研究具有一定程度的差距,我國目前處于實驗研究以及理論探索階段,實用化和商品化的程度還未達到。這項項目基于數碼攝像技術,通過電腦直接處理圖像信息,其研發(fā)促使使我國獲得最快速、最便利的視覺技術。

1.5核磁共振檢測技術

1946年,核磁共振現象由美國科學家F.Bloch和E.M.Purcell發(fā)現,這一技術廣泛應用于研究物質結構。核磁共振可以便利地生成果實內部組織結構的高清圖像。方便檢測果品壓傷、蟲害以及成熟度,因此在檢測蘋果、香蕉糖度等方面潛在價值極高。而那些因采收成熟度而影響品質的品種,鑒于核磁共振技術,能提高收獲和運輸可靠性?,F階段,這種技術要想真正應用于果品檢測和評價果品質量,還存在諸多問題,然而其優(yōu)勢明顯,這種技術無疑是一種良好的果品無損檢測方法[9]。

1.6力學特性檢測技術

基于動力學原理測度農產品硬度的檢測方法是力學特性檢測技術。采用振動頻率分析法以及沖擊力檢測法,檢測果品堅實度來判斷果實成熟度。力學特性檢測技術方便判斷果品的采收期,依照成熟度分級、貯藏果品,確定果品的保鮮期和貯存期。盡管這種技術具有較為堅實的實踐應用基礎及歷史,但介于果品品質和物理參數間的復雜關系,實際應用是一個漫長的研究過程[10]。

第3篇:計算機視覺的展望范文

關鍵詞:深度學習;行為識別;神經網絡

1 概述

動作行為識別是計算機視覺領域中的一個研究熱點,已經廣泛應用于智能監(jiān)控、人機交互、視頻檢索等領域中[1]。動作行為識別技術是通過對視頻或者圖像中人體動作行為做出有意義的判斷。有效表達圖像(視頻)中的實際目標和場景內容是最基本,最核心的問題。因此,對于特征的構建和選擇得到廣泛關注,例如STIP、SIFT、MSER等。但是,能通過無監(jiān)督方式讓機器自動從樣本中學習到表征樣本的特征,會讓人們更好地利用計算機來實現人的視覺功能。而深度學習作為神經網絡的延伸和發(fā)展,是通過逐層構建一個多層網絡來使得機器自動學習到隱含在數據內部的關系,從而讓學習到的特征更加準確性。

文章旨在探討深度學習與機器學習(神經網絡)之間的關系,并且介紹深度學習的由來、概念和原理;同時介紹目前深度學習在計算機視覺中的應用。最后提出深度學習目前發(fā)展所面臨的問題,以及對未來的展望。

2 深度學習

2.1 深度學習概述

深度學習源于人工神經網絡的研究,是機器學習的拓展。深度學習是經過組合低層特征來形成更加抽象的屬性類別和特征,從中發(fā)現原始數據的特征表征[2]。現在用于動作行為識別的技術是通過“動作表征”+“動作分類器”的框架來進行行為識別的。其中“動作表征”是人們手動設計特征獲取到的,也就是在目前識別框架內存在一個對動作圖像(視頻)的預處理過程。

深度學習和淺層學習相對。目前許多學習算法是淺層網絡學習方法,具有一定的局限性,例如在樣本有限的狀況下,表示復雜函數的能力有限制,且對復雜分類問題的泛化能力也會受到一定約束[3]。而深度學習通過學習深層非線性網絡結構,達到復雜函數逼近,又能在樣本少的情況下學習原始數據的特征。BP算法作為傳統(tǒng)神經網絡的典型算法,雖然訓練多層網絡,但僅含幾層網絡,訓練方法很不理想[3]。因為其輸入和輸出間非線性映射讓網絡誤差函數形成含多個極小點的非線性空間,因而經常收斂到局部最小,且隨著網絡層數的增加,容易過擬合。而深度學習可以獲得分布式表示,通過逐層學習算法來得到原始輸入數據的主要變量。通過深度學習的非監(jiān)督訓練完成,同時利用生成性訓練避免因函數表達能力過強而出現過擬合情況。

2.2 深度學習原理

傳統(tǒng)機器學習僅含單層非線性變換的淺層網絡結構,而且淺層模型單一。這對于深度網絡來說易造成陷入最優(yōu)或產生梯度分散等問題。因此,Hinton等人在基于深度置信網(DBNs)的情況下提出非監(jiān)督貪婪逐層訓練算法,隨后提出了多層次自動編碼器深層結構,這給解決深層網絡結構相關的優(yōu)化難題帶來了希望。此外Lecun等人提出的卷積神經網絡是第一個多層次結構的學習算法。同時深度學習還出現了許多結構:多層感知機、去噪自動編碼器、稀疏編碼等。

卷積神經網絡是第一個真正采用多層次網絡結構,具有魯棒性的深度學習算法,通過探究數據在空間上的相關性,減少訓練參數的數量。而且卷積神經網絡(CNN)適應性強,善于發(fā)現數據的局部特征。它的權重共享結構降低了網絡模型的復雜度,減少了權值的數量,使得卷積神經網絡在模式識別中取得了很好的結果。

自動編碼器的核心關鍵是將原始圖像(視頻)輸入信號進行編碼,使用編碼后的信號來重建原始信號,使得兩者之間的重建誤差最小。通過將原始信號編碼成另一形式,能夠有效地提取信號中的主要信息,能夠簡潔地表達原始圖像(視頻)的特征。

3 深度學習的應用

3.1 語音識別

從2009年開始,微軟研究院語音識別專家通過與Hinton合作,首先將RBM和DBN引入到語音識別聲學模型訓練中,使得語音識別的錯誤率相對減低30%,這徹底改變了語音識別原有的技術框架。在國際上,IBM、google等公司都快速進行了DNN語音識別的研究,并且速度飛快。國內方面,阿里巴巴,科大訊飛、百度、中科院自動化所等公司或研究單位,也在進行深度學習在語音識別上的研究。

3.2 視頻中的動作行為識別

準確迅速識別視頻中人的動作行為對于視頻搜索和視頻監(jiān)控具有劃時代的意義。最近幾年,深度學習技術被應用于視頻動作行為識別中。如Ji等人[4]提出多層網絡的3D卷積神經網絡來學習視頻中的時空特征,并通過卷積來實現對整個視頻特征的學習,從而代替之前的時空興趣點檢測和特征描述提取。在TRECVID數據庫上進行的實驗取得了不錯效果。

4 結束語

文章對深度學習的主要概念進行了全面闡述,包括其由來、原理、研究進展和相應的應用等。在很多領域中,深度學習都表現了潛在的巨大價值,但深度學習作為淺層學習的延伸,仍處于發(fā)展階段,還有很多問題值得我們深入探討:

(1)我們需要了解深度學習的樣本復雜度,需要多少訓練樣本才能學習到足夠的深度模型。

(2)在推進深度學習的學習理論和計算理論的同時,我們是否可以建立一個通用的深度學習網絡模型,作為統(tǒng)一的框架來處理語音、圖像和語言。

(3)神經網絡具有前饋性連接和反饋性連接,可是我們研究的深度網絡中還沒有加入反饋連接,這些都給深度學習的研究帶來了嚴峻的挑戰(zhàn)。

參考文獻

[1]王亮,胡衛(wèi)明,譚鐵牛.人運動的視覺分析綜述[J].計算機學報,2002,25(3):225-237.

[2]余凱,賈磊,陳雨強.深度學習的昨天、今天和明天[J].計算機研究與發(fā)展,2013,50(9):1799-1804.

第4篇:計算機視覺的展望范文

關鍵詞:立體視覺;圖像分割;陰影抑制;三維重建

1 概述

立體視覺的交通場景理解系統(tǒng)關鍵技術主要解決交通對象(行人、汽車、摩托車、自行車等)的三維信息模型化;低層處理,即先把圖像數字符號化和特征c的提取過程,主要包括圖像的分割和描述;運動檢測與運動匹配,主要技術有基于時空梯度的方法、基于相關的方法、頻率域法等;模型匹配與識別;交通對象的陰影檢測;系統(tǒng)實時性,由于三維重構計算量較大,提高系統(tǒng)實時性等六大問題。其中對三維重建、運動檢測與運動匹配和模型匹配與識別是立體視覺的交通場景理解系統(tǒng)關鍵技術主要研究方向。

從計算機視覺的角度進行分類,基于模型交通流量檢測技術的方法可以分類為:基于區(qū)域跟蹤的方法;基于動態(tài)輪廓的目標跟蹤方法;基于特征的跟蹤方法;基于3D模型(立體視覺)的車輛跟蹤識別方法。

2 立體視覺的三維重建研究方法

基于立體視覺的三維重建是指通過對二維圖像的處理,利用立體視覺的原理獲取場景中目標的三維信息。雙目立體視覺是直接模擬人類雙眼來處理景物的一種新型研究方法,由于其靈活性較高,可以測量多種條件下景物的三維信息。

2.1 圖像自適應閾值分割法

圖像自適應閾值分割法無論參數的選取為何種特征值,都能準確快速的捕捉待處理的運動目標。采用自適應閾值分割方法對獲得的交通對象的視頻圖像進行處理,把交通目標特征層經行分類處理,提高了類判別能力。同時,閾值來源較為廣泛和準確,因此,不僅具有較好的識別率還具有較強的實時性。在背景存在微小運動和環(huán)境亮度突變的情形下也具有很好的魯棒性。徐文聰等人主要從自適應閾值分割的方法對運動車輛進行檢測和流量統(tǒng)計。

在徐文聰研究中,閾值的取值為圖像的形態(tài)值,結合車道線和標定的攝像機內外參數,利用Dtsu算法提取候選車燈連通域信息。張虹波、孫明玉研究中,閾值的取值為圖像的灰度值。張虹波利用圖像差分方法獲得運動目標。提取虛擬檢測區(qū)域內的車輛圖像,進行圖像的數字化和濾除噪聲等預處理,對視頻圖像提取背景模型,得到車流量信息。孫明玉提出基于新型自適應閾值的運動目標提取算法。孫明玉[4]提出基于新型自適應閾值的運動目標提取算法。首先,根據運動屬性,分成兩個聚類,一是運動目標,二是背景。對提取的圖像按像素灰度進行分類,以聚類間的方根-算術均值距離最大值作為分割閾選擇的準則,實時更新提取的運動目標的二值化閾值,從而實現對運動目標的準確完整提取。

2.2 基于側影輪廓的三維重建方法

基于側影輪廓的三維建模是一種新的建模方法,也稱為可見外殼 (Visual Hull)生成方法。側影輪廓法是利用攝像機拍攝的不同角度的圖像進行立體重建,具有良好的幾何和拓撲結構的一致性,同時提取的特征點較少,易于計算,有較好的魯棒性。

阮孟貴、章毓晉利用攝像機在各個相異的角度獲取的多幅圖像完成三維重建。主要利用反射投影的交叉輪廓進行匹配,重建物體表面。伍燕萍用Marching Cubes算法,把獲取的多幅圖像進行側影輪廓重建,生成物體的可見外殼。曹煜利用平面鏡反射原理,對圖像輪廓線之間極的線幾何關系進行分析,獲得相應的相機內外參數,實現目標物體的三維重建。

2.3 基于序列圖像的三維重建方法

序列圖像法主要是利用數字圖像處理的方法對圖像二值化,便于計算機處理。通過對提取的特征點之間進行相似度的匹配,利用矩陣分析進行三維重建。此類方法關鍵在于正確三維數據的獲取,利用計算機相關軟件進行圖像掃描、圖像預處理、建立數據模型,怎樣辨別噪聲是此方法的難點。雖然序列圖像法存在一定的噪聲污染,但由于其設備簡單,在交通場景中運用面較廣。

劉同敏利用提取的圖像序列作為測量矩陣的參數,提出了一種基于匹配相似度的最小二乘法三維重建方法。譚論正提出了基于PCA的交通場景點的重建方法。利用最小二乘法求場景點的三維軌跡,根據獲得的數據實現運動目標和背景模型的三維重建。孫麗娟通過透視投影重建算法中引入了迭代算法。利用矩陣擾動理論,分析圖像噪聲對不同特征點重構的影響,得出圖像數量越多重建精度越高的結論。彭科舉提出了尺度不變特征變換特征和角點特征相結合的三維重建算法。

2.4 混合高斯模型進行背景建模

隨著信息技術、計算機技術、數據通信技術、傳感器技術、電子控制技術快速發(fā)展,基于視頻的智能交通控制系統(tǒng)在交通控制中占主要作用。在交通對象的監(jiān)測中,高斯背景模型在建立對運動目標的提取有著至關重要的作用。研究發(fā)現,視頻圖像提取的特征值背景顏色和像素的灰度值符合高斯分布。由于像素在時間域上的分布信息符合高斯分布,利用其構造其背景模型能解決光線突變等問題帶來的影響,能夠適應于戶外復雜光線的環(huán)境。此方法建模后模型的魯棒性強,準確率高。目前,高斯背景建模在交通智能控制系統(tǒng)中發(fā)揮著越來越重要的作用。

劉亞利等人提出了基于邊緣特征的混合高斯背景建模方法。此方法加快了高斯模型的收斂速度,有較強的光變性。同時利用像素在時間域及空間域上的分布信信息,王永忠等人提出了一種基于自適應混合高斯模型的時空背景建模方法。監(jiān)控系統(tǒng)采集的數庫不僅僅有時間上的信息,還有空間位移信息。王永忠提出的時空背景建模方法利用時間和空間上的像素分布信息,不僅提高了建模精度還解決了傳統(tǒng)的混合高斯背景建模方法對不平穩(wěn)場景建模失效的這一缺點。

3 結束語

基于立體視覺的三維建模技術研究是一個非常有意義的研究課題,在交通參數檢測技術的研究中,我們要結合相關的計算機圖像采集和處理技術,充分利用道路已有的資源,并將其采集的資源圖形化、數字化。雙目立體視覺技術對目前的單視點平面監(jiān)控系統(tǒng)缺點進行很好的彌補。利用雙目立體視覺對交通對象進行檢測和監(jiān)控,對獲得圖像數據分析,完成運動目標的三維空間定位和追蹤。結合現有的計算機、電子信息技術,互聯(lián)網技術,對交通加強智能化建設,逐步實現增強道路交通監(jiān)控的信息化和自動化。

參考文獻

[1]周冬梅,張明星,代永霞,等.基于紋理的車輛陰影消除新算法[J].自動化與儀表,2014(1):133-138.

[2]徐文聰,劉海.夜間環(huán)境交通數據采集系統(tǒng)設計與實現[J].測控技術,2012,31(6):60-66.

第5篇:計算機視覺的展望范文

關鍵詞:焊接自動化;圖像處理;應用;發(fā)展趨勢

中圖分類號:C37 文獻標識碼:A

一、概述

隨著計算機視覺技術的發(fā)展,近年來利用機器視覺直接觀察焊接熔池,對焊

接質量進行閉環(huán)控制是通過圖像處理獲取熔池的幾何形狀信息,已是當前研究的主要方向。

和傳統(tǒng)的手工焊和半自動焊接過程相比,使用機器視覺進行直接觀測焊接熔池有著很明顯的優(yōu)點,采集的數字圖像信息豐富,表象直觀,且數字化的圖像數據可以實時傳輸到計算機高速緩存內,提取特征信息, 進行實時處理,同時作出在線判決,可以實現焊接過程質量實時控制和傳感。

在傳統(tǒng)的手工焊接和半自動焊接過程當中,對于一個有經驗的焊工,通過直接觀察熔池的行為、接頭的位置、焊道外形及電弧形狀,能夠感知焊接的狀態(tài)。若是感覺到實際焊接過程中同最佳狀態(tài)不一致,為了達到最佳狀態(tài)可以通過調節(jié)各參數,以獲得高質量的焊縫??梢园堰@個過程劃分為眼-腦-手的控制過程。圖像處理在焊接過程中的重要意義就等同于手工焊接過程中人的眼睛,可以實現采集和處理焊接位置的傳感、焊接時熔池、焊道對中、熔寬和熔深的信息,然后利用計算機發(fā)出指令,實現焊接過程的各種工藝參數如電流、電壓、焊接速度的調節(jié)和電弧或焊絲的對中。

二、圖像處理的概念

圖像處理(image processing),用計算機對圖像進行分析,以達到所需結果的技術。又稱影像處理。一般圖像處理就指的是對數字圖像處理。數字圖像是指用數字攝像機、掃描儀等設備經過采樣和數字化得到的一個大的二維數組,該數組的元素稱為像素,其值為一整數,稱為灰度值。圖像處理技術的主要內容包括圖像壓縮,匹配、描述和識別以及增強和復原這3個部分。常見的處理包括有圖像復原、圖像數字化、圖像增強、圖像編碼、圖像分析和圖像分割等

三、焊接圖像攝取方法

圖像的處理一般包括量化、圖像識別和圖像預處理等幾個步驟。圖像預處理包括圖像增強、圖像變換和圖像恢復,盡量把因為隨機因素的干擾和攝像中各種條件的限制而產生的不足和噪聲減小,繼而可以獲取焊縫位置的精確信息;量化由圖像卡完成;圖像識別包括邊緣提取和圖像分割等,可借助小波變換、快速傅立葉變換、概率統(tǒng)計等數學工具對圖像進行理解、分析、模式識別和特征提取。

從國內外大量文獻來看,利用機器視覺采集焊接熔池圖像的方法主要分為被動式直接視覺傳感和主動式直接視覺傳感兩大類,視覺傳感器常采用CCD攝取原始圖像。CCD是英文(Charge-Coupled Devices)的縮寫,意即“電荷耦合器件”。具有體積小、耐震動、重量輕、穩(wěn)定性好、壽命長、速度高,幾何失真小及耐高壓等一系列優(yōu)點。CCD是固態(tài)圖像傳感器的一種,固態(tài)圖像傳感器是指把布設在半導體襯底上的許多感光小單元的光-電信號,用所控制的時鐘脈沖讀取出來的一類功能器件。

動式直接視覺傳感利用窄帶復合濾光系統(tǒng)濾除非連續(xù)光譜的電弧強光,并采用高強脈沖激光或具有圖像增強器的高頻閃光燈作為輔助光源,可有效地抑制弧光獲得清晰圖像。被動式直接視覺傳感是利用焊接過程中的結構光進行成像。主被動式直接視覺傳感存在強光干擾的問題,激光焊接中,通常采用中性減光的辦法解決強光干擾的問題;在電弧焊中,對于短路電弧焊和脈沖電弧焊.可在短路期間或基值電流期間獲取圖像數據,或者在攝像機前通入部分保護氣,減少煙霧和飛濺的影響;TIG/MIG/MAG焊時弧光在600~700nm波段內相對光強最弱最穩(wěn)定,選用這一波段內的干涉濾光片和防熱玻璃可有效地排除弧光及紅外干擾。

四、圖像處理在焊接中的應用

現如今,對于圖像處理主要集中應用在脈沖機器人焊接、TIG焊、激光焊和焊縫質量的檢測等領域。圖像技術在機器人焊接領域應用較廣。由于機器人需要有很強的適應能力,借助三維視覺傳感系統(tǒng)和計算機圖像處理技術,焊接機器人可對焊接環(huán)境進行實時控制。通過圖像的采集,可幫助機器人進行焊縫的對中,為機器人焊接提供實時特征信息,如熔深、熔寬和熔池的形狀等,從而實現焊接過程的智能控制。目前國內哈工大的吳林教授在這方面作了較深入的研究,從焊縫位置的傳感到熔滴的過渡,從過程實時控制到最后焊接質量的檢測都進行了較為系統(tǒng)的研究。

哈工大的何景山博士在脈沖TIG焊熔深及熔透的彩色圖形法傳感方面進行了較深入的研究。圖像處理目前用得最廣的領域是在脈沖TIG焊中,國內外許多學者都對該領域進行了積極的探索。首先創(chuàng)建了一套適用于脈沖TIG焊的彩色圖像法熔深和熔透的傳感系統(tǒng),通過對脈沖峰值和脈寬的控制實現對熔深和熔透的控制,其控制信息來源于基值期間,進行圖像信息的采集。

此外,圖像處理還在焊接的其它領域中有一定的應用。有的將圖像處理用于焊接缺陷的自動監(jiān)測與缺陷尺寸的保真,也都收到了良好的效果。有些科技工作者還將圖像處理用于水下濕法焊接,通過復合濾光技術和水下CCD攝像系統(tǒng),采集出了藥芯焊絲水下濕法焊接電弧區(qū)域的圖像,用中值濾波和梯度算子的電弧區(qū)域圖像邊緣檢測方法,有效地區(qū)分了電弧燃燒區(qū)域和電弧氣泡區(qū)域。哈爾濱工業(yè)大學的何景山、楊春利等人結合采用埋弧焊進行容器類焊接結構制造過程中的工藝特點及實際工況,設計了一種將微型攝像機、微型半導體激光發(fā)生器及具有濾光功能的光學系統(tǒng)三者集成一體的焊縫視覺傳感器。

焊接控制過程中的一個重要環(huán)節(jié)就是焊接縫隙檢測,圖像處理在這方面的應用也有許多學者研究。為了實現電弧焊過程的自動對中和焊縫質量控制,必須對焊接縫隙的相對位置和坡口幾何參數進行檢測。西安交大的梁晉、賈昌申等在《圖像法焊接縫隙檢測的研究》一文介紹了一套自行設計的計算機焊接縫隙檢測系統(tǒng),包括圖像采集卡、計算機接口、光學傳感器、圖像處理軟件,分析了它們的基本結構和工作原理,討論了提高光學傳感器、圖像處理軟硬件等抗干擾能力的措施。該系統(tǒng)工作原理是:由光源和CCD攝像機組成的光學傳感器攝取圖象,CCD攝像機把圖象轉換為電信號,再經圖象采集卡把模擬信號變?yōu)閿底中盘柎鎯τ谟嬎銠C內,計算機對此信號進行必要的處理,即可得到縫隙位置和坡口幾何參數信息,在監(jiān)視器屏幕上顯示出來,或經過D/A電路給執(zhí)行機構,修正焊槍位置,實現閉環(huán)對中控制。有的將圖像分割和小波分析應用于焊接領域,小波分析在焊縫視覺跟蹤過程中檢測焊縫,采用多次小波變換可獲得清晰的焊縫邊緣,大大簡化了硬件設備;圖像分割法可減小焊縫識別的圖像處理的復雜性,使得焊接過程的實時性增強。

五、圖像處理在焊接中應用的展望

為焊接現象的描述及內在規(guī)律的解釋提供了極佳的條件和直接的證據,推動焊接理論和實踐的發(fā)展就是通過圖像傳感的這種方法。同時也使得研究者能夠觀察到其它傳感方法所不能觀察到的被強光所淹沒的豐富直觀的信息。

把圖像處理技術應用到現代焊接技術中,將會推動焊接過程質量實時傳感與控制的發(fā)展和成熟,使得焊接過程通過閉環(huán)反饋控制而實現完全自動化,保證焊接質量,提高焊接生產效率。

總之,作為智能控制中關鍵技術―數字圖像技術,在焊接過程中發(fā)揮的作用將會越來越大,將為焊接智能化生產作出貢獻?,F代工業(yè)正朝著信息化和智能化方向發(fā)展,現代焊接技術也必然要實現智能化。

參考文獻:

[1]段佳佳,楊迎春.圖像處理在自動焊接中的應用[J].電子測試,2012,02:12-15.

[2]陳彥賓,李俐群,陳鳳東,陳杰.圖像處理在自動焊接中的應用和展望[J].材料科學與工藝,2003,01:106-112.

作者簡介:

第6篇:計算機視覺的展望范文

關鍵詞:數字圖像;處理技術;電子信息

中圖分類號:TN911.7 文獻標識碼:A 文章編號:1000-8136(2012)09-0153-02

不論在哪種通訊手段中,人們都更愿意選擇直觀的圖像表達,因此,未來社會對圖像傳遞信息的要求越來越高,及時性、直觀性、客觀性等發(fā)展條件都對現有的數字圖像處理技術提出了挑戰(zhàn)。

1數字圖像處理技術概述

數字圖像處理又稱為計算機圖像處理,它是指將圖像信號轉換成數字信號并利用計算機對其進行處理的過程。這一過程包括對圖像進行增強、除噪、分割、復原、編碼、壓縮、提取特征等內容,圖像處理技術的產生離不開計算機的發(fā)展、數學的發(fā)展以及各個行業(yè)的應用需求的增長。20世紀60年代,圖像處理的技術開始得到較為科學的應用,人們用這種技術進行輸出圖像的理想化處理。

經過多年的發(fā)展,現在的電子圖像處理技術已具有了以下特點:更好的再現性:數字圖像處理與傳統(tǒng)的模擬圖像處理相比,不會因為圖像處理過程中的存儲、復制或傳輸等環(huán)節(jié)引起圖像質量的改變;占用的頻帶更寬:這一點是相對于語言信息而言的,圖像信息比語言信息所占頻帶要大好幾個數量級,因此圖像信息在實現操作的過程中難度更大;適用面寬:可以從各個途徑獲得數據源,從顯微鏡到天文望遠鏡的圖像都可以進行數字處理;具有較高的靈活性:只要可以用數學公式和數理邏輯表達的內容,幾乎都可以用電子圖像來進行表現處理.

2數字圖像處理技術的發(fā)展

自從美國在1964年開始通過衛(wèi)星獲得大量月球圖片并運用數字技術對之進行處理之后,越來越多的相應技術開始被運用到圖像處理方面,數字圖像處理也作為一門科學占據了一個獨立的學科地位,開始被各個領域的科學研究運用。圖像技術再一次的飛躍式發(fā)展出現在1972年,標志是CT醫(yī)學技術的誕生,在這種技術指導下,運用X射線計算機斷層攝影裝置,根據人的頭部截面的投影,計算機對數據處理后重建截面圖像,這種圖像重建技術后來被推廣到全身CT的裝置中,為人類發(fā)展做出了跨時代的貢獻,隨后,數字圖像處理技術在更多的領域里被運用,發(fā)展成為一門具有無限前景的新型學科。之后十年數字圖像處理技術也朝著更高深的方向發(fā)展,人們開始通過計算機構建出數字化的人類視覺系統(tǒng),這項技術被稱為圖像理解或計算機視覺。很多國家已在這方面投入了很多的研究精力,并取得了高深的研究成果,其中,20世紀70年代末提出的視覺計算理論為后來計算機數字圖像技術的理論發(fā)展提供了主導思想,但理論上如此,在實際操作中還存在著很多的困難。

我國在建國之初就展開了計算機技術的研究,而改革開放以來,我國在計算機數字圖像處理技術上的發(fā)展進步也是非常大的,甚至在某些理論研究方面已趕上了世界先進水平,首先,對于成像數據的收集能力方面,我國通過成功研發(fā)的一系列傳感器以及發(fā)射的對地觀測衛(wèi)星,能夠及時有效地獲得風云、海洋、資源和環(huán)境減災等方面的相關數據,并取得了有效的數據結果和數據成像效果。另外,數字圖像處理技術應用較為廣泛的領域代表分別是建筑、通行工程和生物醫(yī)學工程方面,這些方面對數字圖像處理技術的應用,最能直接體現該技術的發(fā)展現狀。在建筑行業(yè)中,數字圖像處理技術可以將擬建造的建筑或建筑群的高度、密度以及其他可能影響建筑質量、建筑環(huán)境的信息轉換成圖像,從而使設計者更為合理地進行規(guī)劃;在通信工程領域,數字圖像技術和語音、文字等因素構成了現代多媒體的基本內容,在傳遞圖像的過程中,采用編碼技術來壓縮信息的比特量,這種技術現在的發(fā)展內容包括變換編碼等,未來可能發(fā)揮作用的還有小波變換圖像壓縮編碼、分行編碼等。在生物醫(yī)學工程中,書籍圖像技術能將人體活動的機理以圖像的形式客觀地呈現在研究者面前,對醫(yī)學未來的發(fā)展具有不可替代的作用。

3數字圖像處理技術的發(fā)展趨勢

計算機數字圖像處理技術在未來信息技術方面將會發(fā)揮的重要作用早已被人們看到,對于計算機圖像技術的發(fā)展道路,大致可以歸結出3個原則性內容:①未來數據圖像技術強調高清晰度、高速傳輸、實時圖像處理、三維成像或多維成像、智能化、自動化等方向發(fā)展。②未來數字圖像處理技術強調操作、運用的方便性,圖像處理功能的集中化趨勢是必然會存在的。③更新的理論研究與更快的算法研究。理論走在實踐的前面,已經是現代科學的特點,未來數字圖像處理技術的實際運用要取得更多的發(fā)展,必然離不開理論和研究方法的更新,新理論中包括小波分析、分形幾何、形態(tài)學、遺傳算法等都將得到更深層次的發(fā)展。

4結束語

數字圖像處理技術的有效應用在人們日常生活中就能切身地感受到,不管是看電視、看電影、上網還是移動通信,每個人都與這種技術發(fā)生著最緊密的聯(lián)系。數字圖像處理技術的發(fā)展關系到每個人對優(yōu)越的社會生活、現代物質享受的程度的深淺,所以,對之進行及時的研究和關注在電子通信行業(yè)中是非常重要的。

第7篇:計算機視覺的展望范文

【關鍵詞】單目視覺 風洞 飛機模型 位姿判別 傳感系統(tǒng)

【Abstract】In order to provide a reference for later flight control computers, the study has studied and written a software system which could discriminate the position and orientation of wind tunnels model based on monocular vision. An aircraft model with driving force is able to fly stably and autonomously in the wind tunnel. By control-law, the aircraft model stays static relative to the ground, unlocking all six degrees of freedom. Multiple LED marked points are placed on the aircraft model. The CCD industrial camera model at the top of the model continuously captures the image and returns real-time image data to an upper computer with a dynamic link library. The free-flight trials system can get the spatial position and altitude information of the aircraft model through the use of upper computer software with C/C++ language, achieving identification algorithms, as well as position and orientation solver algorithms.

【Keywords】Monocular vision wind tunnel aircraft model attitude determination sensing systems

1 引言

近年來,隨著計算機技術和圖像處理技術以及數字視頻器件的發(fā)展,計算機機器視覺與視覺檢測在許多領域得到了廣泛應用[1]:如機翼表面油流試驗、壓敏漆表面壓力測量、模型變形測量、投放試驗、非接觸位移測量等.另外在工業(yè)檢測[2]中應用更加廣泛,如流水線工件自動檢測、大型復雜曲面的三維檢測、大型工件平行度和垂直度測量、字符識別、醫(yī)學圖像分析、未來外星車導航[3]等等。在現代自動化生產過程[4]中,機器視覺系統(tǒng)廣泛地應用于工況監(jiān)視、成品檢驗和質量控制等領域。同時,機器視覺與視覺檢測技術逐步發(fā)展為使用視頻測量技術(Videogram-metric Technique)[5],該技術在風洞測量[6][7]這種要求非侵入式測量中具有無可比擬的優(yōu)勢,因此在風洞測量中得到了大量應用。目前雖然我國利用CCD圖像傳感器設計出車牌識別[8][9]等系統(tǒng),逐步開始了工業(yè)現場的應用[10],但是我國該技術起步較晚,應用領域真正高端的不多。本文,將機器視覺技術應用于基于單目視覺的風洞模型位姿傳感系統(tǒng),提供了另一種獲取飛機空間位置信息研究飛機位姿的方法。擴展了該技術的應用領域,填補了國內機器視覺技術發(fā)展的空白,順應了時展的潮流。

2 風洞模型及其工作原理

常規(guī)風洞試驗一般將模型固定在支架上,支架上裝有天平測力系統(tǒng),可以帶動模型在一定自由度內運動。但其顯著缺點是支架對模型周圍的流場存在干擾,同時模型自由度受到約束。常規(guī)風洞試驗如圖2.1:

而風洞模型自由飛技術不限制模型自由度,沒有支架干擾,可以最大程度的模擬飛機在大氣中飛行的環(huán)境。本系統(tǒng)中引入機器視覺技術,通過設計控制律,使模型相對于地面靜止,在模型上放置多個LED標志物,通過CCD攝像機識別,推算模型的姿態(tài)或空間位置。如圖2.2:

3 相機接口實現

飛行器位姿識別屬于典型的機器視覺技術范疇,機器視覺技術是依靠圖像攝取裝置將攝取目標轉換為圖像信號,并將該信號傳送給專用的圖像處理系統(tǒng),根據像素分布和亮度、顏色等信息,轉變成數字化信號;圖像系統(tǒng)對這些信號進行各種運算來抽取目標的特征,進而根據判別的結果來控制現場的設備動作的先進技術。

圖像采集是機器視覺技術的兩大技術核心之一,由于既需要優(yōu)質的圖像質量,又需要高效的圖像采集速率,當下普遍使用CCD相機(Charge-coupled Device)對攝取目標進行圖像采集。

CCD相機本質上是一種半導體器件,能夠將普通的光學影像轉化為特殊的數字信號, CCD上植入的微小光敏物質稱作像素(Pixel)。一塊CCD上包含的像素數越多,其提供的畫面分辨率也就越高。一般而言CCD相機獲取的圖像為RGB圖像,也就是說每一個像素都由紅(R)綠(G)籃(B)三個成分組成,來表示RGB色彩空間中的一個點。CCD的作用就像膠片一樣,但它是把圖像像素轉換成數字信號。CCD上有許多排列整齊的電容,能感應光線,并將影像轉變成數字信號。經由外部電路的控制,每個小電容能將其所帶的電荷轉給它相鄰的電容。

相機攝取的光學影像轉換成的數字信號,通過相機的驅動程序可儲存到計算機的存儲器當中。利用相機提供的接口配置好計算機的工程環(huán)境可以通過編寫開程序代碼對相機進行操作控制,接口一般分為兩大類,一是主功能接口,具體功能包含攝像機開啟關閉、采集圖像、控制攝像機等具體操作,包含文件 GxIAPI.h,動態(tài)鏈接庫 GxIAPI.dll,靜態(tài)鏈接庫 GxIAPI.lib二是圖像處理接口,包含數據轉換等功能操作。利用這些接口便可編寫相應的代碼實現之后的位姿識別算法,包含文件 DxImageProc.h,動態(tài)鏈接庫 DxImageProc.dll,靜態(tài)鏈接庫 DxImageProc.lib。

上述應用接口庫支持32位編程開發(fā)工具Microsoft Visual C/C++。使用C/C++編程工具,用戶 應在程序中調用相關的包含文件(.h),并將靜態(tài)鏈接庫(.lib)文件加入到工程文件中,供編譯程序在鏈接(Link)時使用。

完成上述準備工作之后,便可采集圖像并根據編寫的程序對圖像進行進一步處理,其具體采集流程如圖3.1:

4 識別算法及其原理

通過CCD相機讀取到的圖像以類似矩陣的數據類型存儲在計算機中,其中黑暗環(huán)境的亮度值較低,其數據結構中的標記位會被標記為0,而發(fā)光光源部分亮度值較高,其數據結構中的標記位會被標記為1。其模型類似圖4.1,其中每一格代表一個像素點:

1代表亮點

該算法從矩陣首行首列開始,由左至右,由上至下開始進行遍歷搜索,每當搜索到亮點(標記位為1的像素點),就對該點進行以該點為中心,依次按照上,右上,右,右下,下,左下,左,左上的優(yōu)先順序進行搜索判斷,若相鄰點也為1,則對該相鄰點繼續(xù)擴展搜索,直至將所有相鄰的亮度點全部搜索完畢,之后將所有被搜索到的點標記為ACCESS,防止下次搜索重復計算,若此次擴展搜索獲得的亮點總數超過設定值(本程序默認設置為200,可修改)則判定此處為亮點。按照上述方法將全圖遍歷完成后,便可求得全圖所有亮度點。搜素偽代碼如下:

//********************************************

// 尋找亮點區(qū)域,記錄相關值,并標記已訪問

// sumi 橫坐標之和;sumj 縱坐標之和;

// points 點區(qū)內像素點的數目

//********************************************

findthearea(i,j)//標記一個片區(qū)

5 位姿判別算法

參考六自由度頭部跟蹤算法[11][12],以四個LED燈所標記的點所在平面為,即飛機為輻射坐標系() ,令CCD攝像機攝像坐標系代表風洞的坐標系(),CCD的成像面當成圖像坐標系(,)。因此,判斷飛機模型的姿態(tài)可以轉化為分析輻射坐標系對于風洞坐標系的位置關系。由此可求得位姿信息,方位角α,滾轉角β,偏航角。

輻射坐標系和攝像坐標系的變換關系為

而矩陣H的表達式

采用小孔成像模型,像點坐標(,)為:

其中i=A,B,C,D,代表所獲取飛機模型上的4個LED燈的信息。

綜合上述公式,進行等量代換

假設4個LED燈構成的正方形對角線長度為2L,則4個LED燈在輻射坐標系下的坐標為A(0,L,0),B(L,0,0) ,C(0,-L,0),D(-L,0,0)帶入前式,可知每個LED對應2個方程:

設:

根據以上兩式轉化這6個中間變量,然后聯(lián)系轉換矩陣H,便可求得位姿角:

6 Labview接口設計

飛控計算機的系統(tǒng)狀態(tài)實時顯示程序采用LabView開發(fā),便于模型狀態(tài)數據的記錄,飛控參數的調整。位姿信息最終作為輸入數據傳送到系統(tǒng)狀態(tài)實時顯示程序,程序對輸入的位姿信息做進一步處理。

不同的位姿信息傳送方法對實時性的影響相差較大,因此,選擇高效的數據傳送方法至關重要。本項目擬采用LabView調用動態(tài)鏈接庫的方法來實現數據傳送。

將獲取位姿信息源代碼編譯生成動態(tài)鏈接庫文件,然后將文件加載至LabView項目中,通過調用動態(tài)鏈接庫的接口函數來獲取位姿信息數據,達到快速通訊的目的。

7 結語

風洞模型自由飛技術是空氣動力學領域一項先進的測試技術,可以模擬飛機復雜的飛行動作,這項技術實現的關鍵之一是姿態(tài)測量。

本文針對通過飛機模型有限個標志亮點來獲取模型位姿信息并傳送至上級處理系統(tǒng)的方法進行了詳細的討論。通過對飛機模型姿態(tài)與模型上有限個亮點的位置信息的關系進行分析,給出了實時位姿信息獲取系統(tǒng)的構造思想。該系統(tǒng)提供實時的飛機模型位姿信息,為飛控計算機對模型的控制提供參考依據。

參考文獻:

[1]賈云得.機器視覺[M].北京:科學出版社,2000.

[2]段峰,王耀南,雷曉峰,吳立釗,譚文.機器視覺技術及其應用綜述[J].自動化博覽,2002年03期.

[3]唐向陽,張勇,李江有,黃崗,楊松,關宏;機器視覺關鍵技術的現狀及應用展望[J].昆明理工大學學報(理工版),2004年02期.

[4]關勝曉.機器視覺及其應用發(fā)展[J].自動化博覽,2005年03期.

[5]R.Shorts,W:L.Snow.Video-metric tracking of wind tunnel aerospace models at NASA

Langley research center[C].The Thompson Symposium held at the University of York

on 20th April 1 996:673~689.

[6]Hassan Mostafavi. Wind tunnel model aircraft attitude and motion analysis[J].PRO.SPIE.Signal and image processing systems performance evaluation simulmion and modeling.199I(1483):104~111.

[7]ohn V Foster,Kevin Cunningharn.Charles M.Fremaux.Dynamics modding and simulation of large transport airplanes in upset conditions[J].Navigation and control conference and exhibit,2005:l5~l 8.

[8]鄭南寧.計算機視覺與模式識別[M].北京:國防工業(yè)出版社,1998.

[9]劉煥軍,王耀南,段峰.機器視覺中的圖像采集技術[J].電腦與信息技術,2003年01期

[10]王慶友,孫學株.CCD應用技術[M].天津:天津大學出版社,1993

第8篇:計算機視覺的展望范文

關鍵詞:鐵路貨車;輪對參數;鐵路運輸;安全系數;自動檢測系統(tǒng)

中圖分類號:U270 文獻標識碼:A 文章編號:1009-2374(2014)33-0025-02

輪對是鐵路貨車行走過程中重要的構件,安全高效的輪對是保證鐵路能夠快速、安全運輸的關鍵因素,輪對故障導致的安全事故屢見不鮮,給鐵路運輸造成了嚴重的損失。另外,輪對故障也會給車輛本身以及鐵路固定設施帶來一定程度的損害。目前,我國仍然依靠傳統(tǒng)的人工手動測量來對其進行故障的檢測診斷,不但效率低下,檢測精度以及可檢測項目也不盡如人意,為鐵路正常運行帶來了隱患。因此,發(fā)展一種新型的自動貨車輪對檢測技術對于提高我國檢測水平、提高鐵路運輸安全系數有著重要的意義。

1 輪對自動檢測技術的原理及現狀

目前來說,國內外主要應用的輪對自動檢測技術按照原理分類,可分為以下三類:光截圖像原理技術、視覺自動測量技術以及激光位移測距技術,主要應用于貨車的入庫檢查以及地鐵在線監(jiān)查上。下面分別簡述一下這三類原理:

1.1 光截圖像原理技術

這種技術主要原理為利用三角激光測量技術來實現測量物體二維尺寸的目的。采用的投射光源為點狀高強度激光,高速的CCD相機作為圖像采集設備。當測試完畢后會得到一系列的曲線,將其和標準的校正曲線進行比對矯點,從而實現目標參數的自動檢測。這種技術在低速以及靜態(tài)測量中的精度比較高,但是對于高速測量的精度尚不能令人滿意,這是由于CCD相機的采集速度有限而造成的。但是這種原理制備的設備價格低廉、操作簡單,得到了廣泛的應用,如丹麥的EDOC公司、美國的BEENA公司以及國內的哈爾濱威克公司等都有相應的產品。

1.2 視覺自動測量技術

視覺自動測量技術是一種基于視覺測量系統(tǒng),建立在計算機視覺研究基礎上的新興技術,其優(yōu)點為抗干擾能力強、高效易行,非常適合一些在現場生產中的在線非接觸性監(jiān)控及監(jiān)測。在實際生產過程中,該技術基于視頻成像原理及先進的圖像識別功能工作,通過高速攝像機現場拍攝車輛輪對運行狀況,采用逐幀截屏得到清晰圖片,再對圖片進行識別辨認的方法來實現對車輛輪對的監(jiān)控監(jiān)測。

1.3 激光位移測距技術

激光位移技術是一種高精度、高精密的非接觸行測量技術,主要用于測量對象物體的位置以及位移的變化,可以準確監(jiān)測出物體的位移、體積尺寸、振動頻率等物理幾何量的測量。按照原理,激光位移技術可分為激光回波法和激光三角測量法兩種,而在鐵輪貨車輪對檢測中主要用的是激光三角測量法,這種檢測方法精度高,但監(jiān)測的距離較短。在實際應用中,左右兩路光電流從激光位移傳感器發(fā)出,通過干涉成像,就可以反推算出物體激光點和成像透鏡前面的距離,從而達到監(jiān)測的目的。目前這種技術已經被應用于我國部分鐵路

路段。

2 輪對自動檢測系統(tǒng)的研制及簡單介紹

2.1 系統(tǒng)結構整體設計

根據輪對檢測工藝要求以及車間的實際工作狀況,我們設計了一種以龍門通過式機械結構為基礎的輪對自動檢測系統(tǒng),其簡單組成主要包括進給總成、升降總成、帶轉總成、測量裝置以及傳感器等。待貨車輪對沿著特定軌道進入測量裝置后,通過各個部件的協(xié)同作用以及協(xié)調工作,自動完成對輪對各參數的測量。本裝置可以檢測的輪對參數主要包括輪緣厚度、輪座直徑、車輪直徑、車軸中央直徑等。

待測的輪對在自動計算機控制系統(tǒng)的作用下,通過導向裝置機構使得輪對到達指定的測量位置,具體如下:當輪對滾動到待測位置時,擋輪裝置將其擋住,位于裝置下方的輪對提升結構將輪對升起后由轉動裝置驅使輪對轉動。

與此同時,測量裝置在直線電機的驅動下,通過絲杠的帶動使其沿直線運動單元迅速下降到測量位置停止。當測量傳感器做橫向運動時,可以測量輪對的中央直徑,左右輪緣寬度等參數;和其相連的旋轉電機可以控制測量傳感器做順時針以及逆時針的旋轉,可以測量左右輪座直徑以及輪輞厚等參數。在自動控制系統(tǒng)的作用下,激光傳感器按照一定的路徑做直線往復運動,可以自動采集被測輪對中各測量點的數據,通過安裝的攝像裝置可以將裝置板上的圖像反映到計算機的顯示屏上,經過計算機運算處理后得到測量結果保存到相應數據庫中并自動打印。當采集數據完成后,左右的測量裝置以及激光傳感器自動上升到初始位置,測試的輪對停止轉動并自動下降,最后由輪推裝置推出測量位置,完成整個的工作循環(huán)。

2.2 測控系統(tǒng)設計

本自動檢測系統(tǒng)的測控系統(tǒng)主要有工業(yè)控制高精密計算機、運動控制部分、數據自動采集處理部分以及測控軟件等部分組成。

2.2.1 工業(yè)控制高精密計算機。該部分作為整體系統(tǒng)的關鍵組成之一,擔負著處理數據,采集打印圖像以及對運動的部件進行高精度高準確度控制的作用。設計中我們采用的是方正的主機,CPU為AMD 速龍II X4 740,內存為4GB的DDR內存,配備Dell打印機,利用Windows自帶的Microsoft Visual C++ 7.0編程系統(tǒng)進行編程。我們采用的計算機配置較高,編程系統(tǒng)較為先進,為整個檢測系統(tǒng)的優(yōu)良性能奠定了良好的基礎。

2.2.2 運動控制部分。運動控制部分主要由步進電機、氣動控制裝置以及異步電機三部分組成。實際運行條件下,要求本系統(tǒng)的定位精度高,整體系統(tǒng)動作平穩(wěn),沖擊力小。因為旋轉特性不同,結合實際現場運行的需要,選擇合適的電機是非常重要的。在輪對旋轉中,由于對電機的要求較低,因此采用的是步進電機,最佳細分圈數為6400步/圈。在滑臺極限位置兩側安裝有光電開發(fā),實現對運動極限位置的控制,保護與之相連的傳感器。設計中旋轉運動機構和橫向運動機構對電機要求較高,因此我們使用了帶有64位高性能RISC中央處理器的交流伺服電機,提高了機器的響應性。

2.2.3 數據自動采集處理部分。數據采集部分主要由激光傳感器,電渦流傳感器以及A/D采集卡三部分組成,這部分也是系統(tǒng)設計最重要的部分,其采集數據的準確度決定著系統(tǒng)的檢測精度,是設計中的重點。其基本工作原理是激光傳感器輸出的電信號經由電渦流傳感器的放大、濾波、抑躁處理后送入A/D采集卡進行模數轉換。

設計中利用電渦流傳感器對輪對的踏面進行高速的數據采集,計算機處理后可得踏面特征;對于車輪直徑以及車軸中央直徑等則采用激光傳感器。為排除實際操作條件下的干擾,我們自行設計了一種A/D采集卡,帶有32bit分辨率的A/D轉換器以及模擬輸入通道,保證最佳轉換精度,最大限度地保證了數據的可靠性。

2.2.4 測控軟件。本系統(tǒng)采用先進的VC++7.0進行軟件的設計,采用先進的多線程編程技術,利用模塊化設計方法,軟件程序結構清晰,使用界面具有自動填入、人工修改編輯的功能,上手快,使用方便。數據庫方面,我們采用的是ODBC法來訪問Access數據庫。

3 貨車輪對自動檢測技術展望

國內外的研究結果表明,現有的輪對自動檢測技術基本上已經具備實際應用的條件,但是目前我國的檢測系統(tǒng)大部分安裝于列車通過速度較低的路段,并且受氣候條件影響較小;而鐵路重載貨車具有速度高、環(huán)境惡劣等特點,還需對現有自動檢測系統(tǒng)技術作進一步的深入研究,從而實現其廣泛應用,消除安全隱患,杜絕由輪對故障導致的嚴重安全事故。

參考文獻

[1] 黃曙光,黃海,吳乃優(yōu),敖銀輝,高向東.鐵路貨車輪對自動檢測系統(tǒng)的研制[J].機電工程技術,2002,(2).

第9篇:計算機視覺的展望范文

關鍵詞:雙目立體視覺; 攝像機標定;立體匹配;三維重建

中圖分類號:TP37 文獻標識碼:A文章編號:1009-3044(2011)09-2145-03

The Analysis of the Technology and the Future Application of the Binocular Stereo Vision System

CHENG Huang-jin

(Huainan Union University, Huainan 232038, China)

Abstract: This article makes an analysis of the implementation process of the binocular stereo vision technology,presents implementation methods and drawbacks of camera calibration, feature extraction, stereo matching, especially gives a practical and effective 3D reconstruction method ,the article also analyses and prospects the future application and development of this technology.

Key words: binocular stereo vision; camera calibration; stereo matching; 3D reconstruction

雙目立體視覺(Binocular Stereo Vision)是計算機視覺的一種重要形式,它是基于視差原理,由不同位置的A、B兩臺或者同一位置的一臺攝像機(CCD)經過位置移動或者旋轉來拍攝同一幅場景,通過計算對應點在兩幅圖像間的位置偏差,來獲取物體三維幾何信息的方法。和其他類的體視方法相比,如投影式、透鏡板式、全息照相式等三維成像技術,雙目立體視覺測量方法具有低成本、高效率、結構簡單、精度合適等優(yōu)點。自上世紀80年代創(chuàng)立以來,經過近幾十年的發(fā)展,雙目立體視覺已經成為計算機被動測距方法中最重要的距離感知技術,已在工業(yè)檢測、機器人導航、醫(yī)學機器成像、控制與檢測位姿、以及在軍事和航空測繪上等眾多領域中得到了越來越廣泛的應用。

1 雙目體視系統(tǒng)的實現

雙目立體視覺技術的實現一般可分為:圖像獲取、攝像機標定、特征提取、圖像匹配和三維重建幾個步驟,以下是各個過程的具體實現方法和特點。

1.1 圖像獲取

圖像獲取指的是先通過多個或單個攝像機從不同位置拍攝某物體,得到至少兩幅的二維圖像,再利用立體視覺方法對此圖像進行處理,最終獲取同一場景的三維幾何信息的過程。立體視覺可在多種條件下靈活地測量景物的三維立體信息,在計算機被動測距方法中,它是一種最重要的距離感知技術,在非接觸測量中占有越來越重要的位置。

雙目體視系統(tǒng)的圖像獲取對應的針孔模型如圖1所示。在理想狀態(tài)下,攝像機C1與C2的光軸互相平行,內部參數和角距也都相等,并且圖中的二維成像平面x1o1y1和x2o2y2重合,其中P1與P2分別是空間點P在C1與C2上的成像點。但在實際應用中,需要考慮兩臺攝像機的內部參數不完全相同帶來的影響,要精確分析雙目體視系統(tǒng)的結構參數與測量精度之間的關系,并對某一特定點進行三角測量試驗,進而得到兩臺攝像機光軸夾角與該點測量誤差之間的函數關系。通常在兩攝像頭光軸夾角一定的情況下,測量誤差將隨著被測坐標系與攝像頭坐標系之間距離的增大而增大,在滿足測量范圍的前提下,一般選擇兩CCD之間的正向夾角為銳角,且大于45度。

1.2 攝像機標定[2,4-5]

對雙目體視而言,攝像機或數碼相機是利用計算機技術對物理世界進行重建前的基本測量工具,由于攝像機參數會因為組合過程、環(huán)境溫度、零件更換等發(fā)生變化,為了準確定位,攝像機必須標定。攝像機標定是實現立體視覺技術的關鍵步驟之一,標定的參數有關于光學與幾何性質的內部參數和涉及坐標系三維位置與方向的外部參數,為了得到兩個攝像機的內、外參數,通常先采用單攝像機的標定方法,再通過同一世界坐標中的一組定標點來建立兩個攝像機之間的位置關系。

標定方法分精度低但簡單快速的線性標定法和考慮畸變參數但復雜繁瑣的非線性標定法。在單攝像機標定方法中,目前常用的主要有:直接線性變換法、傳統(tǒng)設備標定法、透視變換矩陣法和線性與非線性結合法等。在雙攝像機標定中,是否有精確的外部參數決定著最終的標定結果,受結構配置的準確性和攝像機距離與視角的影響,一般都需要確定8個以上的已知世界坐標點,才能得到比較滿意的參數矩陣。此外,雙攝像機標定中除了考慮焦距、主點坐標、線性誤差等以外,還需考慮徑向、切向和離心畸變,以及鏡頭校正、測量范圍等問題,應用范圍受到了很大的限制。目前,通用性較好的有基于神經網絡的雙目立體視覺攝像機標定法,有采用線性與非線性變換結合標定法等,前者的基本思想是先對攝像機進行線性標定,然后通過網絡訓練建立起三維空間點位置補償的多層前饋神經網絡模型。后者是先利用直接線性轉換模型(DLT)得到投影矩陣,通過約束條件分解參數矩陣,分別求出攝像機內部參數;然后將得到的標定參數作為初值,代入非線性方程進行優(yōu)化,得到精確的標定參數。

1.3 特征點提取[1-3]

測量中,測量精度將直接受到特征點的二維圖像坐標能否準確提取的影響,需要提取的特征點應當與傳感器類型及抽取特征所用技術等相適應,并且要具有足夠的魯棒性和一致性。因為在圖像獲取過程中,存在一系列的噪聲源,為了顯著的改進圖像質量,使圖像征點更加突出,通常在進行特征點像的坐標提取前,要對獲取的圖像進行預處理。

目前,常見的特征點提取方法有邊緣提取法、興趣算子法、最小灰度差法等。其中邊緣提取法和興趣算子法對光照條件比較敏感,當物體相鄰面的灰度近似時,這些方法能夠在較低的精度要求下,概括且有效地提取特征點,然而當某一像素存在于局部灰度出現差異的區(qū)域,或者存在于具有不同灰度值的幾個相鄰區(qū)域之間時,這些方法也往往會將其作為邊緣特征點提取出來。而最小灰度差法是對數字圖像的每一個原像素,分別考察與其同行、同列或對角相鄰的若干個像素的灰度變化,再選取這些像素與原像素間灰度差的最小值來作為特征點算子值的一種方法。它可以最大程度的消除物體相鄰面及物體與背景間存在的灰度差異而造成的影響,對外界光照條件具有較強的適應性,但一致性較差。

1.4 立體匹配[1-2,6]

立體匹配是雙目體視技術中最重要,也是最復雜的一步。當二維圖像特征點提取后,關鍵任務是匹配,也就是尋求左(右)圖像中的每個特征點在右(左)圖像中的對應點。由于將空間三維場景投影為平面二維圖像時,同一景物在不同視點下的圖像中存在著明顯差異,并且場景中的噪聲干擾、光照條件、景物的物理特性與幾何形狀、攝像機特性等諸多變化因素都將被綜合到單一的圖像灰度值中,因此僅由灰度值來定性以上這些因素和特征是十分困難的。為了求解對應和減少錯誤匹配,人們建立了諸如唯一性約束、連續(xù)性約束、外極線約束、一致性約束等許多約束,然而隨著約束條件的增加,匹配難度相應增大,匹配的選擇性空間相應縮小。根據匹配基元的不同,立體匹配的算法可分為區(qū)域匹配、特征匹配和相位匹配三大類。

區(qū)域匹配算法是利用局部窗口之間灰度信息的相關程度,通過區(qū)域匹配建立特征點與對應點之間的相互關系的一種方法,它在變化平緩且細節(jié)豐富的地方可以達到較高的精度,但該算法的計算量大、速度慢,并且存在著匹配窗大小難以選擇的缺點。與區(qū)域匹配相比,特征匹配則不直接依賴于灰度,利用對高頻噪聲不敏感的模型來提取和定位特征,因此具有較強的抗干擾性,算法簡便且高效,但匹配結果的精確度受到特征提取和定位過程的直接影響,特征在圖像中的稀疏性決定著特征匹配只能得到稀疏的視差場。相位匹配是近二十年才發(fā)展起來的一類匹配算法,它將相位作為匹配基元,很好的抑制了圖像的高頻噪聲,適于并行處理,能獲得亞像素級精度的致密視差,但也存在著相位奇點和相位卷繞的問題。

1.5 三維重建[1,6]

在完成了圖像獲取、攝像機標定、特征點提取和立體匹配之后,就得到了任一被測點在兩個圖像中的對應齊次坐標和兩攝像機的參數矩陣,接下來就是對空間點進行三維重建。

結合上述圖1,用兩個參數標定過的攝像機同時觀察空間物體表面上任意一點P,在確定了攝像機圖像上的共軛對應點P1和P2是同一空間點P的圖像點后,P點的空間位置就可以由兩直線O1P1與O2P2的交點來唯一確定,其中O1,O2分別為兩攝像機的光心。

設攝像機的投影矩陣為:

代入下式:

其中(x1,y1,1)與(x2,y2,1)分別為P1與P2在各自圖像中的齊次坐標;(X,Y,Z,1)為P點在世界坐標系下的齊次坐標;ωi(i=1,2)為非零參數,αimn(m=1,2,3;n=1,2,3,4)為投影矩陣Ai(i=1,2)中的元素,它們與攝像機的位置及成像系統(tǒng)參數有關,可通過攝像機標定來確定。

攝像機標定后,根據式(1)和被測點P在攝像機像面上的像點坐標(x1,y1)與(x2,y2),可將上式變形為:

(2)

即:

(3)

這樣就可以求出未知點P的三維空間坐標(X,Y,Z)。

在測量過程中,當標定參照物與被測物體的相對位置始終保持不變的情況下,也可以只用一個攝像機,采用多個不同位置分別拍攝的方法,得到同一物體的多幅二維圖像。

2 雙目體視系統(tǒng)的發(fā)展[1,6]

正如本文引言所述,雙目立體視覺系統(tǒng)發(fā)展到現在,已經在很多領域得到了廣泛應用。例如日本大阪大學自適應機械系統(tǒng)研究院研制了一種自適應雙目視覺伺服系統(tǒng);東京大學將實時雙目立體視覺和機器人整體姿態(tài)信息集成,開發(fā)了仿真機器人動態(tài)行走導航系統(tǒng);華盛頓大學與微軟公司合作為火星衛(wèi)星“探測者”號研制了寬基線立體視覺系統(tǒng),使“探測者”號能夠在火星上對其即將跨越的幾千米內的地形進行精確的定位和導航;浙江大學機械系完全利用透視成像原理,采用雙目體視方法實現了對多自由度機械裝置的動態(tài)、精確位姿檢測;哈工大采用異構雙目活動視覺系統(tǒng)實現了全自主足球機器人導航等等。

但就雙目立體視覺技術的發(fā)展現狀而言,要構造出類似于人眼的通用雙目立體視覺系統(tǒng),還有很長的路要走,未來的發(fā)展趨勢可總結如下:

1)如何建立更有效的雙目體視模型,能更充分地反映立體視覺不確定性的本質屬性,為匹配提供更多的約束信息,降低立體匹配的難度;

2)探索新的適用于全面立體視覺的計算理論和匹配策略,選擇有效的匹配準則和算法結構,以解決存在灰度失真、幾何畸變(透視、旋轉、縮放等)、噪聲干擾、特殊結構(平坦區(qū)域、重復相似結構等)及遮掩景物的匹配問題;

3)算法向并行化發(fā)展,提高速度,減少運算量,增強系統(tǒng)的實用性;

4)強調場景與任務的約束,針對不同的應用目的,建立有目的的和面向任務的體視系統(tǒng)。

參考文獻:

[1] 管業(yè)鵬,童林夙.雙目立體視覺測量方法研究[J].儀器儀表學報,2003,24(6):581-584.

[2] 隋婧,金偉其.雙目立體視覺技術的實現及其進展[J].電子技術應用,2004(10):4-6.

[3] Barnard S T, Thompson W B.Disparity Analysis of Images IEEE Trans,1980,PAM I-2(4):333-340.

[4] Golub G, Loan C van, Matrix Computations[M].Balti-more,Maryland:The John Hopkins University Press,1996.