前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺的應(yīng)用方向主題范文,僅供參考,歡迎閱讀并收藏。
近年來,經(jīng)濟(jì)的發(fā)展和人們生活水平的提升也使得人們的出行更加便捷,越來越多的人都是自己駕車出行,這樣導(dǎo)致公路上的交通流量不斷增加,如何保障交通的順暢性和安全性成為人們關(guān)注的重點問題。信息技術(shù)的發(fā)展推動了計算機視覺技術(shù)的出現(xiàn),為交通安全性的提升提供了一定的保障。本文主要對計算機視覺技術(shù)進(jìn)行分析,進(jìn)一步探討計算機視覺技術(shù)在智能交通系統(tǒng)中的應(yīng)用。
【關(guān)鍵詞】計算機 視覺技術(shù) 智能交通 系統(tǒng) 應(yīng)用
智能交通系統(tǒng)簡稱ITS,這是一種新型的交通管理系統(tǒng)。該系統(tǒng)主要結(jié)合了信息化技術(shù)、計算機技術(shù)以及數(shù)據(jù)傳輸技術(shù)等多種技術(shù),用來對整個交通運輸體系進(jìn)行管理,可以實現(xiàn)人、車、路的全面監(jiān)控和管理。計算機視覺藝術(shù)作為智能交通系統(tǒng)中的一個重要環(huán)節(jié),受到相關(guān)工作人員的高度重視。隨著計算機視覺技術(shù)的發(fā)展,不僅為交通行業(yè)的發(fā)展提供了更多的便捷,同時還能夠篩選道路交通的各種信息,進(jìn)一步增強了智能交通系統(tǒng)的靈活性和準(zhǔn)確性。
1 計算機視覺技術(shù)的概述
計算機視覺也被稱為圖像分析和圖解理解,其包括的理論主要有攝影幾何學(xué)、概率論、圖像處理理論以及人工智能理論等部分。計算機視覺技術(shù)主要是用二維投影圖像實現(xiàn)三維物體重構(gòu)。這種技術(shù)的應(yīng)用范圍比較廣泛,不僅應(yīng)用于二維圖像識別方面,同時還用于三維物體的識別和重建上面。通過計算機視覺技術(shù)能夠獲取專業(yè)化的三維信息,對三維信息的獲取一般有兩種方法,其中一種是直接獲取法,還有一種是間接獲取法。直接獲取法主要是通過計算機視覺技術(shù)的效果來確定三維運動中產(chǎn)生的各種參數(shù),這一過程對攝像機運動問題的關(guān)注程度較高;間接獲取的方式就是將單幅圖像和攝像機焦距相結(jié)合,來判斷被測量位置視覺上的信息。計算機視覺技術(shù)的關(guān)鍵就是實現(xiàn)特別匹配,在特殊情況下可以利用不同的攝像C同時收集運動信息,從而提高相關(guān)控制的精確度。
2 計算機視覺技術(shù)在智能交通系統(tǒng)中的應(yīng)用
計算機視覺技術(shù)在智能交通系統(tǒng)中的應(yīng)用可以實現(xiàn)道路交通的監(jiān)控,同時還能夠?qū)崿F(xiàn)自動收費、智能導(dǎo)航等功能,主要應(yīng)用有以下幾個方面的內(nèi)容。
2.1 交通監(jiān)控中對計算機視覺技術(shù)的應(yīng)用
基于計算機視覺技術(shù)的交通監(jiān)控系統(tǒng)主要分為三個步驟,首先是對車輛和行人進(jìn)行跟蹤和分割,其次是對車流量進(jìn)行分析和計算,并且計算車輛的平均速度和道路上車輛的隊列長度,最后根據(jù)道路的交通狀況來規(guī)劃形式線路,從而有效緩解道路交通擁堵的現(xiàn)狀,方便人們減少出行時間。車輛和行人作為道路中運動的主要目標(biāo),在監(jiān)控場合下,需要對運動時間進(jìn)行有效分割,常用到的分割方式包括光流法和幀差法兩種,其中前一種分割方式主要是依據(jù)圖像中不同的運動用映射參數(shù)正確的表達(dá),這樣可以將具有同樣映射參數(shù)的光流量進(jìn)行分配,從而完成參數(shù)分割。計算機視覺在交通監(jiān)控中的應(yīng)用主要是對車輛速度、車輛數(shù)目、車輛分類進(jìn)行檢測。隨著計算機通信技術(shù)的發(fā)展,計算機視覺技術(shù)也是日新月異,基于計算機視覺的交通監(jiān)控系統(tǒng)具有較強的實時工作性,能夠快速的適應(yīng)高度公路以及城市道路交通的監(jiān)控。
2.2 車輛導(dǎo)航中對計算機視覺技術(shù)的應(yīng)用
實現(xiàn)車輛的智能導(dǎo)航是計算機視覺技術(shù)在智能交通中應(yīng)用的典型案例。這種技術(shù)主要為駕駛?cè)藛T提供道路信息和車輛運行狀況兩大信息。通過車輛智能導(dǎo)航系統(tǒng)的運行能夠?qū)Φ缆穬蛇叺慕缦捱M(jìn)行有效的識別,將車輛引向規(guī)定的行駛車道,在車輛行駛過程中,該系統(tǒng)能夠自動檢測車輛與前方其他車輛之間的距離,從而提醒駕駛?cè)藛T保持車輛的安全距離,最終實現(xiàn)安全導(dǎo)航駕駛。通過該系統(tǒng)的攝像機運動能夠識別其他車輛的行駛狀況,并且通過計算檢測點的方式計算車輛的模擬匹配點。車倆智能導(dǎo)航系統(tǒng)中就使用了計算機視覺技術(shù),可以從中提取相關(guān)信息,計算車輛行駛的安全距離和速度。
2.3 計算機視覺技術(shù)用于車輛輔助駕駛
計算機視覺技術(shù)在車輛輔助駕駛中的應(yīng)用主要是幫助駕駛?cè)藛T對外界的變化做出反應(yīng)。具體表現(xiàn)為車輛在市內(nèi)行駛時,計算機視覺技術(shù)的應(yīng)用能夠識別周邊道路的標(biāo)記,并且對交通標(biāo)志、其他車輛和行人進(jìn)行識別,然后篩選相關(guān)信息進(jìn)行計算,讓駕駛?cè)饲宄饨绲木唧w狀況,從而避開其他的車輛和行人,能夠從根本上減少交通事故的發(fā)生,增強車輛的安全運行。輔助駕駛的形式轉(zhuǎn)變?yōu)槿藱C交互的方式,一定程度上能夠滿足駕駛?cè)藛T對信息的需求。
2.4 計算機視覺技術(shù)用于車輛智能收費
車輛收費是車輛在公共交通位置行駛中的一個關(guān)鍵環(huán)節(jié)。隨著科學(xué)技術(shù)的發(fā)展,車輛收費系統(tǒng)逐漸向著計算機技術(shù)的應(yīng)用方向發(fā)展,計算機視覺技術(shù)在各地區(qū)交通發(fā)展中的應(yīng)用是現(xiàn)代化交通發(fā)展的一個重要突破口。很多地區(qū)的智能化收費都是通過識別車牌的方式來實現(xiàn)收費,我國在車牌識別這方面僅僅限制于單目車牌和雙目車牌的識別,其中單目車牌識別的核心就是將車牌照位置作為核心部分,我國大部分地區(qū)都是將單目系統(tǒng)作為核心部分來使用。采用雙目系統(tǒng)對車牌進(jìn)行識別,也可以對車輛的型號進(jìn)行識別,通過大量的實踐發(fā)現(xiàn),雙目系統(tǒng)進(jìn)行車牌識別的實用性較強。但是這種識別方式在實際應(yīng)用過程中仍然存在著信息獲取難度大、車牌照定位難度大等多種問題,尤其是車輛在高速路上行駛時,對于車牌信息的獲取更為困難,因此,在這方面還需要加大研究和實踐。
3 結(jié)束語
隨著計算機視覺技術(shù)的智能化發(fā)展,其在智能交通系統(tǒng)中的應(yīng)用能夠解決多方面的問題。該技術(shù)的應(yīng)用不僅能夠?qū)崿F(xiàn)車輛的實時監(jiān)控,同時還能夠?qū)崿F(xiàn)車輛導(dǎo)航以及車輛收費,幫助駕駛?cè)藛T識別車輛行駛中存在的障礙物,這樣一來,可以增強車輛行駛的安全性,同時還能夠提高我國道路交通系統(tǒng)的整體管理水平。但是該技術(shù)應(yīng)用中也存在不足之處,未來發(fā)展中需要降低視覺系統(tǒng)的價格,減少系統(tǒng)的尺寸,從而增強系統(tǒng)對車輛信息的處理速度,最終實現(xiàn)對道路交通的全面監(jiān)測。
參考文獻(xiàn)
[1]王春波,張衛(wèi)東,許曉鳴.計算機視覺技術(shù)在智能交通系統(tǒng)中的應(yīng)用[J].測控技術(shù),2000(05):22-24.
[2]郁梅,蔣剛毅,郁伯康.智能交通系統(tǒng)中的計算機視覺技術(shù)應(yīng)用[J].計算機工程與應(yīng)用,2001(10):101-103+121.
[3]顧晶. 基于計算機視覺的智能交通監(jiān)控系統(tǒng)的研究[D].東南大學(xué),2006.
[4]謝萍萍,黃傳春.計算機視覺技術(shù)在智能交通系統(tǒng)中的應(yīng)用[J].福建電腦,2008(10):77+133.
物體為什么會呈現(xiàn)出人們所看到的視覺效果?經(jīng)過多重反射后,光線將怎樣變化?如何讓計算機把真實世界里的物理原理數(shù)字化表現(xiàn)出來?這些都是松下康之在微軟亞洲研究院工作時要思考的問題,攝像機拍攝出的畫面抖動看不清怎么辦?松下康之也遇到過生活提出的小挑戰(zhàn)。
松下康之用研究員的“專屬語言”解釋道,“低層視覺研究”和“滿幀視頻穩(wěn)定技術(shù)”可以很好地回答和解決上面問題?!斑@也正是我所從事的兩個研究方向:一個是光度學(xué),另一個是視頻分析,”微軟亞洲研究院視覺計算組主管研究員松下康之說,“兩者之間并沒有十分緊密的聯(lián)系,但這也正是有趣的地方?!?/p>
從東京大學(xué)的博士到微軟亞洲研究院實習(xí)生、從日本東京到北京的希格瑪大廈、從電氣工程學(xué)專業(yè)到以物理學(xué)為基礎(chǔ)的計算機視覺和視頻分析與合成。事實上,這種“毫無關(guān)系”所帶來的驚喜與巧合也貫穿于松下康之的經(jīng)歷之中。于是,松下康之給記者講述了一個充滿偶然與必然、選擇與堅持的故事。言語間,流露出日本文化的嚴(yán)謹(jǐn)、美國式的活潑和與在微軟亞洲研究院的中國研究員一樣的親切與隨和。
邂逅未來
微軟亞洲研究院院長洪小文曾說過:“創(chuàng)新更多的是意外”。而松下康之與微軟亞洲研究院的緣分,正是充滿著這種“必然的意外”。
在東京大學(xué)讀書的時候,松下康之本科、碩士、博士的專業(yè)方向都是電氣工程。那時,松下康之已經(jīng)研究了智能交通系統(tǒng)。“但是,我意識到自己想做一些更加基礎(chǔ)的研究,并且希望可以把這些研究應(yīng)用到不同的事情上?!痹诓┦慨厴I(yè)前兩年,松下康之就發(fā)現(xiàn)了自己對計算機視覺領(lǐng)域的濃厚興趣。而電氣工程與計算機科學(xué)聯(lián)系緊密,計算機系統(tǒng)結(jié)構(gòu)和軟件都有學(xué)習(xí),所以對于松下康之來說,從電氣工程轉(zhuǎn)到計算機視覺并不是一個很大的跨越。
2002年,當(dāng)時松下康之還在讀博,在一次國際性的計算機視覺大會上,他見到了時任微軟亞洲研究院副院長的沈向洋,“我之前就認(rèn)識他,還知道他在計算機視覺領(lǐng)域非常有名。我希望能有機會與他一起工作,學(xué)到更多東西。”于是,松下康之向沈向洋毛遂自薦,“意外地”成了一名微軟亞洲研究院的實習(xí)生,經(jīng)過4個月的實習(xí)生活之后,松下康之發(fā)現(xiàn)自己已經(jīng)喜歡上了這里的研究環(huán)境和生活,就這樣,在微軟亞洲研究院的工作開始了。
如何用科技來解決實際問題,從而改變更多人的生活,一直是微軟亞洲研究院的初衷。生活也不斷地給松下康之帶來靈感和意外的收獲。
其中,“滿幀視頻穩(wěn)定技術(shù)”的“誕生”就源于松下康之的婚禮――用手持的攝像機拍攝的婚禮畫面是搖晃的,看起來很不舒服,新婚妻子對婚禮錄像效果很不滿意,松下康之就想通過研究解決視頻顫抖的問題。“現(xiàn)有的數(shù)字影像鑲嵌技術(shù)可以對畫面進(jìn)行穩(wěn)定性處理,但如果物體移動,這種在場景固定的情況下才能實現(xiàn)的方法就不可行了。而通過‘滿幀視頻穩(wěn)定技術(shù)’,丟失掉的像素被自然的補充上了?!蓖恚€可以去除覆蓋在視頻上的文字、鏡頭上的污點,來補上丟失的像素。
科技的光影魔術(shù)
“視頻分析在不久的將來將變得更加重要,因為圖像和視頻的界限已經(jīng)越來越模糊,我相信最后一切都將變成視頻?!彼上驴抵畬τ浾哒f。
微軟亞洲研究院的計算機視覺包括:高層視覺(如人臉識別技術(shù))和低層視覺(如光度學(xué),即研究光線與物體的相互作用),松下康之的研究方向?qū)儆诤笳摺?/p>
“光度學(xué)也非常重要,因為如果我們不明白‘低層’上發(fā)生了什么,就無法在‘高層視覺’研究上取得突破,所以‘低層視覺’研究是非常基礎(chǔ)的。如果“低層視覺”發(fā)展了,那么“高層視覺”也會隨之發(fā)展?!?/p>
雖然是“肉眼”難以察覺的變化,但是松下康之卻給記者描述了光度學(xué)形象的應(yīng)用――3D復(fù)原和現(xiàn)實物體數(shù)字化。而要實現(xiàn)上面的兩項應(yīng)用,很明顯需要比普通人更特別的“視力”。
“計算機視覺里有一個傳統(tǒng)的方法,叫多視角立體視覺法(multi-view stereo),通過不同視角拍攝的圖片我們可以重現(xiàn)3D,但不能做細(xì)節(jié)的重現(xiàn);還有另一種方法,叫立體光學(xué)法(photometric stereo),攝像機和物體都是固定的,但是光線是變化的,如果移動光源就可以得到物體的不同觀察值,通過觀察值可以得到表面方向(surface orientation)?!?/p>
前者可以得到整體的形狀,但卻無法得到細(xì)節(jié),而后者不能給你整體的形狀,因為它只能給你表面方向。如何把兩個技術(shù)的優(yōu)點結(jié)合起來得到最真實的3D圖像呢?
“我們考慮如果把一個持續(xù)光源固定在攝像機上,這樣我們就可以同時移動光源和攝像機?!庇谑牵上驴抵退麃碜詵|京大學(xué)的實習(xí)生一起做出了看起來與普通家用數(shù)碼產(chǎn)品沒有太大差別的“3D攝像機”?!斑@個3D攝像機的相關(guān)的配件在市場上很容易就能買到,手持永遠(yuǎn)是簡單的,人們不會想要拿著一個龐然大物?!彼上驴抵蛴浾呓榻B研發(fā)背后的原因。
文化熔爐
作為美國電氣電子工程師協(xié)會2009年計算機視覺與模式識別國際會議(CVPR)和2009年計算機視覺國際會議(ICCV)的區(qū)域主席、著名期刊International Journal of Computer Vision(IJCV)和Computer Vision Applications(CVA)的編委,松下康之坦言,微軟亞洲研究院對研究員在專業(yè)領(lǐng)域的自由交流的支持,使得研究員對自己的研究領(lǐng)域“看得更遠(yuǎn)、更透徹”。
“通過這些職務(wù),我對研究方向有了更高的認(rèn)識,這種視野能夠幫助我決定今后什么樣的研究更有價值。此外,我能夠認(rèn)識計算機視覺界的很多人,這是另一個收獲?!彼上驴抵χf。
關(guān)鍵詞:計算機視覺;案例推理;圖像處理;圖像描述
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2007)04-11102-03
1 引言
基于案例推理(case-base reasoning)是人工智能中正不斷發(fā)展的一項重要推理技術(shù)?;诎咐评砼c類比推理方法相似,案例推理將舊經(jīng)驗或教訓(xùn)轉(zhuǎn)換為知識,出現(xiàn)新問題時,首先查找以前是否有相似的案例,并用相似案例解決新問題。如果沒遇到相似案例的,經(jīng)過推理后解決新問題的方法,又會成為新的案例或新經(jīng)驗,下一次再遇到相同問題時,就可以復(fù)用這些案例或經(jīng)驗。
這與人遇到問題時,首先會用經(jīng)驗思考解決問題的方式相似,這也是解決問題較好的方法。基于案例推理應(yīng)用于工業(yè)產(chǎn)品檢測或故障診斷時具有以下特點:
CBR智能化程度較高。利用案例中隱含的難以規(guī)則化的知識,以輔助規(guī)則推理的不足,提高故障診斷系統(tǒng)的智能化程度。
CBR較好解決“知識獲取”的瓶頸。CBR知識表示以案例為基礎(chǔ),案例的獲取比規(guī)則獲取要容易,大大簡化知識獲取的過。
CBR求解效率較高。是對過去的求解結(jié)果進(jìn)行復(fù)用,而不是再次從頭開始推導(dǎo),可以提高對新問題的求解效率。
CBR求解的質(zhì)量較高。CBR以過去求解成功或失敗的經(jīng)歷,可以指導(dǎo)當(dāng)前求解時該怎樣走向成功或避開失敗。
CBR持續(xù)不斷的學(xué)習(xí)能力,使得它可以適應(yīng)于將來問題的解決。
所以基于案例推理方法正不斷應(yīng)用在產(chǎn)品質(zhì)量檢測和設(shè)備故障診斷方面,并取得較好的經(jīng)濟(jì)效益。為了產(chǎn)品檢測和設(shè)備故障診斷中,更為智能化,更容易實現(xiàn)現(xiàn)場檢測和診斷,計算機視覺技術(shù)起到很大的作用。
計算機視覺是研究用計算機來模擬人和生物的視覺系統(tǒng)功能的技術(shù)學(xué)科,使計算機具有感知周圍視覺世界的能力。通過計算機視覺,進(jìn)行圖像的獲取預(yù)處理、圖像分割與特征抽取、識別與分類、三維信息理解、景物描述、圖像解釋,讓計算機具有對周圍世界的空間物體進(jìn)行傳感、抽象、判斷的能力,從而達(dá)到識別、理解的目的。
計算機視覺隨著科學(xué)技術(shù)發(fā)展,特別計算機技術(shù)、通信技術(shù)、圖像采集技術(shù)、傳感器技術(shù)等,以及神經(jīng)網(wǎng)絡(luò)理論、模糊數(shù)學(xué)理論、小波的分析理論等計算機視覺理論的不斷發(fā)展和日趨成熟,使計算機視覺從上世紀(jì)60年代開始興起發(fā)展到現(xiàn)在,取得快速發(fā)展,已經(jīng)從簡單圖像質(zhì)量處理發(fā)展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉(zhuǎn)向運動,由二維轉(zhuǎn)向三維,并主要著眼于對圖像的識別和理解上,也使計算機視覺的應(yīng)用領(lǐng)域更為廣泛,為案例推理中運用計算機視覺打下基礎(chǔ)。
2 案例推理系統(tǒng)的主要關(guān)鍵技術(shù)
(1)案例的表示與組織
案例的表示與組織即是如何抽取案例的特征變量,并以一定的結(jié)構(gòu)在計算機中組織存儲。如何將信息抽取出特征變量,選擇什么語言描述案例和選擇什么內(nèi)容存放在案例中,案例按什么組織結(jié)構(gòu)存放在存儲器中,這關(guān)系到基于案例推理方法的效率,而且對于案例數(shù)量越來越多,結(jié)構(gòu)十分復(fù)雜的案例庫,尤其重要。
(2)案例的索引與檢索
案例的索引與檢索即是為了查找最佳相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫中檢索并選擇潛在可用相似案例。后面的工作能否發(fā)揮出應(yīng)有的作用,很大程度上依賴于這一階段得到的案例質(zhì)量的高低,因此這一步非常關(guān)鍵。
(3)案例的復(fù)用和調(diào)整
案例的復(fù)用即是如何根據(jù)舊案例得出新解,涉及到找出案例與新問題之間的不同之處,案例中的哪些部分可以用于新問題,哪些部分不適合應(yīng)用于新問題的解決。而復(fù)用還分案例的結(jié)果復(fù)用,案例的求解方法復(fù)用。
(4)案例的學(xué)習(xí)
案例的學(xué)習(xí)即是將新解添加到案例庫中,擴(kuò)充案例庫的案例種類與數(shù)量,這過程也是知識獲取。此過程涉及選取哪些信息保留,以及如何把新案例有機集成到案例庫中,包括如何存儲,如何建立索引等等。
針對案例推理的關(guān)鍵技術(shù),根據(jù)檢測和故障診斷系統(tǒng)的特點,計算機視覺主要解決如何將產(chǎn)品圖像輸入系統(tǒng),如何將產(chǎn)品圖像特征進(jìn)行抽取和描述,如何區(qū)別產(chǎn)品不同之處。以便案例推理系統(tǒng)進(jìn)行案例建模,確立案例的表示形成和案例相似度的計算。本文主要從計算機視覺如何運用在案例推理系統(tǒng)進(jìn)行探討。
3 產(chǎn)品輸入系統(tǒng)
產(chǎn)品輸入系統(tǒng)在不同產(chǎn)品類型和生產(chǎn)環(huán)境可能有不同之處,主要應(yīng)有傳感器單元和圖像采集單元。如圖1。
圖1 產(chǎn)品輸入系統(tǒng)結(jié)構(gòu)
傳感器單元主要判斷是否有產(chǎn)品存在,是否需要進(jìn)行圖像采集,是否繼續(xù)下一個產(chǎn)品圖像的采集。這簡單傳感器可使用光電開關(guān),配合光源,當(dāng)產(chǎn)品經(jīng)過時,產(chǎn)品遮擋住光源,使光電開關(guān)產(chǎn)生一個0值,而沒有產(chǎn)品經(jīng)過時,光電開關(guān)產(chǎn)生相反的1值,系統(tǒng)通過判斷光電開關(guān)的值,從而判斷是否有產(chǎn)品。
圖像采集單元簡單地說是將產(chǎn)品拍攝并形成數(shù)字化圖像,主要包括光源、反射鏡、CCD相機和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機主要是拍攝設(shè)備。圖像采集卡主要是將圖像數(shù)字化。通過傳感器判斷有產(chǎn)品后,光源發(fā)出的光均勻地照在被測件上,CCD相機拍攝,拍攝圖像經(jīng)過圖像采集卡數(shù)字化后輸入存儲設(shè)備。存儲設(shè)備即為計算機硬盤。存放原始圖像、數(shù)據(jù)、處理結(jié)果等。
這是案例推理系統(tǒng)的原始數(shù)據(jù),是圖像處理、圖像特征抽取描述的基礎(chǔ)。
4 圖像處理
在案例推理系統(tǒng)中,需要對案例的組織和案例建模,案例的組織即案例的表示,相對計算機而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區(qū)別其它圖像,具有唯一性。同時,又能完整地表示該圖像。所以案例的表示要體現(xiàn)案例的完整性、唯一性、操作容易性。
圖像中有顏色區(qū)別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說圖像內(nèi)部包含表示的本質(zhì),即圖像的描述。根據(jù)圖像特點,確立圖像案例的表示,以圖像的像素、圖像的數(shù)字化外觀、圖像物體的數(shù)字組成等屬性。這需要對產(chǎn)品輸入的原始圖像進(jìn)行處理。
在計算機視覺技術(shù)中,對原始圖像主要進(jìn)行圖像增強、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內(nèi)容。經(jīng)過這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺效果,又便于計算機對圖像進(jìn)行分析、處理和識別。具體工作流程如圖2所示:
圖2 計算機視覺的任務(wù)與工作流程
圖像預(yù)處理是將產(chǎn)品的數(shù)字圖像輸入計算機后,首先要進(jìn)行圖像的預(yù)處理,主要完成對圖像噪聲的消除以及零件的邊緣提取。預(yù)處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。
圖像二值化處理主將灰度圖形二值化的關(guān)鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據(jù)灰度直方圖中兩峰之間的谷值作為閾值來分割目標(biāo)和背景。
圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實際成像過程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。
圖像邊緣提取是為了將圖像中有意義的對象與其背景分開,并使之具有某種指定的數(shù)學(xué)或符號表達(dá)形式,使計算機能夠理解對象的具體含義,檢測出邊緣的圖像就可以進(jìn)行特征提取和形狀分析了??刹捎枚喾N算法,如采用Sobel算子提取邊緣。
圖像預(yù)處理是為下一步的特征描述打基礎(chǔ),預(yù)處理的好壞直接影響案例推理的結(jié)果和檢測診斷的效率。
特征提取是對圖像進(jìn)行描述,是案例建模關(guān)鍵,案例建模是根據(jù)案例組織要求抽取圖像特征,是建立案例索引和檢索的關(guān)鍵。如果圖像沒有特征,就談不上進(jìn)行檢索。圖像特征可通過圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產(chǎn)品、產(chǎn)品形狀大小、產(chǎn)品顏色,產(chǎn)品有什么缺陷、產(chǎn)品缺陷在什么位置等特征,根據(jù)這些圖像特征進(jìn)行描述,形成計算機中屬性值,并從數(shù)據(jù)庫查找相應(yīng)信息資料,從而確定產(chǎn)品之間的關(guān)系,相似度,也就是案例推理的方向。
5 系統(tǒng)的檢索
根據(jù)案例推理原理和相應(yīng)算法,建立案例推理系統(tǒng)模型,如圖3所示。
圖3 案例推理系統(tǒng)
對話系統(tǒng):完成人機交互、問題描述、結(jié)果顯示和系統(tǒng)總控制。
案例庫系統(tǒng):由案例庫及案例庫管理系統(tǒng)組成。
數(shù)據(jù)析取系統(tǒng):對各種已有的源數(shù)據(jù)庫的數(shù)據(jù)通過轉(zhuǎn)換而形成所需的數(shù)據(jù)。
多庫協(xié)同器:根據(jù)問題求解的需要,按照一定的數(shù)據(jù)抽取策略,完成問題求解過程中對模型庫系統(tǒng)、方法庫系統(tǒng)、知識庫系統(tǒng)和數(shù)據(jù)庫系統(tǒng)等資源的調(diào)度與協(xié)調(diào)。
知識庫系統(tǒng):由產(chǎn)生式規(guī)則組成,這些知識包括專家經(jīng)驗和以規(guī)則形式表示的有關(guān)知識,也可以是數(shù)據(jù)挖掘結(jié)論,支持案例檢索、案例分析、案例調(diào)整等。 模型庫系統(tǒng):由模型庫、算法庫、模型庫管理系統(tǒng)組成。完成模型識別和調(diào)用,并把結(jié)果綜合,送入對話系統(tǒng)顯示,作為補充信息供案例檢索、調(diào)整使用。
數(shù)據(jù)庫系統(tǒng):存放待決策支持的所有問題,并完成其維護(hù)與查詢等功能。
由于系統(tǒng)主要應(yīng)用產(chǎn)品的現(xiàn)場實時檢測監(jiān)控或故障診斷,所以系統(tǒng)的檢索時,也必須輸入檢索值,即輸入現(xiàn)場產(chǎn)品的圖像,在通過產(chǎn)品預(yù)處理、圖像的二值化、分割和邊界處理后,進(jìn)行圖像特征描述,根據(jù)圖像描述進(jìn)行分類識別。根據(jù)案例推理的算法檢索案例庫中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度最大作為結(jié)果,并將案例的解輸出,給相關(guān)控制系統(tǒng)進(jìn)行決策。如產(chǎn)品質(zhì)量檢測,確定產(chǎn)品質(zhì)量是否合格,是否有不合格產(chǎn)品,不合格產(chǎn)品是什么原因造成,故障源是什么,如何解決和排除故障,等等。
6 結(jié)論
案例推理方法有效地解決計算機視覺技術(shù)中圖像檢索問題。對提高圖像檢索的效率和準(zhǔn)確度提供了平臺。
計算機視覺技術(shù)也為案例推理系統(tǒng)實現(xiàn)產(chǎn)品現(xiàn)場實時檢測、監(jiān)控、診斷提供技術(shù)支持。計算機視覺技術(shù)現(xiàn)場的數(shù)據(jù)采集、處理為案例推理打好基礎(chǔ)。
兩者的結(jié)合設(shè)計的系統(tǒng)適用范圍很廣,只要產(chǎn)品需要進(jìn)行質(zhì)量檢測、監(jiān)控,或設(shè)備需要進(jìn)行故障診斷和維護(hù),都可以適用。
系統(tǒng)提供的實時檢測、監(jiān)控和診斷功能,提高企業(yè)的生產(chǎn)效益,降低了生產(chǎn)成本。
參考文獻(xiàn):
[1](美)??希⊿onka,M).圖像處理分析與機器視覺[M].人民郵電出版社.
[2]王宏等譯.計算機視覺[M].電子工業(yè)出版社.
[3]蔡建榮.自然場景下成熟水果的計算機視覺識別[J].農(nóng)業(yè)機械,36(2):61-64.
[4]王宇輝.基于計算機視覺的錐體零件尺寸在線檢測算法[J].重型機械,2005,2:4-6
[5]駱志堅.基于計算機視覺檢測技術(shù)自動計數(shù)系統(tǒng)的研究與應(yīng)用[J].儀表技術(shù)與傳感器,2005,3:41-43.
[6]左小德.貼近度分析法在案例庫推理中的應(yīng)用[J],南大學(xué)學(xué)報(自然科學(xué)版),1997,18(1):21-26.
[7]姜麗紅.案例推理在智能化預(yù)測支持系統(tǒng)中的應(yīng)用研究[J].決策與決策支持系統(tǒng),1996,6(4):63-69.
農(nóng)業(yè)機械化不僅是人類的解放,解放勞動力。這些年輕的勞動力投入到其他領(lǐng)域,促進(jìn)中國的經(jīng)濟(jì)發(fā)展可以提高農(nóng)業(yè)生產(chǎn)的效率,優(yōu)化操作質(zhì)量和增加作物產(chǎn)量,有利于農(nóng)業(yè)發(fā)展和農(nóng)民收入,因此,今后應(yīng)重視先進(jìn)技術(shù)的推廣,提高農(nóng)業(yè)機械化水平。目前農(nóng)業(yè)機械的使用,一些機械在使用過程中不能清楚地確定作物的位置,機器在關(guān)閉過程中很容易錯過,所以利用新技術(shù)在農(nóng)業(yè)機械有利于彌補農(nóng)業(yè)機械的脆弱性,提高機器的運作效率。
目前,高新技術(shù)的應(yīng)用范圍擴(kuò)大,農(nóng)業(yè)機械行業(yè)也開始使用高新技術(shù),引入計算機視覺技術(shù)、自動控制技術(shù)、信息網(wǎng)絡(luò)技術(shù)、人工智能技術(shù)、機器人技術(shù)和液壓技術(shù)在農(nóng)業(yè)機械的應(yīng)用現(xiàn)狀。
2 農(nóng)業(yè)機械的應(yīng)用技術(shù)
2.1 農(nóng)業(yè)機械的應(yīng)用計算機視覺技術(shù)
農(nóng)業(yè)機械的應(yīng)用計算機視覺技術(shù),主要是利用計算機視覺技術(shù)在農(nóng)產(chǎn)品質(zhì)量、品位等農(nóng)業(yè)產(chǎn)品檢查,是基于圖像處理,計算機視覺的學(xué)科,主要是視覺信息處理理論。表達(dá)和計算方法研究,近年來,圖像處理,計算機硬件和軟件,等可視化仿真技術(shù)的逐漸發(fā)展計算機視覺技術(shù)的使用功能也擴(kuò)大,計算機視覺技術(shù)是用來檢查農(nóng)產(chǎn)品的質(zhì)量不僅是現(xiàn)階段和分級產(chǎn)品還用于收割、種植等。
2.2 農(nóng)業(yè)機械的CAD技術(shù)
CAD技術(shù)在我國已廣泛應(yīng)用于機械工程設(shè)計制造從上個世紀(jì)60年代,我國40多年后獨立研究開發(fā)和推廣應(yīng)用。但由于我國機械工程設(shè)計CAD系統(tǒng)的開發(fā)過程的社會主義改革開放的影響,以便后期的完美程度我國機械工程設(shè)計CAD系統(tǒng)程度的效率和其他性能大大受到限制,相對于我國的國外機械工程設(shè)計CAD系統(tǒng)仍處于較低水平。
2.3 農(nóng)業(yè)機械的信息網(wǎng)絡(luò)技術(shù)
信息網(wǎng)絡(luò)技術(shù)在農(nóng)業(yè)機械中的應(yīng)用非常成功,信息網(wǎng)絡(luò)技術(shù)和地理信息系統(tǒng),結(jié)合自動化技術(shù)等技術(shù),可以監(jiān)測作物和土壤的農(nóng)業(yè)生產(chǎn),也可以生產(chǎn)作物的發(fā)展,植物病蟲害,和實時監(jiān)控等等,然后依靠定位系統(tǒng)和地理信息系統(tǒng)來完成現(xiàn)場操作。
農(nóng)業(yè)機械、機器人技術(shù)應(yīng)用、信息網(wǎng)絡(luò)、計算機視覺、自動控制技術(shù)的融合。目前,已經(jīng)開發(fā)了采摘機器人,嫁接機器人,機器人除草,施肥機器人噴涂機器人,等。對肥料和噴涂機器人的使用,可以避免肥料、殺蟲劑和其他化學(xué)品危害人體,達(dá)到改善環(huán)境的目的。目前雖然我國機器人技術(shù)落后于發(fā)達(dá)國家,取得了一些就,但由于現(xiàn)代機械機器人的購買成本非常高,所以這項技術(shù)并沒有得到普及。
在農(nóng)業(yè)機械的設(shè)計、制造和測試,虛擬現(xiàn)實技術(shù)具有非常廣闊的發(fā)展前景,利用虛擬現(xiàn)實技術(shù)建立三維模型的農(nóng)業(yè)機械設(shè)計師不僅可以了解每一個部分的質(zhì)量,也可以完全滿足的每一部分的運行性能三維農(nóng)業(yè)機械模型具有很高的精度,和農(nóng)業(yè)機械制造商大規(guī)模生產(chǎn)的計算機數(shù)據(jù)的基礎(chǔ)上。
在虛擬制造系統(tǒng)中,虛擬現(xiàn)實技術(shù)的基礎(chǔ),虛擬制造系統(tǒng)是由多種學(xué)科知識,利用計算機技術(shù)綜合建模、仿真、生產(chǎn)、制造汽車。與此同時,虛擬制造系統(tǒng)還可以制定合理的產(chǎn)品檢驗和測試程序。目前,虛擬制造技術(shù)應(yīng)用范圍廣泛,涉及開始工裝及模具生產(chǎn)設(shè)備,和其他領(lǐng)域,可以在生產(chǎn)部門系統(tǒng),在這一過程中完成建模、修改、分析和優(yōu)化的四個工作。此外,虛擬現(xiàn)實技術(shù)用于柔性制造系統(tǒng)和計算機集成制造系統(tǒng)的設(shè)計。
2.4 人工智能技術(shù)
近年來,全球高端技術(shù)獲得了農(nóng)業(yè)機械在農(nóng)業(yè)的快速發(fā)展,管理,挖掘和采摘等實現(xiàn)智能化,使用人工智能技術(shù)研究和開發(fā)的激光拖拉機、內(nèi)部導(dǎo)航設(shè)備,等等,可以拖拉機的方向和具置測量,并通過建立計算機數(shù)據(jù)庫將記錄相關(guān)數(shù)據(jù),使用數(shù)據(jù)庫了解排水位置、土壤濕度、等等。了解土地信息后,制定合理的土地種植方案,計算機化化肥消費,數(shù)量的農(nóng)藥和種子。
3 先進(jìn)技術(shù)的應(yīng)用在農(nóng)業(yè)機械化操作的保障措施
得到更好的應(yīng)用程序為了促進(jìn)先進(jìn)技術(shù),提高農(nóng)業(yè)機械化水平,未來應(yīng)該完善的技術(shù)推廣體系,提高農(nóng)業(yè)機械化水平,促進(jìn)農(nóng)業(yè)生產(chǎn)和發(fā)展。完善的技術(shù)推廣體系,高度重視農(nóng)業(yè)技術(shù)推廣,建立試驗示范基地,發(fā)揮作用的指導(dǎo),讓農(nóng)民參觀和學(xué)習(xí)。讓他們意識到農(nóng)業(yè)機械設(shè)備的重要作用,加強農(nóng)業(yè)機械化的意識,接受和使用機械設(shè)備,技術(shù)推廣和培訓(xùn)活動。讓廣大農(nóng)民掌握農(nóng)業(yè)機械和設(shè)備的使用,提高思想認(rèn)識和應(yīng)用技能、農(nóng)業(yè)機械和農(nóng)業(yè)技術(shù)應(yīng)用于農(nóng)業(yè)生產(chǎn)。
構(gòu)建技術(shù)環(huán)境,當(dāng)?shù)卣畱?yīng)該高度重視農(nóng)業(yè)機械和農(nóng)業(yè)技術(shù)推廣的作用。提高思想認(rèn)識,加強規(guī)劃和指導(dǎo),增加資本投資,培訓(xùn)專業(yè)人才,創(chuàng)新工作方法,對許多人來說,完善的技術(shù)推廣體系,認(rèn)真履行職責(zé),并擴(kuò)大先進(jìn)技術(shù)的影響。完善法律法規(guī),充分利用其在技術(shù)和人才優(yōu)勢,重視技術(shù)的宣傳和推廣活動,增強服務(wù)意識,擴(kuò)展廣泛的服務(wù)渠道,更好的滿足實際工作的需要,對農(nóng)業(yè)技術(shù)的發(fā)展,為推廣農(nóng)業(yè)機械和設(shè)備創(chuàng)造便利。
4 農(nóng)業(yè)機械新技術(shù)的發(fā)展
農(nóng)業(yè)機械新技術(shù)的應(yīng)用和發(fā)展是為了提高農(nóng)業(yè)的生產(chǎn)力服務(wù),所以農(nóng)業(yè)機械新技術(shù)的發(fā)展主要是以下幾點:
首先,加快新技術(shù)的使用和推廣??茖W(xué)技術(shù)是第一生產(chǎn)力,加快計算機視覺技術(shù)、自動控制技術(shù)和智能技術(shù)等新技術(shù)在農(nóng)業(yè)機械的使用,同時引進(jìn)國外先進(jìn)的機械、新技術(shù),促進(jìn)我國農(nóng)業(yè)的發(fā)展,提高農(nóng)業(yè)的生產(chǎn)效率具有重要意義。
第二,政府補貼。購買新機器的個人組織生產(chǎn)、資本壓力,使得他們很難機械技術(shù)推廣,所以對于農(nóng)業(yè)機械推廣使用新技術(shù),政府將給予補貼材料,擴(kuò)大新機器的使用。
第三,提高農(nóng)業(yè)資源的利用效率。機械使用以提高農(nóng)業(yè)生產(chǎn)的效率,提高農(nóng)業(yè)資源的利用率。例如,在傳統(tǒng)的農(nóng)業(yè)生產(chǎn)過程中,和處理農(nóng)作物秸稈,絕大多數(shù)情況下燃燒,不僅浪費資源,還污染空氣。但農(nóng)業(yè)機械的使用新技術(shù)的農(nóng)作物秸稈粉碎加工、作物秸稈可以轉(zhuǎn)化成脂肪不僅材料,提高農(nóng)業(yè)資源的使用效率,也減少了空氣污染。
關(guān)鍵詞:印制電路板;圖像處理;機器視覺;PCB裸板;自動光學(xué)檢測;缺陷檢測 文獻(xiàn)標(biāo)識碼:A
中圖分類號:TP391 文章編號:1009-2374(2016)09-0010-05 DOI:10.13535/ki.11-4406/n.2016.09.005
我國是全球第一大PCB生產(chǎn)基地,作為電子產(chǎn)品承載體的電路板,其集成度和產(chǎn)量不斷在提高。為了保證電子產(chǎn)品的性能,電路板缺陷檢測技術(shù)已經(jīng)成為電子行業(yè)中非常關(guān)鍵的技術(shù)。建立在圖像處理算法基礎(chǔ)上的機器視覺檢測技術(shù)與傳統(tǒng)的人工檢測技術(shù)相比,提高了缺陷檢測的效率和準(zhǔn)確度。因此,設(shè)計一種高效精準(zhǔn)的機器視覺檢測電路板缺陷的系統(tǒng),具有非常重要的現(xiàn)實意義。評估印刷電路板質(zhì)量的一個重要因素就是表觀檢測,PCB的表觀質(zhì)量對產(chǎn)品性能及成品使用安全有著極大的重要性。而伴隨著近年來在工業(yè)生產(chǎn)領(lǐng)域崛起的計算機視覺,當(dāng)前表觀缺陷檢測和分類識別的研究方向已經(jīng)轉(zhuǎn)向了利用計算機視覺技術(shù)來實現(xiàn)。計算機圖像處理識別技術(shù)這種基于計算機視覺的檢測技術(shù)成功取代了傳統(tǒng)的PCB缺陷檢測方法,在自動光學(xué)檢測系統(tǒng)眾多應(yīng)用中占據(jù)了相對重要的地位,一躍成為PCB生產(chǎn)業(yè)表觀缺陷的主要檢測方法。
圖1 系統(tǒng)框圖
因此本文通過設(shè)計AOI自動光學(xué)檢測系統(tǒng),搭建較為簡單的PCB缺陷自動檢測系統(tǒng)的實驗平臺,對PCB中四類較為關(guān)鍵、常見的缺陷進(jìn)行檢測、分析、識別、判定,為研究推廣PCB缺陷自動檢測系統(tǒng)開拓應(yīng)用前景,如能實現(xiàn)工業(yè)上的產(chǎn)業(yè)化檢測,將有高額的經(jīng)濟(jì)收益。本文側(cè)重對PCB中的四類較為關(guān)鍵、常見的缺陷進(jìn)行檢測、分析、識別、判定,并且僅搭建了較為簡單的PCB缺陷自動檢測系統(tǒng)的實驗平臺,即通過復(fù)雜算法對采集到的圖像進(jìn)行處理、配準(zhǔn)、對比,從而得出PCB缺陷類型及對其進(jìn)行標(biāo)識。如圖1所示。
1 硬件設(shè)計方案
PCB缺陷檢測的總體系統(tǒng)設(shè)計方案主要是基于自動光學(xué)檢測技術(shù)來搭建PCB缺陷檢測系統(tǒng),硬件設(shè)計是使用CNC-T程控光源高精度影像測試系統(tǒng)操作臺,對待測電路板進(jìn)行圖像采集,再通過VS2010軟件所編寫程序處理,得出待測電路板的缺陷種類。整個系統(tǒng)主要分為運動控制、光源、圖像采集、圖像處理四個模塊,分模塊簡要闡述了實驗過程、所需設(shè)備以及軟件算法,搭建了一個相對完整的系統(tǒng)工作平臺。
圖2 CNC-T程控光源影像操作臺
該設(shè)備具有測量元素種類齊全、手動測量、自動對焦等多種功能,使用該設(shè)備采集圖像進(jìn)行二維檢測,測量軟體為YR-CNC,將圖像儲存至電腦后便由VS軟件進(jìn)行圖像處理。實驗組成如圖3所示:
圖3 實驗系統(tǒng)框圖
1.1 運動控制模塊
本系統(tǒng)運動流程為:被檢測的PCB在檢測臺上,通過步進(jìn)電機XY軸運動到攝像機拍攝區(qū)域,CCD攝像機固定在工作臺上方(Z軸),通過Z軸的運動實現(xiàn)聚焦。如圖4所示:
圖4 平臺運動示意圖
設(shè)備工作臺臺面尺寸為746mm×506mm,承載玻璃面尺寸為452mm×354mm,有效測量行程為400×300×200。本裝置既可通過軟件驅(qū)動自動采集圖像,也可以通過手動控制,移動并聚焦采集待測PCB的圖像。
1.2 光源模塊
輔助光照――采用的是正向和背向光源這兩種輔助光照。其中正光源和攝像頭同側(cè),均位于Z軸上,正光源主要用于檢測待測物體的表面特征。背光源位于檢測臺面下方,與正光源處于同軸反向關(guān)系,背光源能突出待測物體的輪廓特征,常用于檢測物體輪廓尺寸。
圖像采集:分別利用正光源突出PCB表面如走線、過孔和焊盤等主要特征,而下光源主要使PCB的輪廓尺寸和過孔產(chǎn)生強烈的輪廓對比。
光源:使用的是高度集中照明光源中心的LDR系列,由于該光源的傘狀結(jié)構(gòu)緊密排列著LED且采用了CCS獨創(chuàng)的柔性板,使之成為LED照明系統(tǒng)的標(biāo)準(zhǔn)模式。照明系統(tǒng)如圖5所示:
圖5 照明系統(tǒng)
1.3 圖像采集模塊
圖像采集模塊是由圖像采集卡、相機和鏡頭組成的,該模塊是圖像配準(zhǔn)階段的硬件基礎(chǔ)。計算機采集圖像的媒介就是相機,而相機按照不同原理又分為多種,常見的有CCD(Charge Coupled Device)和CMOS(Complementary Metal Oxide Semiconductor)兩類。本系統(tǒng)采用的是CCD 1/2英寸43萬像素彩色攝像頭和高清晰度0.7~4.5X變焦倍率鏡頭,顯示分辨率為0.001mm。
1.4 圖像處理模塊
通常獲得的圖像將受到工業(yè)現(xiàn)場環(huán)境、光照等條件的干擾,計算機所獲得的圖像質(zhì)量多數(shù)參差不齊,圖像的清晰度不一致,大大增加了PCB缺陷檢測的難度,所以在利用復(fù)雜算法檢測、識別PCB缺陷前要先對圖像進(jìn)行預(yù)處理。
本圖像處理模塊主要通過VS軟件在OpenCV計算機視覺庫的基礎(chǔ)上,通過一系列算法對圖像進(jìn)行處理對比。
2 系統(tǒng)軟件設(shè)計
2.1 OpenCV
OpenCV(Open Source Computer Vision Library)是一個跨平臺的可以運行在Linux、Windows和Mac OS操作系統(tǒng)上的基于(開源)發(fā)行的計算機視覺庫。它重量輕而高效,開放了多種接口如MATLAB、Ruby和Python等,并且在計算機視覺和圖像處理中大多數(shù)通用的算法都是被允許的。OpenCV可用于開發(fā)實時圖像處理、計算機視覺和模式識別方案,它提供了多種函數(shù),實現(xiàn)了大量的計算機視覺算法,算法涵蓋了從最基礎(chǔ)的濾波至以高級的物體檢測。OpenCV實際上是一堆C和C++語言源代碼文件,許多常見的計算機視覺算法由這些源代碼文件實現(xiàn)。如C接口函數(shù)cvCanny()實現(xiàn)Canny邊緣檢測算法。它可直接加入到我們自己的軟件項目編程中,而無需去編寫自己的Canny算子代碼,就是沒有必要重復(fù)“造輪子”。
根據(jù)OpenCV中源代碼文件巨多的特點,以算法的功能為基準(zhǔn),將這些源文件分到多個模塊中,如core、imgproc、highgui等。將每個模塊中的源文件編譯成一個庫文件(如opencv_core.lib、opencv_imgproc.lib、opencv_highgui.lib等),用戶在使用時,僅需在自己的項目中添加要用的庫文件,與自己的源文件一起連接成可執(zhí)行程序即可。
OpenCV計算機視覺庫的出現(xiàn),是為了使人們利用方便快捷的計算機視覺框架,在計算機視覺領(lǐng)域可以更加輕松地設(shè)計出更為復(fù)雜的應(yīng)用程序。OpenCV涵蓋了多種計算機視覺應(yīng)用區(qū)域,如用戶界面、信息安全、醫(yī)學(xué)影像學(xué)、工廠產(chǎn)品檢驗、立體視覺、機器人和攝像機標(biāo)定等,約有500多個函數(shù)。因為計算機視覺與機器學(xué)習(xí)是相輔相成的,所以O(shè)penCV也開放了MLL(Machine Learning Library)機器學(xué)習(xí)庫。MLL除了在視覺任務(wù)相關(guān)中使用,也可以很容易地應(yīng)用到其他機器學(xué)習(xí)中。
2.2 Microsoft Visual Studio2010
Visual Studio是微軟公司推出的開發(fā)環(huán)境,是同行業(yè)中目前最流行的Windows平臺應(yīng)用程序開發(fā)環(huán)境。Visual Studio 2010于2010年4月12日,其集成開發(fā)環(huán)境(IDE)已被重新設(shè)計和組織,變得更簡單了。
Visual Studio 2010同時帶來了NET Framework 4.0、Microsoft Visual Studio 2010 CTP(Community Technology Preview――CTP),并且支持開發(fā)面向Windows 7的應(yīng)用程序。除了Microsoft SQL Server外,它還支持IBM DB2和Oracle數(shù)據(jù)庫。目前有專業(yè)版、高級版、旗艦版、學(xué)習(xí)版和測試版五個版本。Visual Studio的用處十分廣泛,不僅可被用來基于Windows平臺創(chuàng)建Windows應(yīng)用程序和Web應(yīng)用程序,還可被用來創(chuàng)建智能設(shè)備、Office插件和Web服務(wù)等應(yīng)用程序。微軟的Visual Studio 2010將成為一個版本的經(jīng)典,這是相當(dāng)于6.0版本。該版本可以自定義開始頁,新功能還包括:(1)C# 4.0中的動態(tài)類型和動態(tài)編程;(2)多顯示器支持;(3)使用Visual Studio 2010的特性支持TDD;(4)支持Office;(5)Quick Search特性;(6)C++ 0x新特性;(7)IDE增強;(8)使用Visual C++ 2010創(chuàng)建Ribbon界面;(9)新增基于.NET平臺的語言F#。本課題將基于OpenCV計算機視覺庫使用Microsoft Visual Studio2010開發(fā)環(huán)境,通過編輯算法實現(xiàn)PCB缺陷檢測。
3 圖像預(yù)處理
要使用計算機對圖像進(jìn)行處理,所得到的連續(xù)圖像就必須被轉(zhuǎn)換為離散的數(shù)據(jù)集,這是因為計算機只能處理離散度數(shù)據(jù),這一過程我們稱之為圖像采集。圖像采集由圖像采集系統(tǒng)實現(xiàn),如圖6所示。圖像采集系統(tǒng)的三個主要模塊是成像系統(tǒng)、采樣系統(tǒng)和量化器。
圖6
將整理出的字符圖像交予識別模塊來識別,被稱為圖像的預(yù)處理。PCB的圖像預(yù)處理包括灰度化、增強、濾波、二值化、配準(zhǔn)等,處理后的PCB輸出的圖像質(zhì)量將得到改善,在很大程度上使得該圖像特征更直觀,方便計算機分析和處理。PCB的圖像預(yù)處理為整個PCB缺陷檢測系統(tǒng)的核心部件,很大程度上決定了檢測的準(zhǔn)確性。圖像預(yù)處理流程如圖7所示:
圖7 圖像預(yù)處理流程圖
4 PCB缺陷檢測
本文針對四種常見缺陷:斷路、短路、毛刺(凸起)、缺損(凹陷)進(jìn)行檢測研究。在這四種缺陷中,最為嚴(yán)重的缺陷類型是斷路和短路,它們將會使整塊板子失去本來的功能;而凸起、凹陷也可能影響到PCB在使用過程中的穩(wěn)定性能。如圖8所示為幾種常見的缺陷:
圖8 常見電路板缺陷
4.1 PCB缺陷的檢測方法
常用的PCB缺陷檢測方法有參考法和非參考法兩種。要是從概念理解和電路難易程度看,參考法明顯更加具有概念直觀、電路簡單的優(yōu)勢;要是從檢測所需要的條件來看,非參考法則在不需要待測PCB與標(biāo)準(zhǔn)PCB進(jìn)行準(zhǔn)確對準(zhǔn)這一點上優(yōu)于參考法。
本課題采用參考法進(jìn)行PCB缺陷檢測。
使用參考法對PCB缺陷進(jìn)行檢測的流程為:(1)確定標(biāo)準(zhǔn)的PCB圖像并放入?yún)⒖紟?;?)通過成像設(shè)備采集待測PCB圖像,進(jìn)行圖像預(yù)處理之后,再二值化PCB待測圖像,并對其進(jìn)行連通域提?。唬?)然后將處理結(jié)果與標(biāo)準(zhǔn)圖像進(jìn)行對比,利用圖像相減來判斷PCB可能存在的缺陷;(4)進(jìn)行分類,確定缺陷類型。
4.2 圖像連通域
像素是圖像中最小的單位,每個像素周圍有8個鄰接像素,常見的鄰接關(guān)系有兩種:4鄰接與8鄰接。4鄰接一共4個點,即上下左右。包括對角線位置的點,8鄰接的點一共有8個,如圖9所示:
圖9 領(lǐng)域示圖
如果像素點A與B鄰接,我們稱A與B連通,即有如下的結(jié)論:
如果A與B連通、B與C連通,則A與C連通。在視覺上看來,點與點相互連通,形成一個區(qū)域,而不是連通的點形成不同的區(qū)域。這種相互立體的所有的點,我們稱為連通區(qū)域。連通區(qū)域標(biāo)記常用的方法有Two-Pass(兩遍掃描法)和Seed Filling(種子填充法)兩種方法,本課題主要介紹第二種。
Seed Filling來源于計算機圖形學(xué),通常應(yīng)用在填充圖形上。思路:以一個前景像素當(dāng)作種子,而后在處于同一像素值且位置相鄰的連通區(qū)域,把和種子相鄰的前景像素融合到同一組像素中,結(jié)果將是獲得一個像素集,即連通區(qū)域。接下來介紹使用種子填充法實現(xiàn)的連通區(qū)域分析法:
第一,重復(fù)掃描圖像,當(dāng)?shù)玫疆?dāng)前像素點B(x,y)=1時停止:(1)賦予B(x,y)一個label,并將像素位置作為種子,接著將所有位于該種子周圍的前景像素都壓入棧中;(2)將棧頂像素賦以相同的label值并彈出,接著將全部位于棧頂像素周邊的前景像素都壓入棧中;(3)重復(fù)(2)步驟,直到棧為空。此時,圖像B中的一個像素值被標(biāo)記為label的連通區(qū)域便被找到了。
第二,在掃描結(jié)束前,重復(fù)第一個步驟,由此可以獲得圖像B中所有的連通區(qū)域在掃描結(jié)束后。
掃描所得的連通域如圖10所示:
圖10 圖像連通域提取
4.3 缺陷識別
缺陷識別具體特征如表1所示:
表1 缺陷特征
缺陷種類 二值圖像面積 連通區(qū)域數(shù)
斷路 減少 增加
短路 增加 減少
凸起 增加 不變
凹陷 減少 不變
第一,短路和斷路。在出現(xiàn)短路缺陷時,待測圖像與標(biāo)準(zhǔn)圖像相比,其所包含的連通區(qū)域數(shù)將會減少。同理可得,在出現(xiàn)斷路缺陷時,待測圖像與標(biāo)準(zhǔn)圖像相比,其所包含的連通區(qū)域數(shù)將會增多。因此,斷路和短路缺陷便可利用比較連通區(qū)域數(shù)來判定和識別。
第二,凸起和凹陷。凸起缺陷將導(dǎo)致導(dǎo)線和導(dǎo)線、導(dǎo)線和其他導(dǎo)體間的間隙變小,而凹陷缺陷將導(dǎo)致導(dǎo)線和導(dǎo)線、導(dǎo)線和其他導(dǎo)體間的間隙變大,二者均會導(dǎo)致PCB使用過程中出現(xiàn)不穩(wěn)定狀態(tài)。而觀察可知,這兩種缺陷的連通區(qū)域相同,差別在于各自二值化面積的大小,所以可以通過計算該待測圖像的連通區(qū)域面積來識別凸起、凹陷缺陷。
識別過程:將經(jīng)過圖像預(yù)處理的待測PCB圖像與標(biāo)準(zhǔn)圖像進(jìn)行對比后,通過算法找出缺陷。比較二者的連通區(qū)域數(shù),若前者大于后者,則標(biāo)定該缺陷點為斷路,反之則為短路;若二者連通區(qū)域數(shù)相同,則比較二值化圖像面積,若前者大于后者,則標(biāo)定該缺陷點為凸起,反之則為凹陷。檢測流程如圖11所示:
圖11 PCB缺陷檢測流程圖
5 系統(tǒng)實驗
本文使用CNC-T程控光源高精度影像測試系統(tǒng)操作臺,結(jié)合VS2010軟件基于OpenCV計算機視覺庫的算法編程來實現(xiàn)PCB的缺陷檢測。整體實驗過程為:手動控制操作臺捕捉、聚焦、采集待測PCB的圖像,采集到的圖像與標(biāo)準(zhǔn)圖像進(jìn)行對比、識別,得出缺陷種類并顯示結(jié)果。
本課題一共就所研究缺陷類型,做了40組實驗,通過實驗結(jié)果計算正確率。如表2所示:
表2 實驗結(jié)果統(tǒng)計
缺陷類型 實驗次數(shù) 正確率
斷路 10 100%
短路 10 100%
凸起 10 100%
凹陷 10 100%
針對不同電路板圖中出現(xiàn)的同種斷路類型進(jìn)行檢測,效果如圖12a、圖12b、圖12c所示,可準(zhǔn)確檢測出缺陷存在。
圖12
針對不同電路板圖中出現(xiàn)的同種短路類型進(jìn)行檢測,效果如圖13a、圖13b、圖13c所示,可準(zhǔn)確檢測出缺陷存在。
圖13
針對不同電路板圖中出現(xiàn)的同種凸起類型進(jìn)行檢測,效果如圖14a、圖14b、圖14c所示,可準(zhǔn)確檢測出缺陷存在。
圖14
針對不同電路板圖中出現(xiàn)的同種凹陷類型進(jìn)行檢測,效果如圖15a、圖15b、圖15c所示,可準(zhǔn)確檢測出缺陷存在。
圖15
6 結(jié)語
PCB板面向體積越來越小、密度越來越高的方向發(fā)展。在檢測產(chǎn)品價格方面,國外AOI檢測產(chǎn)品價格普遍偏高,而由于經(jīng)濟(jì)原因,在國內(nèi)PCB板生產(chǎn)制造商多數(shù)仍采用人工目測等傳統(tǒng)檢測方法檢測。隨著經(jīng)濟(jì)的發(fā)展,數(shù)字圖像處理研究的深入,自動光學(xué)檢測系統(tǒng)也開始頻繁活躍在人們視線中,但在PCB缺陷檢測方面的應(yīng)用卻還有待完善。因此,本論文建立在深入掌握工控系統(tǒng)結(jié)構(gòu)并從PCB板的質(zhì)量標(biāo)準(zhǔn)、圖像特點、缺陷特征及檢測要求的分析基礎(chǔ)上,對以圖像處理為基礎(chǔ)的PCB缺陷檢測技術(shù)進(jìn)行了深入研究。由于PCB缺陷自動檢測系統(tǒng)的研究涉及多個領(lǐng)域的知識,其研究過程十分耗時、繁瑣,由此,本論文僅僅對PCB缺陷檢測中較為常見的問題進(jìn)行了較深入研究,并且僅搭建了較為簡單的PCB缺陷自動檢測系統(tǒng)的實驗平臺,對PCB中的四類較為關(guān)鍵、常見的缺陷進(jìn)行檢測、分析、識別、判定。雖然還未實現(xiàn)真正實現(xiàn)工業(yè)上產(chǎn)業(yè)化檢測,但是在未來幾十年中,研究推廣的PCB缺陷自動檢測系統(tǒng)將有十分良好的應(yīng)用前景,也將有高額的經(jīng)濟(jì)收益。
參考文獻(xiàn)
[1] 陳勝勇,劉盛,等.基于OpenCV的計算機視覺技術(shù)實現(xiàn)[M].北京:科學(xué)出版社,2008.
[2] Gary Bradski,Adrian Kaebler,于仕琪,等.學(xué)習(xí)OpenCV[M].北京:清華大學(xué)出版社,2009.
[3] 周長發(fā).精通Visual C++圖像處理編程(第3版)
[M].北京:電子工業(yè)出版社,2006.
[4] 黨振.中國大陸PCB產(chǎn)業(yè)的現(xiàn)狀與未來[J].印制電路信息,2006,32(1).
[5] 胡躍明,譚穎.自動光學(xué)檢測在中國的應(yīng)用現(xiàn)狀和發(fā)展[J].微計算機信息,2006,(4).
[6] 李漢,何星,等.印刷電路板的自動光學(xué)檢測系統(tǒng)
[J].無損檢測,2004,26(6).
[7] 張利,高永英,等.PCB板檢測中的定位研究[J].中國圖像圖形學(xué),1999,4(8).
[8] 姚立新,張武學(xué),等.AOI系統(tǒng)在PCB中的應(yīng)用[J].電子工業(yè)專用備,2004,(5).
[9] 范小濤,夏雨人.一種基于圖像處理的PCB檢測算法研究[J].計算機工程與應(yīng)用,2004,(13).
[10] 傅莉.印制電路板的發(fā)展及前景[J].電腦與電信,2010,(5).
[11] 張明軒.基于視頻序列的人臉檢測與跟蹤算法研究[D].中北大學(xué),2011.
[12] 張馳.基于機器視覺的智能控制與圖像識別問題研究[D].蘭州理工大學(xué),2009.
[13] 謝飛.基于計算機視覺的自動光學(xué)檢測關(guān)鍵技術(shù)與應(yīng)用研究[D].南京大學(xué),2013.
[14] 張靜.PCB表觀缺陷的自動光學(xué)檢測理論與技術(shù)
[D].電子科技大學(xué),2013.
[15] 俞瑋.AOI技術(shù)在PCB缺陷檢測中的應(yīng)用研究[D].電子科技大學(xué),2007.
【關(guān)鍵詞】OpenCV視覺庫 圖像處理 Android平臺
Opencv全稱:Open Source Computer Vision Library,是一個可以移植到其他開發(fā)工具中的一個跨平臺的圖像處理視覺庫,它由C++語言編寫,主要有C++、C語言接口,為了能在手機等移動端更方便的進(jìn)行圖像處理,我們利用其JAVA接口將opencv視覺庫添加到Android的開發(fā)工具中,實現(xiàn)了在移動端的圖像處理功能。
1 opencv的特點
(1)跨平臺,有很好的移植性。Opencv由跨平臺的中高層API構(gòu)成,可以運行在Linux、Windows和Mac OS操作系y上,該庫有C++、C、Java接口,我們運用Java接口就可以將Opencv視覺庫移植到Android studio開發(fā)工具中。
(2)免費、開源,與耗費很高的商業(yè)化工具(比如 MATLAB+Simulink)有很大的區(qū)別。
(3)高效、快速、使用方便。Opencv視覺庫具有強大的圖像運算功能,API中有比較完善的處理函數(shù),能夠明顯提高開發(fā)效率。
2 Opencv在Android studio中的環(huán)境搭建流程
2.1 安裝Java JDK
需要完成JDK的下載、安裝和環(huán)境配置的流程,安裝完成后,要運行資源管理器輸入 Java Version來驗證是否安裝成功,若顯示Java版本信息,則安裝成功。
2.2 下載Android Studio開發(fā)工具并安裝
在Android Studio的中文社區(qū)下載最新的Android Studio開發(fā)工具(要包含Java SDK),并運行Android Studio,根據(jù)安裝提示進(jìn)行安裝,并運行開發(fā)工具。
2.3 配置Opencv Android SDK
在Opencv官網(wǎng)(http://)下載Opencv Android SDK并解壓。在Android Studio中,新建一工程,點擊File并import Module,并選中解壓的Opencv SDK文件夾中的Java文件夾,這樣就將Opencv視覺庫移植到了Android Studio中。然后右鍵App project,打開open Module Settings中的Depencies,點擊Module Dependency,添加OpencvLibrary,這樣就完成了深層配置。最后把Opencv SDK文件夾中的native文件夾中的libs的4個文件夾復(fù)制到所建好的工作空間中的project中的libs中。
3 圖像的灰度處理和像素取反處理的應(yīng)用舉例
本文中是用的移動端為魅族MX3,Android版本號為5.0.1。
3.1 灰度處理
使用OpenCv將一幅圖像轉(zhuǎn)換為灰度圖像在實際應(yīng)用中也不少,轉(zhuǎn)換為灰度圖像比較簡單,關(guān)鍵函數(shù): cvCvtColor:cvCvtColor(IplImage* src, IplImage* dst, CV_BRG2GRAY)。值得注意的是:最后一個參數(shù)為 CV_BRG2GRAY ,表示將BRG圖片(彩色圖片)轉(zhuǎn)換為灰度圖片(黑白),參數(shù)src、dst必須事先分配好內(nèi)存空間,使用完之后必須要釋放空間。
3.2 像素操作―取反
OpenCV中圖像取反是將圖像中的像素點變?yōu)樵瓉硐袼攸c的反色。例如,如果一副灰度圖像的每個像素值由2^8=256個,假設(shè)點i點像素值為brga[i] ,則取反后的像素值為 255- brga[i]&oxff。
關(guān)鍵代碼為:
int cnum = src.channels();
byte[] bgra = new byte[cnum];
for (int i = 0;i
bgra[i] = (byte) (255 - bgra[i]&0xff);}
然后運用matToBitmap函數(shù)將Mat格式的圖像轉(zhuǎn)換成Bitmap的圖像,并顯示在android手機移動端。
經(jīng)過編寫代碼并運行得到的處理結(jié)果如圖1所示。
4 結(jié)束語
OpenCV視覺庫是一套簡單易用且完整的計算機視覺框架,幫助開發(fā)人員完成大量的底層工作,減少了工作量,更有效提高了設(shè)計出復(fù)雜計算機圖形處理的能力。并且我們將OpenCV移植到Android操作系統(tǒng)中去,也是圖像處理領(lǐng)域的一大進(jìn)步。我們相信,在OpenCVForAndroid的應(yīng)用不斷拓展中,眾多圖像處理領(lǐng)域會有廣泛的前景。
參考文獻(xiàn)
[1]陳雪嬌.基于Open CV的計算機視覺技術(shù)研究[J].電腦知識與技術(shù),2015(30).
[2]張家怡.圖像識別的技術(shù)現(xiàn)狀和發(fā)展趨勢[J].電腦知識與技術(shù),2010(21).
[3]黎松,平西建,丁益洪.開放源代碼的計算機視覺類庫Open CV的應(yīng)用[J].計算機應(yīng)用與軟件,2005.22(08).
[4]何鵬,王連鵬,楚艷紅.基于Open CV 的機器視覺在智能手機中的應(yīng)用[J].計算機工程與設(shè)計,2011(10).
[5]王福斌,李迎燕,劉杰,陳至坤.基于OpenCV的機器視覺圖像處理技術(shù)實現(xiàn)[J].機械與電子,2010(06).
作者簡介
劉賢輝(1992-),男,山東省青島市人?,F(xiàn)為青島市山東科技大學(xué)在讀研究生。主要研究方向為移動端的圖像處理研究
通過闡述農(nóng)業(yè)機械中的幾種新的技術(shù)手段,比如計算機技術(shù)、網(wǎng)絡(luò)信息技術(shù)、人工智能技術(shù)及液壓技術(shù)等在農(nóng)業(yè)機械中的應(yīng)用情況,對農(nóng)業(yè)機械技術(shù)的發(fā)展進(jìn)行了分析,希望可以為農(nóng)業(yè)機械設(shè)備的智能化發(fā)展提供相應(yīng)的參考依據(jù)。
關(guān)鍵詞:
農(nóng)業(yè)機械;技術(shù)手段;應(yīng)用;發(fā)展前景
我國在國際上的地位正在逐漸提高,這與我國的經(jīng)濟(jì)發(fā)展是分不開的,經(jīng)濟(jì)的發(fā)展需要基礎(chǔ)的支持,農(nóng)業(yè)就是我國的基礎(chǔ),我國是農(nóng)業(yè)大國,農(nóng)村人口基數(shù)大。隨著近幾年我國農(nóng)業(yè)的發(fā)展,很多高新技術(shù)也被運用到農(nóng)業(yè)的機械設(shè)備中,使農(nóng)機設(shè)備向著智能化的方向發(fā)展,有效地提升了農(nóng)業(yè)生產(chǎn)的整體效率。在農(nóng)業(yè)的生產(chǎn)中使用高新技術(shù)還能夠提高農(nóng)業(yè)的生產(chǎn)效率,保證農(nóng)機相關(guān)機械的正常運作。
1農(nóng)業(yè)機械技術(shù)的應(yīng)用分析
1.1計算機技術(shù)
這里所說的計算機技術(shù)主要指的是計算機視覺技術(shù),這一技術(shù)最早被運用在農(nóng)業(yè)機械上是在20世紀(jì)70年代中期,當(dāng)時主要運用的是計算機技術(shù)中的視覺技術(shù),利用這一技術(shù)的主要目的是可以對農(nóng)產(chǎn)品的品質(zhì)質(zhì)量進(jìn)行分級別檢查。計算機視覺技術(shù)是以圖像處理為基準(zhǔn),隨著圖像處理以及視覺模擬技術(shù)的發(fā)展,計算機視覺技術(shù)不僅可以用來檢查農(nóng)產(chǎn)品的品質(zhì),而且還可以用來對農(nóng)產(chǎn)品進(jìn)行播種、收割。雖然計算機視覺技術(shù)在我國農(nóng)業(yè)技術(shù)領(lǐng)域的應(yīng)用時間還不是很長,在實際的使用中還有很多的問題出現(xiàn),但是相信隨著科學(xué)技術(shù)的不斷發(fā)展,計算機視覺技術(shù)必將會改變傳統(tǒng)的農(nóng)業(yè)作業(yè)模式,為現(xiàn)代化農(nóng)業(yè)發(fā)展提供技術(shù)上的支持。
1.2網(wǎng)絡(luò)信息技術(shù)
網(wǎng)絡(luò)信息技術(shù)在我國農(nóng)業(yè)機械上的應(yīng)用是非常成功的,信息技術(shù)與地理信息系統(tǒng)的有機結(jié)合不僅可以為農(nóng)業(yè)的生產(chǎn)提供高精度的監(jiān)控,而且還能夠?qū)r(nóng)業(yè)生產(chǎn)中出現(xiàn)病蟲害的情況進(jìn)行及時的檢測,然后根據(jù)定位系統(tǒng)來進(jìn)行田間作業(yè)。
1.3液壓技術(shù)
液壓技術(shù)主要依靠的是微電子技術(shù)和工業(yè)傳感技術(shù),在數(shù)據(jù)的采集上,運用液壓技術(shù)主要完成的是能量的轉(zhuǎn)換和匹配,其目的是為了讓農(nóng)業(yè)機械的效率能夠得到進(jìn)一步的提高,讓機械設(shè)備的相關(guān)系統(tǒng)特征可以得到完善,讓機械設(shè)備的可靠性能夠得到提升,這也很好地符合了環(huán)境保護(hù)的相關(guān)標(biāo)準(zhǔn)要求。而大部分的農(nóng)業(yè)機械都是采用內(nèi)燃機作為原動力,所以很多時候都會出現(xiàn)工作負(fù)荷,一般情況下,我們都是通過電液控制手段來完成負(fù)載與原動力之間的匹配情況,盡可能地減少功率傳輸過程中出現(xiàn)的損失,從而提高農(nóng)業(yè)機械系統(tǒng)的工作效率。
1.4人工智能技術(shù)
隨著信息全球化的不斷深入,高端技術(shù)不僅在大型的企事業(yè)單位中被運用,在農(nóng)業(yè)中也得到了廣泛的應(yīng)用,比較有成果的就是美國利用人工智能技術(shù)研發(fā)出激光拖拉機、機械的內(nèi)部導(dǎo)航裝置,等等,這些裝置可以對拖拉機的運行方向及所處位置進(jìn)行實時的測定,在了解地區(qū)土地信息之后,再制定合理的土地種植方案、農(nóng)藥及種子的數(shù)量,等等。
2農(nóng)業(yè)機械技術(shù)的發(fā)展趨勢
2.1推廣農(nóng)業(yè)機械產(chǎn)品的技術(shù)發(fā)展
目前在我國的農(nóng)業(yè)機械發(fā)展上,已經(jīng)開始運用機電智能化技術(shù)和計算機技術(shù),這使得農(nóng)業(yè)機械化設(shè)備的科技含量有了極大的提高,不僅有效地提高了農(nóng)業(yè)機械的作業(yè)效率,而且也提升了農(nóng)業(yè)的生產(chǎn)效率。
2.2農(nóng)業(yè)資源的利用率得到了提升
只有提高了農(nóng)業(yè)資源的開發(fā)利用率,才能夠確保農(nóng)業(yè)實現(xiàn)可持續(xù)發(fā)展,同時也為保護(hù)生態(tài)環(huán)境奠定基礎(chǔ),如回收農(nóng)業(yè)生產(chǎn)的廢棄物,普及無害化的處理設(shè)備,運用無害化技術(shù)來處理廢水可以有效地達(dá)到保護(hù)環(huán)境的作用。而在農(nóng)業(yè)種植的過程中,使用有機肥料還可以進(jìn)一步提高農(nóng)業(yè)資源的利用效率。除此之外,大力發(fā)展節(jié)能型動力機械設(shè)備可以有效地避免出現(xiàn)資源浪費,從而提高農(nóng)業(yè)資源的整體利用效率。
2.3提高農(nóng)業(yè)機械產(chǎn)品的質(zhì)量監(jiān)督水平
要想提升農(nóng)業(yè)的機械化水平,還要從規(guī)范設(shè)計的基本要求出發(fā),全面提高農(nóng)業(yè)產(chǎn)品的質(zhì)量。在質(zhì)量提升的過程中,還要注重農(nóng)業(yè)產(chǎn)品的整體造型和外觀,農(nóng)機設(shè)備的耐久性也要經(jīng)得起考驗。選用與農(nóng)機設(shè)備相配套的發(fā)電機及元件,能夠最大程度上提高農(nóng)業(yè)機械產(chǎn)品的質(zhì)量。在農(nóng)業(yè)機械設(shè)備完成安裝之后,還要對其進(jìn)行試運行,只有保證了設(shè)備各項指標(biāo)都正常的基礎(chǔ)上,才能夠真正的投入使用,這也是提高農(nóng)業(yè)機械產(chǎn)品可靠性的前提。
2.4加大政府的補貼力度
各級地方政府要加大農(nóng)業(yè)機械的技術(shù)推廣,做好農(nóng)業(yè)機械的培訓(xùn)工作。國家還要將拖拉機、插秧機等農(nóng)機具作為農(nóng)具購置補貼的關(guān)鍵,普及農(nóng)業(yè)機械知識。這樣也能夠更好地提高農(nóng)業(yè)機械化的發(fā)展進(jìn)程。2.5確保農(nóng)業(yè)機械技術(shù)的安全生產(chǎn)關(guān)注安全監(jiān)督管理及裝備的創(chuàng)建工作,加大農(nóng)業(yè)機械的安全投入,以便更好地滿足農(nóng)業(yè)機械工作安全監(jiān)督管理的需求。除此之外,最重要的是,要將農(nóng)業(yè)機械的安全檢驗工作納入到各級縣市政府的財政預(yù)算當(dāng)中。
3結(jié)語
隨著科學(xué)技術(shù)的飛速發(fā)展,一些高新技術(shù)正在逐漸地被運用到農(nóng)業(yè)的機械設(shè)備中,這些機械設(shè)備的出現(xiàn)不僅提高了農(nóng)業(yè)的整體生產(chǎn)水平,而且還進(jìn)一步提升了農(nóng)業(yè)的生產(chǎn)效率,很好地實現(xiàn)了農(nóng)業(yè)的可持續(xù)發(fā)展。在今后的農(nóng)業(yè)發(fā)展過程中,農(nóng)業(yè)機械也必定是智能化的,所以要求操作人員要不斷地提高自己的專業(yè)素養(yǎng),全面推廣農(nóng)業(yè)機械新技術(shù),只有這樣才能夠真正意義上實現(xiàn)我國農(nóng)業(yè)機械的智能化。
作者:徐家亮 劉曉鵬 單位:黑龍江省克東縣農(nóng)機安全監(jiān)理站
參考文獻(xiàn):
[1]陶樂然.長春星宇小區(qū)新技術(shù)應(yīng)用[C]//增強自主創(chuàng)新能力促進(jìn)吉林經(jīng)濟(jì)發(fā)展———啟明杯•吉林省第四屆科學(xué)技術(shù)學(xué)術(shù)年會論文集(下冊).2006.
[2]劉蒙之.傳播新技術(shù)與國家發(fā)展———一種政治經(jīng)濟(jì)學(xué)的觀察[C]//中國傳播學(xué)會成立大會暨第九次全國傳播學(xué)研討會論文集.2006.
[3]張仁江,田莉.制造業(yè)企業(yè)新技術(shù)采納:動因、路徑及障礙分析———基于T公司的縱向案例研究[C]//第六屆(2011)中國管理學(xué)年會———技術(shù)與創(chuàng)新管理分會場論文集.2011.
[4]胡札進(jìn),姚尚斌,徐七三“.雙低”儲藏與四項儲糧新技術(shù)的綜合應(yīng)用[C]//全面建設(shè)小康社會:中國科技工作者的歷史責(zé)任———中國科協(xié)2003年學(xué)術(shù)年會論文集(上).2003.
[5]柳旭.淺析電視空間新技術(shù)對審美體驗的影響[C]//2009中國電影電視技術(shù)學(xué)會影視技術(shù)文集.2010.
提起數(shù)字媒體,人們通常會想到傳媒行業(yè),其實數(shù)字媒體的應(yīng)用絕不局限于傳媒。隨著寬帶網(wǎng)絡(luò)的普及,人們在日常業(yè)務(wù)處理過程中,正面對越來越豐富的網(wǎng)上媒體和內(nèi)容,包括各種視頻、音頻、文本、圖像等。下面,就讓我們跟著諸位數(shù)字媒體方面的專家一起來分享這個繽紛的世界。
三維幾何建模與形狀表示
北京大學(xué)視覺與聽覺信息處理國家重點實驗室主任教育部長江學(xué)者獎勵計劃特聘教授 查紅彬
精彩問答
在背景比較復(fù)雜、有干擾的情況下模型檢索的效果怎么樣?
在模型檢索的時候并沒有考慮背景,因為這是做模型檢索比較容易的部分。模型檢索一般是沒有背景的,但也可以做,但是要推廣到背景比較復(fù)雜的物體上識別可能有很大的問題,因為這時候匹配不僅僅是局部匹配,而是兩個子集和子集的匹配問題,到目前為止,我們只是做沒有背景的模型檢索。
為什么要重新談?wù)撊S形狀表示問題?在多媒體信息處理領(lǐng)域里面,有兩個比較重要的方向,這也是計算機科學(xué)技術(shù)領(lǐng)域里兩個重要的方向,一個是計算機視覺,一個是計算機圖形學(xué)。計算機視覺是從圖像中通過識別或重建處理,得到一個對對象物的描述。反過來說圖形學(xué),是對一個對象和場景的描述,通過繪制和動畫生成圖像和視頻。它們從處理過程來說是逆過程,這兩個領(lǐng)域之間有密切的關(guān)聯(lián)。
我們現(xiàn)在考慮計算機三維建?;蚰P偷拿枋?,考慮的不僅僅是計算機視覺或計算機圖形學(xué)所包含的內(nèi)容。這里面簡單列舉一下,比如基于模型的三維物體識別和場景識別,這兩個應(yīng)該是典型的計算機視覺里面考慮的應(yīng)用。除了這以外還可以用模型干別的事情,比如繪制,還包括基于這樣模型的設(shè)計、變形、動畫等等。除了兩個單獨研究的應(yīng)用之外,還要想怎么把兩者結(jié)合起來,把虛擬和真實的東西無縫連接到一起,這些都牽涉到三維模型。
我們考慮的三維模型跟以前相比,應(yīng)用領(lǐng)域大了很多,要達(dá)到這個要求,對模型的表達(dá)、形狀的表達(dá)也都有了更高的要求。
怎樣找到一些更新更有效地表達(dá)形式來符合這些要求呢?這里有四個方面,現(xiàn)在能不能建立一個形狀空間,把考慮的對象完整地在形狀空間里面表達(dá)出來。第二點就是針對形狀的特性,表達(dá)要具有柔性,對象物的表面不都是連續(xù)的,也有一些非連續(xù)性和不規(guī)律性,這些特性怎樣能夠進(jìn)行柔性處理。第三個是需要一些描述是局部性的,另外一些要求描述是整體性的,這兩者之間如何有一個很好的結(jié)合方法。第四是在大量的計算當(dāng)中,包括變形和動畫中有很多編輯的工具,所以我們要求對現(xiàn)在的形狀表達(dá)有一些比較高的要求。
在計算機視覺里面有一個老大難就是識別,已有模型,但是眼前看到的是一部分三維數(shù)據(jù),怎么用這部分?jǐn)?shù)據(jù)和模型數(shù)據(jù)匹配來識別它呢?這就牽涉到局部匹配,我們要解決局部匹配需要什么描述?我們要有一個模型,從大量的數(shù)據(jù)中建立一個模型庫,并從中抽取很多特征,把這些特征進(jìn)行組織。這里面牽涉三個比較大的問題,第一個是形狀空間怎么構(gòu)造,沒有很好的特征表達(dá)或整理的形式,后面的匹配以及其他的工作就很難做。第二個是怎么定義基于這種特征的相似度。第三個是怎樣在形狀空間當(dāng)中搜索到最優(yōu)的匹配。
針對這些問題我們最近一兩年做了一些工作,最近提出一個廣義形狀分布(Generalized Shape Distributions)描述方式,主要目的有兩點,能不能在三維形狀表示過程當(dāng)中,找到一些最關(guān)鍵的描述指令,并從中找到相互關(guān)系,把整體和局部結(jié)合起來。如果把之間的關(guān)系描述出來,就能把局部結(jié)構(gòu)性的信息用整體觀點加進(jìn)去,這兩件工作就是我們做這件事情的主要目的。
在形狀描述問題上,我們還有很多工作要做,除了局部、整體描述之外,我們要想辦法把他們結(jié)合到一起。今后幾年要用更多的模式識別的辦法,來解決面臨的圖形學(xué)或虛擬現(xiàn)實和計算機視覺當(dāng)中的很多問題。
生活中的計算機視覺
香港中文大學(xué)信息工程系終身教授
微軟亞洲研究院視覺計算組負(fù)責(zé)人 湯曉歐
精彩問答
微軟亞洲研究院視覺計算組在原創(chuàng)思想這一塊,引領(lǐng)下一個方向有沒有什么考慮,您談到很多對人們?nèi)粘I钣绊懞艽蟮膽?yīng)用,但是在背后的更深層的考慮,更新的創(chuàng)意在哪里呢?
我們的研究者都很年輕,我本人也才工作七年的時間,很多的算法已經(jīng)發(fā)展這么多年了,所以在開始的時候比較容易想出來的方法,現(xiàn)在已經(jīng)很難有那么多的原創(chuàng)內(nèi)容。我們的工作是去找一些非常原創(chuàng)的內(nèi)容,有的是理論上的,有的是新的發(fā)明,這可以有很大的影響。
圖像通過閃光燈的分割,前景和背景深度差會不會影響分割效果,距離會不會影響分割效果呢?
我們這個通過閃光燈對圖像進(jìn)行分割的技術(shù),會一定程度上受到光的強度和距離的影響。
我們主要的研究領(lǐng)域包括計算機視覺、模式識別、圖像處理和視頻處理。下面就為大家介紹幾個比較典型的應(yīng)用。
如何將圖片的前景和后景分離?我們現(xiàn)在照兩張圖片,一張打閃光燈,一張沒有打閃光燈,這樣拍出來的照片背景沒有變化,但前景變化很厲害。在開閃光燈的情況下拍的照片,前景和后景可以利用一些技術(shù)很容易地分開來。
把一個圖片的前景切割出來放入另一張圖后,那剩下的圖片缺一塊的怎么辦呢?如何修復(fù)剩下的圖片呢?在例舉的圖片上,大家可以看到不同的區(qū)域,我們可以由一個算法,從其他的地方借過來,再貼上去,經(jīng)過這樣的處理后,圖像基本上和原來沒有太大的區(qū)別。
如此的修修補補又有什么用呢?比如說,你對這張圖像不是很滿意,你可以把圖片上不喜歡的部分劃出來,然后利用一些技術(shù)將劃出來的空白部分填上。更有用的地方在于,你照了不想被別人看到的照片后,除了刪除,你多了一個選擇。你可以把不想讓別人看到的照片部分去掉,并利用一些算法把空白的地方填補上,而且讓別人看不出來。
現(xiàn)在大家的電腦上都會有很多照片,怎么快速地瀏覽這些照片呢?我們可以把這些圖像都放在一個屏幕上,可屏幕畢竟有限,怎么才能把照片放得更多一些呢?我們現(xiàn)在做的是可以隨機把照片放到桌面上,但是電腦會對每張照片上的重要信息進(jìn)行篩選,在放盡可能多的照片的同時,讓每張照片上最重要的信息不被遮掩,而且均勻地分布在桌面上。這樣大家看起來就更清楚了。這個算法就是怎么讓所有圖像均勻分布,同時把所有背景都要蓋上。我們可以對圖像進(jìn)行各種處理,同時我們也可以利用一些技術(shù)知道別人有沒有處理圖像,對圖像有沒有做過手腳。
現(xiàn)在我們來說說視頻方面。比如說抖動很厲害的圖像,怎么把物體移到中間?一個辦法是把除移動圖像外的公共部分切出來,但是移動越大,公共部分就會越來越小,更好的辦法是用一些技術(shù)把空處填上。
現(xiàn)在MSN的功能已經(jīng)越來越豐富。比如說一段電影,你看到一件比較中意的衣服,只要你把鼠標(biāo)移動衣服的覆蓋范圍,你就能很清楚地知道這件衣服的品牌及價格。如果你把鼠標(biāo)在那件衣服上輕點,電腦就會直接跳轉(zhuǎn)到這個衣服的相關(guān)網(wǎng)站。
你在視頻聊天的時候如果不想讓對方看到你所處的環(huán)境,你就可以很輕松地把背景模糊掉。如果大家對自己的長相不是那么有信心,我們可以幫你改變一下你的長相。為自己添一幅酷酷的墨鏡,換上一個性感的大嘴巴,這些都能輕而易舉地完成。
多媒體傳感器網(wǎng)絡(luò)
北京郵電大學(xué)教授、博士生導(dǎo)師
智能通信軟件與多媒體北京市重點實驗室主任 馬華東
傳感器研究是IT非常熱門的話題, 首先我為大家介紹一下多媒體傳感器網(wǎng)絡(luò)的基本概念。從早期的巨型機到今天的小型機,生物芯片尺寸越來越小,但是效率越來越高;網(wǎng)絡(luò)設(shè)備聯(lián)網(wǎng)和數(shù)據(jù)交換的需求越來越大,設(shè)備之間的傳輸量也越來越大;從信息處理的角度來看,內(nèi)容逐漸占據(jù)了主導(dǎo)地位,由數(shù)據(jù)為中心轉(zhuǎn)到以內(nèi)容處理為中心。這三方面的演化是今天討論多媒體傳感器的背景。
傳感器網(wǎng)絡(luò)是一組傳感器節(jié)點,由組織方式協(xié)作地感知采集和處理感知對象的信息,它的基本特點是造價低、能量敏感、通信能力有限、計算能力弱、動態(tài)變化。現(xiàn)在的需求是要求通信能力越來越強,計算能力應(yīng)付節(jié)點的處理的要求。
右圖是目前主流的傳感器節(jié)點的配置,從配置來講還是比較低的,現(xiàn)在信息處理側(cè)重壓力、溫度、光、震動等簡單的數(shù)據(jù)或者是標(biāo)量數(shù)據(jù)。人類獲取信息80%是視覺信息,10%左右是聽覺信息,也就是說90%左右的信息是多媒體信息。傳感器網(wǎng)絡(luò)就是對音頻、視頻信息獲取后提供給使用者,使其對環(huán)境信息有一個全方位的了解,對傳感器網(wǎng)絡(luò)的應(yīng)用是非常廣泛的。
從網(wǎng)絡(luò)的結(jié)構(gòu)來講,基本結(jié)構(gòu)和原來傳感器網(wǎng)絡(luò)差別不是很大,這里面強調(diào)增加音頻、視頻獲取處理,網(wǎng)絡(luò)傳輸整個過程的各個環(huán)節(jié),同時這里面最好可以交互。有了這個概念以后,深入分析一下主要特點,首先是網(wǎng)絡(luò)能力的增強,這樣一個傳感器網(wǎng)絡(luò)應(yīng)該集信息的采集、處理傳輸、轉(zhuǎn)發(fā)、能量供應(yīng)等方面,除了傳統(tǒng)的標(biāo)量數(shù)據(jù),音頻、視頻的圖像數(shù)據(jù),都可以進(jìn)行采集處理。
現(xiàn)在多媒體傳感器網(wǎng)絡(luò)目前有哪些問題呢?從需求來看,現(xiàn)在網(wǎng)絡(luò)是異構(gòu)的信息,媒體信息的格式,種類很多,并且差異非常大,數(shù)據(jù)量比較大,特別是音頻、視頻信息,格式比較復(fù)雜。這些信息傳輸過程中需要高速實時地傳輸,對網(wǎng)絡(luò)傳輸速率也提出了比較高的要求。媒體信息的安全問題,也是網(wǎng)絡(luò)需要考慮的,還有服務(wù)質(zhì)量的問題。針對這些需求,我們可以看到,通信資源和計算資源這兩者之間存在非常大的矛盾,或者非常大的鴻溝,如何解決這兩者之間的差距就是我們研究的問題所在。
最后談一下多媒體傳感器網(wǎng)絡(luò)研究的挑戰(zhàn),首先是節(jié)點的芯片設(shè)計,這是基礎(chǔ),這里面需要采用多種技術(shù),包括軟硬件協(xié)同設(shè)計的技術(shù),各種技術(shù)結(jié)合,降低成本、能耗、體積、提高運算速度和可靠性。第二是三維場景的覆蓋問題,方向性傳感模型是一個簡單的二維圖形,實際上是三維圖形監(jiān)測,這是一個三維場景方向的問題,研究這個就復(fù)雜多了。還有一個問題是服務(wù)質(zhì)量保證問題,在新的網(wǎng)絡(luò)當(dāng)中服務(wù)質(zhì)量體系是什么樣,也是研究的方向。再一個是信息處理,為了使網(wǎng)絡(luò)傳輸數(shù)據(jù)量比較快,能不能在節(jié)點做信息處理的計算。當(dāng)然信息的安全也比較重要,用這些節(jié)點獲取多媒體信息怎么保證安全的質(zhì)量,使應(yīng)該看到的人看到這些信息,不應(yīng)該看到的人看不到這些信息。
在多媒體傳感器網(wǎng)絡(luò)中,我們還是做了一些工作,和一些同行學(xué)者也有一些交流,這里面也有一些質(zhì)疑,說多媒體傳感網(wǎng)絡(luò)和原來傳感器網(wǎng)絡(luò)設(shè)計初衷是不是吻合的,原來沒有想讓它處理這么多信息,原來體積比較小,加上這些信息以后,無疑使它的體積增大,這里面和初衷之間是不是有矛盾,傳感器網(wǎng)絡(luò)研究有沒有必要性,如果有必要性可行不可行,這都是我們目前研究的問題。
關(guān)鍵詞:增強現(xiàn)實;視線追蹤;應(yīng)用
增強現(xiàn)實(Augmented Reality簡稱AR)技術(shù)是近年來的一個研究熱點,有著廣泛的應(yīng)用前景。它是對現(xiàn)實世界的補充,使得虛擬物體從感官上成為周圍真實環(huán)境的組成部分。與傳統(tǒng)的虛擬現(xiàn)實(Virtual Reality簡稱VR)不同,增強現(xiàn)實只是實現(xiàn)對現(xiàn)實環(huán)境的增強,加深了對現(xiàn)實環(huán)境的感受。在實際的AR體驗中,因為人的觀察視線會不斷地變化,AR系統(tǒng)需要實時的根據(jù)用戶的視場重新建立位置坐標(biāo)系,進(jìn)行追蹤。而視線追蹤技術(shù)就是實時地跟蹤用戶頭部的位置和視線方向,根據(jù)這些信息來確定虛擬物體在真實空間坐標(biāo)中的位置,并將它實時地顯示在顯示器中的正確位置。
一、視線追蹤技術(shù)及其特點
(一)視線追蹤技術(shù)概述。
視線追蹤也稱為眼動追蹤,它被認(rèn)為是研究視覺信息加工的有效手段。利用專用設(shè)備來記錄學(xué)習(xí)者的眼球運動(Eve-Movement,簡稱眼動)情況,可以作為分析學(xué)習(xí)者內(nèi)部心理活動情況的依據(jù)。關(guān)于視線追蹤技術(shù)的研究己有較長歷史,目前它己在多個領(lǐng)域得到廣泛應(yīng)用。例如用于圖片廣告研究(網(wǎng)頁評估、設(shè)計評估等)、動態(tài)分析(航空航天、體育運動、汽車、飛機駕駛等)、產(chǎn)品測試(可用性測試)、場景研究(商場購物、店鋪裝演、家居環(huán)境等)和人機交互等多個領(lǐng)域。此外,視線追蹤在智能計算機、智能家電、虛擬現(xiàn)實和數(shù)字游戲等領(lǐng)域也有很好的應(yīng)用前景。
在眼動實驗研究中,當(dāng)被試對視覺信息進(jìn)行提取時,其注視時間、注視次數(shù)、注視點序列、眼跳距離、回視次數(shù)、瞳孔直徑等通常被視為思維和心理加工的重要參數(shù)。因此,通過對被試在學(xué)習(xí)過程中的實時眼動信息進(jìn)行觀測,可用于分析和引導(dǎo)其學(xué)習(xí)的依據(jù)。眼動模式一般分為三種:注視(fixation)、眼跳(saccade)和追隨運動(pursuit movement)。其中,持續(xù)一段時間、相對穩(wěn)定的眼球運動稱為注視;眼球快速運動時導(dǎo)致視覺區(qū)域的聚焦點產(chǎn)生變化,這種行為稱為眼跳;眼睛緩慢、平滑地追蹤某個緩慢運動的目標(biāo),則稱為追隨運動。通過分析眼動模式和相關(guān)參數(shù),可以獲得很多重要的信息。例如,眼跳速度會隨著疲倦程度的增加而降低,而隨著學(xué)習(xí)任務(wù)難度的增加而增加;眨眼速度和眼睛睜開程度的降低則可能意味著疲倦的加重。因此,可以據(jù)此來確定學(xué)習(xí)者的學(xué)習(xí)精神狀態(tài),或?qū)ζ鋵W(xué)習(xí)過程進(jìn)行分析,從而采取相應(yīng)的學(xué)習(xí)策略或干預(yù)措施。
(二)視線追蹤系統(tǒng)的類型及其特點。
人眼的注視點主要由頭的方位和眼睛視線決定。頭的方位決定了人眼可能注視的范圍,眼睛的視線決定了注視點的精確位置。國內(nèi)外將視覺跟蹤技術(shù)按照借助的媒介分為硬件和軟件兩種。以硬件為基礎(chǔ)的視線跟蹤的基本工作原理是利用圖像處理技術(shù),通過攝像機攝入瞳孔反射的紅外線記錄視線變化,達(dá)到視線追蹤的目的。視線跟蹤裝置目前有穿戴式與非穿戴式,接觸式與非接觸式,如帶上專用頭盔、眼鏡或者頭部固定支架,置于頭部上的攝像機,這種情形用戶使用較不舒適。通過軟件實現(xiàn)的視線跟蹤方法,對用戶沒有干擾,首先利用攝像機獲取頭部、臉部或眼睛圖像,再經(jīng)過軟件分析對視線定位與跟蹤。由于不需要佩戴任何裝置,用戶的自由度舒適度較好。
人與計算機交互是研究人與計算機之間溝通的技術(shù),將視線跟蹤、語音識別、手勢輸入、感覺反饋等引入人機交互,提高了交互的自然性和高效性。視線追蹤技術(shù)同樣引發(fā)了人機交互系統(tǒng)的改革,鼠標(biāo)、觸控板的消失,及通過追蹤人眼視線,用眼神來操作電腦、輸入文字、玩游戲。
二、視線追蹤技術(shù)在AR增強現(xiàn)實研究中的應(yīng)用
(一)顯示技術(shù)。
AR的簡單定義就是將計算機生成的虛擬數(shù)字信息疊加到現(xiàn)實的生活場景中。這個“疊加”是需要通過顯示設(shè)備作為中介來實現(xiàn)。
增強現(xiàn)實系統(tǒng)中的顯示器可以分為頭盔顯示器(HMD)和非頭盔顯示設(shè)備。目前,一般的增強現(xiàn)實系統(tǒng)主要使用透視式頭盔顯示器。透視式頭盔顯示器主要由三個基本環(huán)節(jié)構(gòu)成:虛擬信息顯示通道、真實環(huán)境顯示通道、圖像融合及顯示通道。其中,虛擬信息的顯示原理與虛擬現(xiàn)實系統(tǒng)所用的浸沒式頭盔顯示器基本相同;圖像融合與顯示通道是與用戶交互的最終接口,根據(jù)其中真實環(huán)境的表現(xiàn)方式,可分為基于CCD攝像原理的視頻透視式頭盔顯示器和基于光學(xué)原理的光學(xué)透視式頭盔顯示器兩類。
光W透視技術(shù)是通過安裝在設(shè)備眼前的光學(xué)透鏡來呈現(xiàn)出真實和虛擬世界。首先計算機生成的虛擬信息經(jīng)過光學(xué)系統(tǒng)放大后反射后進(jìn)入視野,透過透鏡又能直接看到現(xiàn)實場景,兩部分的信息匯聚到人眼的視網(wǎng)膜上實現(xiàn)AR的效果。視頻透視技術(shù)是借助安裝在頭顯上的攝像頭來捕捉獲取外部真實環(huán)境,計算機將數(shù)字模擬信息疊加到攝像機的視頻信號上,再將真實場景和虛擬場景進(jìn)行融合。相比較光學(xué)透視技術(shù),它的視角場更大,而且不受外界的強光干擾。不過一旦攝像機與用戶的視點不能保持完全重合,會產(chǎn)生一些偏差。
(二)跟蹤注冊技術(shù)。
基于計算機視覺的注冊技術(shù)主要是指利用計算機視覺獲取真實場景的信息后,經(jīng)過圖像處理方面的知識來識別和跟蹤定位真實場景。細(xì)分可以劃為基于傳統(tǒng)標(biāo)志的注冊算法和基于自然特征點無標(biāo)志注冊算法?;谟嬎銠C視覺的注冊技術(shù)的精度較高,但是對計算量非常大,而且算法復(fù)雜,對系統(tǒng)的要求非常高。
為了取長補短,得到更加精確的注冊結(jié)果,現(xiàn)在有結(jié)合兩種技術(shù)的混合注冊方法。通常是先由跟蹤傳感器大概估計位置姿態(tài),再通過視覺法進(jìn)一步精確調(diào)整定位。一般采用的復(fù)合法有視覺與電磁跟蹤結(jié)合、視覺與慣導(dǎo)跟蹤結(jié)合、視覺與GPS跟蹤結(jié)合等。
三、結(jié)論
在國外,增強現(xiàn)實早已在醫(yī)學(xué)、遙操作、制造與維修、可視化與教育培訓(xùn)、娛樂、軍事訓(xùn)練等領(lǐng)域取得了成功應(yīng)用。在國內(nèi),不少單位和個人對增強現(xiàn)實中的關(guān)鍵技術(shù)和算法進(jìn)行了研究,并且以牙科醫(yī)學(xué)、設(shè)備維修等許多背景得到了初步應(yīng)用研究。但國內(nèi)的研究目前仍多限于實驗階段,與國外的應(yīng)用水平還有一定距離。
目前,隨著增強現(xiàn)實的快速發(fā)展,出現(xiàn)了許多新的研究方向,如新的顯示方式、照片真實感圖形繪制、調(diào)節(jié)現(xiàn)實、基于網(wǎng)絡(luò)的增強現(xiàn)實和針對戶外隨身增強現(xiàn)實系統(tǒng)的技術(shù)等等。其中涉及到的技術(shù)包括基于圖像的繪制(IBMR)、多通道信息融合、普適計算技術(shù)、顯示設(shè)備和跟蹤設(shè)備的隨身便攜化等。隨著系統(tǒng)性能的提高、操作過程的簡化和設(shè)備成本的降低,增強現(xiàn)實會在越來越多的領(lǐng)域得到廣泛應(yīng)用。
參考文獻(xiàn):
[1]奚惠寧等.視線追蹤應(yīng)用技術(shù)的專利分析[J].電視技術(shù),2013(S2)。