公務(wù)員期刊網(wǎng) 精選范文 計(jì)算機(jī)視覺(jué)總結(jié)范文

計(jì)算機(jī)視覺(jué)總結(jié)精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計(jì)算機(jī)視覺(jué)總結(jié)主題范文,僅供參考,歡迎閱讀并收藏。

計(jì)算機(jī)視覺(jué)總結(jié)

第1篇:計(jì)算機(jī)視覺(jué)總結(jié)范文

關(guān)鍵詞:計(jì)算機(jī)視覺(jué)圖像 精密測(cè)量 構(gòu)造幾何模型 信號(hào)源的接收

中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)05-1211-02

新型計(jì)算機(jī)視覺(jué)圖像精密測(cè)量是一種基于計(jì)算機(jī)程序設(shè)計(jì)以及圖像顯示的高精度的關(guān)鍵技術(shù),它廣泛用于測(cè)量的領(lǐng)域,對(duì)于測(cè)量的準(zhǔn)確性有很好的保證。這種關(guān)鍵技術(shù)是幾何了光學(xué)的特性,發(fā)揮了圖像學(xué)的顯影性,把普通的測(cè)量技術(shù)瞬間提升到了一個(gè)新的高度。在這項(xiàng)關(guān)鍵技術(shù)中包含了物理學(xué)中光的效應(yīng),圖像中的傳感器以及計(jì)算機(jī)中的編程軟件,這還不完全,還有一些其他科學(xué)領(lǐng)域知識(shí)的輔助,可以說(shuō)這項(xiàng)關(guān)鍵技術(shù)是一個(gè)非常有技術(shù)含量的技術(shù),很值得學(xué)者進(jìn)行研究。

1 計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)的具體形式

在以往的測(cè)量中,選擇的測(cè)量方式還是完全采用機(jī)械的形式,但是在使用了計(jì)算機(jī)視覺(jué)圖像精密測(cè)量后,完成了許多以往技術(shù)所不能達(dá)到的任務(wù)。在我們的研究中,計(jì)算機(jī)視覺(jué)圖像測(cè)量的原理是通過(guò)攝像機(jī)將被處理的對(duì)象采集進(jìn)行影像采集,在多個(gè)控制點(diǎn)的數(shù)據(jù)采集完成后,系統(tǒng)會(huì)自動(dòng)將這些圖像進(jìn)行整合,得出相關(guān)的幾何多變參數(shù),再在計(jì)算機(jī)上以具體的數(shù)據(jù)顯示出來(lái),以供技術(shù)人員使用參照。

在上面所說(shuō)的攝像機(jī)并不是我們通常意義上生活中使用的攝像機(jī)。它是一種可視化較強(qiáng),表針比較敏感的測(cè)試儀??梢詫⒁曈X(jué)中的二維形態(tài)通過(guò)顯影,記錄在機(jī)械的光譜儀上,再將這種的二維圖像做數(shù)學(xué)處理,有二階矩陣轉(zhuǎn)換為三階矩陣,通過(guò)播放儀呈現(xiàn)出三維的影像。這時(shí)的圖像變?yōu)榱Ⅲw化,更有層次感,效果上也有了明顯的變化,這是一種顯示方法。此外還有一種造價(jià)較高的儀器,我們不常使用,就是圖像提取器。同樣是采集控制點(diǎn)的數(shù)據(jù),將數(shù)據(jù)整合在系統(tǒng)之內(nèi),然后對(duì)于原始的圖像進(jìn)行預(yù)處理,不再經(jīng)過(guò)有曝光這個(gè)程序,將圖像中關(guān)鍵點(diǎn)的坐標(biāo)在整個(gè)內(nèi)部軸面上體現(xiàn)出來(lái),提取數(shù)據(jù)幀數(shù),再運(yùn)用機(jī)器的智能識(shí)別系統(tǒng),對(duì)控制點(diǎn)的坐標(biāo)進(jìn)行數(shù)據(jù)分析,自動(dòng)生成圖形,這也可以用于精密測(cè)量。它的優(yōu)點(diǎn)就是使用上極其的方面,基本只要架立儀器和打開(kāi)開(kāi)關(guān),其他的工作機(jī)械系統(tǒng)都會(huì)自動(dòng)的完成。使用的困難就是造價(jià)極其的高,不適合一般企業(yè)使用。在基于計(jì)算機(jī)視覺(jué)圖像測(cè)量中使用上的原理如下:

1) 計(jì)算出觀察控制點(diǎn)到計(jì)算機(jī)視覺(jué)圖像測(cè)量?jī)x器的有效距離;

2) 得出觀察點(diǎn)到目標(biāo)控制點(diǎn)之間的三維的運(yùn)動(dòng)幾何參數(shù);

3) 推斷出目標(biāo)控制點(diǎn)在整個(gè)平面上的表面特征( 大多時(shí)候要求形成立體視覺(jué));

4) 還通過(guò)觀察可以判斷出目標(biāo)物體的幾何坐標(biāo)方位。

在整個(gè)計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)中最關(guān)鍵的元件就是壓力應(yīng)變電阻儀,這也是傳感器的一部分。壓力應(yīng)變電阻儀的使用方式是將應(yīng)力片粘貼在控制點(diǎn)位上,事先在物體表面打磨平整,清理干凈后,涂抹丙酮試劑,在液體完全風(fēng)干后就可以黏貼應(yīng)力片,通過(guò)導(dǎo)線的聯(lián)接,形成了一小段閉合的電路,時(shí)刻讓計(jì)算機(jī)視覺(jué)圖像系統(tǒng)可以感應(yīng)到并作跟蹤觀察。因受到來(lái)自不同方面諧波的影響后,應(yīng)力片會(huì)產(chǎn)生一定數(shù)值的電阻,在電路中,這些電阻會(huì)轉(zhuǎn)化為電流,視覺(jué)圖像系統(tǒng)接收到了電流后就會(huì)顯示在儀表盤(pán)上相應(yīng)的數(shù)據(jù),我們就可以根據(jù)儀表盤(pán)中的數(shù)據(jù)記錄測(cè)量中的數(shù)據(jù),很好的解決了原始機(jī)械在使用過(guò)程中大量的做無(wú)用功所消耗資源的現(xiàn)象。傳感器對(duì)每個(gè)應(yīng)點(diǎn)都進(jìn)行動(dòng)態(tài)的測(cè)量,將數(shù)據(jù)模轉(zhuǎn)換成現(xiàn)實(shí)中的圖像,精確的成像可以測(cè)算出控制點(diǎn)的位置,用計(jì)算機(jī)視覺(jué)圖像精密測(cè)量結(jié)合數(shù)據(jù)方面的相關(guān)的分析,得出施工中的可行性報(bào)告分析,減低了施工中的成本,將施工的預(yù)算控制在一個(gè)合理的范圍之內(nèi)。

當(dāng)無(wú)法觀察到控制點(diǎn)是,計(jì)算機(jī)視覺(jué)圖像精密測(cè)量可以通過(guò)接收信號(hào)或是相關(guān)的頻率波段來(lái)收集數(shù)據(jù),不會(huì)因?yàn)橐酝鶞y(cè)量的環(huán)境不好,距離太遠(yuǎn),誤差太大的影響。

2 計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)分析

在計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)中解決了很多以往很難完成的任務(wù),但是在使用過(guò)程中還是發(fā)生了很多的問(wèn)題。尤其在視覺(jué)圖像的選擇中,無(wú)法使用高幀數(shù)的圖片顯示,無(wú)法將計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)的優(yōu)點(diǎn)發(fā)揮出來(lái)。我們就計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)中常見(jiàn)的問(wèn)題進(jìn)行討論。

2.1 降低失誤的概率

在很多的數(shù)據(jù)誤差中,有一部分是出現(xiàn)在人為的因素上面。對(duì)于機(jī)器的不熟悉和操作中的疏忽都會(huì)在一定程度上對(duì)圖像的視覺(jué)感模擬帶來(lái)麻煩。對(duì)于網(wǎng)絡(luò)設(shè)備的配置上,要經(jīng)常性的學(xué)習(xí),將配置在可能的情況下設(shè)置的更加合理和使用,保證網(wǎng)絡(luò)連接系統(tǒng)的安全性。為防止更多因操作帶來(lái)的誤差,選用系統(tǒng)登入的制度,用戶(hù)在通過(guò)識(shí)別后進(jìn)入系統(tǒng),在采集數(shù)據(jù)后,確定最終數(shù)據(jù)上又相關(guān)的再次確定的標(biāo)識(shí),系統(tǒng)對(duì)本身有的登錄服務(wù)器和路由器有相關(guān)的資料解釋?zhuān)涗浐脤?shí)用操作的時(shí)間,及時(shí)備份。

2.2 對(duì)于權(quán)限的控制

權(quán)限控制是針對(duì)測(cè)量關(guān)鍵所提出的一種安全保護(hù)措施,它是在使用計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)中對(duì)用戶(hù)和用戶(hù)組賦予一定的權(quán)限,可以限制用戶(hù)和用戶(hù)組對(duì)目錄、子目錄、文件、打印機(jī)和其他共享資源的瀏覽和更改。圖像中的運(yùn)行服務(wù)器在停止的情況下可以做出不應(yīng)答的操作指令,立刻關(guān)閉當(dāng)前不適用的界面,加快系統(tǒng)的運(yùn)行速度,對(duì)于每天的日志文件實(shí)時(shí)監(jiān)控,一旦發(fā)現(xiàn)問(wèn)題及時(shí)解決。對(duì)于數(shù)據(jù)終端的數(shù)據(jù)可采用可三維加密的方法,定時(shí)進(jìn)行安全檢測(cè)等手段來(lái)進(jìn)一步加強(qiáng)系統(tǒng)的安全性。如果通過(guò)了加密通道,系統(tǒng)可以將數(shù)據(jù)自動(dòng)的保存和轉(zhuǎn)換為視圖模式,對(duì)于數(shù)據(jù)的審計(jì)和運(yùn)行可以同時(shí)進(jìn)行,這樣就可以很好的保證大地測(cè)量中的圖像數(shù)據(jù)安全,利用防護(hù)墻將采集中廢棄的數(shù)據(jù)革除在外,避免數(shù)值之間發(fā)生紊亂的現(xiàn)象,進(jìn)一步改善計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)。

2.3 開(kāi)啟自動(dòng)建立備份系統(tǒng)

計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)的完善中會(huì)常遇到系統(tǒng)突然崩潰或是圖像受到嚴(yán)重干擾導(dǎo)致無(wú)法轉(zhuǎn)換的一系列情況,發(fā)生這種情況最大的可能性就是系統(tǒng)在處理多組數(shù)據(jù)后無(wú)法重新還原成進(jìn)入界面。這時(shí)為保證圖片轉(zhuǎn)換成數(shù)字的系統(tǒng)數(shù)據(jù)不丟失,我們對(duì)系統(tǒng)進(jìn)行備份。選定固定的磁盤(pán)保存數(shù)據(jù),定期將產(chǎn)生的數(shù)據(jù)(轉(zhuǎn)換前的圖像和轉(zhuǎn)換后的數(shù)值)導(dǎo)出,保證程序的正常運(yùn)行。當(dāng)系統(tǒng)一旦發(fā)生錯(cuò)誤,可以盡快的恢復(fù)數(shù)據(jù)的初始狀態(tài),為測(cè)量任務(wù)的完成爭(zhēng)取更多的時(shí)間。我們還要減少信號(hào)源周?chē)母蓴_,定期的更新系統(tǒng)數(shù)據(jù)庫(kù),保持?jǐn)?shù)據(jù)采集的穩(wěn)定性,把攝像機(jī)記錄出的數(shù)據(jù)節(jié)點(diǎn)保存在相應(yīng)的技術(shù)圖紙上,用這樣的方式來(lái)知道測(cè)量工作。系統(tǒng)備份的數(shù)據(jù)還可以用于數(shù)據(jù)的對(duì)比,重復(fù)測(cè)量后得出的數(shù)據(jù),系統(tǒng)會(huì)自動(dòng)也備份的數(shù)據(jù)進(jìn)行比對(duì),發(fā)現(xiàn)誤差值在規(guī)定以外,就會(huì)做出相應(yīng)的預(yù)警,這樣也能在工作中降低出現(xiàn)誤差的概率。

3 計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)遇到的困難和使用前景

計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)作為一種新興技術(shù)在使用時(shí)間上不過(guò)十幾年,其使用的程度已經(jīng)無(wú)法估算。正是因?yàn)樗暮?jiǎn)單、使用、精度高以及自動(dòng)化能力卓越的特點(diǎn)受到了測(cè)量單位的廣泛青睞。在測(cè)量方面的這些可靠性和穩(wěn)定性也是有目共睹的。在土木和機(jī)械測(cè)量的行業(yè)計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)都會(huì)有廣泛和良好的使用,前景也是十分的廣闊。但是不容忽視該技術(shù)也有一些弊端。這項(xiàng)關(guān)鍵技術(shù)中涵蓋的學(xué)科非常的多,涉及到的知識(shí)也很全面,一旦出現(xiàn)了機(jī)器的故障,在維修上還是一個(gè)很大的問(wèn)題,如何很好的解決計(jì)算機(jī)視覺(jué)圖像技術(shù)的相關(guān)核心問(wèn)題就是當(dāng)下亟待解決的。

我們都知道,人的眼睛是可以受到吱聲的控制,想要完成觀測(cè)是十分簡(jiǎn)單的,但是在計(jì)算機(jī)視覺(jué)圖像技術(shù)中,畢竟是采取攝像機(jī)取景的模式,在取得的點(diǎn)位有的時(shí)候不是特別的有代表性,很難將這些問(wèn)題具體化、形象化。達(dá)不到我們?cè)O(shè)計(jì)時(shí)的初衷。所以在這些模型的構(gòu)建中和數(shù)據(jù)的轉(zhuǎn)換上必須有嚴(yán)格的規(guī)定和要求,切不可盲目的實(shí)施測(cè)量,每項(xiàng)技術(shù)操作都要按規(guī)程來(lái)實(shí)施。

上文中也談到了,計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)中最主要的構(gòu)建是傳感器,一個(gè)合理的傳感器是體統(tǒng)的“心臟”,我們?cè)趦x器的操作中,不能時(shí)時(shí)刻刻對(duì)傳感器進(jìn)行檢查,甚至這種高精度的元件在檢查上也并不是一件簡(jiǎn)單的事情,通過(guò)不斷的研究,將傳感器的等級(jí)和使用方法上進(jìn)行一定的創(chuàng)新也是一項(xiàng)科研任務(wù)。

4 結(jié)束語(yǔ)

在測(cè)量工程發(fā)展的今天,很多的測(cè)量技術(shù)已經(jīng)離不了計(jì)算機(jī)視覺(jué)圖像技術(shù)的輔助,該文中詳細(xì)的談到了基于計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)方面的研究,對(duì)于之中可能出現(xiàn)的一些問(wèn)題也提出了相應(yīng)的解決方案。測(cè)量工程中計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)可以很好的解決和完善測(cè)量中遇到的一些問(wèn)題,但是也暴露出了很多的問(wèn)題。

將基于計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)引入到測(cè)量工程中來(lái),也是加強(qiáng)了工程建設(shè)的信息化水平??梢灶A(yù)見(jiàn)的是,在未來(lái)使用計(jì)算機(jī)視覺(jué)圖像技術(shù)建立的測(cè)量模型會(huì)得到更多、更好的應(yīng)用。但作為一個(gè)長(zhǎng)期復(fù)雜的技術(shù)工程,在這個(gè)建設(shè)過(guò)程中定會(huì)有一些困難的出現(xiàn)。希望通過(guò)不斷的發(fā)現(xiàn)問(wèn)題、總結(jié)經(jīng)驗(yàn),讓計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)在測(cè)量中作用發(fā)揮的更好。

參考文獻(xiàn):

[1] 湯劍,周芳芹,楊繼隆.計(jì)算機(jī)視覺(jué)圖像系統(tǒng)的技術(shù)改造[J].機(jī)電產(chǎn)品開(kāi)發(fā)與創(chuàng)新周刊,2005,14(18):33-36.

[2] 段發(fā)階,等. 拔絲??仔斡?jì)算機(jī)視覺(jué)檢測(cè)技術(shù)[J]. 光電工程時(shí)報(bào), 1996,23(13):189-190.

第2篇:計(jì)算機(jī)視覺(jué)總結(jié)范文

關(guān)鍵詞:計(jì)算機(jī)視覺(jué);課堂考勤;深度學(xué)習(xí);MCV架構(gòu)

前言

隨著國(guó)家標(biāo)準(zhǔn)《智慧校園總體框架》(Smartcampusoverallframework)的,智慧校園的規(guī)劃與設(shè)計(jì)成為了校園建設(shè)的重點(diǎn)項(xiàng)目[1]。而課堂考勤作為學(xué)校教學(xué)管理、學(xué)生評(píng)價(jià)的重要組成部分,隨著物聯(lián)網(wǎng)技術(shù)、人工智能和移動(dòng)通信技術(shù)的水平的提高與發(fā)展,更應(yīng)該向著智能化、準(zhǔn)確化的方向發(fā)展[2]。本文研究了的當(dāng)前應(yīng)用的課堂考勤方式,并做了進(jìn)一步的分析,最終根據(jù)社會(huì)技術(shù)的革新與發(fā)展[3],提出了一種基于計(jì)算機(jī)視覺(jué)的實(shí)時(shí)課堂考勤系統(tǒng)的設(shè)計(jì)。我們的主要工作是搭建了整個(gè)系統(tǒng)框架,包括數(shù)據(jù)庫(kù)系統(tǒng)、服務(wù)器、計(jì)算機(jī)視覺(jué)模型、網(wǎng)絡(luò)通信、圖像采集系統(tǒng)、客戶(hù)端和網(wǎng)絡(luò)通信系統(tǒng)。

1課堂考勤方式現(xiàn)狀

目前校園中主要的課堂考勤方式存在為兩種,分別是傳統(tǒng)的考勤方式和生物識(shí)別的考勤方式。如圖1所示,其中傳統(tǒng)的考勤方式包括點(diǎn)名考勤和通過(guò)校園卡進(jìn)行考勤,點(diǎn)名考勤的方式仍然是高校中最常用的考勤手段,因它不受場(chǎng)地的限制,可以根據(jù)點(diǎn)名冊(cè)直接核對(duì)現(xiàn)場(chǎng)的學(xué)生信息,但這種方式存在的缺點(diǎn)就是花費(fèi)時(shí)間,影響上課效率,為此有些教師不進(jìn)行點(diǎn)名,因此影響了考勤的效果。校園卡考勤解決了點(diǎn)名占用課堂時(shí)間的問(wèn)題,但這種方式具有學(xué)生代考勤的漏洞,因?yàn)閷W(xué)生可以拿著別人的校園卡進(jìn)行考勤。生物識(shí)別的考勤方式包括指紋考勤和人臉識(shí)別考勤,這些方式有效解決了傳統(tǒng)考勤方式代考勤的弊端,但這種方式受設(shè)備硬件的影響,識(shí)別能力太慢,尤其是在下課后學(xué)生較多,考勤簽退時(shí)容易發(fā)生擁擠等現(xiàn)象,具有安全隱患[4]。因此,為解決當(dāng)前考勤方式存在的一些弊端,本文設(shè)計(jì)了一種基于計(jì)算機(jī)視覺(jué)的實(shí)時(shí)課堂考勤系統(tǒng)。

2系統(tǒng)設(shè)計(jì)基礎(chǔ)

2.1系統(tǒng)開(kāi)發(fā)環(huán)境

本文設(shè)計(jì)的實(shí)時(shí)課堂考勤系統(tǒng)主要是使用Python開(kāi)發(fā)語(yǔ)言,Python是目前最流行開(kāi)發(fā)語(yǔ)言之一,主要應(yīng)用于Web服務(wù)設(shè)計(jì)、大數(shù)據(jù)、人工智能等領(lǐng)域,它的主要優(yōu)點(diǎn)是開(kāi)發(fā)效率高、可擴(kuò)展性強(qiáng)、跨平臺(tái)和具有可移植性等,滿足了本文系統(tǒng)的設(shè)計(jì)要求。另外,在開(kāi)發(fā)過(guò)程還用到了基于Python的第三方軟件開(kāi)發(fā)包,包括Flask用于搭建系統(tǒng)的Web服務(wù)器;PyQt5用于搭建系統(tǒng)的客戶(hù)端;OpenCV用于系統(tǒng)中對(duì)圖像視頻的處理;Tensoflow用于開(kāi)發(fā)計(jì)算機(jī)視覺(jué)模型,搭建深度學(xué)習(xí)模型,完成人臉檢測(cè)和識(shí)別任務(wù);Mysqlclient用于管理、訪問(wèn)、查詢(xún)和更新Mysql數(shù)據(jù)庫(kù)。

2.2系統(tǒng)開(kāi)發(fā)框架

本文設(shè)計(jì)的實(shí)時(shí)課堂考勤系統(tǒng)通信基于Web應(yīng)用,因此選擇一個(gè)合適的服務(wù)架構(gòu)有利于提高系統(tǒng)的開(kāi)發(fā)和部署效率。目前較流行的Web應(yīng)用主要有MVC(ModelViewController)和CMS(ContentManagementSystem)兩種架構(gòu)。本文使用了基于Python和Flask搭建的MVC架構(gòu)[5],該架構(gòu)如圖2所示,主要包括模型層、視圖層和控制器。使用該框架的優(yōu)點(diǎn)是可將視圖層和業(yè)務(wù)邏輯層進(jìn)行分離開(kāi)發(fā),提高開(kāi)發(fā)效率,方便系統(tǒng)的部署、維護(hù)和管理。

3系統(tǒng)設(shè)計(jì)方式

3.1系統(tǒng)總結(jié)構(gòu)設(shè)計(jì)

本文設(shè)計(jì)的實(shí)時(shí)課堂考勤系統(tǒng)的總體結(jié)構(gòu)如圖3所示。根據(jù)MVC構(gòu)架的設(shè)計(jì),我們將該系統(tǒng)分為了模型層、控制器層和視圖層,另外還包括網(wǎng)絡(luò)通信設(shè)備。

3.2模型層設(shè)計(jì)

模型層主要是關(guān)系型數(shù)據(jù)庫(kù)模,MySQL是目前使用最多的關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng),也是學(xué)校管理系統(tǒng)使用最多的數(shù)據(jù)系統(tǒng),為了更好地與學(xué)校管理系統(tǒng)兼容,我們選擇了MySQL數(shù)據(jù)庫(kù),數(shù)據(jù)表之間的關(guān)系如圖4所示。

3.3控制器層設(shè)計(jì)

控制器層主要包括服務(wù)器應(yīng)用軟件和計(jì)算機(jī)視覺(jué)模型,服務(wù)器應(yīng)用軟件的功能包括系統(tǒng)通信配置、數(shù)據(jù)業(yè)務(wù)處理和系統(tǒng)各模塊間的調(diào)度。計(jì)算機(jī)視覺(jué)模型是實(shí)時(shí)課堂考勤系統(tǒng)的核心模塊,基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)[6],主要作用是進(jìn)行人臉檢測(cè)和識(shí)別兩個(gè)部分,計(jì)算機(jī)視覺(jué)模型的工作流程如圖5所示。在人臉檢測(cè)階段使用VGG16檢測(cè)器作為主干網(wǎng)絡(luò),為提高模型的檢測(cè)準(zhǔn)確率,通過(guò)引入注意力模型和多尺度特征融合對(duì)網(wǎng)絡(luò)進(jìn)行了優(yōu)化,有效地從輸入圖片中提取人臉位置信息,得到人臉圖像。在人臉識(shí)別階段首先使用FaceNe人臉識(shí)別網(wǎng)絡(luò)提取人臉圖像的特征圖,然后通過(guò)決策樹(shù)算法與待檢測(cè)的人臉特征進(jìn)行匹配,從而識(shí)別圖片中的學(xué)生信息。

3.4視圖層設(shè)計(jì)

本文設(shè)計(jì)的實(shí)時(shí)考勤系統(tǒng)的模型層主要包括圖像采集系統(tǒng)和客戶(hù)端。目前各學(xué)校教室內(nèi)都安裝有監(jiān)控設(shè)備,因此為節(jié)約成本和安裝消耗,圖像采集系統(tǒng)使用教室內(nèi)的監(jiān)控設(shè)備作為圖像采集系統(tǒng),負(fù)責(zé)采集教室現(xiàn)場(chǎng)圖片??蛻?hù)端設(shè)計(jì)首先在本系統(tǒng)中采用應(yīng)用程序接口,然后在教學(xué)管理系統(tǒng)中設(shè)計(jì)圖形化用戶(hù)界面,通過(guò)應(yīng)用程序接口調(diào)用本系統(tǒng)的功能,從而減少資源浪費(fèi),方便維護(hù)和管理。

4實(shí)時(shí)考勤功能的實(shí)現(xiàn)

實(shí)時(shí)考勤功能的實(shí)現(xiàn)方式如圖6所示,首先系統(tǒng)啟動(dòng)后,用戶(hù)可以隨時(shí)更新考勤信息,比如在數(shù)據(jù)庫(kù)中創(chuàng)建新的考勤表等。接著系統(tǒng)會(huì)自動(dòng)讀取考勤表的信息,比如課程所在教室、上課時(shí)間。然后啟動(dòng)考勤程序,進(jìn)行簽到、簽退操作,并將考勤數(shù)據(jù)保存到考勤數(shù)據(jù)表中。整個(gè)系統(tǒng)啟動(dòng)完成后可以自動(dòng)運(yùn)行,直到關(guān)閉系統(tǒng),而且可以實(shí)時(shí)進(jìn)行課堂考勤。

第3篇:計(jì)算機(jī)視覺(jué)總結(jié)范文

【關(guān)鍵詞】自動(dòng)控制技術(shù);農(nóng)業(yè)自動(dòng)化

由于歷史、觀念和技術(shù)等方面的原因, 我國(guó)傳統(tǒng)農(nóng)業(yè)機(jī)械與發(fā)達(dá)國(guó)家相比有很大差距,已遠(yuǎn)遠(yuǎn)不能適應(yīng)農(nóng)業(yè)的科技進(jìn)步。近些年來(lái), 自動(dòng)化的研究逐漸被人們所認(rèn)識(shí), 自動(dòng)控制在農(nóng)業(yè)上的應(yīng)用越來(lái)越受到重視。例如,把計(jì)算機(jī)技術(shù)、微處理技術(shù)、傳感與檢測(cè)技術(shù)、信息處理技術(shù)結(jié)合起來(lái), 應(yīng)用于傳統(tǒng)農(nóng)業(yè)機(jī)械, 極大地促進(jìn)了產(chǎn)品性能的提高。我國(guó)農(nóng)業(yè)部門(mén)總結(jié)了一些地區(qū)的農(nóng)業(yè)自動(dòng)化先進(jìn)經(jīng)驗(yàn)(如臺(tái)灣地區(qū)的農(nóng)業(yè)生產(chǎn)自動(dòng)化、漁業(yè)生產(chǎn)自動(dòng)化、畜牧業(yè)生產(chǎn)自動(dòng)化及農(nóng)產(chǎn)品貿(mào)易自動(dòng)化)的開(kāi)發(fā)與應(yīng)用情況, 同時(shí)也汲取了國(guó)外一些國(guó)家的先進(jìn)經(jīng)驗(yàn)、技術(shù),如日本的四行半喂人聯(lián)合收割機(jī)是計(jì)算機(jī)控制的自動(dòng)化裝置在半喂人聯(lián)合收割機(jī)中的應(yīng)用,英國(guó)通過(guò)對(duì)施肥機(jī)散播肥料的動(dòng)力測(cè)量來(lái)控制肥料的精確使用量。這些技術(shù)和方法是我國(guó)農(nóng)業(yè)機(jī)械的自動(dòng)化裝置得到了補(bǔ)充和新的發(fā)展,從而形成了一系列適合我國(guó)農(nóng)業(yè)特點(diǎn)的自動(dòng)化控制技術(shù)。

1.已有的農(nóng)業(yè)機(jī)械及裝置的部分自動(dòng)化控制

自動(dòng)化技術(shù)提高了已有農(nóng)業(yè)機(jī)械及裝置的作業(yè)性能和操作性能。浙江省把自動(dòng)化技術(shù)應(yīng)用于茶葉機(jī)械上,成功研制出6CRK-55型可編程控制加壓茶葉揉捻機(jī),它利用計(jì)算機(jī)控制電功加壓機(jī)構(gòu),能根據(jù)茶葉的具體情況編制最佳揉捻程序?qū)崿F(xiàn)揉捻過(guò)程的自動(dòng)控制,是機(jī)電一體化技術(shù)在茶葉機(jī)械上的首次成功應(yīng)用。

1.1應(yīng)用于拖拉機(jī)

在農(nóng)用拖拉機(jī)上已廣泛使用了機(jī)械油壓式三點(diǎn)聯(lián)結(jié)的位調(diào)節(jié)和力調(diào)節(jié)系統(tǒng)裝置, 現(xiàn)又在開(kāi)發(fā)和采用性能更完善的電子油壓式三點(diǎn)聯(lián)結(jié)裝置。

1.2應(yīng)用于施肥播種機(jī)

根據(jù)行駛速度和檢測(cè)種子粒數(shù)來(lái)確定播種量是否符合要求的裝置, 以及將馬鈴薯種子割成瓣后播種的裝置等。

1.3應(yīng)用于谷物干燥機(jī)

不受外界條件干擾, 能自動(dòng)維持熱風(fēng)溫度的裝置停電或干燥機(jī)過(guò)熱引起火災(zāi)時(shí),自動(dòng)掐斷燃料供給的裝置。

2.微灌自動(dòng)控制技術(shù)

我國(guó)從20世紀(jì)年50代就開(kāi)始進(jìn)行節(jié)水灌溉的研究與推廣據(jù)統(tǒng)計(jì)。到1992年,全國(guó)共有節(jié)水灌溉工程面積0.133億m2,其中噴灌面積80萬(wàn)m2, 農(nóng)業(yè)節(jié)水工程取得了巨大的進(jìn)展。灌溉管理自動(dòng)化是發(fā)展高效農(nóng)業(yè)的重要手段,高效農(nóng)業(yè)和精細(xì)農(nóng)業(yè)要求必須實(shí)現(xiàn)水資源的高效利用。采用遙感遙測(cè)等新技術(shù)監(jiān)測(cè)土壤墑性和作物生長(zhǎng)情況,對(duì)灌溉用水進(jìn)行動(dòng)態(tài)監(jiān)測(cè)預(yù)報(bào),實(shí)現(xiàn)灌溉用水管理的自動(dòng)化和動(dòng)態(tài)管理。在微灌技術(shù)領(lǐng)域,我國(guó)先后研制和改進(jìn)了等流量滴灌設(shè)備、微噴灌設(shè)備、微灌帶、孔口滴頭、壓力補(bǔ)償式滴頭、折射式和旋轉(zhuǎn)式微噴頭、過(guò)濾器和進(jìn)排氣閥等設(shè)備,總結(jié)出了一套基本適合我國(guó)國(guó)情的微灌設(shè)計(jì)參數(shù)和計(jì)算方法,建立了一批新的試驗(yàn)示范基地。在一些地區(qū)實(shí)現(xiàn)了自動(dòng)化灌溉系統(tǒng),可以長(zhǎng)時(shí)間地自動(dòng)啟閉水泵和自動(dòng)按一定的輪灌順序進(jìn)行灌溉。這種系統(tǒng)中應(yīng)用了灌水器、土壤水分傳感器、溫度傳感器、壓力傳感器、水位傳感器和雨量傳感器、電線等。

3.自動(dòng)控制技術(shù)在精準(zhǔn)農(nóng)業(yè)中的應(yīng)用

第4篇:計(jì)算機(jī)視覺(jué)總結(jié)范文

關(guān)鍵詞:增強(qiáng)現(xiàn)實(shí);計(jì)算機(jī)視覺(jué);三維注冊(cè)

中圖分類(lèi)號(hào):TP242 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9599?。?012) 19-0000-02

1 引言

隨著計(jì)算機(jī)技術(shù)的迅速發(fā)展,計(jì)算機(jī)視覺(jué)、虛擬現(xiàn)實(shí)技術(shù)、人工智能、計(jì)算機(jī)圖形學(xué)等技術(shù)被廣泛地研究和應(yīng)用,這些技術(shù)引導(dǎo)著人們進(jìn)入了一個(gè)信息數(shù)字化的虛擬時(shí)代。

增強(qiáng)現(xiàn)實(shí)技術(shù)(Augmented Reality,AR)作為虛擬現(xiàn)實(shí)技術(shù)和計(jì)算機(jī)圖形學(xué)相結(jié)合的產(chǎn)物,它是在通過(guò)計(jì)算機(jī)渲染生成虛擬的物體或文字信息模型的同時(shí),對(duì)真實(shí)的場(chǎng)景進(jìn)行標(biāo)定,從而使虛擬的物體能夠被準(zhǔn)確地放置到真實(shí)的場(chǎng)景中,最終通過(guò)顯示設(shè)備顯示出來(lái),使用戶(hù)處于虛擬和現(xiàn)實(shí)相融合的亦真亦幻的新環(huán)境中,無(wú)法清楚地分辨出真實(shí)和虛擬。增強(qiáng)現(xiàn)實(shí)技術(shù)增強(qiáng)了用戶(hù)的觀感及其與真實(shí)場(chǎng)景之間的交互。

增強(qiáng)現(xiàn)實(shí)技術(shù)作為虛擬現(xiàn)實(shí)的一個(gè)重要分支,是虛擬現(xiàn)實(shí)技術(shù)發(fā)展過(guò)程中的產(chǎn)物。如圖1.1所示,該圖為Milgram提出的增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)關(guān)系的一種分類(lèi)學(xué)表示方法。由圖我們可以看出,虛擬現(xiàn)實(shí)所創(chuàng)建出來(lái)的是一種完全虛擬的三維世界,它與真實(shí)的世界相隔離。而增強(qiáng)現(xiàn)實(shí)是以現(xiàn)實(shí)場(chǎng)景為基礎(chǔ),場(chǎng)景中的虛擬物體隨著真實(shí)物體的變化而變化,提供給用戶(hù)的是一種復(fù)合的視覺(jué)效果,就好像這些虛擬物體真實(shí)的存在于場(chǎng)景中。

2 增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用

增強(qiáng)現(xiàn)實(shí)技術(shù)在20世紀(jì)90年代真正興起,其發(fā)展與20世紀(jì)60年代計(jì)算機(jī)圖形學(xué)的迅速發(fā)展密不可分。增強(qiáng)現(xiàn)實(shí)技術(shù)不僅擁有虛擬現(xiàn)實(shí)的各種優(yōu)點(diǎn),同時(shí)又有其獨(dú)特的視覺(jué)增強(qiáng)功能,因此成為了國(guó)內(nèi)外研究機(jī)構(gòu)和知名大學(xué)的研究熱點(diǎn),并廣泛的被應(yīng)用于教育、醫(yī)療、工業(yè)、娛樂(lè)、軍事等多個(gè)領(lǐng)域。

2.1 教育

增強(qiáng)現(xiàn)實(shí)豐富了教育學(xué)習(xí)生活。傳統(tǒng)的書(shū)籍中只存在文字信息,通過(guò)增強(qiáng)現(xiàn)實(shí)技術(shù),我們可以透過(guò)書(shū)籍看見(jiàn)文字相關(guān)的動(dòng)態(tài)畫(huà)面或是影像,圖文并茂,極大的增強(qiáng)了學(xué)生的學(xué)習(xí)興趣。目前的魔法書(shū)系統(tǒng)就是這一技術(shù)的很好運(yùn)用,用戶(hù)通過(guò)頭盔顯示器可以看到書(shū)中描述的場(chǎng)景,使讀者可以完全沉浸在虛實(shí)結(jié)合的環(huán)境中,提高學(xué)習(xí)興趣和效率。

2.2 醫(yī)療

增強(qiáng)現(xiàn)實(shí)技術(shù)可以幫助醫(yī)生實(shí)現(xiàn)可視化手術(shù)或手術(shù)培訓(xùn)。準(zhǔn)確地定位真實(shí)場(chǎng)景是增強(qiáng)現(xiàn)實(shí)技術(shù)的一個(gè)重要方面,在醫(yī)療中,運(yùn)用增強(qiáng)現(xiàn)實(shí)技術(shù)可以進(jìn)行手術(shù)定位,實(shí)時(shí)地收集病人體內(nèi)的3D影像,并將其與真實(shí)的人體相結(jié)合,使得醫(yī)生可以“透視”病人體內(nèi),從而減少手術(shù)的風(fēng)險(xiǎn),該技術(shù)對(duì)微創(chuàng)手術(shù)也有著深遠(yuǎn)的意義。手術(shù)培訓(xùn)方面,通過(guò)加入虛擬的提示注解,可以提醒醫(yī)生手術(shù)中的一些必要步驟,降低手術(shù)風(fēng)險(xiǎn)。

2.3 工業(yè)

增強(qiáng)現(xiàn)實(shí)的另一個(gè)應(yīng)用是工業(yè)組裝和維修。通過(guò)增強(qiáng)現(xiàn)實(shí)技術(shù)可以顯示出各種設(shè)備零件的內(nèi)部結(jié)構(gòu)圖、使用說(shuō)明等,方便安裝和維修。顯示的內(nèi)容可以不僅僅是簡(jiǎn)單的文字或圖片,更能直接渲染生成3D的圖形,并按步驟一步一步的顯示出來(lái),方便操作。

2.4 娛樂(lè)

電影、廣告、游戲、體育比賽轉(zhuǎn)播中,增強(qiáng)現(xiàn)實(shí)技術(shù)也得到了廣泛的運(yùn)用。體育比賽中,能夠在直播現(xiàn)場(chǎng)實(shí)時(shí)地插入三維的圖形、動(dòng)畫(huà)、視頻等虛擬的比賽相關(guān)信息或廣告。日常生活中,出現(xiàn)一種增強(qiáng)現(xiàn)實(shí)瀏覽器,它利用多種傳感器將日常需求通過(guò)實(shí)景與虛景結(jié)合后呈現(xiàn)在用戶(hù)面前,用戶(hù)可以通過(guò)增強(qiáng)現(xiàn)實(shí)瀏覽器看到實(shí)景的文字介紹、三維模型等,并可以搜索定位。

3 增強(qiáng)現(xiàn)實(shí)相關(guān)技術(shù)

增強(qiáng)現(xiàn)實(shí)系統(tǒng)具有虛實(shí)結(jié)合、三維注冊(cè)、實(shí)時(shí)交互三個(gè)特點(diǎn)。三個(gè)特點(diǎn)之間緊密聯(lián)系,要求在合成的場(chǎng)景中虛擬的物體能夠擁有真實(shí)的存在感和位置感。因此顯示技術(shù)、定位技術(shù)、虛實(shí)融合技術(shù)、用戶(hù)交互技術(shù)是實(shí)現(xiàn)增強(qiáng)現(xiàn)實(shí)系統(tǒng)的基礎(chǔ)支撐技術(shù)。

3.1 顯示技術(shù)

理想的AR系統(tǒng)的顯示器具有體積小、移動(dòng)方便、圖像繪制清晰、交互自然等特點(diǎn),但是目前仍不能制造出完成符合這些特點(diǎn)的顯示器。常用的顯示設(shè)備可以分為四類(lèi):普通液晶現(xiàn)實(shí)器;頭戴式顯示器;手持式顯示器;投影式顯示器。

液晶顯示器是最為常見(jiàn),也最容易得到的顯示設(shè)備。但是液晶顯示器體積較大,移動(dòng)不方便,限制了用戶(hù)的活動(dòng)范圍。頭戴式顯示器,佩戴于用戶(hù)的頭部,這種顯示器本身提供了一路或兩路攝像機(jī),采用視頻合成技術(shù),為用戶(hù)提供場(chǎng)景的顯示。但是頭戴式顯示器在戶(hù)外長(zhǎng)時(shí)間佩戴很不舒服,因此也不能為用戶(hù)廣泛接受。手持式顯示器,較頭戴式顯示器稍有改進(jìn),但是也限制了用戶(hù)手部的活動(dòng)。投影式顯示器能夠?qū)?chǎng)景投影到較大范圍的環(huán)境中,位置固定,適合于室內(nèi)的AR系統(tǒng)。

3.2 定位技術(shù)

增強(qiáng)現(xiàn)實(shí)系統(tǒng)需要將虛擬的物體準(zhǔn)確地放置到真實(shí)的場(chǎng)景中,因此定位技術(shù)顯得尤為重要。目前的定位技術(shù)主要分為兩種:一種是基于硬件的定位技術(shù);一種是基于計(jì)算機(jī)視覺(jué)技術(shù)的定位技術(shù)。

基于硬件的定位技術(shù)一般使用硬件設(shè)備定位,主要包括:全球衛(wèi)星定位系統(tǒng)、測(cè)距儀、導(dǎo)航儀、機(jī)械裝置等。

基于計(jì)算機(jī)視覺(jué)的定位技術(shù)一般是從真實(shí)場(chǎng)景中獲得一幅或多幅圖像,根據(jù)圖像中的信息,計(jì)算出攝像機(jī)和圖形中物體的相對(duì)信息,最終恢復(fù)出三維場(chǎng)景的結(jié)構(gòu),從而達(dá)到定位的目的。

基于計(jì)算機(jī)視覺(jué)的定位技術(shù)主要包括以下幾種:

(1)單視圖法:在一幅圖像中找到六個(gè)以上特征點(diǎn)進(jìn)行跟蹤,通過(guò)已知的特征點(diǎn)的三維坐標(biāo)和其成像坐標(biāo)進(jìn)行定位。

(2)多視圖法:從多個(gè)角度拍攝場(chǎng)景,根據(jù)常用的角點(diǎn)檢測(cè)法,檢測(cè)多幅圖像的角點(diǎn)并進(jìn)行匹配,從而計(jì)算出真實(shí)場(chǎng)景中物體的景深,最終實(shí)現(xiàn)定位。

(3)運(yùn)動(dòng)目標(biāo)的序列圖像:根據(jù)序列圖像估算運(yùn)動(dòng)目標(biāo)的各項(xiàng)參數(shù)。

(4)模板匹配法:從多個(gè)視角出發(fā)尋找真實(shí)圖像中的物體作為模板數(shù)字化圖像,繼而將虛擬物體疊加到真實(shí)場(chǎng)景。

3.3 虛實(shí)融合技術(shù)

增強(qiáng)現(xiàn)實(shí)技術(shù)中的虛擬融合主要指虛擬物體在真實(shí)場(chǎng)景中的配準(zhǔn),以及虛擬物體與真實(shí)場(chǎng)景的一致性。

在增強(qiáng)現(xiàn)實(shí)系統(tǒng)的實(shí)現(xiàn)過(guò)程中,一致性是一個(gè)關(guān)鍵性問(wèn)題。虛實(shí)融合的一致性包括動(dòng)態(tài)一致性和靜態(tài)一致性。其中,動(dòng)態(tài)一致性通常指場(chǎng)景的實(shí)時(shí)繪制,跟蹤過(guò)程中虛擬物體和真實(shí)場(chǎng)景的空間位置的一致性等;靜態(tài)一致性通常指虛擬物體與真實(shí)場(chǎng)景外觀的一致性變化等。

另一方面,為了實(shí)現(xiàn)很好的虛實(shí)融合效果,必須對(duì)拍攝真實(shí)場(chǎng)景的相機(jī)進(jìn)行標(biāo)定,并與繪制虛擬物體的虛擬相機(jī)參數(shù)進(jìn)行匹配。攝像機(jī)標(biāo)定主要是對(duì)攝像機(jī)的內(nèi)外參數(shù)的確定。目前,攝像機(jī)標(biāo)定技術(shù)已經(jīng)較為成熟,主要可以分為三類(lèi):傳統(tǒng)的標(biāo)定法,如張正友標(biāo)定法;自標(biāo)定法,如基于Kruppa方程的自標(biāo)定法;基于主動(dòng)視覺(jué)的標(biāo)定法,如基于射影重建的標(biāo)定法。三類(lèi)標(biāo)定法各有利弊,并沒(méi)有一種可以普遍適用,因此攝像機(jī)標(biāo)定技術(shù)仍是一個(gè)研究重點(diǎn)。

3.4 用戶(hù)交互技術(shù)

人們總是向往能夠使用自然的方式和虛擬的物體交互,但這是十分困難的,增強(qiáng)現(xiàn)實(shí)系統(tǒng)根據(jù)跟蹤定位獲得的有關(guān)真實(shí)場(chǎng)景的信息對(duì)虛擬物體發(fā)出指令。目前,交互技術(shù)主要使用以下三種方式:

(1)在場(chǎng)景中選擇一個(gè)或多個(gè)特征點(diǎn)作為標(biāo)記點(diǎn),這是增強(qiáng)現(xiàn)實(shí)系統(tǒng)中最基本的交互方式。

(2)使用計(jì)算機(jī)識(shí)別出人或物體的姿態(tài),進(jìn)而交互操作。

(3)制作特殊工具,能夠通過(guò)按鍵等簡(jiǎn)單方式觸發(fā)事件。

4 結(jié)束語(yǔ)

本文總結(jié)了現(xiàn)階段增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用領(lǐng)域,并對(duì)其涉及到的關(guān)鍵技術(shù)進(jìn)行了闡述。增強(qiáng)現(xiàn)實(shí)技術(shù)作為一個(gè)多學(xué)科交叉的研究領(lǐng)域,必將飛速發(fā)展,更多的融入到我們的生活中。

參考文獻(xiàn):

[1]紀(jì)慶革,潘志庚,李祥晨.虛擬現(xiàn)實(shí)在體育體育仿真中的應(yīng)用綜述[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2003,15(11):1333-1338.

[2]陳靖,王涌天,閆達(dá)遠(yuǎn).增強(qiáng)現(xiàn)實(shí)系統(tǒng)及其應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2001,15:72-75.

[3]Milgram Pand Kishino F.A taxonomy of mixed reality visual displays[J].IEICE Trans.Information Systems,1994,E772D(12):1321-1329.

第5篇:計(jì)算機(jī)視覺(jué)總結(jié)范文

近年來(lái),計(jì)算機(jī)視覺(jué)在安防領(lǐng)域的應(yīng)用正備受關(guān)注,身份識(shí)別是核心問(wèn)題。人臉識(shí)別是一種基于臉部特征信息進(jìn)行身份識(shí)別的技術(shù),人臉檢測(cè)是其中的基礎(chǔ)和關(guān)鍵部分。介紹了四種不同的人臉檢測(cè)技術(shù),分析了相關(guān)的算法和理論,概述了各自的優(yōu)缺點(diǎn)。最后,討論了人臉檢測(cè)技術(shù)今后的研究方向及發(fā)展趨勢(shì)。

【關(guān)鍵詞】計(jì)算機(jī)視覺(jué) 身份識(shí)別 人臉檢測(cè)

1 人臉檢測(cè)問(wèn)題綜述

在國(guó)土安全和社會(huì)安全問(wèn)題日益突顯的背景下,世界各國(guó)家都對(duì)安防領(lǐng)域進(jìn)行不遺余力地投入。隨著計(jì)算機(jī)視覺(jué)技術(shù)的不斷發(fā)展,基于生物特征識(shí)別的身份識(shí)別技術(shù)受到人們的廣泛關(guān)注,在未來(lái)一段時(shí)間內(nèi)生物識(shí)別技術(shù)將成為信息產(chǎn)業(yè)的一次革命。其中人臉識(shí)別技術(shù)作為一種極具潛力的生物識(shí)別方式,以其識(shí)別速度快,主動(dòng)性強(qiáng),性?xún)r(jià)比高等顯著的技術(shù)優(yōu)勢(shì),在各個(gè)領(lǐng)域都體現(xiàn)出了巨大的商業(yè)價(jià)值和社會(huì)價(jià)值。

人臉檢測(cè)是人臉識(shí)別的前提和關(guān)鍵,一般采用相機(jī)實(shí)時(shí)采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中對(duì)人臉進(jìn)行檢測(cè)和跟蹤。人臉的自動(dòng)檢測(cè)是一項(xiàng)頗有難度的工作,主要體現(xiàn)在:(1)不同族群年齡等問(wèn)題導(dǎo)致人臉的差異性。(2)人臉上的胡須等附屬物對(duì)檢測(cè)造成的干擾。(3)人體姿態(tài)變化和遮擋物存在對(duì)檢測(cè)的影響。(4)環(huán)境和硬件條件對(duì)圖像采集效果的影響。針對(duì)這些問(wèn)題,國(guó)內(nèi)外著名高校和科研機(jī)構(gòu)進(jìn)行了很多相關(guān)的研究,致力于解決在復(fù)雜背景下如何準(zhǔn)確高效地進(jìn)行人臉檢測(cè)的問(wèn)題。

2 實(shí)現(xiàn)人臉檢測(cè)的相關(guān)技術(shù)

根據(jù)近年來(lái)計(jì)算機(jī)視覺(jué)領(lǐng)域人臉檢測(cè)問(wèn)題的研究進(jìn)展,本文在這里進(jìn)行總結(jié)性綜述,目前人臉檢測(cè)的方法可以分為基于知識(shí)和統(tǒng)計(jì)兩類(lèi),有以下四種常用的檢測(cè)算法。

2.1 模板匹配

模板匹配可以分成固定模板和變形模板。固定模板指的是根據(jù)先驗(yàn)數(shù)據(jù)歸納出一個(gè)統(tǒng)一的模板,然后根據(jù)一個(gè)能量函數(shù)確定被檢測(cè)區(qū)域中和模板相關(guān)程度較高的位置,即人臉位置。由于不同人物之間臉部的差異性很大,加上環(huán)境等因素的影響,此方法并不具有很強(qiáng)的實(shí)用性。變形模板原理上和固定模板的操作方式相同,不過(guò)變形模板自身的參數(shù)模型在一定范圍內(nèi)具有可變性,因此檢測(cè)的動(dòng)態(tài)范圍更大,檢測(cè)效果相對(duì)較好一些。

2.2 樣本學(xué)習(xí)

由于人臉的復(fù)雜性,顯式描述十分困難,因此基于統(tǒng)計(jì)模式的檢測(cè)方法受到了人們的廣泛關(guān)注。此方法將人臉看做一種模式,通過(guò)對(duì)大量樣本圖像的機(jī)器學(xué)習(xí)完成分類(lèi)器的構(gòu)造,利用分類(lèi)器實(shí)現(xiàn)對(duì)人臉的檢測(cè)判別,在這里問(wèn)題被轉(zhuǎn)化為模式識(shí)別中的二分類(lèi)的形式。

首先,需要建立一個(gè)樣本空間,其中包括“人臉”和“非人臉”的正負(fù)兩種樣本,對(duì)樣本圖片歸一化處理后,順序展開(kāi)后進(jìn)行主分量分解,在大量樣本形成的高維矩陣中計(jì)算其特征值和特征向量,然后采用一定的學(xué)習(xí)機(jī)制在特征空間中建立分類(lèi),以此可得到用來(lái)檢測(cè)樣本圖片是否為人臉的正負(fù)判別規(guī)則式,二者為互斥關(guān)系。此檢測(cè)方法具有較高的準(zhǔn)確度,但是需要大量的正負(fù)樣本圖片,MIT等一些高校和研究機(jī)構(gòu)建立了開(kāi)放的人臉庫(kù)。

2.3 人工神經(jīng)網(wǎng)絡(luò)

人工神經(jīng)網(wǎng)絡(luò)(ANN )是將模式的統(tǒng)計(jì)特性包含在ANN的結(jié)構(gòu)和參數(shù)中,對(duì)于人臉這類(lèi)復(fù)雜的、難以顯式描述的抽象型模式,這一檢測(cè)方法具有其自身特別的優(yōu)勢(shì)。

神經(jīng)網(wǎng)絡(luò)方法本質(zhì)上也是基于樣本學(xué)習(xí),首先使用經(jīng)過(guò)預(yù)處理的“人臉”樣本以及采用“自舉”方法收集分類(lèi)器錯(cuò)分的樣本作為正負(fù)樣本訓(xùn)練各個(gè)ANN,然后根據(jù)結(jié)果進(jìn)一步對(duì)分類(lèi)器進(jìn)行修正,構(gòu)造多層感知器(MLP)網(wǎng)絡(luò)作為分類(lèi)器對(duì)人臉進(jìn)行檢測(cè)。人工神經(jīng)網(wǎng)絡(luò)是并行分布式系統(tǒng),采用了與傳統(tǒng)人工智能和信息處理技術(shù)不同的原理,模擬大腦神經(jīng)網(wǎng)絡(luò)處理、記憶信息的方式進(jìn)行目標(biāo)檢測(cè)。神經(jīng)網(wǎng)絡(luò)模型克服了傳統(tǒng)的基于算數(shù)邏輯符號(hào)的人工智能在處理直覺(jué)、非結(jié)構(gòu)化信息方面的缺陷,具有自適應(yīng)、自組織和實(shí)時(shí)學(xué)習(xí)的特點(diǎn),應(yīng)用在人臉檢測(cè)問(wèn)題中性能表現(xiàn)突出。

2.4 基于隱馬爾可夫模型

隱馬爾可夫模型(HMM)是一種雙重隨機(jī)過(guò)程,一種是有限狀態(tài)的馬爾可夫鏈,另一種是序列的觀察值。由于只能通過(guò)觀察值得到馬爾可夫鏈的狀態(tài),因此稱(chēng)之為隱馬爾可夫模型。對(duì)于人臉而言,可以把它分為前額、眼睛、鼻子、嘴巴、下巴五個(gè)部分來(lái)檢測(cè)。根據(jù)這五個(gè)區(qū)域位置順序不變性,可以分別用相應(yīng)的觀察向量序列檢測(cè)每一個(gè)部分,使用一個(gè)包含五個(gè)狀態(tài)的一維連續(xù)HMM來(lái)表示人臉。接著對(duì)各塊進(jìn)行KL變換,提取每塊一些最大的特征向量作為觀察值對(duì)HMM進(jìn)行訓(xùn)練。此后,還提出了一種嵌入式隱馬爾可夫模型,該方法除了將人臉劃分為五塊外,還在每塊中從左至右嵌入了一個(gè)HMM。接著進(jìn)行二維DCT變換,把變換后得到的系數(shù)作為訓(xùn)練值。

3 結(jié)束語(yǔ)

人臉檢測(cè)是個(gè)發(fā)展很快的研究方向,人臉檢測(cè)技術(shù)的發(fā)展趨勢(shì)是利用多特征,多種分類(lèi)方式進(jìn)行啟發(fā)式知識(shí)與統(tǒng)計(jì)學(xué)習(xí)方法的結(jié)合,未來(lái)對(duì)人臉檢測(cè)的研究將會(huì)更注重其實(shí)時(shí)的應(yīng)用,這就對(duì)檢測(cè)算法的效率提出了更高的要求。另外,可以消除光照對(duì)人臉成像影響的紅外人臉識(shí)別技術(shù),加入相互對(duì)比機(jī)制的包含正臉、側(cè)臉三維信息的人臉三維模型重建檢測(cè)技術(shù)也正在研究當(dāng)中。隨著技術(shù)的不斷進(jìn)步和市場(chǎng)逐漸的規(guī)范化,人臉檢測(cè)識(shí)別技術(shù)會(huì)越來(lái)越多地應(yīng)用于社會(huì)的各個(gè)領(lǐng)域,在促進(jìn)社會(huì)發(fā)展的同時(shí)方便人們的生活。

參考文獻(xiàn)

[1]許燕,王維蘭.基于視覺(jué)運(yùn)動(dòng)人臉檢測(cè)技術(shù)的研究[J].計(jì)算機(jī)仿真, 2014(1):434-437.

[2]孫寧,鄒采榮,趙力.人臉檢測(cè)綜述[J].電路與系統(tǒng)學(xué)報(bào),2006,11(6):101-108.

作者簡(jiǎn)介

姚坤(1990-),男,現(xiàn)為聊城大學(xué)物理科學(xué)與信息工程學(xué)院碩士研究生,主要研究方向?yàn)闄C(jī)器視覺(jué)。

第6篇:計(jì)算機(jī)視覺(jué)總結(jié)范文

一、超聲醫(yī)學(xué)圖像處理方法

1.1計(jì)算機(jī)的視覺(jué)

我國(guó)的計(jì)算機(jī)視覺(jué)處理手法與醫(yī)學(xué)影像研究處理方法的結(jié)合一直是一個(gè)重點(diǎn)研究課題,同時(shí)也對(duì)我國(guó)傳統(tǒng)的醫(yī)學(xué)圖像處理技術(shù)的發(fā)展產(chǎn)生了重要影響。在我國(guó)的計(jì)算機(jī)視覺(jué)領(lǐng)域目前已經(jīng)研究總結(jié)了大量有價(jià)值的研究方法和研究技術(shù)。

1.1.1圖像濾波

超聲的圖像濾波應(yīng)用主要作用在于過(guò)濾掉斑點(diǎn)噪聲。斑點(diǎn)噪聲主要是因?yàn)槿梭w內(nèi)存在很多實(shí)際尺寸小于波長(zhǎng)的人體組織機(jī)構(gòu),同時(shí)在后向的散射聲波影響下而產(chǎn)生,斑點(diǎn)和噪聲的出現(xiàn)進(jìn)一步降低了在B超成像過(guò)程中的實(shí)際圖像對(duì)比以及組織內(nèi)可以提取的詳細(xì)信息數(shù)據(jù)。通過(guò)調(diào)查研究可以發(fā)現(xiàn),斑點(diǎn)噪聲的模型可以大致劃分為兩個(gè)類(lèi)別:完全性的隨機(jī)模型、長(zhǎng)階次非隨機(jī)模型、斷階次非隨機(jī)模型。目前我國(guó)已經(jīng)采用的多種超聲成像濾波算法都可以實(shí)現(xiàn)一定程度的噪聲過(guò)濾,并沒(méi)有哪一個(gè)固定的濾波算法可以實(shí)現(xiàn)應(yīng)用最優(yōu)效果發(fā)揮,對(duì)于固定的圖像成像分析可以采用多種定性以及定量形式進(jìn)行計(jì)算,從而對(duì)各類(lèi)型濾波進(jìn)行對(duì)比分析,所以屬于一種可行性較強(qiáng)的應(yīng)用方案[1]。

1.1.2圖像分割

醫(yī)學(xué)的圖像構(gòu)成處理方法研究過(guò)程中,圖像分割一直都是其中一個(gè)熱門(mén)討論課題。主要的圖像分割目標(biāo)在于按照合理的規(guī)則進(jìn)行圖像像素類(lèi)型劃分。早期的該部分技術(shù)主要有區(qū)域生長(zhǎng)以及聚類(lèi),主要是借助圖像的灰度信息,但是應(yīng)用此類(lèi)方法對(duì)于灰度值較為相近的兩種類(lèi)型物品難以區(qū)分,以邊緣檢測(cè)的方法進(jìn)行分析需要結(jié)合梯度信息,但是該類(lèi)型的方法沒(méi)有較為敏感的噪聲反應(yīng)度,同時(shí)對(duì)于邊緣較為模糊的物體提取存在困難,因?yàn)榇蟛糠值漠a(chǎn)科超聲醫(yī)學(xué)計(jì)算機(jī)成像質(zhì)量較差,同時(shí)在操作過(guò)程中的待分割目標(biāo)也較為復(fù)雜,所以需要利用更加多元化的信息處理方法才能取得更好的分割處理效果。形狀先驗(yàn)操作形式是在活動(dòng)的具體輪廓和活動(dòng)模型的提出而受到重視,以神經(jīng)網(wǎng)絡(luò)信息計(jì)算方法為分割的主要目標(biāo),同時(shí)也可以通過(guò)學(xué)習(xí)一種合理的分割形式來(lái)提高分割效果[2]。

1.2機(jī)器學(xué)習(xí)

在我國(guó)的產(chǎn)前超聲醫(yī)學(xué)處理過(guò)程中,機(jī)器學(xué)習(xí)都占據(jù)重要的地位并發(fā)揮著重要的作用,主要是因?yàn)闄C(jī)器學(xué)習(xí)促進(jìn)了我國(guó)的產(chǎn)前超聲診斷以及智能化發(fā)展,對(duì)于部分沒(méi)有充足精確度和分析推導(dǎo)較為困難的問(wèn)題,可以利用實(shí)際案例中的自動(dòng)學(xué)習(xí)算法提高準(zhǔn)確性。近些年來(lái),我國(guó)大部分的超聲成像醫(yī)學(xué)設(shè)備開(kāi)始應(yīng)用于臨床實(shí)踐中,從而豐富了總體的超聲醫(yī)學(xué)成像數(shù)據(jù)信息資源,進(jìn)而也提高了機(jī)器學(xué)習(xí)在產(chǎn)前超聲的醫(yī)學(xué)應(yīng)用可行性[3]。

二、產(chǎn)前的應(yīng)用

第7篇:計(jì)算機(jī)視覺(jué)總結(jié)范文

關(guān)鍵詞: 視頻;火焰檢測(cè);運(yùn)動(dòng)區(qū)域;顏色模型;頻閃

中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)22-5303-04

當(dāng)今社會(huì)人們的生活、辦公越來(lái)越密集化,物資存儲(chǔ)也更加集中,一旦發(fā)生火災(zāi)將會(huì)對(duì)人們的生命和財(cái)產(chǎn)安全造成巨大的威脅,人們對(duì)火災(zāi)預(yù)防重視程度不斷加強(qiáng)。傳統(tǒng)的火災(zāi)預(yù)防技術(shù)主要是基于溫度、煙霧的感應(yīng)[1]。這類(lèi)方法需要在檢測(cè)環(huán)境中安裝溫度或者煙霧傳感器,對(duì)火災(zāi)的檢測(cè)效果往往會(huì)受到距離、溫度、粉塵等物理?xiàng)l件的影響[2]。為了克服傳統(tǒng)火災(zāi)檢測(cè)系統(tǒng)存在的問(wèn)題,研究人員提出了基于視頻分析的火災(zāi)檢測(cè)技術(shù)。該類(lèi)方法通過(guò)攝像機(jī)獲取監(jiān)控場(chǎng)景中的實(shí)時(shí)視頻畫(huà)面,利用圖像處理和視頻分析技術(shù)檢測(cè)火災(zāi)的發(fā)生,這種非接觸式的檢測(cè)方法直觀主動(dòng),對(duì)監(jiān)控場(chǎng)景具有普適性,可以克服傳統(tǒng)火災(zāi)檢測(cè)系統(tǒng)受物理?xiàng)l件限制的缺點(diǎn)[3]。文獻(xiàn)[4]結(jié)合火焰顏色統(tǒng)計(jì)模型和序列模式挖掘的方法,能夠檢測(cè)出一幅圖像中的火焰,文獻(xiàn)[5]利用視頻中火焰區(qū)域的火焰顏色概率模型、火焰區(qū)域的形狀以及火焰外形的變化規(guī)律來(lái)檢測(cè)火災(zāi)的發(fā)生。文獻(xiàn)[6] 采用一種基于色覺(jué)和無(wú)序性測(cè)量的RGB模型來(lái)檢測(cè)火焰和煙霧,而文獻(xiàn)[7]則是通過(guò)在HIS顏色空間下使用直方圖特征分割的方法來(lái)判斷是否有火災(zāi)發(fā)生。

為了提高火焰檢測(cè)的效率和準(zhǔn)確率,該文首先通過(guò)運(yùn)動(dòng)檢測(cè)算法提取出視頻中運(yùn)動(dòng)的區(qū)域,進(jìn)一步使用火焰顏色模型來(lái)選擇出候選區(qū)域,最后根據(jù)火焰的頻閃特性建立簡(jiǎn)化的火焰頻閃模型,進(jìn)一步濾除非火焰區(qū)域,提高檢測(cè)精度。

1 運(yùn)動(dòng)區(qū)域提取

運(yùn)動(dòng)區(qū)域提取的目的是將不斷運(yùn)動(dòng)的區(qū)域從背景圖像中提取出來(lái),是視頻分析算法的關(guān)鍵基礎(chǔ)環(huán)節(jié),是目標(biāo)定位、識(shí)別和跟蹤的前提[8]。

眾所周知,由于受到氣流等因素的影響,火焰在燃燒過(guò)程中會(huì)持續(xù)不斷的運(yùn)動(dòng),該文先使用ViBe(Visual Background Extractor)[9]算法提取出視頻中的運(yùn)動(dòng)區(qū)域,縮小檢測(cè)范圍,提高火焰檢測(cè)的效率和精度。

ViBe算法由Olivier Barnich和Marc Van Droogenbroeck于2011年提出,是一種像素級(jí)視頻運(yùn)動(dòng)提取算法,由于它計(jì)算簡(jiǎn)單,效率較高,能夠較準(zhǔn)確的提取出完整目標(biāo),且占用硬件資源較少,目前得到了廣泛的應(yīng)用。ViBe算法是一種基于統(tǒng)計(jì)背景模型的運(yùn)動(dòng)區(qū)域檢測(cè)算法,其基本流程如圖1。算法首先根據(jù)第一幀圖像建立背景模板,圖像的每個(gè)像素點(diǎn)在背景模版中都有一個(gè)維數(shù)為N的樣本集合,初始化時(shí)樣本集合里的值從每個(gè)像素點(diǎn)的R[×]R鄰域內(nèi)隨機(jī)抽取。對(duì)后續(xù)圖像幀的處理包含匹配和背景更新兩個(gè)部分。匹配過(guò)程中計(jì)算當(dāng)前像素點(diǎn)與其樣本集合中的元素值在顏色空間中的距離,并統(tǒng)計(jì)距離小于一定閾值D的元素個(gè)數(shù),當(dāng)個(gè)數(shù)大于一定閾值T,則判定該像素點(diǎn)為背景點(diǎn),否則判定其為前景點(diǎn)。對(duì)判定為背景點(diǎn)的像素要更新對(duì)應(yīng)的樣本集合,首先隨機(jī)抽取NUM個(gè)樣本集合中的元素,將其值更新為當(dāng)前像素的值。由于視頻幀中的像素點(diǎn)與其鄰域內(nèi)的像素點(diǎn)具有一定的相關(guān)性,所以要隨機(jī)對(duì)其鄰域內(nèi)的一個(gè)像素點(diǎn)進(jìn)行背景更新。ViBe算法的檢測(cè)結(jié)果如圖2。

2 火焰顏色檢測(cè)

火焰在一般背景下會(huì)呈現(xiàn)出明顯的高亮度,其獨(dú)特的顏色在不同的色彩空間(RGB、HSV等)都具有特定的分布[10]。該文在上述ViBe算法的基礎(chǔ)上利用火焰顏色特性來(lái)去除運(yùn)動(dòng)區(qū)域中非火焰區(qū)域,提高檢測(cè)精度。該文使用的火焰顏色分布如下:

3 火焰頻閃模型

火焰在燃燒過(guò)程中由于湍流流動(dòng)導(dǎo)致火焰,即火苗的無(wú)序閃動(dòng),具體表現(xiàn)為一種持續(xù)的高頻時(shí)序變化,研究者們還發(fā)現(xiàn)這種無(wú)序閃動(dòng)具有與燃料和燃器形狀無(wú)關(guān)的動(dòng)態(tài)范圍(10Hz以?xún)?nèi))[11]。文獻(xiàn)[12]采用火焰顏色像素沿時(shí)間軸的一維傅里葉變換來(lái)檢測(cè)火焰的頻閃特性,計(jì)算較為復(fù)雜。該文根據(jù)火焰的頻閃特性,統(tǒng)計(jì)像素點(diǎn)在固定時(shí)域范圍內(nèi)的變化次數(shù),建立一個(gè)簡(jiǎn)化的火焰頻閃模型。具體算法如下:

1) 建立一個(gè)大小為[TIME]的火焰頻閃模型,模型中每個(gè)元素為一幅二值圖像,圖像的分辨率與原圖相同,每個(gè)像素點(diǎn)表示原圖中該像素點(diǎn)是否發(fā)生變化。

2) 通過(guò)ViBe算法獲得第[n]幀圖像的運(yùn)動(dòng)區(qū)域,與第[n-1]幀圖像的運(yùn)動(dòng)區(qū)域進(jìn)行比較,獲取當(dāng)前圖像中像素點(diǎn)的變化情況,存入火焰頻閃模型。若1

3) 設(shè)置計(jì)數(shù)器[DiffCnt],初始為0,通過(guò)火焰頻閃模型獲取當(dāng)前幀運(yùn)動(dòng)區(qū)域中各個(gè)像素點(diǎn)在[TIME]幀內(nèi)的變化次數(shù)[t],若[Tmin]

4) 計(jì)算[DiffCnt]與運(yùn)動(dòng)區(qū)域大小的比值,大于一定的閾值[Alpha],則認(rèn)為當(dāng)前運(yùn)動(dòng)區(qū)域符合火焰頻閃特性。若視頻未結(jié)束,則跳轉(zhuǎn)(2)。

火焰頻閃模型實(shí)驗(yàn)結(jié)果如圖4,其中[TIME]、[Tmin]、[Tmax]、[Alpha]的取值分別為25、5、15、0.5。

4 實(shí)驗(yàn)結(jié)果

為了驗(yàn)證算法的效果,該文采用了不同環(huán)境下的測(cè)試視頻進(jìn)行了實(shí)驗(yàn),結(jié)果如圖5。實(shí)驗(yàn)使用的硬件環(huán)境為:CPU為Pentium? Dual-CoreE6700(主頻為3.2GHz),內(nèi)存2GB,軟件平臺(tái)為:操作系統(tǒng)為Windows 7(32位),使用C++語(yǔ)言在Microsoft Visual Studio 2010進(jìn)行編程,調(diào)用OpenCv圖像處理庫(kù)。實(shí)驗(yàn)中所用的測(cè)試視頻分辨率均為320[×]240。通過(guò)上述實(shí)驗(yàn)可以發(fā)現(xiàn)本文提出的算法能夠在不同環(huán)境下檢測(cè)出火焰的發(fā)生,且執(zhí)行效率較高,實(shí)驗(yàn)處理一幀圖像平均只需要5ms。但是在復(fù)雜環(huán)境下,該方法也會(huì)產(chǎn)生錯(cuò)誤檢測(cè)。

5 總結(jié)

本文通過(guò)結(jié)合火焰的運(yùn)動(dòng)特性、顏色特征以及頻閃特性,提出了一種簡(jiǎn)單高效的視頻火焰檢測(cè)算法,能夠在不同環(huán)境下檢測(cè)出火焰的發(fā)生,具有一定的實(shí)際應(yīng)用價(jià)值。但是由于實(shí)際環(huán)境的復(fù)雜性以及算法本身存在的缺陷,該文提出的方法也會(huì)產(chǎn)生一些錯(cuò)誤的檢測(cè)。未來(lái)的研究工作中準(zhǔn)備進(jìn)一步分析算法錯(cuò)誤檢測(cè)的情況,繼續(xù)提高算法的準(zhǔn)確率。

參考文獻(xiàn):

[1] 袁非牛,廖光煊,張永明,等.計(jì)算機(jī)視覺(jué)火災(zāi)探測(cè)中的特征提取[J]. 中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào),2006,36(1):39-43.

[2] 楊俊,王潤(rùn)生.基于計(jì)算機(jī)視覺(jué)的視頻火焰檢測(cè)技術(shù)[J].中國(guó)圖像圖形學(xué)報(bào),2008,13(7):1222-1234.

[3] 高愛(ài)蓮.基于視頻的火焰檢測(cè)方法研究[D].昆明理工大學(xué),2008.10.

[4] Yu-Chiang Li,Wei-Cheng Wu.Visual Fire Detection Based on Data Mining Technique[C].2011 First International Conference on Robot, Vision and Signal Processing,2011(11):238-331.

[5] Che-Bin Liu and Ahuja N.Vision Based Fire Detection[J]. Proceedings of the 17th International Conference on Pattern Recognition,2004(8):134-137.

[6] Thou-Ho Chen, Ping-Hsueh Wu, and Yung-Chuen Chiou. An Early Fire-Detection Method Based on Image Processing[C]. 2004 International Conference on Image Processing, 2004(10):1707-1710.

[7] 陳威,劉菁華. 顏色直方圖特征分割方法在火災(zāi)探測(cè)中的應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011,21(7):199-202.

[8] 侯宏錄,李寧鳥(niǎo),劉迪迪,等.智能視頻監(jiān)控中運(yùn)動(dòng)目標(biāo)檢測(cè)的研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2012,22(2):49-52.

[9] Barnich O ,Van Droogenbroeck M. ViBe: A Universal Background Subtraction Algorithm for Video Sequences[C]. IEEE Transactions on Image Processing, 2011(6):1709-1724.

[10] 楊俊,王潤(rùn)生.基于計(jì)算機(jī)視覺(jué)的視頻火焰檢測(cè)技術(shù)[J].2008,13(7):1222-1234.

第8篇:計(jì)算機(jī)視覺(jué)總結(jié)范文

(1.第二炮兵士官學(xué)校103教研室,山東青州262500;2.第二炮兵士官學(xué)校202教研室,山東青州262500)

摘要:尺度不變局部特征以其良好的尺度、旋轉(zhuǎn)和光照不變性,在計(jì)算機(jī)視覺(jué)、目標(biāo)識(shí)別、三維圖像重構(gòu)等領(lǐng)域中得到了廣泛的應(yīng)用。本文在大量試驗(yàn)數(shù)據(jù)的基礎(chǔ)上,總結(jié)了目前常用的幾種尺度不變特征匹配算法的性能,比較得出各種算法的優(yōu)缺點(diǎn)及其適用領(lǐng)域,并指出尺度不變局部特征檢測(cè)算法的研究和發(fā)展趨勢(shì)。

關(guān)鍵詞:局部特征;尺度不變;圖像匹配;特征檢測(cè)

中圖分類(lèi)號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1007-9599 (2011) 09-0000-01

Scale-invariant Local Feature Detection Algorithm Study

Cao Juan1,Zhao Xuyang1,Mi Wengpeng2,Hong Chenghua1

(1.Teaching and Research Section103,the PLA Second Artillery Academy,Qingzhou262500,China;2.Teaching and Research Section202,the PLA Second Artillery Academy,Qingzhou262500,China)

Abstract:Scale invariant feature is famous for its wonderful scale invariance,rotation invariance and illumination invariance,which is widely used in computer vision,object categorization,3D image retrieval and so on.Proved by a large number of experiment dates,performance comparisons among the common scale invariant detectors showed us the advantage,disadvantage of each detector in this paper,which can help the new researchers to follow the right way according to their specific requirements.In the end,this paper indicates the developing trend of scale invariant detectors.

Keywords:Local feature;Scale invariant;Image matching;Feature detection

圖像匹配技術(shù)是計(jì)算機(jī)視覺(jué)、三維圖像標(biāo)定、目標(biāo)識(shí)別以及景象匹配導(dǎo)航和制導(dǎo)等領(lǐng)域中的核心技術(shù)之一。而匹配精度在很大程度上取決于特征檢測(cè)算子的定位精度。尺度不變特征檢測(cè)算法是一種對(duì)尺度變化具有良好的協(xié)變特性的算法,對(duì)于存在比例變化圖像,可以提供較高的特征點(diǎn)定位精度,為后續(xù)的匹配處理奠定良好的基礎(chǔ)。本文總結(jié)了目前常用的幾種尺度不變局部特征檢測(cè)算法,并從實(shí)際應(yīng)用的角度出發(fā),對(duì)比各種算法的優(yōu)缺點(diǎn),為工程應(yīng)用中尺度不變算法的選擇提出了建設(shè)性的意見(jiàn)。

一、尺度不變特征檢測(cè)算法

尺度不變特征檢測(cè)算法的理論基礎(chǔ)來(lái)源于尺度空間理論。該理論最早出現(xiàn)于計(jì)算機(jī)視覺(jué)領(lǐng)域,目的是模擬圖像數(shù)據(jù)的多尺度特征[1],其主要思想是利用尺度空間高斯核與原圖像的卷積對(duì)原始圖像進(jìn)行尺度變換,獲得圖像在多尺度下的尺度空間表示序列,通過(guò)大尺度下的模糊輪廓和小尺度下的精細(xì)結(jié)構(gòu)等一系列的圖像信息對(duì)原始圖像進(jìn)行表達(dá)。目前使用得較多的尺度不變特征檢測(cè)算子主要有DOG[2][3][4]、Harris-Laplace[5][6]、Hessian-Laplace[5][7]。下面分別對(duì)這些檢測(cè)算子進(jìn)行介紹:

(一)DOG。DOG檢測(cè)的思想最早是由Crowley和Parker于1984年提出來(lái)的。1999年Low改進(jìn)了此方法,并將其應(yīng)用于目標(biāo)識(shí)別領(lǐng)域。該算法首先通過(guò)對(duì)高斯尺度空間的采樣,建立高斯金字塔。高斯金子塔采樣分階,階內(nèi)又分層的結(jié)構(gòu)。每階每層都代表不同尺度值平滑后的高斯圖像,隨著階數(shù)和階內(nèi)層數(shù)的增加尺度值逐漸增大。其金字塔特性體現(xiàn)在不同階處理的圖像大小不同,通過(guò)對(duì)降維采樣,階數(shù)越高則處理的圖像越小。然后算法對(duì)高斯金字塔的相鄰層相減,得到DOG金字塔,其每層的尺度保持為減數(shù)的尺度。這種提取方法以及參數(shù)使得特征點(diǎn)具有很強(qiáng)的旋轉(zhuǎn)和尺度不變特性,并且對(duì)于光照、噪聲以及仿射變化都具有一定的魯棒性。(二)Harris-Laplace。該算子將Harris檢測(cè)算子的可靠性與自動(dòng)尺度選擇相結(jié)合,使檢測(cè)出的特征點(diǎn)具有尺度不變性。Harris檢測(cè)算子以二階動(dòng)差矩為基礎(chǔ),該矩陣具有旋轉(zhuǎn)不變性,但是要使得它能獨(dú)立于圖像分辨率的變化還需要適應(yīng)尺度變化。本算法通過(guò)將基于圖像灰度值的二階動(dòng)差矩變?yōu)榛诟咚箍臻g的矩陣,構(gòu)造具有尺度適應(yīng)性的二階動(dòng)差矩,利用該多尺度表達(dá)式來(lái)檢測(cè)潛在的特征點(diǎn)。然后對(duì)于每個(gè)潛在的特征點(diǎn),計(jì)算其Laplace-of-Gaussian函數(shù)值隨著尺度的變化的響應(yīng)圖像,該圖像的局部極大值點(diǎn)所對(duì)應(yīng)的尺度即為特征尺度。對(duì)于在選擇的尺度范圍內(nèi)LOG響應(yīng)沒(méi)有極值點(diǎn)以及響應(yīng)值低于某個(gè)閾值的點(diǎn)則去除。這樣對(duì)于滿足要求的興趣點(diǎn),則以其位置和特征尺度對(duì)其進(jìn)行標(biāo)注,由此可見(jiàn)Harris-laplace算法提取出的這樣的特征點(diǎn)則具有尺度和旋轉(zhuǎn)不變性。(三)Hessian-Laplace。與Harris-Laplace類(lèi)似,Hessian-Laplace也是通過(guò)兩個(gè)度量分別檢測(cè)興趣點(diǎn)的位置和尺度的;所不同的是在進(jìn)行興趣點(diǎn)空間定位時(shí),使用尺度歸一化Hessian矩陣的行列式最為度量。研究表明基于Hessian矩陣的檢測(cè)算子比基于二階動(dòng)差矩的算子更穩(wěn)定,特征點(diǎn)的重復(fù)率更高。由于Hessian矩陣可以產(chǎn)生更少的拉伸以及錯(cuò)誤定位的結(jié)構(gòu),所以Hessian-Laplace特征檢測(cè)算子在穩(wěn)定性和速度上都略高于Harris-Laplace。(四)顯著區(qū)域檢測(cè)算子(The salient region detector)。2001年,Kadir,T.和Brady,M.提出了顯著性區(qū)域檢測(cè)算子。該算子計(jì)算以像素點(diǎn)為中心的圓形區(qū)域的灰度值的概率密度函數(shù)(Probability Density Function),然后利用香農(nóng)熵來(lái)定義局部區(qū)域灰度值分布的復(fù)雜性,并將其作為顯著性度量,選擇香農(nóng)熵極值點(diǎn)所對(duì)應(yīng)的尺度作為特征尺度,并計(jì)算當(dāng)前點(diǎn)特征尺度下的顯著度。檢測(cè)算子通過(guò)比較不同點(diǎn)的顯著度,將其分為不同的等級(jí),并選出最具有代表性的點(diǎn)作為特征點(diǎn)。

二、性能比較

上述幾種檢測(cè)算法都是典型的尺度不變特征檢測(cè)算法,同時(shí)兼具旋轉(zhuǎn)不變性,對(duì)于圖像光照變化、背景噪聲以及視角變化引起的仿射、透視變換均具有一定程度上的魯棒性。然而由于不同的檢測(cè)算子使用的尺度空間度量函數(shù)不同,所以具有不同的個(gè)性化表現(xiàn)。檢測(cè)算法評(píng)估顯示在尺度變化的情況下,Hessian-Laplace具有最高的點(diǎn)重復(fù)率和定位精度,Harris-Laplace以及DOG算法次之,但是DOG算法的運(yùn)算速度是三者中最快的,是Hessian-Laplace的兩倍,Harris-Laplace的十倍。Harris-Laplace以及Hessian-Laplace對(duì)于角點(diǎn)和高度紋理化的點(diǎn)最敏感,而DOG則更適合于處理結(jié)構(gòu)化圖像;顯著區(qū)域檢測(cè)算法在速度和定位精度上都相對(duì)較差,但是在物體分類(lèi)識(shí)別領(lǐng)域中展現(xiàn)出優(yōu)良的性能。

三、小結(jié)

尺度不變特征以其優(yōu)良的魯棒性成為當(dāng)前特征匹配算法研究中的熱點(diǎn)。其中,DOG算子適用于實(shí)時(shí)性要求較高的場(chǎng)合,Hessian-Laplace適用于對(duì)定位精度要求較嚴(yán)格的場(chǎng)合,Harris-Laplace適用于紋理圖像,而顯著區(qū)域檢測(cè)算法適用于對(duì)實(shí)時(shí)性要求較低的物體分類(lèi)識(shí)別領(lǐng)域??偟膩?lái)說(shuō),目前尺度不變特征檢測(cè)算子運(yùn)算速度相對(duì)比較慢,滿足不了景象匹配導(dǎo)航和制導(dǎo)等對(duì)實(shí)時(shí)性要求高的領(lǐng)域的要求,如何改進(jìn)現(xiàn)有算法的,在不降低精度的情況下提高算法速度,或以精度的略微下降換取速度的較大提高,是目前檢測(cè)算子研究的熱點(diǎn);同時(shí)尋找新的更簡(jiǎn)單局部特征(如圖像的飽和度等),開(kāi)發(fā)新的特征檢測(cè)算子以及檢測(cè)算子的硬件實(shí)現(xiàn)也是值得深入研究的方向。

參考文獻(xiàn):

[1]FaugerasO,Robert L.What can two images tell us about the third one[C].Proceedings of the Europe Conference on Computer Vision,1994

[2]Crowley J,Parker,A.A representation for shape based on peaks and ridges in the difference of low pass transform.IEEE Transactions on Pattern Analysis and Machine Intelligence,1984,6(2):156C170

[3]Lowe D.G.Object recognition from local scale-invariant features.In Proceedings of the 7th International Conference on Computer Vision,1999,1150C1157

[4]Lowe D.G..Distinctive Image Features from Scale-Invariant Keypoints,Int’l puter Vision,2004,60(2):91-110

[5]Krystian Mikolajczyk,Cordelia Schmid.Scale&Affine Invariant Interest Point Detectors.International Journal of Computer Vision.2004,60(1):63-86

第9篇:計(jì)算機(jī)視覺(jué)總結(jié)范文

關(guān)鍵詞:視頻拼接;跟蹤定位;OPENCV

[基金資助]:全國(guó)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練項(xiàng)目(2013XKCX210)廣西高??茖W(xué)技術(shù)研究項(xiàng)目:(2013YB092)

引言

隨著安防向著智能化的進(jìn)一步發(fā)展,越來(lái)越多的領(lǐng)域?qū)鹘y(tǒng)意義上的視頻監(jiān)控提出了更多的要求。傳統(tǒng)的監(jiān)控?cái)z像機(jī)多為固定攝像機(jī),監(jiān)控視野狹窄,而且運(yùn)動(dòng)目標(biāo)容易超出監(jiān)控視野范圍,而不能對(duì)其連續(xù)跟蹤,這也就導(dǎo)致了監(jiān)控漏洞的出現(xiàn)。如果能夠建立一種既能全局監(jiān)控掌握整體情況,又能針對(duì)感興趣目標(biāo)進(jìn)行跟蹤特寫(xiě)的系統(tǒng),就可以很好地解決全局監(jiān)控與局部跟蹤不可兼得的難題,因此提出了基于視頻拼接的特寫(xiě)聯(lián)動(dòng)系統(tǒng)。

1 介紹OPENCV

OPENCV是一個(gè)開(kāi)源的跨平臺(tái)計(jì)算機(jī)視覺(jué)庫(kù),可以運(yùn)行在Linux、Windows和Mac OS等多個(gè)操作系統(tǒng)上。它輕量級(jí)而且高效,由一系列 C 函數(shù)和少量 C++ 類(lèi)構(gòu)成,同時(shí)提供了Python、Ruby、MATLAB等語(yǔ)言的接口,實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺(jué)方面的很多通用算法。

2 圖像拼接

OPENCV提供的專(zhuān)門(mén)用于全景拼接的類(lèi)Stitcher,該類(lèi)可以對(duì)無(wú)序的任意張圖片進(jìn)行全景拼接,拼接效果如圖2.1所示。

(a)

圖2.1 Stitcher類(lèi)的拼接效果

可以看出,效果是十分不錯(cuò)的。不過(guò)在時(shí)間的處理上,Stitcher封裝的算法表現(xiàn)的并不令人滿意,對(duì)兩張320*240的JPG圖像,花費(fèi)了9968毫秒才完成了拼接。所以這個(gè)類(lèi)也只適合用來(lái)做圖片的拼接,想要在視頻中做實(shí)時(shí)的拼接處理是不可能的。

3 視頻拼接

Stitcher封裝的算法,除了時(shí)間,其他各方面都令人滿意。假如需要將其運(yùn)用到視頻拼接上,以每秒播放20幀為例,速度需要提高100多倍,光優(yōu)化代碼是不現(xiàn)實(shí)的。

不過(guò)經(jīng)過(guò)對(duì)Stitcher類(lèi)的詳細(xì)了解,可以對(duì)拼接兩張圖片的條件進(jìn)行總結(jié),就是相機(jī)參數(shù)和img_mask圖片。也就是說(shuō),不需要每一次都計(jì)算這兩個(gè)東西,只需要提取視頻的第一幀進(jìn)行拼接,然后保存這兩個(gè)參數(shù),視頻之后的所有幀直接用就行了。OPENCV提供了Stitcher所有的C源代碼,對(duì)應(yīng)的拼接算法封裝在estimateTransform和composePanorama函數(shù)中。只需要將這兩個(gè)函數(shù)融合成一個(gè),將其中涉及到相機(jī)參數(shù)(代碼中定義為cameras_)和img_mask圖片(代碼中定義為mask_warped)的變量轉(zhuǎn)換成Stitcher類(lèi)的變量,然后重新定義一個(gè)函數(shù),將composePanorama尾部的圖片融入代碼復(fù)制出來(lái)就行了。代碼修改后,同樣是320*240的兩張圖片,耗時(shí)157毫秒。這樣視頻拼接的功能就可以用Stitcher類(lèi)來(lái)實(shí)現(xiàn)了。

4 跟蹤定位

對(duì)圖像場(chǎng)景中的物體進(jìn)行跟蹤,首先需要知道物體是否是活動(dòng)的。假如物體一直處于不運(yùn)動(dòng)的狀態(tài),那么這種情況應(yīng)該屬于圖像識(shí)別的范疇。如果物體運(yùn)動(dòng),必將產(chǎn)生位移,也就是相對(duì)于上一幀發(fā)生了像素偏差,然而,圖像背景并沒(méi)有移動(dòng)。這樣一來(lái)跟蹤算法顯而易見(jiàn)。

首先需要記錄第一幀的圖像數(shù)據(jù),然后記錄第二幀的圖像數(shù)據(jù),兩幀數(shù)據(jù)圖像做對(duì)比,定義如下計(jì)算公式:

其中,x,y分別是像素的坐標(biāo),threshold是閾值。一般來(lái)說(shuō),閾值為零,表示像素沒(méi)有發(fā)生位移。不過(guò)在實(shí)際情況下,考慮到光線和天氣的影響,像素會(huì)在人眼分辨不出來(lái)的情況下發(fā)生變化,所以閾值就不同的場(chǎng)景而定。圖片的運(yùn)算結(jié)果如圖4.1所示,考慮到實(shí)際情況,需要對(duì)結(jié)果進(jìn)行濾波處理,之后進(jìn)行像素膨脹處理,這兩個(gè)步驟主要是將圖像中有明顯位置移動(dòng)的物體保留下來(lái),過(guò)濾掉因光照、天氣產(chǎn)生的噪聲。為了達(dá)到更好的效果,也可以加入對(duì)時(shí)間的判斷,具體算法可以參見(jiàn)Gary Bradski和Adrian kaebler的learning Opencv[5]的第九章。

5 實(shí)驗(yàn)結(jié)果及分析

實(shí)驗(yàn)結(jié)果基本上每個(gè)小章節(jié)的結(jié)尾都已經(jīng)給出,以下給出系統(tǒng)整體運(yùn)行的結(jié)果。本文選用三個(gè)校園取景的視頻作為實(shí)驗(yàn)視頻,采用VS2008編譯器,搭建OPENCV2.2.4的環(huán)境,運(yùn)行系統(tǒng)為WINDOWS XP,運(yùn)行效果如圖5.1所示,時(shí)間耗費(fèi)如表5.2所示。

圖5.1 拼接及跟蹤的結(jié)果

實(shí)驗(yàn)采用兩個(gè)480*360大小的avi視頻,實(shí)時(shí)拼接耗時(shí)360毫秒,加上跟蹤算法總共消耗386毫秒。實(shí)際應(yīng)用中。從源代碼分析,主要消耗時(shí)間的過(guò)程有:圖片的重新投影(代碼中定義為warp),耗時(shí)109毫秒。投影后的圖片與各自的二值圖像標(biāo)記混合(代碼中定義為feed),耗時(shí)32毫秒。所有圖像融合(代碼中定義為blend),耗時(shí)47秒。其中wrap和feed執(zhí)行了多次,blend執(zhí)行一次。

6 總結(jié)

本文對(duì)視頻拼接的特寫(xiě)聯(lián)動(dòng)系統(tǒng)的實(shí)現(xiàn)進(jìn)行了詳細(xì)的介紹。主要通過(guò)優(yōu)化OPENCV圖像處理庫(kù)來(lái)編寫(xiě)系統(tǒng)程序代碼,通過(guò)優(yōu)化Stitcher類(lèi)算法,從而實(shí)現(xiàn)所需的特定功能。融合了跟蹤算法,有效解決了跨場(chǎng)景跟蹤的難題,有一定的實(shí)用性和研究?jī)r(jià)值。

參考文獻(xiàn)

[1] MATTHEW BROWN* AND DAVID G LOWE. Automatic Panoramic Image Stitching using Invariant Festures, December 2006

[2] 王小強(qiáng),陳臨強(qiáng),梁旭. 實(shí)時(shí)全自動(dòng)視頻拼接方法, 2011

[3] David G. Lowe. Distanctive Image Festure from Scale-Invariant Keypoints, 2004

[4] Bill Triggs,Philip McLauchlan,Richard Hartley. Bundle Adjustment A modern Synthesis, 2000