前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的濾波器去噪原理和基本方法主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:深度學(xué)習(xí)算法;視頻圖像;文本區(qū)域定位;形態(tài)學(xué)去噪;字符識別
DoI:10.15938/j.jhust.2016.06.012
中圖分類號:TP391.43
文獻(xiàn)標(biāo)志碼:A
文章編號:1007-2683(2016)06-0061-06
0.引言
視頻中的文字檢測與識別是視頻圖像檢測領(lǐng)域的一項重要研究內(nèi)容.在復(fù)雜背景下,視頻文本的準(zhǔn)確定位與識別有利于進(jìn)行視頻圖像檢測,只有準(zhǔn)確的視頻文本區(qū)域的定位,才能提高OcR字符識別系統(tǒng)的文本識別準(zhǔn)確率,進(jìn)而提高基于內(nèi)容的視頻圖像的正確檢測的效率,對視頻定位與檢索有十分重要的應(yīng)用價值,一般的文本定位方法主要包括:邊緣特征定位法、筆畫寬度定位法、紋理特征定位法、機(jī)器學(xué)習(xí)法等,本文采用2D-Gabor濾波器與深度學(xué)習(xí)算法相結(jié)合的方法,實現(xiàn)對復(fù)雜背景視頻中文本區(qū)域的定位,并研究了基于形態(tài)學(xué)的視頻圖像去噪方法,再通過OCR系統(tǒng)實現(xiàn)字符的識別,以提高OCR系統(tǒng)字符識別的準(zhǔn)確率。
1.深度學(xué)習(xí)視頻文本區(qū)域定位與識別流程
本文將深度學(xué)習(xí)算法理論應(yīng)用于視頻文本區(qū)域定位與識別過程,設(shè)計了一種基于紋理特征的逐層增量深度學(xué)習(xí)算法.該算法的處理流程如圖1所示.首先,將視頻圖像通過Gabor濾波器濾波,獲得視頻圖像文本中文字的紋理特征;接著,將紋理特征作為訓(xùn)練樣本,利用受限玻爾茲曼機(jī)(restricted bolt-zmann machine,RBM)逐層對紋理圖像進(jìn)行增量學(xué)習(xí),在學(xué)習(xí)過程中,用標(biāo)記樣本作為監(jiān)督數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)微調(diào),構(gòu)成深度置信網(wǎng)絡(luò)(deep belief network,DBN),并標(biāo)記文本區(qū)域和背景區(qū)域的二值圖像;之后,利用形態(tài)學(xué)方法對二值圖像去噪處理,再映射到定位圖像上,得到僅包含文本區(qū)域而去除背景區(qū)域的文本圖像,最后,再將圖像進(jìn)行二值化、灰度等后續(xù)處理,送入到OCR字符識別系統(tǒng)進(jìn)行字符識別.
2.逐層增量深度學(xué)習(xí)視頻文本定位算法
2.1視頻圖像紋理特征的提取
字符的紋理具有周期性,并且在一定的頻率范圍內(nèi)能量相對集中,所以可以利用二維Gabor濾波器對視頻圖像在不同尺度和方向上進(jìn)行濾波,Gabor濾波器理論最早由Daugman提出,能夠很好地描述對應(yīng)于空間頻率(尺度)、空間位置及方向選擇性的局部結(jié)構(gòu)信息。
鑒于中文字符主要由橫、撇、豎、捺4種基本筆畫組成,所以Gabor濾波器要求能夠在這4個方向上反映中文字符的筆畫特征,并且要求能夠保證對這4個方向紋理區(qū)域的頻率分量均有很好的響應(yīng)。Wang等研究了Gabor濾波器中心頻率與漢字的筆畫的關(guān)系,發(fā)現(xiàn)Gabor濾波器的中心頻率與周期入成倒數(shù)關(guān)系,且周期入是筆畫寬度η的一半,當(dāng)筆畫的方向與Gabor濾波器的方向處于正交時,Ga-bor濾波器輸出最優(yōu),因此,可以通過筆畫的寬度來確定Gabor濾波器的中心頻率,本文中Gabor濾波器所選擇的參數(shù)為低頻中心頻率U1,/sub>=0.2,高頻中心頻率U,sub>h0.4,方向數(shù)和尺度數(shù)分別為T=4,M=4。
圖2(b)所示為圖2(a)原視頻圖像在橫、撇、豎、捺4個方向進(jìn)行Gabor濾波后的結(jié)果.由圖2(b)可知,Gabor濾器能夠?qū)⑽淖旨y理和背景紋理分離,并使文字在橫、撇、豎、捺4個方向的紋理信息得到保持,同時背景區(qū)域的紋理被有效的抑制。
2.2深度學(xué)習(xí)算法基本原理
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究領(lǐng)域中的一個新問題,其目的在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)算法是由深信度網(wǎng)絡(luò)(depth be-lief network,DBN)上的一系列受限玻爾茲曼機(jī)(re-stricted bohzmann machine,RBM)的概率模型組成.深度學(xué)習(xí)算法一般描述過程如下:假設(shè)有一個系統(tǒng)s,它有n層,S1,S2....Sn設(shè)輸入為I,輸出為o,學(xué)習(xí)的一般過程表示為:I=S1=S2,…Sn=O,如果輸出O等于輸入I即輸入I經(jīng)過這個系統(tǒng)變化之后沒有任何的信息損失或者損失很小,可以看作基本上保持不變,這意味著輸入,經(jīng)過每一層Si,都幾乎沒有信息的損失,即任何一層SI,都是原有信息(即輸入i)的另外一種表示,深度學(xué)習(xí)算法的核心思路有:①無監(jiān)督學(xué)習(xí)用于每一層網(wǎng)絡(luò)的預(yù)訓(xùn)練;②每次用無監(jiān)督學(xué)習(xí)只訓(xùn)練其中一層,將其訓(xùn)練結(jié)果作為其高一層的輸入;③用自頂而下的監(jiān)督算法去調(diào)整所有層。
2.3深度學(xué)習(xí)網(wǎng)絡(luò)(DBN)的構(gòu)建
本文采用的深度置信網(wǎng)絡(luò)的深度學(xué)習(xí)算法,是通過一系列受限波爾茲曼機(jī)(RBM)的概率模型組成.Hinton和sejnowski等設(shè)計了一種能夠用在機(jī)器學(xué)習(xí)中的隨機(jī)循環(huán)網(wǎng)絡(luò)一受限波爾茲曼機(jī),它是一種如圖3所示的兩層無向圖模型,包含可視層v和隱藏層h,同時限制同一層節(jié)點之間的連接,而不同的單元層之間有連接。
2.4網(wǎng)絡(luò)訓(xùn)練與權(quán)值調(diào)整
DBN網(wǎng)絡(luò)需要進(jìn)行訓(xùn)練以獲得最佳權(quán)值,通常DBN網(wǎng)絡(luò)訓(xùn)練包括自底向上非監(jiān)督學(xué)習(xí)和自頂向下的監(jiān)督學(xué)習(xí)兩個部分,其過程為先對紋理特征圖像采用RBM進(jìn)行逐層增量學(xué)習(xí),應(yīng)用最大似然估計法不斷地調(diào)整網(wǎng)絡(luò)中權(quán)值,使RBM達(dá)到能量平衡,再用監(jiān)督數(shù)據(jù),對整個DBN網(wǎng)絡(luò)進(jìn)行微調(diào),
在非監(jiān)督學(xué)習(xí)過程中,DBN網(wǎng)絡(luò)中每一個狀態(tài)值都對應(yīng)一層的結(jié)點,計算的輸入輸出數(shù)據(jù)都是對應(yīng)結(jié)點狀態(tài)值為“1”的概率值,而Hn層的輸入向量是每個文字區(qū)域的紋理樣本,通過交替的吉布斯采雍螅作為DBN網(wǎng)絡(luò)的輸入.設(shè)深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)包含n個隱藏層,每層的節(jié)點數(shù)分別是L1,L1,…,LN,紋理特征圖像送入到DBN網(wǎng)絡(luò)中的輸入層Ho層,不斷的調(diào)整Hn和H1,之間權(quán)值Wo,根據(jù)式(8)、(9)將調(diào)整得到的權(quán)值Wn與初始數(shù)據(jù)根據(jù)式(7)計算出一組新的概率送入H1層,作為H1層的輸入數(shù)據(jù).重復(fù)上述計算過程得到WS1,WS1,…,Wn-1最終得到DBN網(wǎng)絡(luò)的初始權(quán)值Wi={Wo,w1,W2,…,Wn-1},DBN網(wǎng)絡(luò)包含n+2層,即H0,H1,H2,…,Hn層和樣本標(biāo)簽數(shù)據(jù)層,其中HSn作為輸入層,其節(jié)點數(shù)為64,標(biāo)簽樣本層為輸出層,中間n層的節(jié)點數(shù)分別是L1,L2,LSn,…采用無標(biāo)注的訓(xùn)練樣本構(gòu)建DBN網(wǎng)絡(luò),以HSo和H1之間的訓(xùn)練為例,HSn和Hn,層構(gòu)成了一個RBM,HN與可見層移的節(jié)點數(shù)相同,H1,與隱藏層h的節(jié)點數(shù)相同,利用交替的吉布斯抽樣來調(diào)整權(quán)值WSn,直到RBM收斂。
在非監(jiān)督學(xué)習(xí)過程中,保存RBM調(diào)整得到的權(quán)值,并作為自頂向下的監(jiān)督學(xué)習(xí)的初始權(quán)值,與監(jiān)督學(xué)習(xí)過程一樣,根據(jù)樣本的標(biāo)注,采用梯度下降法再次微調(diào)權(quán)值,這里,RBM網(wǎng)絡(luò)和DBN網(wǎng)絡(luò)采用同樣的網(wǎng)絡(luò)結(jié)構(gòu),都具有相同的輸入層和隱藏層,包括每層的節(jié)點數(shù)目也都相同,只是DBN網(wǎng)絡(luò)最后還有一個輸出層.DBN網(wǎng)絡(luò)訓(xùn)練過程如圖4所示,
3.形態(tài)學(xué)視頻圖像去噪處理
通過深度置信網(wǎng)絡(luò)法對文本區(qū)域準(zhǔn)確定位后,再根據(jù)字符的特征,采用形態(tài)學(xué)處理方法實現(xiàn)對空洞區(qū)域和孤立點進(jìn)行填充、去噪、腐蝕以及膨脹等操作,最后再將獲得的標(biāo)記二值圖像映射到原圖像,實現(xiàn)清晰背景的文本圖像。
針對圖像中存在的孤立點噪聲問題,通過鄰域背景區(qū)域形態(tài)學(xué)比較,修改標(biāo)記二值圖像中孤立點背景區(qū)域值,實現(xiàn)孤立點去噪處理,如在標(biāo)記二值圖像過程中,由于字符之間存在間隔和中文標(biāo)點符號,經(jīng)過DBN網(wǎng)絡(luò)處理后,該區(qū)域易被判定為背景區(qū)域,此時需要根據(jù)形態(tài)學(xué)法進(jìn)行背景填充,即將背景區(qū)域值“0”修改為文字區(qū)域值“1”,為消除視頻圖像中次要文本區(qū)域的定位,以達(dá)到對視頻中主要文字信息的提取與識別,本文采用了基于形態(tài)學(xué)的圖像腐蝕與膨脹方法。
選用原點位于中心的5×5對稱結(jié)構(gòu)元素作腐蝕和膨脹運(yùn)算,由于腐蝕運(yùn)算,在去除噪聲點的同時,會對圖像中文本區(qū)域的形狀有影響,故在進(jìn)行腐蝕運(yùn)算,去除部分噪聲點后,再進(jìn)行膨脹運(yùn)算以消除腐蝕運(yùn)算之后對文本區(qū)域的影響。
經(jīng)過DBN網(wǎng)絡(luò)、形態(tài)學(xué)去噪處理以及圖像映射后的效果如圖5所示,由圖5所示可見視頻圖像在經(jīng)過訓(xùn)練的DBN網(wǎng)絡(luò)處理后,可以有效定位出字符、文本區(qū)域信息,如圖5(b)所示;而經(jīng)過形態(tài)學(xué)處理后圖像中的噪點和不連續(xù)點被有效去除,獲得清晰的文本區(qū)域圖像,如圖5(c)所示。
4.OCR字符識別及結(jié)果分析
視頻圖像文本區(qū)域定位都是從最底層特征映射出相應(yīng)的頂層特征,依次層層映射,直到得到最頂層的結(jié)果。
通過對DBN網(wǎng)絡(luò)及經(jīng)形態(tài)學(xué)處理后文本區(qū)域,進(jìn)行二值化處理,去除與邊界相連的區(qū)域,將文本域背景黑白反轉(zhuǎn),再送到OCR軟件進(jìn)行識別。圖6所示為圖5中視頻幀圖像中的一段文本區(qū)域的二值反轉(zhuǎn)圖像,圖7為此二值反轉(zhuǎn)圖像經(jīng)OCR識別后的結(jié)果。
將本文提出的逐層增量深度學(xué)習(xí)算法與神經(jīng)網(wǎng)絡(luò)、經(jīng)典Kim方法以及SVM方法對文本區(qū)域的定位作對比.采用式(12)中的查全率(RR)、查準(zhǔn)率(PR)以及系數(shù)F來綜合評價這幾種方法的使用效果。
其中:c為圖像中正確檢測到的文本區(qū)域個數(shù);m為圖像中檢測到的文本區(qū)域總數(shù);n為圖像中實際存在的文本區(qū)域總數(shù);F系數(shù)用來對各個算法性能進(jìn)行綜合排名,是將查全率和查準(zhǔn)率這兩個性能的指標(biāo)線性合并而成。
4.1不同網(wǎng)絡(luò)結(jié)構(gòu)的比較
為研究不同DBN網(wǎng)絡(luò)結(jié)構(gòu)對算法性能的影響,故測試了不同DBN網(wǎng)絡(luò)層數(shù)的性能,實驗結(jié)果如表1所示,測試數(shù)據(jù)表明,隨著網(wǎng)絡(luò)層數(shù)的增加,DBN網(wǎng)絡(luò)的正確率逐步提高,網(wǎng)絡(luò)的逼近能力逐步增強(qiáng),但是,隨著網(wǎng)絡(luò)層數(shù)的增加,網(wǎng)絡(luò)的復(fù)雜度也會不斷的增加,網(wǎng)絡(luò)的泛化力會逐步降低,所以并不是網(wǎng)絡(luò)層數(shù)越多越好,實驗中,認(rèn)為4-DBN網(wǎng)絡(luò)能夠滿足文本區(qū)域的需求,因此后續(xù)實驗選擇4-DBN網(wǎng)絡(luò)為基準(zhǔn)。
4.2與其他方法的比較
通過選用100幅不同背景的視頻幀圖像、字體大小、字體顏色、單行或者多行等情況下,采用如上4種不同方法對文本區(qū)域進(jìn)行定位和對比,測試結(jié)果如表2所示。
從表2的試驗結(jié)果對比可以看出,DBN網(wǎng)絡(luò)文字區(qū)域定位的效果要明顯優(yōu)于其它3種方法,其查全率和查準(zhǔn)率均高于Kim和SVM法,并且其F系數(shù)也是最高的.針對表1中DBN網(wǎng)絡(luò)正確定位的文本區(qū)域總數(shù)378個,總字符數(shù)為5059個,進(jìn)行文本識別實驗,經(jīng)二值化和形態(tài)學(xué)去噪處理后再進(jìn)行OCR識別,表2測試結(jié)果表明,DBN網(wǎng)絡(luò)在文本定位方面與其他3種算法有著明顯的優(yōu)勢.通過正確定位出文本區(qū)域,使對視頻中的文本字符的正確識別率也明顯提高,保障了后續(xù)文本識別的正確率.
【關(guān)鍵詞】小波分析;小波去噪;非平穩(wěn)信號;matlab仿真
Abstract:This paper describes the emergence and development of wavelet analysis, and its principle and mathematical description was given instructions, further illustrates the application principles and methods of wavelet analysis to eliminate noise, this paper focus on the residential noise of non-stationary signals study, carried out the algorithm and simulation results.Key words: wavelet analysis; wavelet denoising; non-stationary signals; matlab simulation
中圖分類號:O29 文獻(xiàn)標(biāo)識碼: A 文章編號:
小波分析是當(dāng)前應(yīng)用數(shù)學(xué)和工程學(xué)科中一個迅速發(fā)展的新領(lǐng)域,經(jīng)過近10年的探索研究,重要的數(shù)學(xué)形式化體系已經(jīng)建立,理論基礎(chǔ)更加扎實。與Fourier變換相比,小波變換是空間(時間)和頻率的局部變換,因而能有效地從信號中提取信息。通過伸縮和平移等運(yùn)算功能可對函數(shù)或信號進(jìn)行多尺度的細(xì)化分析,解決了Fourier變換不能解決的許多困難問題。
小波(Wavelet)這一術(shù)語,顧名思義,“小波”就是小的波形。所謂“小”是指它具有衰減性;而稱之為“波”則是指它的波動性,其振幅正負(fù)相間的震蕩形式。與Fourier變換相比,小波變換是時間(空間)頻率的局部化分析,它通過伸縮平移運(yùn)算對信號(函數(shù))逐步進(jìn)行多尺度細(xì)化,最終達(dá)到高頻處時間細(xì)分,低頻處頻率細(xì)分,能自動適應(yīng)時頻信號分析的要求,從而可聚焦到信號的任意細(xì)節(jié),解決了Fourier變換的困難問題,成為繼Fourier變換以來在科學(xué)方法上的重大突破。有人把小波變換稱為“數(shù)學(xué)顯微鏡”。
一、小波分析原理及其數(shù)學(xué)描述
小波分析是一種窗口大?。创翱诿娣e)固定但其形狀可改變,時問和率窗都可改變的時頻局部化分析方法。即在低頻部分具有較高的頻率分辨率較低的時間分辨率,即在高頻部分具有較高的時間分辨率和較低的頻率分辨使小波變換具有對信號的自適應(yīng)性。
二、小波去噪原理
運(yùn)用小波的多分辨分析特性進(jìn)行信號、圖像的去噪處理是小波分析的重要應(yīng)用之一。
在實際工程中,有用信號通常表現(xiàn)為低頻信號或是一些比較平穩(wěn)的信號,而噪聲信號通常表現(xiàn)為高頻信號。
小波閾值去噪的處理方法一般有以下三種:
1)強(qiáng)制去噪處理。該方法把小波分解結(jié)構(gòu)中的高頻系數(shù)全部變?yōu)榱?,即基于小波分析的車牌識別系統(tǒng)研究把高頻部分全部濾掉,然后在對信號進(jìn)行重構(gòu)處理;這種方法比較簡單,重構(gòu)后的去噪信號也比較平滑,但容易丟失信號的有用成分;
2)閾值去噪處理。該方法利用ddencmp函數(shù)產(chǎn)生信號的默認(rèn)閾值,然后利用wdencmp函數(shù)進(jìn)行去噪處理;
3)給定軟(或硬)閾值去噪處理,閾值往往可以通過經(jīng)驗公式獲得,而且這種閾值比默認(rèn)閾值更具有可信度。
三 、小波去噪的研究
噪聲通常被認(rèn)為是有害信號,一般情況下應(yīng)被抑制,然而,噪聲中也可能包含許多有用信息,如機(jī)電一體化設(shè)備運(yùn)行中所產(chǎn)生的噪聲,就在一定程度上包含了反映其工作情況,狀態(tài)信息或參數(shù)等內(nèi)容,因為這些設(shè)備在運(yùn)行時,其中力、速度、加速度的變化以及振動的振幅、頻率等信息都會以噪聲的形式表現(xiàn)出來。如果能采集、記錄到這樣的噪聲信號并對其進(jìn)行必要的處理,就能從中提取到機(jī)電設(shè)備的工作情況、狀態(tài)參數(shù)等重要信息,還能以此作為我們對其進(jìn)行監(jiān)控的手段之一。利用噪聲信號中的有用信息進(jìn)行機(jī)電設(shè)備的故障診斷或狀態(tài)監(jiān)控,關(guān)鍵之處就是要對它進(jìn)行合適的處理,因為在生產(chǎn)現(xiàn)場所采集到的噪聲信號非常繁雜且數(shù)據(jù)量很大,這其中有不少是無用數(shù)據(jù),若不進(jìn)行處理的話,很難獲得我們想要的信息。在實際的工程應(yīng)用中,所分析的信號可能包含許多尖峰或突變部分,并且噪聲也不是平衡的白噪聲,對這種信號進(jìn)行分析,首先需要作信號的預(yù)處理,將信號的噪聲部分去除,提取有用信號。對這種信號的消噪,傳統(tǒng)的傅里葉變換顯得無能為力,因為傅里葉分析是將信號完全在頻率域中進(jìn)行的,它不能給出信號在某個時間點上的信號變化情況。而小波分析由于能同時在時、頻域中對信號進(jìn)行分析,所以它能有效地區(qū)分信號中的突變部分和噪聲,從而實現(xiàn)信號的消噪。
1、小波分析用于降噪的過程
小波分析用于降噪的過程,可細(xì)分為如下幾段。
1)分析過程:選定一種小波,對信號進(jìn)行N層小波(小波包)分解;
2)作用閾值過程:對分解得到的各層系數(shù)選擇一個閾值,并對細(xì)節(jié)系數(shù)作用軟閾值處理;
3)重建過程:降處理后的系數(shù)通過小波(小波包)重建恢復(fù)原始信號。
這個過程基于下如基本假設(shè),即攜帶信息的原始信號在頻域或小波域的能量相對集中,表現(xiàn)為能量密集區(qū)域的信號分析系數(shù)的絕對值比較大,而噪聲信號的能量譜相對分散,所以其系數(shù)的絕對值小,這樣我們就可以通過作用閾值的方法過濾掉絕對值小于一定閾值的小波系數(shù),從而達(dá)到降噪的效果。
2、用小波分析對非平穩(wěn)信號消除噪聲
在一個方波信號上加入一個高斯白噪聲,再將其分別用小波分析和傅里葉變換進(jìn)行信號噪聲消除。
1)小波基的選擇:
作為小波的函數(shù),它一定要滿足容許條件,在時域一定要是有限支撐的,同時,也希望在頻域也是有限支撐的,但若時域越窄,其頻域必然是越寬,反之亦然。在時域和頻域的有限支撐方面往往只能取一個折中。此外,希望由母小波形成的是兩兩正交的;進(jìn)一步希望有高階的消失矩,希望與相關(guān)的濾波器具有線性相位等等。這里選擇的是sym小波,又稱為正交小波,它是雙正交小波,并是緊支撐的,且接近對稱(故所用的濾波器可接近于線性相位)。
2)小波多尺度分解各子帶系數(shù)的特點及噪聲影響
對圖像的小波變換覆蓋了圖像頻帶90%的小波系數(shù)集中在21、22、23它們包含了大部分圖像信息,所以可以只考慮這三個尺度的信息,而尺度2j> 23 的信息保留在圖像的低頻分量中。隨著層數(shù)的增加,小波系數(shù)的范圍越來越大,說明較低層的小波系數(shù)具有更重要的地位。分辨率最低時,該子帶小波系數(shù)的范圍比別的子帶小波系數(shù)范圍寬,值和方差都比別的要大,說明這些小波系數(shù)同樣具有重要地位。
在各個子帶做特征提取之前,應(yīng)首先考慮圖像中噪聲對子帶系數(shù)的影響。根據(jù)Donoho 的理論對含噪圖像連續(xù)做幾次小波分解之后,由空間分布不均勻的干凈圖像所對應(yīng)的各尺度上小波系數(shù)在某些特定的位置有較大的值,這些點對應(yīng)干凈圖像的畸變位置和重要信息,而其它大部分位置的值較?。粚τ诎自肼暥?,它對應(yīng)的小波系數(shù)在每一尺度上的分布是均勻的,并隨著尺度的增加,系數(shù)的幅值有所減小??梢钥闯?,噪聲的影響主要集中在最高頻子帶中。因此考慮消噪問題時,可根據(jù)噪聲小波分解的系數(shù)的特點找一個合適閾值λ,把低于λ的小波系數(shù)視為主要由噪聲引起的設(shè)為0,而高于λ的予以保留,對最高頻子帶可提高閾值以減少噪聲影響。
參考文獻(xiàn)
[1]胡廣書,現(xiàn)代信號處理教程,清華大學(xué)出版社,2004
[2]徐長發(fā)、李國寬,實用小波方法,華中科技大學(xué)出版社,2001
[3]董長虹,Mablab小波分析工具箱原理與應(yīng)用,國防工業(yè)出版社,2004
[4]小波分析理論與MATLAB實現(xiàn),電子工業(yè)出版社,2005
[5]胡昌華、李國華,基于MATLAB6.X的系統(tǒng)分析與設(shè)計―小波分析,電子工業(yè)出版社,1999
[6]周利清譯,信號處理引論,電子工業(yè)出版社,2005
[7]張建國、孫曉東、張禮勇,基于時頻分析的信號特征提取方法研究,電測與儀表,Vol.42 No.474 Jun. 2005
關(guān)鍵詞:噪聲消除 Matlab Verilog
中圖分類號:TP39 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2013)09-0139-02
1 常用的噪聲消除基本原理
數(shù)字圖像噪聲處理方法大致可分為在空間域處理和在頻率域處理??臻g域噪聲處理方法主要包括:鄰域平均法、中值濾波、多圖像平均法等。頻率域處理方法從狹義上說是指圖像經(jīng)過傅立葉變換(FT),然后利用已設(shè)計好的低通濾波器濾除高頻噪聲;從廣義上說是指圖像經(jīng)過DCT變換或Walsh變換或Wavelet變換后利用每種變換自身特點衰減噪聲。
2 改進(jìn)型領(lǐng)域平均法的MATLAB驗證
本設(shè)計采用的是改進(jìn)型領(lǐng)域平均法,確定其領(lǐng)域范圍為四領(lǐng)域,也就是像素點周圍任意設(shè)定的四個點作為處理對象。并且根據(jù)討論的8領(lǐng)域閾值T的取值范圍,在四領(lǐng)域中取其值為20—50之間的任意一數(shù)。
在實際的處理過程中,噪聲的檢測是將像素點的灰度值分別與相鄰四個點的灰度值進(jìn)行比較,如果它們的灰度差值存在大于閾值T的數(shù)(程序中閾值取為32),那么就認(rèn)為該點為噪聲點。
對改進(jìn)型領(lǐng)域平均法,首先用MATLAB驗證其正確性與可行性。MATLAB處理數(shù)字圖像非常方便。
MATLAB驗證的具體思路:
(1)首先用MATLAB中的rgb2gray將真彩色的圖像轉(zhuǎn)化成灰度圖;
(2)然后利用imnoise函數(shù)給灰度圖像加上椒鹽噪聲,并且將一些固定點值設(shè)定在[0:15]或[240:255]的范圍內(nèi),認(rèn)為其為壞點;
(3)使用函數(shù)dec2bin將加入椒鹽噪聲和固定壞點的圖像的灰度值轉(zhuǎn)化成二進(jìn)制數(shù)據(jù),以便Verilog的數(shù)據(jù)讀入;
(4)編寫程序用MATLAB實現(xiàn)其算法(消噪過程中的閾值取為32)。
從視覺效果來說由領(lǐng)域平均法處理后圖1(a)幾乎看不到有噪聲點,而1(b)中還能看到幾個明顯的噪聲點。由此可以得出的結(jié)論,該算法對加入噪聲點的比例小的圖像處理效果比加入噪聲多的圖像效果要好。下一步將利用Verilog語言來實現(xiàn)其算法。
3 領(lǐng)域平均法的Verilog實現(xiàn)
如(圖2)模塊端口功能說明:Rst——系統(tǒng)復(fù)位信號,在高電平有效;Clk——系統(tǒng)時鐘信號,本實驗中的頻率為10MHz,同時也是數(shù)據(jù)采集信號,Clk的上升沿讀入數(shù)據(jù);Vsync——幀同步信號,在高電平有效;Hsync——行同步信號,在高電平有效;Data_in——輸入圖像數(shù)據(jù);Flag_h——行計數(shù)器屏蔽信號,為了達(dá)到可綜合的功能引入的屏蔽信號;Flag_l——列計數(shù)器屏蔽信號,為了達(dá)到可綜合的功能引入的屏蔽信號;Flag_vh——幀計數(shù)器屏蔽信號,為了達(dá)到可綜合的功能引入的屏蔽信號;Vsync_out——幀輸出信號;Hsync_out——行輸出信號;Data_out——處理完后輸出圖像數(shù)據(jù);
幾個寄存器變量:vcounter——幀計數(shù)變量;hcounter —— 行計數(shù)變量;lcounter —— 列計數(shù)變量。
本程序中對于vcounter,hcounter采用異步復(fù)位在rst的上升沿的時候置為0,而lcounter以及寄存器m,n,p,q,i,j采用的是同步復(fù)位??梢院芮宄孛靼酌總€信號上升沿時刻各變量的變化:在幀選擇信號vsync和行選擇信號hsync上升沿,分別對幀計數(shù)變量vcounter、行計數(shù)變量hcounter和列計數(shù)變量lcounter執(zhí)行相應(yīng)的變化;在時鐘信號clk上升沿時,如果幀同步信號vsync和行同步信號hsync均有效,則讀入數(shù)據(jù),根據(jù)行計數(shù)變量hcounter的值不同,選擇所讀入數(shù)據(jù)的存儲;并且在時鐘信號clk上升沿,若在有效像素區(qū)域內(nèi),則執(zhí)行所采用的消噪算法,進(jìn)行鄰域比較和鄰域平均賦值。
由于4鄰域平均法,只有知道三行的數(shù)據(jù)才能用鄰域平均值替代中間行的原灰度值,因而設(shè)定兩個行存儲器mem_1和mem_2,而且隨著處理的進(jìn)行,這兩個行存儲器必須往下循環(huán)賦值:即在輸出第二行數(shù)據(jù)時,mem_1記錄第一行數(shù)據(jù),mem_2記錄第二行數(shù)據(jù);輸出第三行數(shù)據(jù)時,mem_1記錄第二行數(shù)據(jù),mem_2記錄第三行數(shù)據(jù);……直至輸出第M行數(shù)據(jù)時,mem_1記錄第M-1行數(shù)據(jù),mem_2記錄第M行數(shù)據(jù)。
當(dāng)行計數(shù)變量hcounter=1時,將數(shù)據(jù)存入存儲器mem_1;當(dāng)行計數(shù)變量hcounter=2時,將數(shù)據(jù)存入存儲器mem_2;當(dāng)行計數(shù)變量hcounter>=3時,數(shù)據(jù)直接讀入寄存器reg_x,處理完之后,將該寄存器的數(shù)據(jù)存入存儲器mem_2,而mem_2中原來的數(shù)據(jù)存入存儲器mem_1中。通過這樣的賦值,可以一直記錄下待處理行和上一行的數(shù)據(jù),加之最新讀入的下一行數(shù)據(jù),就可以采用4鄰域平均法進(jìn)行處理了。
本文主要研究了圖像識別在軸承孔徑檢測中的應(yīng)用,通過對實驗結(jié)果進(jìn)行分析,找到有效提高傳感器成像精度、減小噪聲等方法來改進(jìn)傳感器采集數(shù)據(jù)質(zhì)量和提升系統(tǒng)分辨率。通過實驗分析出其中存在問題,并將其改進(jìn),從而獲得更加準(zhǔn)確和有價值信息。本課題的難點:由于機(jī)器視覺系統(tǒng)屬于非線性體敏感元件,而傳統(tǒng)意義上線性變換是非平穩(wěn)隨機(jī)過程;線性規(guī)劃方法也無法解決非連續(xù)優(yōu)化性問題。
1.1 軸承孔徑檢測系統(tǒng)的組成
在工程中,軸承孔徑檢測系統(tǒng)主要由三個部分組成:圖像采集模塊、背景信息提取模塊和實驗數(shù)據(jù)處理與分析平臺。圖像獲取是指通過各種傳感器來獲得所需的運(yùn)動參數(shù)。該過程可用于實時監(jiān)測并對其進(jìn)行量化研究;預(yù)處理包括濾波重建及邊緣提取等操作;由于噪聲干擾,在實際應(yīng)用中通常需要將軸承孔徑信號。本文研究的內(nèi)容是圖像識別在軸承孔徑檢測中,主要包括了預(yù)處理。將灰度變換、邊緣提取和邊緣定位等相關(guān)方法進(jìn)行集成。二值化。對波峰產(chǎn)生過程進(jìn)行分析,并確定閾值選擇原則;根據(jù)噪聲標(biāo)準(zhǔn)信號來判斷是否有噪音出現(xiàn);然后通過模板匹配技術(shù)實現(xiàn)圖像的輪廓與特征分離以達(dá)到最佳識別效果,從而保證后續(xù)工作順利進(jìn)行。攝像機(jī)用于記錄運(yùn)動物體(如軸或盤)在空間中走勢,并控制其向投影,拍攝所需要的圖片,同時采集每個像素點對應(yīng)于該載體上所有對象位置信息;鏡頭通過攝像頭收集到數(shù)據(jù)后傳送給處理器進(jìn)行計算運(yùn)算;計算機(jī)則將圖像處理結(jié)果實時地存放在內(nèi)存上以待識別系統(tǒng)分析的時間周期內(nèi)。
1.2 孔徑測量
孔徑測量的方法有很多種,例如:光學(xué)傳感器法、紅外探測器技術(shù)和磁粉檢測器法等等。但其應(yīng)用范圍比較廣泛。光學(xué)傳感器是用來對太陽光進(jìn)行折射或反射的種非接觸式測角儀器;光電轉(zhuǎn)換器件將被轉(zhuǎn)化為電信號輸出;在一些特殊場合下也可以使用孔徑測量儀來測量軸上或者偏心位置,如:激光探傷、電磁感應(yīng)檢測等都可用于孔徑測定和精密度??讖綔y量是一種對物體表面的徑向或軸心進(jìn)行無接觸式稱重方法。其工作原理為:首先由傳感器獲取待測零件在不同位置上的垂直方向和水平方向上兩部分,并記錄下數(shù)據(jù),然后將這兩個數(shù)值計算平均值得到該平面內(nèi)任意點對應(yīng)0-1m圖像。根據(jù)測得結(jié)果確定出所需檢測孔數(shù)及尺寸后即可測量徑值或軸心直徑等參數(shù)作為參考依據(jù)可進(jìn)行定位、標(biāo)定工作。為了提高孔徑檢測的精確度,需要對運(yùn)動著、結(jié)構(gòu)復(fù)雜且有嚴(yán)格要求工件加工位置進(jìn)行準(zhǔn)確測量。通常采用的是光學(xué)掃描方式來獲取孔徑信息。但是由于相機(jī)在拍攝過程中可能會存在曝光誤差等因素導(dǎo)致其成像不夠精確,所以通過圖像處理方法獲得了較好的精度和分辨率后就可以利用投影法或其他形態(tài)學(xué)方法實現(xiàn)孔徑檢測工作,即基于空間分析特征提取出有效地、完整且可描述的邊緣區(qū)域并對這些輪廓進(jìn)行準(zhǔn)確識別以作為最終孔徑信息。
1.3 圖像成像
本文使用的圖像預(yù)處理算法是基于Matlab軟件開發(fā)平臺所提供。該程序首先通過對運(yùn)動目標(biāo)進(jìn)行測量,將采集得到的數(shù)據(jù)導(dǎo)入到計算機(jī)中,然后經(jīng)過解算后獲得了最終模型。在整個過程中采用的是變換域法來完成圖像成像:①先把待拍攝物體分割成不同區(qū)域;②再根據(jù)輪廓形狀特征選擇相應(yīng)像素點;③最后再掃描所有傳感器獲取完整圖像并計算出投影面積和相干長度從而形成一個新圖象。圖像處理和成像的目的都是為了獲得清晰、完整的目標(biāo)信息。在實際應(yīng)用中,我們通常采用兩種方式實現(xiàn):(1)將待測物體放在光學(xué)系統(tǒng)上。由于灰度分布是不均勻性因素存在于其中,所以一般情況下無法進(jìn)行標(biāo)定校準(zhǔn);(2)用一定半徑長度或?qū)挾缺瘸吡砍鲆粋€點或一組圖像來表示圖像對象特征信息的過程稱為成像。在這個過程中可根據(jù)需要通過不同方法處理得到所需結(jié)果。在對不同的圖像進(jìn)行處理后,我們可以得到不同特征值對應(yīng)其灰度級分布情況。通常,將待測樣品按照一定比例放置于相應(yīng)區(qū)域中。但是由于實際測量過程中會受到噪聲干擾影響信號質(zhì)量及邊緣位置變化等信息難以獲取時效性較差、同時成像效果也有很大差異:因此在這種情形下需要使用到的是基于特定方式來實現(xiàn)圖像預(yù)處理的方法,一般常用特征值對應(yīng)點表示為灰度級分布函數(shù),即Q=1/XRL)*Str。
1.4 圖像傳感器與信號
目前,傳感器技術(shù)已經(jīng)在廣泛的應(yīng)用,其功能是向特定方向發(fā)展,包括從不同角度來收集信息。如:將圖像信號轉(zhuǎn)換成數(shù)字量進(jìn)行處理;通過對傳感器輸出的模擬電壓或電流變換到相應(yīng)頻率電路中所需形式等過程獲得輸入信號。在實際工作情況下通常采用兩種方式實現(xiàn)傳感器與待測物體之,間準(zhǔn)確、快速地傳遞數(shù)據(jù)和實時響應(yīng)速度以及準(zhǔn)確性要求(即高精度),這就是常用的幾種動態(tài)信息采集。由于不同的傳感器,其工作原理也不相同。紅外檢測器:通過對紅外光信號進(jìn)行調(diào)制,使之成為紅外線發(fā)射/接收裝置所需要使用到的設(shè)備或器件(如測溫儀、計算機(jī)),微波探頭:由特殊材料制成且采用對稱放置構(gòu)成并能與外部電路連接而成一個整體結(jié)構(gòu)系統(tǒng)。該探測元件可用于對不同波長和振動頻率范圍內(nèi)物體的監(jiān)測,也可以檢測出內(nèi)部溫度變化及外部磁場強(qiáng)度等信號,具有較高靈敏度。信號處理的目的是為了獲得有用信息,圖像傳感器則主要用來獲取運(yùn)動物體或振動系統(tǒng)中被測對象的外部特征。目前,國內(nèi)外常用的是一種用于測量和控制圖像采集設(shè)備。這種方法可以在一定程度上降低對灰度值變化敏感而引起噪聲干擾等問題;但由于在某些場合下需要檢測目標(biāo)與背景之間距離較遠(yuǎn)時使用該方式會產(chǎn)生較大誤差從而導(dǎo)致其精度不夠高。
2圖像識別在軸承孔徑檢測中的應(yīng)用
2.1 圖像識別實驗
圖像處理的硬件平臺是整個系統(tǒng)中最重要部分,它主要由計算機(jī)和攝像頭組成。機(jī)器視覺技術(shù)應(yīng)用到了大量的理論知識。然而這些理論在實際生產(chǎn)生活中是不常用得。因此需要開發(fā)軟件來幫助實現(xiàn)圖像識別等問題上一步步進(jìn)行解決,使其能夠更好地服務(wù)于工程領(lǐng)域并為其他學(xué)科提供一定參考價值和實用性作用;同時也可以將一些基本概念引入硬件平臺中去,如攝像機(jī)、投影儀與計算機(jī)網(wǎng)絡(luò)等等設(shè)備都可成為實驗數(shù)據(jù)采集的一部分用于檢測系統(tǒng)誤差信號。本文所設(shè)計的圖像識別系統(tǒng),硬件平臺主要由RGB傳感器。該設(shè)備是通過光電檢測芯片和三極管組成。在這個裝置中,我們可以看到三個元器件分別對準(zhǔn)模進(jìn)行放大、調(diào)制以及匹配處理后形成一個完整的波形信號通道,同時也會將其中一個元件作為輸入?yún)?shù)添加到輸出模塊當(dāng)中去并且輸出相應(yīng)的結(jié)果信息以供后續(xù)使用。圖像處理技術(shù)是基于機(jī)器視覺的,通過數(shù)字信號處理和分析,利用計算機(jī)進(jìn)行計算來提取所需要信息。在實驗中用到了很多噪聲檢測算法:均值濾波法、線性卡爾曼濾波方法、神經(jīng)網(wǎng)絡(luò)等;其中FIRP濾波器可以直接對輸入信號做差分運(yùn)算來獲得我們想要得到的樣本數(shù)據(jù);SCTI算法就是一種基于特征點跟蹤技術(shù)而產(chǎn)生的圖像處理模塊,該系統(tǒng)采用的是一個訓(xùn)練好和適應(yīng)能力強(qiáng)于傳統(tǒng)計算機(jī)相比。
2.2 圖像識別系統(tǒng)測量誤差補(bǔ)償
由于相機(jī)的尺寸和位置,圖像采集裝置采用了傾斜放置,雖然在一定程度上可以保證拍攝質(zhì)量。但同時也帶來一些問題。如相機(jī)與傳感器之間距離過近或者存在耦合等都會造成噪聲干擾;其次是對數(shù)據(jù)分析過程中產(chǎn)生偏差導(dǎo)致采樣頻率過高或不連續(xù)的現(xiàn)象等等;因此對于這些影響因素需要進(jìn)行更嚴(yán)格地控制以達(dá)到最佳效果并確保實驗結(jié)果準(zhǔn)確可靠度和分辨率等性能指標(biāo),由于相機(jī)的分辨率在不同級別,所以采集到的圖像質(zhì)量會有所差異。因此需要對所拍攝得到得圖像進(jìn)行處理,首先是預(yù)處理。將鏡頭轉(zhuǎn)換成兩個低頻信號(1)和中高頻信號(2)兩種頻率分別對應(yīng)于高通濾波器上;然后利用數(shù)字采樣法先去除噪聲后再去噪濾波;接著通過算法計算兩幅圖片在不同通道下輸出時的信噪比,從而獲得軸承孔徑檢測所需要的圖像信息數(shù)據(jù)。在對采集到的實驗樣本進(jìn)行了預(yù)處理之后,需要將圖像中的噪聲信號與待檢測樣品之間建立一個映射關(guān)系,這樣能夠方便我們獲取所要研究的是什么樣形信號。而這個映射是由濾波算法產(chǎn)生出來。一般情況下選取合適閾值來選擇出最佳閾值從而達(dá)到目的效果;然后再使用濾波器把得到的匹配結(jié)果和目標(biāo)函數(shù)求取其中最優(yōu)參數(shù)作為參考函數(shù)進(jìn)行計算處理。
2.3 軸承孔徑圖像質(zhì)量檢驗
首先,通過圖像處理軟件進(jìn)行預(yù)處理,得到的二維數(shù)組中有大量背景值。經(jīng)過濾波和二值化操作后。先對噪聲系數(shù)取一定范圍內(nèi)作為測試樣本集(標(biāo)準(zhǔn)組)為2/3左右;然后再去去除最大值或者最小部分?jǐn)?shù)據(jù)點(即閾值得大小)為零以及其他特征向量不為0或缺失的干擾信息之后,利用迭代算法確定出一個合適且穩(wěn)定地時間間隔來進(jìn)行性能測試實驗。在高分辨率的測量設(shè)備中,邊緣輪廓是圖像處理和識別系統(tǒng)最關(guān)鍵的部分,同時也是提取特征參數(shù)、分類等過程所必需要考慮到問題。首先進(jìn)行的是邊緣輪廓提取。因為該實驗需要對不同位置下對應(yīng)目標(biāo)區(qū)域內(nèi)灰度值做兩次掃描。由于背景噪聲會影響待測零件表面信息點所在平面與邊界處實際情況之間存在一定程度上的偏差,因此我們可以通過圖像中邊緣區(qū)域來識別出該部位的輪廓特征參數(shù)。通過對不同的圖像處理算法進(jìn)行對比,實驗結(jié)果表明:本文提出了一種新的基于核函數(shù)濾波和閾值法相結(jié)合來檢測孔徑缺陷。這種方法能夠在保證邊緣信息質(zhì)量前提下減少計算量。由于測試時采用的是雙通道窗口成像方法,所以只需將兩個灰度級上相同位置點作為目標(biāo)區(qū)域即可;而對于兩幅圖片而言則需要通過不同算法中圖像處理步驟進(jìn)行分析比較。
3軸承孔徑檢測算法研究
3.1基于邊緣檢測的圖像算子
通過上述實驗可以看出,本文所提出的幾種誤差模型都各有自己存在的問題。對于圖像處理中出現(xiàn)了噪聲和背景度差值偏差等。為了提高檢測時對運(yùn)動目標(biāo)輪廓進(jìn)行識別而產(chǎn)生過采樣頻率這一不足之處,我們選擇在主成分分析中用到線性平穩(wěn)特征提取方法來消除噪聲;其次是算法速度快、精確度高以及運(yùn)算時間短等優(yōu)點可以有效地降低這些缺點并減少誤差;同時還考慮到本文所提出來的幾種模型都各有優(yōu)劣和缺點。本文利用Matlab中的T-P圖像處理工具箱進(jìn)行了實驗,在MATLAB軟件平臺下,對所提方法與算法都有一定程度.上的仿真驗證。首先通過圖像分割和目標(biāo)定位可以將待測軸承孔徑檢測分為兩部分:第一是邊緣提取。第二則是軸向灰度校正過程、最終得到粗確定值后就可利用中英文曲線平滑識別出該軸承孔徑大小;而對于圖像二值化處理之后再進(jìn)行精減法便只需去除輪廓中心。
3.2基于邊緣檢測的孔徑圖像分割算法研究與改進(jìn)
在實驗中,由于圖像處理技術(shù)的限制,對一些有缺陷(噪聲)的物體進(jìn)行識別時存在較大誤差。比如說:邊緣特征點可能與實際情況不符。這些現(xiàn)象產(chǎn)生原因是不同類型和層次上都會影響到目標(biāo)信息提取結(jié)果;同時也是因為某些因素引起了灰度值變化導(dǎo)致最終得到的是一個個空洞信號而不是真實狀態(tài)下所形成的所有圖像信息等等問題,但在實驗中卻很少有被考慮過),由于圖像處理過程中,所產(chǎn)生的缺陷與圖片上存在畸變,所以在實際應(yīng)用當(dāng)中也會導(dǎo)致識別結(jié)果不準(zhǔn)確。而這種問題是由不同程度的噪聲引起。一般情況下都將其歸結(jié)為兩類:第一類為背景差錯;第二類為偽目標(biāo)物體邊緣輪廓處附近像素點之間出現(xiàn)重疊現(xiàn)象或者圖像區(qū)域內(nèi)某一位置灰度值變化時該部位發(fā)生突變或產(chǎn)生模糊等一系列原因造成的。在圖像處理過程中,由于一些非本質(zhì)性的缺陷,或者是噪聲干擾等。這也可能導(dǎo)致我們無法確定是否存在著某種特定缺陷。因此當(dāng)這些具有明顯特征物體被發(fā)現(xiàn)之后并不是很準(zhǔn)確。但是通常情況下都會有一個重要參數(shù)叫做閾值(O、R或T)來表示目標(biāo)區(qū)域的形狀變化和其相對位置上圖像所含信息量大小以及方向性等等性質(zhì)。因為圖像的灰度值不同,所以在實際應(yīng)用中,對目標(biāo)物體進(jìn)行邊緣檢測時也會出現(xiàn)一定程度上的噪聲干擾。因此為了消除這種影響通常采用去除背景和增強(qiáng)、消噪以及二值化等方法來處理。(1)先添加小波分解為前景基函數(shù)后再將其去除掉;(2)再加入與邊界條件相同或一樣的元素然后再次去預(yù)處理,從而達(dá)到目的圖像中目標(biāo)物體灰度值變化不大或者無明顯波動。
3.3軸承孔徑檢測試的特點
在測試的過程中,我們會遇到不同大小、形狀和角度的孔徑檢測結(jié)果。不同尺寸和深度,其對應(yīng)于各個方面能力都有區(qū)別。因此需要對圖像進(jìn)行處理。首先是濾光圈參數(shù)測量:通過灰度值來判斷是否存在噪聲干擾;其次就是平滑鏡窗口選擇:使用邊緣算子(LM)去噪后得到一個合適的標(biāo)準(zhǔn)函數(shù);最后的是閾值確定與實際誤差計算中常用到的方法一樣。在實際檢測過程中,由于圖像的灰度值和噪聲都會有一些變化,所以當(dāng)我們使用傳統(tǒng)方法去測定時就不能準(zhǔn)確地確定圖像中心。但是利用計算機(jī)成像技術(shù)可以精確識別出所需要特征的位置??煽匦詮?qiáng):因為該算法是通過對待測信號進(jìn)行參數(shù)估計來分析待檢孔徑尺寸并最終得到其大小與方向;而且它還能自動選擇最佳閾值和最理想邊緣點等,這使得檢測過程中能夠快速準(zhǔn)確地確定測量結(jié)果。體積小,重量輕。檢測時,只需將圖像的中心位置改變一下就可以了。而且不用對整個過程進(jìn)行拆卸和移動便可直接測量出孔徑尺寸參數(shù);效率高、便于實現(xiàn)自動化生產(chǎn)等特點均不需要借助專用工具或設(shè)備就能完成工作操作及自動校正性能強(qiáng)于傳統(tǒng)人工測定精度水平上也很突出且顯著優(yōu)勢之一。但由于不同形狀和大小的物體之間存在著各種差異,所以檢測結(jié)果肯定會有較大差別。
4總結(jié)與展望
4.1全文結(jié)論
本文通過研究圖像識別在軸承孔徑檢測的應(yīng)用,介紹了一種新的基于矢量量化特征提取方法一投影尋蹤法。首先對傳統(tǒng)輪廓定位和小波變換進(jìn)行分析;然后用兩種近景差分割算法分別處理兩幀與多幅減運(yùn)動目標(biāo)下得到不同灰度值、不同方向(或線性)尺度上多個前景窗口大小及歸一化后各個背景圖像。利用高斯濾波消除前景中局部平坦區(qū)域的噪聲,本文以圖像識別和軸承孔徑檢測為研究對象,對運(yùn)動的攝像機(jī)拍攝了彩色識別的運(yùn)動鏡頭,并在MATLAB仿真軟件中,使用Matlab進(jìn)行編程實現(xiàn)了基于核函數(shù)法、核函數(shù)法以及矩量密度方法等基本理論。將背景差分變換與線性擬合相結(jié)合來處理背景信息。同時也考慮到不同相機(jī)所拍圖像存在著邊緣區(qū)域和畸變率范圍內(nèi)信號之間的差異性;在對攝像機(jī)運(yùn)動狀態(tài)估計時。
關(guān)鍵詞:邊緣檢測;大壁虎腦組織切片;顯微圖像;檢測算子
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A
文章編號:1004-373X(2008)10-148-03
Study of Edge Detection Operators in Micrograph of Gecko′s Brain Tissue Slice
ZHU Suping1,2,DAI Zhendong1
(1.Institute of Bio-inspired Structure and Surface Engineering,Nanjing University of Aeronautics and Astronautics,Nanjing,210016,China;
2.College of Mechanical and Electrical Engineering,Nanjing Univesity of Aeronautics and Astronautics,Nanjing,210016,China)
Abstract: In order to detect the edge of micrograph of Gecko′s brain tissue slice. Basic operators which are frequently used and studied,a micrograph of Gecko′s brain tissue slice edge processing by VC++6.0,and the characteristics of these methods on the image edge detection are compared.The result tells that Canny operator gets more accurate edge,but at the same time,it may slip some edge and detail.Considering synthesis,Canny operator is good for this kind of picture.
Keywords:edge detection;Gecko′s brain tissue slice;micrograph;detective operator
在研究壁虎仿生機(jī)器人的過程中,確定壁虎運(yùn)動行為與腦部皮層區(qū)域的對應(yīng)控制關(guān)系是關(guān)鍵,文中運(yùn)用邊緣檢測技術(shù)對壁虎腦切片顯微圖像進(jìn)行處理。圖像邊緣是圖像基本特征之一,他蘊(yùn)含了圖像豐富的內(nèi)在信息,并廣泛應(yīng)用于圖像分割、圖像分類、圖像配準(zhǔn)和模式識別中。邊緣檢測是數(shù)字圖像處理中非常關(guān)鍵的組成部分,其目的是精確定位邊緣同時較好地抑制噪聲。傳統(tǒng)的邊緣方法常用的算子有 Roberts算子[1]、Sobel算子[2]、Prewitt算子[3]和Kirsch算子[4],LOG算子[5],此后又提出了許多新的技術(shù),其中突出有Canny的最佳邊緣檢測[6-8]、統(tǒng)計濾波檢測[9]、數(shù)學(xué)形態(tài)學(xué)[10]以及隨斷層技術(shù)興起的三維邊緣檢測。但對不同圖像沒有一個通用最佳檢測算子,應(yīng)根據(jù)具體圖像選用不同檢測方法。
顯微圖像是指將組織、細(xì)胞制成染色切片或涂片在顯微鏡下所看到的圖像。本文采用的切片是首先用蘇木精加伊紅將大壁虎腦組織染色,再用冷凍切片技術(shù)制作而成。人工處理顯微圖像不僅費時費力,而且采集數(shù)據(jù)的精度較低,數(shù)據(jù)不易保存和跟蹤處理。電子顯微圖像的采集分析主要通過高倍顯微鏡獲取原始圖像,然后由圖像采集系統(tǒng)(主要包括CCD 數(shù)碼相機(jī)和圖像采集卡) 把圖像數(shù)據(jù)傳入計算機(jī),然后進(jìn)行圖像處理和識別。
對幾種不同的邊緣檢測算子(Roberts算子、Sobel算子、Prewitt算子、LOG算子、Canny算子)進(jìn)行研究,分析各算子的不同,并對顯微圖像進(jìn)行邊緣檢測,總結(jié)出各種算子的精度及在檢測中算子選定的參考條件。文中所有算法的實現(xiàn)與實驗都用VC++6.0實現(xiàn)。
1 邊緣檢測
1.1 一階微分算子
設(shè)圖像灰度函數(shù)為f(x,y),x,y為像素坐標(biāo),f(x,y)為圖像灰度的梯度見式(1)。則梯度的大小和方向由式(2)和(3)計算得到:
ИЙf=(f/x,f/y)(1)
f=(f/x)2+(f/y)2(2)
θ=tan-1f/yf/x(3)И
Roberts提出的算子在2×2鄰域計算對角導(dǎo)數(shù),圖像上的點(x,y)的梯度的幅度是用方向差分的均方值來近似的:
[HT5",6]Йf=(f(x,y)-f(x+1,y+1))2+(f(x,y+1)-f(x+1,y))2(4)И
Sobel和Prewitt提出了類似的計算偏微分估計值的方法,用梯度算子計算每一像素點的8鄰域內(nèi)梯度估計值。Sobel算子和Prewitt算子分別計算水平方向x的梯度分量Sx和Px,以及垂直方向y的梯度分量Sy和Py,最后求出梯度S,P。
ИSx={f(x+1,y-1)+2f(x+1,y)+f(x+1,y+1)}
-{f(x-1,y-1)+2f(x-1,y)+f(x-1,y+1)}(5)
Sy={f(x-1,y+1) +2f(x,y+1)+f(x+1,y+1)}
-{f(x-1,y-1)+2f(x,y-1)+f(x+1,y-1)}(6)
S= S2x + S2y (7)И
取適當(dāng)閾值T,當(dāng)S>T,該點為邊緣點。
ИPx={f(x+1,y-1)+f(x+1,y)+f(x+1,y+1)}
-{f(x-1,y-1)+f(x-1,y)+f(x-1,y+1)}(8)
Py={f(x-1,y+1)+f(x,y+1)+f(x+1,y+1)}
-{f(x-1,y-1)+f(x,y-1)+f(x+1,y-1)}(9)
P= P2x +P2y (10)И
取適當(dāng)閾值T,當(dāng)P>T,該點為邊緣點。
在實際應(yīng)用中,常用簡單的卷積核來計算方向差分,不同算子對應(yīng)不同的卷積核,如圖1所示 (標(biāo)注“•”的是當(dāng)前像素的位置)。
[HT5”]И1.0
0-1 0.1
-10
[HT6](a) Roberts算子[HT5"SS]
Sx= -101
-20.2
-101,Sy= -1-2-1
00.0
121
[HT6](b) Sobel算子[HT5"SS]
Px= -101
-101
-101,Py= -1-1-1
000
111
[HT6](c) Prewitt算子И
[HT5"K]圖1 一階微分算子的卷積核
1.2 二階微分算子
前面都是利用邊緣處的梯度取得最大值(正的或者負(fù)的),也就是灰度圖像的拐點位置是邊緣。然而,在拐點位置二階導(dǎo)數(shù)是0。所以也可以通過尋找二階導(dǎo)數(shù)的零交叉點來尋找邊緣。二元函數(shù)f(x,y)的Laplace變換定為:
ИЙ2f=(氮x2+氮y2)f(x,y)=f(x,y)x2+f(x,y)y2(11)И
與和前面的梯度算子一樣,這里也是選擇一個模板,然后利用模板進(jìn)行卷積求離散Laplace 變換,然后通過尋找零交叉點尋找邊緣點。在Laplace 變換之前先用高斯濾波進(jìn)行圖像平滑,圖2為編成所用的5×5為Gauss-Laplace算子卷積核。
[HT5”]И00-100
0-1-2-10
-1-216.-2-1
0-1-2-10
00-100И
[HT5"K]圖2 5×5高斯-拉普拉斯模板
1.3 Canny算子
Canny算子實現(xiàn)步驟如下:
(1) 在定位和檢測前濾除噪聲選用高斯濾波器,選擇合適參數(shù)實現(xiàn)高斯平滑;
(2) 用梯度算子增強(qiáng)邊緣:使用sobel梯度算子計算每一像素點的梯度估計值;
(3) 計算方向角:用Sobel梯度算子算得水平方向梯度分量Sx和垂直方向梯度分量Sy,方向角計算式為:
ИЕ=arctan(Sy/Sx)(12)И
(4) 方向角規(guī)范化:對圖像中每個像素只有4個可能的方向與鄰點相連:0°(水平方向)、45°(正對角線)、90°(垂直方向)、135°(負(fù)對角線),邊緣方向必是這4種中最接近的一種。方向角被規(guī)范到以下4個角度:
0°: 0°~22.5 °,157.5 °~180 °
45 °: 22.5 °~67.5 °
90 °: 67.5 °~112.5 °
135 °: 112.5 °~157.5 °
(5) 非最大化抑制:遍歷邊緣點,若該點在方向角方向上是梯度值最大,則保留;否則將該點從邊緣點集合中去除,運(yùn)算結(jié)果將得到一幅細(xì)線圖;
(6) 雙閾值分割:選定2個梯度閾值,一個高閾值TH,一個低閾值TL,通常取TH為TL的2~3倍。先從邊緣點集合中去除梯度值小于高閾值的像素點得邊緣點集合F,再處理梯度介于高低閾值之間的像素點集合M,若F中一點在M中有鄰點,則將該點加入F,最終得到的集合F就是邊緣點集合。
2 大壁虎腦組織切片顯微圖像的實驗結(jié)果及分析
Roberts算子定位比較精確,但由于直接計算圖像差分不包含平滑,所以不能抑制噪聲,對具有陡峭的低噪聲圖像有較好提取效果;Sobel算子和Prewitt算子都是對圖像進(jìn)行差分合乎濾波,只是平滑部分的權(quán)值有區(qū)別,這兩個算子對灰度漸變低噪聲的圖像有較好的檢測效果,但對于本文試驗所用圖染色不均勻,各種噪聲混合的復(fù)雜情況,處理效果就不那么理想了;LOG算子對噪聲的敏感性比一階微分算子大,且不能提供邊緣的方向信息,而主要用于抑制邊緣像素;Canny算子是線性濾波邊緣檢測法中最具代表性的方法之一,也是檢測階躍型邊緣效果較好的算子之一,他比上述其他幾種算子的去噪能力都要強(qiáng),但容易平滑掉一些有效的邊緣和細(xì)節(jié),其整體效果要優(yōu)于其他算子。實驗結(jié)果如圖3所示。
圖3 實驗結(jié)果(最終結(jié)果經(jīng)過去色處理轉(zhuǎn)為灰度圖)
3 結(jié) 語
由于本文采用的圖片為染色組織的顯微圖像,染色效果與拍攝時噪聲混入不可控的,所以無法理論上決策何種算法適合。各種不同的算子對同一幅圖像會產(chǎn)生完全不同的邊緣提取效果。通過試驗發(fā)現(xiàn)針對這組圖像,經(jīng)典的微分算子算法相對簡單,但精度不夠高,其中Sobel算子和Prewitt算子的檢測效果明顯要優(yōu)于Roberts算子,但邊緣不夠連續(xù)、細(xì)銳,LOG算子對噪聲太敏感,而且常產(chǎn)生許多虛假邊緣,故不適合該組圖像的檢測。Canny算子的精度明顯優(yōu)于經(jīng)典微分算子,能檢測出圖像比較細(xì)的邊緣,濾去虛假邊緣。邊緣檢測在醫(yī)學(xué)圖像處理中占有極其重要的地位,由上面的實驗分析可以知道,每種算子都有一定的優(yōu)缺點,對不同的圖像應(yīng)分析具體情況,選用合適的算子。
參 考 文 獻(xiàn)
[1]Roberts L D.Machine Perception of Three-Dimension Solids[C].Optical and Electro-Optimal Information Processing,Cambridge,MA:MIT Press,1965:157-197.
[2]Sobel L.Camera Models and Machine Perception[D].Stanford University,Standford,CA,1970.
[3]Prewitt J.Object Enhancement and Extraction[M].Picture Process. Psychopict,New York:Academic Press,1970.
[4]Kirsch puter Determination of the Constituent Structure of Biological Images[J].Computer and Biomedical Research,1971,18:113-125.
[5]Lunscher W H,Beddoes M P.Optimal Edge Detector Design I:Parameter Selection and Noise Effects[J].IEEE Trans.Pattern Analysis and Machine Intelligence,1986:164-177.
[6]Demigny D.On Optimal Linear Filtering for Edge Detection[J].IEEE Trans.Image Processing,2002,11(7):728-737.
[7]梅躍松,楊樹興,莫波.基于Canny算子的改進(jìn)的圖像邊緣檢測方法[J].激光與紅外,2006,36(6):501-503.
[8]張斌,賀賽先.基于Canny算子的邊緣提取改善方法[J].紅外技術(shù),2006,28(3):165-169.
[9]王新成.高級圖像處理技術(shù)[M].北京:中國科學(xué)技術(shù)出版社,2000.
[10]薛繼偉,張問銀,陳冬芳,等.基于數(shù)學(xué)形態(tài)學(xué)的圖像濾波方法[J].大慶石油學(xué)院學(xué)報,2003,27(4):48-50.
作者簡介 諸素萍 女,1984年出生,江蘇南通人,碩士研究生。研究方向為仿生機(jī)械設(shè)計。