公務員期刊網 論文中心 正文

計算機視覺中深度學習的應用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了計算機視覺中深度學習的應用范文,希望能給你帶來靈感和參考,敬請閱讀。

計算機視覺中深度學習的應用

摘要:闡述計算機視覺借助攝影機與計算機取代人眼對事物進行識別、觀察和分析的一種機器視覺,深度學習技術在很大程度上促進計算機視覺的發(fā)展,探討計算機視覺領域中的深度學習技術的應用實例。

關鍵詞:計算機工程;視覺領域;深度學習技術

引言

計算機視覺簡言之即是依靠電子設備成像來代替生物視覺系統(tǒng),隨后依靠提前寫好的程序對獲取的圖像信息實施處理。該技術的短期應用目的在于完成相對簡單的智能視覺工作,而深度學習技術在計算機視覺領域的應用,在很大程度上豐富了其功能,提高了識別效率,讓其能夠在更多行業(yè)發(fā)揮出自身價值。

1計算機視覺領域的深度學習技術

1.1圖像分類中的深度學習技術

基于深度學習技術,卷積神經網絡得到了進一步的發(fā)展,其應用范圍也更為寬泛,例如說在圖像分類中的運用。圖像分析需要對圖像實施掃描分析,隨后對其具體類別予以劃分,更加注重其整體語義。目前相對普遍進行圖像分類的數據集為ImageNet,其中囊括了非常豐富的內容,存儲了近1500萬個圖像的URL并將圖像劃分為數萬余個類型。ImageNet每年組織開展的大規(guī)模視覺識別挑戰(zhàn)賽(ILSVRC)中,圖像分類算法與技術也不斷創(chuàng)新,圖像分類的準確性也持續(xù)提升。ImageNet數據集表現出規(guī)模大、類型多的突出特點,所以更加適用于遷移學習,即是把部分核心技術或結構拓展應用到各個領域,對于視覺領域的深度模型來說,能夠把模型內的網絡結構和參數直接共享到其他數據集,從而對數據實施微調。圖像分類屬于計算機視覺領域最為基礎的環(huán)節(jié),對于圖像分類模型創(chuàng)建和數據分析處理經驗也能夠遷移應用到其他領域中。

1.2目標檢測中的深度學習技術

目標檢測相對于圖像分類而言表現出更多的復雜性,主要任務是在囊括多種不同類型物體的圖像內精確定位和識別某一物體,恰恰是出于這一目的,深度學習技術在目標檢測中的應用更為復雜,要實現更加精準的效果也相對更難。近年來針對目標檢測的算法日益更新,如優(yōu)化后的R-CNN算法,是借助于卷積神經網絡思想,對物體進行分類,提取物體特征。而SelectiveSearch算法的出現有了進一步的創(chuàng)新和突破,有效促進了檢測準確性的提高,這也給通過卷積神經網絡進行目標檢測帶來了更多可能性,隨后的FastR-CNN算法極大地促進了目標檢測效率的提升,該算法對提取候選區(qū)的問題予以優(yōu)化,大大減少了候選區(qū)提取和目標檢測過程的時間。目標檢測網絡以FastR-CNN算法作為支撐,于輸出位置設置滑動窗同時和候選區(qū)域網絡實施連接,目標檢測的關鍵在于卷積神經網絡,依靠它把各個點的特征進行提取,再借助回歸算法獲得對應范圍出現目標的概率[1]。

1.3人臉識別中的深度學習技術

人臉識別主要是借助相應算法對人臉特征實施提取,因為其建立的人臉模型表現出一定的不穩(wěn)定性,因此模型建立往往也表現出一定的難度,相對于建立剛體模型而言更為困難。人臉識別通常來說涉及人臉檢測定位以及特征提取兩個方面,人臉檢測定位是基于背景圖像中將人臉目標分割出來,實施歸一化處理,而人臉特征提取算法不變。前者存在的技術難點是人臉目標具有多樣性以及背景圖像具有復雜性,所以對背景情境實施合理假設并予以簡化是十分關鍵的。與此同時,高維空間人臉模型的建立較為復雜,精確度估算難度較大,人臉特征提取的技術難度是因為人臉屬于彈性模型,其難度超過剛體模型。一般來說,較為常見對人臉特征實施提取與識別的方法有幾何特征法、特征臉算法以及彈性模型法,CNN算法和過去的特征提取算法比起來表現出更高的穩(wěn)定性和適用性,同時能夠有效抵抗外部干擾,促進人臉識別技術的推廣應用。

2應用實例

2.1安防領域的應用

深度學習技術在計算機視覺領域中的應用可以為安防行業(yè)提供更佳的解決方案,比如說人臉識別技術的應用,很多大型企業(yè)如Facebook、騰訊、阿里巴巴等都將非常關注和重視。作為深度學習技術在計算機視覺領域應用的重要內容,人臉識別在安檢以及反恐等領域中也能夠發(fā)揮出很好的效果。與此同時,對行人角度的REID技術實施研究,依托于深度學習強化目標檢測,對目標特征實施提取和刻畫,能夠為異常行為監(jiān)控和跟蹤帶來支持[2]。

2.2無人駕駛領域的應用

對于無人駕駛領域來說,選擇激光或雷達這類傳感器的成本更高,基于深度學習的計算機視覺技術也能夠提供新的解決方案。依靠攝像機對視頻畫面進行采集,對獲取到的圖像實施分析,提供類似于前車碰撞預警等功能。在這一過程中,計算機視覺技術可以實現對目標的檢測識別、對目標車輛的跟蹤分析、對車道線是否偏離進行檢測等。基于深度學習技術的檢測識別表現出更加強大的優(yōu)勢,現階段深度學習芯片日益增多,對于無人駕駛技術的發(fā)展也帶來了更加有力的支持。

2.3智能家居領域的應用

過去的很多智能家居產品一般都是依靠智能手機藍牙或者WiFi等途徑來實現對家居產品的控制,這一方案即便能夠做到家居智能化,但其水平依舊有待提高?;谏疃葘W習技術,能夠有效促進智能家居行業(yè)的更新發(fā)展,除開語言、語音識別之外,還能夠利用計算機視覺技術實現人際交流與互動,比如說手勢識別控制。2.4教育領域和圖片搜索領域的應用基于深度學習的計算機視覺技術也能夠在智慧教育中得以普及應用,如近年來很多新的拍照解題App,使用者只需要利用手機相機拍照上傳即可獲得相關題目的分析解答,促進學習者學習效率的提升。此時視覺技術包括了對文字的檢測與識別,另外針對個人簡歷識別、文檔識別等方面也能夠進行拓展應用。同時計算機視覺技術還可以在圖片搜索領域中得以應用,使用者通過拍攝上傳相應的圖片,即可從數據庫中找出與原圖相似的圖片,深度學習屬于一種非常高效的技術手段,能夠提供更加快速高效的圖像檢測功能,結合圖像搜索引擎,為用戶帶來更加便捷的服務[3-5]。

2.5醫(yī)療影像數據中的應用

醫(yī)學影像直接關系到對患者疾病診斷的準確性,對于放射科的醫(yī)務人員來說,依靠醫(yī)學影像能夠促進診斷效率的提升。現階段國內外諸多醫(yī)學專家隊伍,在心血管、腫瘤、神經內科以及五官科等都建立了精準深度學習模型,極大地推動醫(yī)療水平的提升,為廣大患者帶來了更加便捷和高效的醫(yī)療服務。基于深度學習技術的計算機視覺在醫(yī)療影像數據中的應用主要集中在如下幾個方面:(1)能夠提供臨床診斷輔助等醫(yī)療服務;(2)依靠數據分析技術,能夠在很大程度上促進醫(yī)療機構經營管理水平的提升;(3)在醫(yī)學影像中的應用,能夠讓醫(yī)務工作者更加直觀便捷地獲取患者影像;(4)深度學習技術能夠為醫(yī)療大數據的可視化帶來便利;(5)在藥企研發(fā)工作中的應用,可以處理好過去一直以來藥物研發(fā)周期長和成本居高不下的問題;(6)在健康管理領域中的應用,借助于可穿戴設備來對個人健康數據實施監(jiān)測,進而對疾病風險予以提前預測。

3結語

深度學習技術在計算機視覺領域中應用的終極目標是為了讓機器可以和人類一樣,觀察并讀懂世界。近年來AI技術的不斷發(fā)展與普及應用,深度學習技術必然會在計算機視覺領域中發(fā)揮出更大的價值,為現代人的生活和工作帶來更多便利。

參考文獻

[1]尹黎明,魯屹華.基于深度學習的監(jiān)控視頻圖像增強方法[J].湖北科技學院學報,2019,39(05):123-125+130.

[2]林成創(chuàng),單純,趙淦森,楊志榮,彭璟,陳少潔,黃潤樺,李壯偉,易序晟,杜嘉華,李雙印,羅浩宇,樊小毛,陳冰川.機器視覺應用中的圖像數據增廣綜述[J].計算機科學與探索,2021,15(04):583-611.

[3]白翔,龐彥偉,章國鋒.計算機視覺中的深度學習專題(2020)簡介[J].中國科學:信息科學,2020,50(02):303-304.

[4]馬元元,李向偉,劉艷飛.海量監(jiān)控視頻分級摘要生成系統(tǒng)研究[J].現代電子技術,2017,40(13):34-37.

[5]陳昭,趙蘇艷.盲環(huán)境下稀疏編碼監(jiān)控視頻圖像降噪仿真[J].計算機仿真,2020,37(03):368-371.

作者:徐衛(wèi)軍 單位:河北大學