公務(wù)員期刊網(wǎng) 精選范文 卷積神經(jīng)網(wǎng)絡(luò)的基本思想范文

卷積神經(jīng)網(wǎng)絡(luò)的基本思想精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的卷積神經(jīng)網(wǎng)絡(luò)的基本思想主題范文,僅供參考,歡迎閱讀并收藏。

卷積神經(jīng)網(wǎng)絡(luò)的基本思想

第1篇:卷積神經(jīng)網(wǎng)絡(luò)的基本思想范文

【關(guān)鍵詞】:高速公路 防逃 人臉識別 高清視

中圖分類號:U412.36+6 文獻標(biāo)識碼:A

人臉識別的分類與概述

人臉識別就是通過計算機提取人臉的特征,并根據(jù)這些特征進行身份驗證。人臉與人體的其他生物特征(指紋、虹膜等)一樣與生俱來,它們所具有的唯一性和不易被復(fù)制的良好特性為身份鑒別提供了必要的前提;同其他生物特征識別技術(shù)相比,人臉識別技術(shù)具有操作簡單、結(jié)果直觀、隱蔽性好的優(yōu)越性。人臉識別一般包括三個步驟:人臉檢測、人臉特征提取和人臉的識別與驗證。其處理流程如圖

輸入圖像 人臉圖像人臉特征輸出結(jié)果

人臉識別的一般步驟

人臉識別方法繁多,早期研究較多的方法有基于幾何特征的人臉識別方法和基于模板匹配的人臉識別方法。目前人臉識別方法主要研究及應(yīng)用的是基于統(tǒng)計的識別方法、基于連接機制的識別方法以及其它一些綜合方法。下面是這幾類方法的基本介紹:[2]

(1)基于幾何特征的人臉識別方法

幾何特征矢量是以人臉器官如眼睛、鼻子、嘴巴等的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,其分量通常包括人臉指定兩點間距離、曲率、角度等。早期的研究者Brunelli[3]等人采用改進的積分投影法提取出用歐式距離表征的35維人臉特征矢量用于人臉識別。Huang Chung Lin等人[4]采用動態(tài)模板[5,6,7]與活動輪廓模型提取出人臉器官的輪廓[8,9,10]?;趲缀翁卣鞯娜四樧R別方法有如下優(yōu)點:符合人類識別人臉的機理,易于理解;對每幅圖像只需要存儲一個特征矢量,存儲量??;對光照變化不敏感。但這種方法同樣存在一些問題,如從圖像中提取這些特征比較困難;對強烈的表情變化和姿態(tài)變化的魯棒性差等。

(2)基于模板匹配的人臉識別方法

模板匹配大都采用歸一化相關(guān),直接計算兩幅圖之間的匹配程度。最簡單的人臉模板就是將人臉看成一個橢圓[10,11]。另一種方法就是將人臉用一組獨立的小模板表示,如眼睛模板、嘴巴模板、鼻子模板等,采用彈性模板方法提取這些模板特征[12]。Brunelli等人專門比較了基于幾何特征的人臉識別方法和基于模板匹配的人臉識別方法,他們得出的結(jié)論是:基于幾何特征的人臉識別方法具有識別速度快和內(nèi)存要求小等優(yōu)點,但基于模板匹配的識別率要高于基于幾何特征的識別率。

(3)基于統(tǒng)計的人臉識別方法

基于統(tǒng)計特征的識別方法包括基于特征臉的方法和基于隱馬爾可夫模型的方法。特征臉(Eigenface)方法[13]是從主成分分析導(dǎo)出的一種人臉識別和描述技術(shù)。主成分分析實質(zhì)上是K-L展開的網(wǎng)絡(luò)遞推實現(xiàn),K-L變換是圖像壓縮中的一種最優(yōu)正交變換,其生成矩陣一般為訓(xùn)練樣本的總體散布矩陣。特征臉方法就是將包含人臉的圖像區(qū)域看作是一種隨機向量,因此可以采用K-L變換獲得其正交K-L基底。對應(yīng)其中較大特征值的基底具有與人臉相似的形狀,因此又稱之為特征臉。

隱馬爾可夫模型(HMM)是用于描述信號統(tǒng)計特性的一組統(tǒng)計模型。基于人臉從上到下、從左到右的結(jié)構(gòu)特征,Samaria等人[14]首先將1-D HMM和2-D Pseudo HMM用于人臉識別。Kohir等[15]采用1-D HMM將低頻DCT系數(shù)作為觀察矢量獲得了好的識別效果。Eickeler等[16]采用2-DPseudo HMM識別DCT壓縮的JPEG圖像中的人臉圖像。Nefian等[17]采用嵌入式HMM識別人臉。

(4)基于連接機制的人臉識別方法(神經(jīng)網(wǎng)絡(luò)彈性圖匹配)

基于連接機制的識別方法,包括一般的神經(jīng)網(wǎng)絡(luò)方法和彈性圖匹配(Elastic Graph Matching)方法。神經(jīng)網(wǎng)絡(luò)在人臉識別應(yīng)用中有很長的歷史[18]。Demers 等[19]提出采用PCA方法提取人臉圖像特征,用自相關(guān)神經(jīng)網(wǎng)絡(luò)進一步壓縮特征,最后采用一個多層處理器來實現(xiàn)人臉識別。Laurence等[20]通過一個多級的SOM實現(xiàn)樣本的聚類,將卷積神經(jīng)網(wǎng)絡(luò)(CNN)用于人臉識別。Lin等[21]采用基于概率決策的神經(jīng)網(wǎng)絡(luò)(PDBNN)方法。最近,徑向基函數(shù)RBF神經(jīng)網(wǎng)絡(luò)因具有逼近性好、空間描述緊湊和訓(xùn)練速度快等特點而被用于人臉識別。Gutta等[22]提出了將RBF與樹分類器結(jié)合起來進行人臉識別的混合分類器結(jié)構(gòu),后來他們用RBF神經(jīng)網(wǎng)絡(luò)進行了針對部分人臉的識別研究[23],他們的研究表明利用部分人臉也可以有效地識別人臉。Er等[24]采用PCA進行維數(shù)壓縮,再用LDA抽取特征,然后基于RBF進行人臉識別。Haddadnia 等[25]基于PZMI(Pseudo Zernike Moment Invariant)特征,并采用混合學(xué)習(xí)算法的RBF神經(jīng)網(wǎng)絡(luò)進行人臉識別。此外,Lucas 等采用連續(xù)的n-tuple網(wǎng)絡(luò)識別人臉。

彈性圖匹配方法是一種基于動態(tài)鏈接結(jié)構(gòu)的方法[26]。在人臉圖像上放置一組矩形網(wǎng)格節(jié)點,每個節(jié)點的特征用該節(jié)點處的多尺度Gabor幅度特征描述,各節(jié)點之間的連接關(guān)系用幾何距離表示,從而構(gòu)成基于二維拓撲圖的人臉描述。根據(jù)兩個圖像中各節(jié)點和連接之間的相似性可以進行人臉識別。Wiskott等[27]將人臉特征上的一些點作為基準(zhǔn)點,強調(diào)了人臉特征的重要性。他們采用每個基準(zhǔn)點存儲一串具有代表性的特征矢量,大大減少了系統(tǒng)的存儲量。Würtz 等[28]只使用人臉面部的特征,進一步消除了結(jié)構(gòu)中的冗余信息和背景信息,并使用一個多層的分級結(jié)構(gòu)。Grudin等[29]也采用分級結(jié)構(gòu)的彈性圖,通過去除了一些冗余節(jié)點,形成稀疏的人臉描述結(jié)構(gòu)。Nastar等[30]提出將人臉圖像I(x,y)表示為可變形的3D網(wǎng)格表面(x, y, I(x,y)),將人臉匹配問題轉(zhuǎn)換為曲面匹配問題,利用有限元分析的方法進行曲面變形,根據(jù)兩幅圖像之間變形匹配的程度識別人臉。

(5)基于形變模型的方法

基于形變模型的方法是一個受到重視的方法。通過合成新的視覺圖像,可以處理姿態(tài)變化的問題。Lanitis等[31]通過在人臉特征邊沿選擇一些稀疏的基準(zhǔn)點描述人臉的形狀特征,然后將形狀變形到所有人臉圖像的平均形狀,再根據(jù)變形后的形狀進行紋理(灰度)變形,形成與形狀無關(guān)的人臉圖像。然后分別對形狀和灰度進行PCA變換,根據(jù)形狀和紋理的相關(guān)性,用PCA對各自的結(jié)果進一步分析,最終得到描述人臉的AAM(Active Appearance Model)模型。通過改變這些參數(shù)可得到不同變化的人臉圖像,模型參數(shù)能夠用于人臉識別。Romdhani 等[32]采用激光掃描儀獲得人臉的3D數(shù)據(jù),分別對一些基準(zhǔn)點構(gòu)成的形狀和基準(zhǔn)點的灰度(或彩色)完成PCA,得到3D人臉形狀和灰度(彩色)基圖像,通過變化參數(shù)就可獲得不同的3D人臉模型。通過施加一些先驗約束可以避免合成不真實的人臉圖像。利用線性形狀和紋理誤差,通過3D模型向2D輸入圖像的自動匹配實現(xiàn)人臉識別。

項目采用的識別算法

人臉自動識別技術(shù)經(jīng)過多年來的研究已經(jīng)積累了大量研究成果。但是仍然面臨很多問題,尤其是在非約束環(huán)境下的人臉識別。結(jié)合本研究項目及應(yīng)用環(huán)境綜合考慮,采用特征臉方法對視屏資料中的司機臉部進行提取識別。

特征臉方法是90年代初期由Turk和Pentland提出算法,具有簡單有效的特點, 也稱為基于主成分分析(principal component analysis,簡稱PCA)的人臉識別方法。把人臉圖像空間線性投影到一個低維的特征空間。PCA實質(zhì)上是K-L展開的網(wǎng)絡(luò)遞推實現(xiàn)。K-L變換是圖像壓縮技術(shù)中的一種最優(yōu)正交變換。人們將它用于統(tǒng)計特征提取。從而形成子空間法模式識別的基礎(chǔ)。若將K-L變換用于人臉識別,則需假設(shè)人臉處于低維線性空間。由高維圖像空間K-L變換后,可得到一組新的正交基,由此可以通過保留部分正交基獲得正交K-L基底。如將子空間對應(yīng)特征值較大的基底按照圖像陣列排列,則可以看出這些正交基呈現(xiàn)出人臉的形狀。因此這些正交基也稱為特征臉,這種人臉的識別方法也叫特征臉法。

特征子臉技術(shù)的基本思想是:從統(tǒng)計的觀點,尋找人臉圖像分布的基本元素,即人臉圖像樣本集協(xié)方差矩陣的特征向量,以此近似地表征人臉圖像。這些特征向量稱為特征臉(Eigenface)。

利用這些基底的線性組合可以描述、表達和逼近人臉圖像,因此可以進行人臉識別與合成。識別過程就是將人臉圖像映射到由特征臉張成的子空間上,比較其與已知人臉在特征臉空間中的位置,具體步驟如下:[33]

(1)初始化,獲得人臉圖像的訓(xùn)練集并計算特征臉,定義為人臉空間;

(2)輸入待識別人臉圖像,將其映射到特征臉空間,得到一組權(quán)值;

(3)通過檢查圖像與人臉空間的距離判斷它是否為人臉;

(4)若為人臉,根據(jù)權(quán)值模式判斷它是否為數(shù)據(jù)庫中的某個人。

1. 計算特征臉

假設(shè)人臉圖像包含個像素,因此可以用維向量Γ表示。如人臉訓(xùn)練集由幅人臉圖像構(gòu)成,則可以用表示人臉訓(xùn)練集。

其均值為:

(2-1)

每幅圖像與均值的差為:

(2-2)

構(gòu)造人臉訓(xùn)練集的協(xié)方差矩陣:

(2-3)

其中 。

協(xié)方差矩陣的正交分解向量即為人臉空間的基向量,也即特征臉。

一般比較大(通常大于1000),所以對矩陣直接求解特征向量是不可能的,為此引出下列定理:

SVD定理:設(shè)是一秩為的維矩陣,則存在兩個正交矩陣:

(2-4)

(2-5)

以及對角陣:

(2-6)

滿足

其中:為矩陣和的非零特征值,和分別為和對應(yīng)于的特征矢量。上述分解成為矩陣的奇異值分解(SVD),為的奇異值。

推論:

(2-7)

由上述定理可知:

人臉訓(xùn)練集所包含的圖像一般要比圖像的像素數(shù)小的多,因此可以轉(zhuǎn)求矩陣

(2-8)

的特征向量,M為人臉訓(xùn)練集圖像總數(shù)。

矩陣的特征向量由差值圖像與線性組合得到:

=(2-9)

實際上,m(m

(2-10)

識別

基于特征臉的人臉識別過程由訓(xùn)練階段和識別階段兩個階段組成。在訓(xùn)練階段,每個己知人臉映射由特征臉張成的子空間上,得到m維向量:

(2-11)

距離閾值定義如下:

(2-12)

在識別階段,首先把待識別的圖像映射到特征臉空間,得到向量

(2-13)

與每個人臉集的距離定義為

(2-14)

為了區(qū)分人臉和非人臉,還需計算原始圖像與其由特征臉空間重建的圖像之間的距離:

(2-15)

其中:

(2-16)

采用最小距離法對人臉進行分類,分類規(guī)則如下:

(1)若,則輸入圖像不是人臉圖像;

(2)若,則輸入圖像包含未知人臉;

(3)若,則輸入圖像為庫中的某個人臉。

實際上,特征臉反映了隱含在人臉樣本集合內(nèi)部的信息和人臉的結(jié)構(gòu)關(guān)系。將眼睛、面頰、下頜的樣本集協(xié)方差矩陣的特征向量稱為特征眼、特征頜和特征唇,統(tǒng)稱特征子臉。特征子臉在相應(yīng)的圖像空間中生成子空間,稱為子臉空間。計算出測試圖像窗口在子臉空間的投影距離,若窗口圖像滿足閾值比較條件,則判斷其為人臉。

基于特征分析的方法,也就是將人臉基準(zhǔn)點的相對比率和其它描述人臉臉部特征的形狀參數(shù)或類別參數(shù)等一起構(gòu)成識別特征向量,這種基于整體臉的識別不僅保留了人臉部件之間的拓撲關(guān)系,而且也保留了各部件本身的信息,而基于部件的識別則是通過提取出局部輪廓信息及灰度信息來設(shè)計具體識別算法?,F(xiàn)在Eigenface(PCA)算法已經(jīng)與經(jīng)典的模板匹配算法一起成為測試人臉識別系統(tǒng)性能的基準(zhǔn)算法;而自1991年特征臉技術(shù)誕生以來,研究者對其進行了各種各樣的實驗和理論分析,F(xiàn)ERET測試結(jié)果也表明,改進的特征臉?biāo)惴ㄊ侵髁鞯娜四樧R別技術(shù),也是具有最好性能的識別方法之一。

該方法是先確定眼虹膜、鼻翼、嘴角等面像五官輪廓的大小、位置、距離等屬性,然后再計算出它們的幾何特征量,而這些特征量形成一描述該面像的特征向量。其技術(shù)的核心實際為"局部人體特征分析"和"圖形/神經(jīng)識別算法。"這種算法是利用人體面部各器官及特征部位的方法。如對應(yīng)幾何關(guān)系多數(shù)據(jù)形成識別參數(shù)與數(shù)據(jù)庫中所有的原始參數(shù)進行比較、判斷與確認。Turk和Pentland提出特征臉的方法,它根據(jù)一組人臉訓(xùn)練圖像構(gòu)造主元子空間,由于主元具有臉的形狀,也稱為特征臉,識別時將測試圖像投影到主元子空間上,得到一組投影系數(shù),和各個已知人的人臉圖像比較進行識別。

結(jié)束語

從目前國情來講,在一段時間內(nèi)高速公路收費還會繼續(xù)存在,某些司機逃費的僥幸心也同樣會有。通過帶路徑識別功能的 RFID 復(fù)合卡作為通行卡,利用 RFID 卡的信息對車輛進行跟蹤,在不增加硬件投入的情況下,直接可以給車道收費系統(tǒng)提供抓拍高清圖像,以及其它報警聯(lián)動系統(tǒng)提供圖像等,可有效解決高速公路沖卡逃費問題,可廣泛應(yīng)用于封閉式管理的公路收費系統(tǒng)。

參考文獻:

[1]江艷霞. 視頻人臉跟蹤識別算法研究. 上海交通大學(xué)博士學(xué)位論文,2007.

[2]Brunelli R and Poggio T., Feature Recognition: Features Versus Templates. IEEE Transactions on

PAMI, 1993, 15(10):1042 -1052.

[3]李剛. 基于特征臉法的正面人臉識別研究. 國防科學(xué)技術(shù)大學(xué)碩士學(xué)位論文,2002.11

[4]JOHN CANNY. A Computational Approach to Edge Detection. IEEE TRANSACTIONS ON PATTERN

ANALYSIS AND MACHINE INTELLIGENCE, VOL.PAMI-8, NO.6, NOVEMBER 1986.

[5]張建飛、陳樹越等. 基于支持向量基的交通視頻人車識別研究[J]. 電視技術(shù),2011

[6]肖波、樊友平等. 復(fù)雜背景下基于運動特征的人面定位[J]. 重慶大學(xué)學(xué)報,2002

[7] 《中華人民共和國交通部公路聯(lián)網(wǎng)收費技術(shù)要求》,交通部

[8] 《廣東省高速公路聯(lián)網(wǎng)收費系統(tǒng)》,DB44 127-2003,廣東省質(zhì)量技術(shù)監(jiān)督局

[9] 《視頻安防監(jiān)控數(shù)字錄像設(shè)備》,GB 20815-2006

[10]《安全防范工程技術(shù)規(guī)范》,GB 50348-2004

第2篇:卷積神經(jīng)網(wǎng)絡(luò)的基本思想范文

論文摘要:當(dāng)點擴展函數(shù)未知或不確知的情況下,從觀察到的退化圖像中恢復(fù)原始圖像的過程稱為圖像盲復(fù)原。近年來,圖像盲復(fù)原算法得到了廣泛的研究。本文在介紹了盲圖像恢復(fù)算法的現(xiàn)狀的基礎(chǔ)上進一步研究其的發(fā)展方向。

一、引言

圖像恢復(fù)是圖像處理中的一大領(lǐng)域,有著廣泛的應(yīng)用,正成為當(dāng)前研究的熱點。圖像恢復(fù)的主要目的是使退化圖像經(jīng)過一定的加工處理,去掉退化因素,以最大的保真度恢復(fù)成原來的圖像。傳統(tǒng)的圖像恢復(fù)假設(shè)圖像的降質(zhì)模型是己知的。而許多情況下,圖像的降質(zhì)模型未知或具有較少的先驗知識,必須進行所謂的盲恢復(fù)。其重要性和艱巨性而成為一個研究熱點。目前所能獲取的觀測圖像是真實圖像經(jīng)過觀測系統(tǒng)成像的結(jié)果。由于觀測系統(tǒng)本身物理特性的限制,同時受觀測環(huán)境的影響,觀測圖像和真實圖像之間不可避免地存在著偏差和失真,稱觀測系統(tǒng)對真實圖像產(chǎn)生了降質(zhì)。圖像恢復(fù)的目的就是根據(jù)降質(zhì)的觀測圖像分析和計算得出真實圖像。

二、圖像盲恢復(fù)算法的現(xiàn)狀

總體來說,圖像盲復(fù)原方法主要分為以下兩類:一是首先利用真實圖像的特別特征估計PSF,然后借助估計得到的PSF,采用經(jīng)典的圖像復(fù)原方法進行圖像的復(fù)原。這類方法將PSF的估計與圖像的復(fù)原過程分為2個不同的過程,因而具有較少計算量的特點;二是PSF辨識和真實圖像估計相結(jié)合,同時辨識PSF和真實圖像。這類算法較為復(fù)雜,計算量較大。另外,對于點擴展函數(shù)也考慮了空間變化的復(fù)雜情況。針對目前的盲復(fù)原算法的現(xiàn)狀,根據(jù)退化模型的特點,重新將算法分為空間不變的單通道盲復(fù)原算法、空間不變多通道盲復(fù)原算法和空間變化圖像盲復(fù)原算法3類。

(一)單通道空間不變圖像盲復(fù)原算法

在這類算法中,最為常用的是參數(shù)法和迭代法。

1)參數(shù)法。所謂參數(shù)法,即模型參數(shù)法,就是將PSF和真實圖像用某一類模型加以描述,但模型的參數(shù)需要進行辨識。在參數(shù)法中,典型的有先驗?zāi):孀R法和ARMA參數(shù)估計法,前者先辨識PSF的模型參數(shù),后辨識真實圖像,屬于第1種類型的圖像盲復(fù)原算法,因而計算量較小;后者同時辨識PSF和真實圖像模型參數(shù),屬于第2種類型圖像盲復(fù)原算法。

2)迭代法。所謂的迭代法,不是通過建立模型而是通過算法的迭代過程,加上有關(guān)真實圖像和PSF的約束來同時辨識PSF和真實圖像的方法。迭代法是單通道

圖像盲復(fù)原算法中應(yīng)用最廣泛的一類算法,它不需建立模型,也不要求PSF為最小相位系統(tǒng),因而跟實際更為接近。在這類算法中,迭代盲復(fù)原算法(IBD),基于非負性和決策域的遞歸逆濾波器算法(NAR2RIF),基于高階統(tǒng)計特性的最小

熵算法等最為典型。

(二)多通道二維圖像盲復(fù)原

多通道二維圖像盲復(fù)原,這類方法將數(shù)字通訊領(lǐng)域應(yīng)用的一維多通道盲原分離算法擴展到二維情況并用于圖像的盲恢復(fù)。這類算法中有兩種代數(shù)方法,一種是先辨識模糊函數(shù),再采用常規(guī)的恢復(fù)算法進行復(fù)原;另一種是直接對逆濾波器進行估計。此類算法的優(yōu)點在于不需對初始圖像進行估計,也不存在穩(wěn)定性和收斂性問題,對圖像以及模糊函數(shù)的約束是松弛的,算法具有一般性。但是第1種算法要求采用復(fù)原算法具有收斂性;第2種算法對噪聲敏感。

(三)空間改變的圖像盲復(fù)原方法

在許多實際的應(yīng)用中,模糊往往是空間變化的,但由于處理工作的難度,目前的研究較少,基本有相關(guān)轉(zhuǎn)換恢復(fù)和直接法兩類。

相關(guān)轉(zhuǎn)換恢復(fù)的基本思想是區(qū)域分割,即將整幅圖像分為若干局部區(qū)域,然后假設(shè)在各個局部區(qū)域模糊是空間不變的,利用空間不變的圖像復(fù)原有關(guān)算法進行復(fù)原。這類方法都是基于窗口的模糊辨識技術(shù),圖像的估計取決于窗口的大小,由于模糊參數(shù)是連續(xù)變化的,在范圍較大時空間不變的假設(shè)是不成立的,因而模糊的估計精度較差,而且這種方法只能針對部分空間變化的模糊進行處理,缺乏通用性;其次在區(qū)域的邊上存在振鈴現(xiàn)象。

直接法的基本思想是直接對圖像進行處理。如采用簡化的二維遞推卡爾曼濾波器進行圖像模型和模糊模型的直接轉(zhuǎn)換方法,其缺點是只能針對有限的模型,而且模型數(shù)增加,計算量會顯著增大;采用共軛梯度迭代算法,但只見到一個31×31的文本圖像處理的結(jié)果報道,對于大圖像處理效果尚需進一步的研究;將空間變化圖像系統(tǒng)建立成馬爾苛夫隨機模型,對復(fù)原過程,采用模擬退火算法進行最大后驗估計的方法,這種方法避免了圖像的窗口化,并能克服模糊參數(shù)不連續(xù)性造成的影響,但這種方法只能局限于將模糊過程建立成單參數(shù)的馬爾苛夫隨機模型的情況,而且計算量也較大。

三、圖像盲恢復(fù)的應(yīng)用前景

(1)現(xiàn)有算法的改進以及新的算法研究?,F(xiàn)有各種算法還存在許多不足,有必要對算法進一步改進。如IBD算法中,如何選擇初始條件才能保證算法的收斂;如何選擇算法終止條件才能保證恢復(fù)的質(zhì)量;如何選擇濾波器中的噪聲參數(shù)才能減少噪聲的影響。又如NAR2RIF算法中,如何進一步解決噪聲敏感問題,支持域的確定以及如何將算法擴展到非均勻背景的情況等。提出新的算法更好地解決圖像盲復(fù)原問題,也是今后研究的熱點。

(2)基于非線性退化模型的圖像盲復(fù)原算法。在實際應(yīng)用中,嚴(yán)格來講,所有的退化模型都是非線性的。對模型采用線性化的方法進行近似處理,雖然算法簡單,但對非線性嚴(yán)重的情況處理效果并不理想。基于多項式以及神經(jīng)網(wǎng)絡(luò)兩種參數(shù)模型處理非線性信號盲分離算法,算法擴展到二維圖像情況需要進一步研究。研究基于非線性退化模型的圖像盲復(fù)原算法也是下一步研究方向之一。

(3)去噪處理算法研究。加性噪聲的存在,使圖像的復(fù)原問題變成了一個病態(tài)問題,而且由于一般假設(shè)只知道噪聲的統(tǒng)計特性,因此要從退化圖像中完全去除噪聲是不可能的。另外,由于噪聲的存在,恢復(fù)的效果并不理想,結(jié)合降噪的圖像盲恢復(fù)的算法研究有很現(xiàn)實的意義,這方面也進行了部分工作。為克服噪聲的影響,一般采用先進行降噪,后進行復(fù)原;二是將降噪和復(fù)原同時進行這兩類方法。目前,大多數(shù)算法中將噪聲描述成高斯噪聲進行研究,在實際應(yīng)用時有較大局限性。對于非高斯情況的研究采用基于噪聲的高階統(tǒng)計特性的去噪算法研究也是很重要的研究方向,也可采用其他類型的方法進行降噪,利用自組織映射的非線性獨立組件分析方法進行圖像降噪處理算法。

(4)實時處理算法。算法的的復(fù)雜性是制約算法應(yīng)用的一個重要方面??刹捎谜齽t化的離散周期Radon變換的方法將二維的卷積轉(zhuǎn)化為一維進行處理,以提高算法的速度;也可采用神經(jīng)網(wǎng)絡(luò)的實時處理算法。算法的實時性是算法實際應(yīng)用的先決條件。

(5)應(yīng)用研究。算法的應(yīng)用是推動算法研究的動力。雖然圖像盲復(fù)原算法在天文學(xué)、醫(yī)學(xué)、遙感等方面獲得了較大的應(yīng)用,但將算法應(yīng)用到一般的工業(yè)圖像實時檢測、機器視覺、網(wǎng)絡(luò)環(huán)境下的圖像傳輸恢復(fù)、刑事偵破等方面還有大量的工作要做。

參考文獻:

[1]薛梅,楊綠溪.用于含噪二值圖像的改進NAS-RIF圖像盲復(fù)原算[J].數(shù)據(jù)處理.2006.17.(2).

第3篇:卷積神經(jīng)網(wǎng)絡(luò)的基本思想范文

關(guān)鍵詞:消費意圖識別;查詢商業(yè)意圖識別;消費意圖模板;社會媒體

中圖分類號:TP391.41 文獻標(biāo)識號:A 文章編號:2095-2163(2015)04-

Consumption Intent Recognition for Social Media: Task, Challenge and Opportunity

FU Bo, LIU Ting

(Research Center for Social Computing and Information Retrieval, Harbin Institute of Technology, Harbin 150001,China)

Abstract: Social media is the platform where people freely share with each other information such as comments, experiences, and an opinion. Among the large amount of posts, some may reveal the users' underlying commercial intention (CI). The consumption intent is a desire or hope for something to purchase. For instance, a post like “Please recommend for me a Nokia mobile phone about 2,000 RMB” may indicate an immediate or future purchase. Such information is valuable for better advertisement services. The paper introduces the problems this task try to resolve, the main challenges of this task, representative emerging work related to this task. After that, the paper proposes several directions that are worth exploring in future.

Keywords: Consumption Intent; Query Commercial Intent; Consumption Intent Pattern; Social Media

0 研究背景

近年來,網(wǎng)絡(luò)數(shù)據(jù)資源呈現(xiàn)幾何式、爆炸式增長,巨量的網(wǎng)絡(luò)數(shù)據(jù)中蘊含著大量的用戶的,對諸如產(chǎn)品購買等有價值的行為信息及個性化需求信息,這些關(guān)于產(chǎn)品類的信息需求表達了人們的各種消費意愿和消費需求。例如,Google、Baidu等搜索引擎查詢?nèi)罩居涗浟巳藗儚幕ヂ?lián)網(wǎng)搜索所需產(chǎn)品的信息;Twitter、新浪微博等社會化媒體平臺的時尚性、廣泛性和互動性能幫助人們即時所需產(chǎn)品的信息;京東商城、淘寶網(wǎng)等電商網(wǎng)站記錄了用戶瀏覽和購買行為。只有充分了解利用用戶的信息和需求,才能做到有的放矢?;ヂ?lián)網(wǎng)各種不同的媒體上存儲了大量用戶資料、用戶之間的社交關(guān)系以及用戶的行為數(shù)據(jù),如表1所示。

可以看出,各種不同媒體中所積累的海量用戶信息為構(gòu)建新的社會化應(yīng)用,以及理解人們當(dāng)前和潛在的消費需求帶來了前所未有的新機遇。在如此龐大用戶基數(shù)的支撐下,互聯(lián)網(wǎng)的巨大潛力正日益體現(xiàn),與現(xiàn)實社會的互動滲透更加緊密深入。互聯(lián)網(wǎng)上出現(xiàn)的不同媒體在商業(yè)、生活、政治等各方面,也正發(fā)揮著源自其強大信息傳播的重要作用。截至2014年12月底,我國網(wǎng)絡(luò)購物用戶規(guī)模達到3.61億,較2013年底增加5 953萬人,增長率為19.7%;我國網(wǎng)民使用網(wǎng)絡(luò)購物的比例從48.9%提升至55.7%。根據(jù)艾瑞咨詢預(yù)測,2017年的網(wǎng)絡(luò)購物交易規(guī)模將達到56 340億元,占社會消費品零售總額的比例為15.7%,較2010年提升12.8個百分點。特別是在商業(yè)營銷上,約有51%的消費者在成為企業(yè)品牌的粉絲后,購買該品牌商品的意愿也會相應(yīng)提高5個百分點??梢哉f,互聯(lián)網(wǎng)上用戶對產(chǎn)品的需求與日俱增,并且形式多種多樣。在經(jīng)濟全球化和信息網(wǎng)絡(luò)化的今天,主動掌握個體興趣偏好和群體消費趨勢等用戶消費需求信息,就可以在市場營銷、產(chǎn)品計劃等實現(xiàn)智能精準(zhǔn)決策,在此背景下,消費意圖(Consumption Intent)識別的相關(guān)技術(shù)應(yīng)運而生。

表1 互聯(lián)網(wǎng)不同媒體數(shù)據(jù)和對應(yīng)的國內(nèi)外流行站點

Tab.1 Examples of different media and the corresponding domestic and foreign websites

1 任務(wù)

消費意圖,是指用戶表達出的對購買產(chǎn)品服務(wù)等一些商業(yè)消費需求的意愿[1]。消費意圖識別技術(shù)是對帶有消費需求色彩的互聯(lián)網(wǎng)用戶生成的文本或用戶本身行為數(shù)據(jù)進行的分析和整理,通過網(wǎng)絡(luò)的方式挖掘出用戶當(dāng)前或潛在的消費需求。

面向社會媒體的消費意圖識別的任務(wù)可以分為基于內(nèi)容的消費意圖識別和基于用戶的消費意圖識別。其中,基于內(nèi)容的消費意圖研究包括消費模板的抽取、消費意圖識別以及消費意圖中的消費對象抽取等。具體地,基于內(nèi)容的消費意圖是指導(dǎo)用戶通過互聯(lián)網(wǎng)與購買需求相關(guān)的信息,如:“我想買一部手機,誰能給推薦一下嗎”,即是一個顯式消費意圖內(nèi)容,這里的“手機”即為消費對象;而基于用戶的消費意圖則是指一條信息沒有明確的表達購買產(chǎn)品或服務(wù)的意圖,但通過推理可發(fā)現(xiàn)用戶潛在的商業(yè)需求,間接地表明用戶將來會購買與母嬰用品相關(guān)的產(chǎn)品或服務(wù)。然而到目前為止,關(guān)于消費意圖并沒一個標(biāo)準(zhǔn)的定義及分類體系。通過大量的調(diào)研,即可發(fā)現(xiàn)基于內(nèi)容的消費意圖文本中有意義的信息主要有觸發(fā)詞語(如“想買”)、消費對象等,而基于用戶的消費意圖也會包含有一些用戶歷史行為。下面本文將逐一介紹目前顯式消費意圖識別研究中的主要任務(wù)和主要實現(xiàn)技術(shù)。

最初的消費意圖識別任務(wù)源自前人對帶有消費意圖的詞語或模板的分析,如“想買”即是帶有消費意圖的模板。隨著互聯(lián)網(wǎng)上大量的帶有消費意圖的文本出現(xiàn),研究者們逐漸從簡單的消費意愿的模板的分析研究過渡到更為復(fù)雜的用戶當(dāng)前需求以及潛在需求的研究?;诖耍凑仗幚斫嵌鹊牟煌?,可分為基于文本內(nèi)容的消費意圖識別和基于用戶的消費意圖識別。其中,前者處理的文本內(nèi)容包括互聯(lián)網(wǎng)上用戶在搜索引擎輸入的單個查詢、單條微博文本等用戶的內(nèi)容,如微博消費意圖文本“想給兒子買個電動挖掘機”,表明了用戶的消費意愿是想為受眾目標(biāo)“兒子”購買一臺“電動挖掘機”的消費對象;后者處理的對象主要是以用戶為中心,如一個用戶一直對母嬰用品有消費意圖。按時消費意圖的時效不同,可分為現(xiàn)實需求和潛在需求。現(xiàn)實需求是指已經(jīng)存在用戶當(dāng)前的需求。潛在需求是指消費者雖然有明確意識的欲望,但由于種種原因還沒有明確的顯示出來的需求。

2 挑戰(zhàn)

互聯(lián)網(wǎng)用戶的消費意圖識別存在著各種各樣的挑戰(zhàn)。具體地,可將其劃分為三種?,F(xiàn)給出如下論述:

2.1 網(wǎng)絡(luò)數(shù)據(jù)采集的挑戰(zhàn)

互聯(lián)網(wǎng)數(shù)據(jù)形式多樣化,不同媒體平臺的用戶和內(nèi)容具有異構(gòu)性,因而針對網(wǎng)絡(luò)數(shù)據(jù)的采集需要就不同類型的內(nèi)容分別進行處理,提取有價值的內(nèi)容信息和用戶行為信息。例如,在線社區(qū)中的用戶信息大部分以超文本標(biāo)記語言(HTML)的網(wǎng)頁方式展現(xiàn),挖掘基于社區(qū)中的用戶消費意圖文本,需要針對HTML這種非結(jié)構(gòu)化的數(shù)據(jù)精準(zhǔn)地抽取出用戶名、用戶發(fā)貼內(nèi)容等元數(shù)據(jù)信息。而社交媒體網(wǎng)站的數(shù)據(jù)挖掘則需要通過采集記錄內(nèi)部系統(tǒng)日志來實現(xiàn),如Facebook的Scribe。因而,在進行消費意圖研究的相關(guān)工作中,都首先需要挖掘出不同媒體中的含有消費意圖的內(nèi)容或具體行為。

2.2 數(shù)據(jù)稀疏的挑戰(zhàn)

互聯(lián)網(wǎng)上存在著大量的垃圾信息。例如社會媒體用戶中有33%左右的用戶微博的是自己的狀態(tài)信息,諸如“好無聊怎么辦”,而僅有8.7%的微博內(nèi)容傳達了有價值的信息。由于微博上用戶可以借助個人習(xí)慣的方式表達自己的感受,因而在這些有價值的信息中,微博內(nèi)容信息通常是隨意、零散和有噪聲的。

2.3 跨社區(qū)的挑戰(zhàn)

互聯(lián)網(wǎng)上社會媒體、論壇、電商網(wǎng)站等迅速發(fā)展,積累了大量的用戶信息,為社會計算的相關(guān)研究提供了前所未有的海量數(shù)據(jù)。例如,Ding等人[2]基于微博用戶的消費意圖研究電影票房預(yù)測問題。也有學(xué)者分別研究了用戶評價[3]和在線論壇中的用戶[4]消費意圖識別問題。但是這些相關(guān)工作都只關(guān)注面向單個社區(qū)或社交媒體的消費意圖識別問題,這是因為不同媒體的用戶之間往往沒有顯式的鏈接,就使得一個媒體中的用戶與其他媒體的用戶之間是無法進行關(guān)聯(lián)的。此外,雖然每個用戶在不同媒體平臺上擁有不同的用戶信息,但是這些用戶信息在不同的平臺之間是非共享的??梢杂^察到,由于不同媒體平臺在主題以及功能上的不同,用戶的信息碎片化地分布在不同類型的媒體平臺中。

3 相關(guān)工作

3.1 消費意圖模板的抽取

模板(pattern)是自然語言領(lǐng)域中的常見概念,是指從自然語言實例(如短語、句子等)中泛化而來的抽象表達。正因為模板較之實例有著更好的概括和泛化能力,因此被廣泛使用于信息抽取、機器翻譯、自然語言生成等研究中。一個模板通常包含兩部分,即模板詞(patternwords)和模板槽(pattern slots),其中前者可看作模板的常量部分,后者則是模板的變量部分。例如,對于模板“想給[x]買個[y]”,“想給”和“買個”是模板詞,而“[x]”是模板槽。在模板匹配過程中,模板詞必須嚴(yán)格匹配,而模板槽可匹配任意內(nèi)容。這里,通過在模板槽中填充具體內(nèi)容從而生成模板實例的過程稱作模板的實例化(instantiation)。例如,在模板“想買[x]買個[y]”的前后兩個槽中分別填充“兒子”和“iPhone6”,便將上述模板實例化為“想給兒子買個iPhone6”。顯然,一個模板可以實例化為多種不同的實例。

模板在信息抽取以及自動問答中已然獲得十分廣泛的應(yīng)用,因此這兩個研究方向的許多學(xué)者都曾提出過模板的抽取方法。與這些方向的研究類似,在消費意圖類模板抽取的研究中,一部分學(xué)者使用基于規(guī)則的方法抽取模板。規(guī)則的制定通常要基于一系列的語言分析與預(yù)處理,如詞性標(biāo)注、命名實體識別和句法分析等。相應(yīng)地,制定的復(fù)述規(guī)則也包括詞序列規(guī)則、詞性規(guī)則以及句法規(guī)則等形式。有學(xué)者[3,5]基于規(guī)則和基于圖的方法分別獲取意圖模板。在基于圖的方法中,通過將意圖模板抽取看作為圖上隨機游走過程,而且定義的圖節(jié)點將分別為模板節(jié)點和原始內(nèi)容節(jié)點,其基本想法是,若模板節(jié)點+原始內(nèi)容節(jié)點仍能出現(xiàn)在原始語料中,則該模板為候選模板,進而通過圖迭代的方法獲取最終模板。依據(jù)這一方法抽取得到的愿望模板可如下所示:

可以看到,基于規(guī)則的方法其缺點在于規(guī)則的可擴展性差,人工編寫規(guī)則的工作量大,成本較高。具體來講,由于人們在語言表述上具有復(fù)雜性和靈活性,規(guī)則的制定過程費時費力且難以覆蓋所有的語言現(xiàn)象。規(guī)則往往依賴于具體語言、領(lǐng)域和文本風(fēng)格,可移植性不好。同時基于規(guī)則的方法代價昂貴,且遷移性差,因此越來越多的研究者開始利用基于統(tǒng)計的方法來識別消費意圖。

有研究者基于種子實例從產(chǎn)品評價中抽取產(chǎn)品受眾者,即上述模板中的“[x]”。例如,Wang等人[6]將抽取產(chǎn)品受眾者的模板用于產(chǎn)品推薦系統(tǒng)的目標(biāo)人物抽取環(huán)節(jié)。研究中首先為其產(chǎn)品推薦系統(tǒng)設(shè)計了一個受眾人分類體系,然后針對該體系人工編寫少量“種子”實例。比如,對于“I bought my son this phone.”類型的產(chǎn)品評論,其編寫的種子實例為“buy somebody something”。該方法利用種子實例作為輸入,并使用基于boostrapping的方法從產(chǎn)品評論中匹配該種子實例的字符串,進而生成模板。依據(jù)此方法抽取得到的受眾者模板如下所示:

3.2基于內(nèi)容的消費意圖識別

Goldberg等[3]首次提出了“buy wish”的概念(即本文定義的顯式消費意圖,如:想買一部手機)。研究是從用戶在互聯(lián)網(wǎng)上的愿望清單和產(chǎn)品評論中的內(nèi)容來識別其中的消費意圖。過程中,即事先人工給定了一些通用的消費意圖規(guī)則模板,比如“I wish for”,而后再利用規(guī)則模板去匹配具有消費意圖的句子。這種方法較為簡單,但基于人工制定模板的匹配方法效果不甚理想,特別是系統(tǒng)的召回率很低。進而,作者提出了基于二元圖方法自動抽取消費意圖模板,如此生成的消費意圖模板表達能力更強,使得系統(tǒng)識別的效果的性能也相對提高,特別是召回率有了顯著的提升。在此基礎(chǔ)上,作者加入了文本中詞匯作為消費意圖識別的特征。盡管采用詞特征比較簡單,但是通過實驗結(jié)果發(fā)現(xiàn)文本中的詞特征對于消費意圖識別是非常有效的。

Chen和Hsu[4]也提出過相似的概念“Intention Posts”。研究者基于不同領(lǐng)域間消費意圖表達方式相近的假設(shè),即用于學(xué)習(xí)的訓(xùn)練樣本與新的測試樣本近似地滿足獨立同分布的條件。利用這種遷移學(xué)習(xí)(Transfer learning)的思想只需要在一個領(lǐng)域標(biāo)注數(shù)據(jù),并將其應(yīng)用于一個新的沒有任何標(biāo)注的目標(biāo)域數(shù)據(jù)。面對著消費意圖文本中表達意圖的內(nèi)容通常只有一個或幾個關(guān)鍵字,同時數(shù)據(jù)不平衡的問題,作者提出了Co-Class算法 。 首先,利用已有領(lǐng)域的標(biāo)注數(shù)據(jù)構(gòu)建一個分類器,然后將分類器應(yīng)用到目標(biāo)域的無標(biāo)注數(shù)據(jù)中。這樣,在目標(biāo)數(shù)據(jù)中便可以重新形成特征選擇,進而構(gòu)建新的分類器。這兩個分類器將共同對目標(biāo)實施數(shù)據(jù)分類。這一迭代過程運行即直至類別標(biāo)簽對目標(biāo)數(shù)據(jù)標(biāo)注不再改變?yōu)橹?。作者分別在四個領(lǐng)域的語料上進行了遷移學(xué)習(xí)的實驗,而通過實驗則證明了提出的Co-class算法對跨領(lǐng)域遷移學(xué)習(xí)的消費意圖識別任務(wù)是有效的。

Wang等[7]在不同領(lǐng)域的消費意圖識別任務(wù)上展開了相關(guān)研究。研究提出了基于圖的方法來識別Twitter中表達用戶意圖的內(nèi)容。具體來說,該方法將要分類的Twitter內(nèi)容和意圖關(guān)鍵詞(如:對句子“I want to buy an xbox”中“buy an xbox”即為文中定義的意圖關(guān)鍵詞)作為圖上的節(jié)點,利用意圖關(guān)鍵詞和Twitter句子之間的關(guān)系形成邊和邊權(quán)重來構(gòu)建圖,繼而使用圖傳播算法來完成在不同領(lǐng)域類別上的消費意圖分類。此外,Ding等人[2]提出了基于領(lǐng)域自適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)的微博文本消費意圖識別方法,并將此方法應(yīng)用到了電影票房預(yù)測的任務(wù)上,研究證明,消費意圖特征有助于預(yù)測電影票房,其原因在于用戶對電影的消費意愿能直接反映出用戶購票的活躍度。

3.3基于內(nèi)容的消費對象識別

相比而言,已有研究主要針對基于內(nèi)容的消費意圖進行識別,很少研究消費意圖句中的消費對象識別。本文定義消費對象是指消費者提出所需要購買的對象,即某段文本內(nèi)容中所論述的對象。由于廣告商所關(guān)注的正是用戶針對某一消費對象的消費意圖,而也就是這一存在使得消費意圖研究更加突顯其現(xiàn)實重要意義。但目前針對消費意圖對象的相關(guān)研究較少。Wang等人[6]提出了從微博中挖掘趨勢相關(guān)產(chǎn)品的問題。相應(yīng)地即將“趨勢”定義為在微博上被用戶熱烈討論的話題。例如,如果有人在微博上說“最近北京空氣很差”,那么就希望從空氣很差這一趨勢中,挖掘出空氣凈化器,口罩等與之相關(guān)的產(chǎn)品。

一般而言,現(xiàn)有的研究是從文本內(nèi)容中挖掘產(chǎn)品命名實體[8-10]或是評價對象[11-14]。這里期望能從產(chǎn)品命名實體和評價對象抽取的研究中借鑒一些有價值的和方法,從而對消費對象抽取研究有所啟發(fā)和促進。一方面,事實上產(chǎn)品命名實體抽取的研究屬于命名實體識別的研究范疇。命名實體(Named Entity:NE)挖掘,主要是指從文本中挖掘出人名、地名、機構(gòu)名等。早期命名實體的研究方法是基于人工規(guī)則的算法。近年來,一些機器學(xué)習(xí)的方法被應(yīng)用到命名實體的研究之中。一部分學(xué)者采用基于分布假設(shè)計算詞義相似度,其基本思想是那些傾向于出現(xiàn)在相似的上下文中的詞意思相近,通過人工給定一組實體作為種子,其上下文作為模板并使用迭代的方法獲取了給定目標(biāo)類別下的新實體。以往的產(chǎn)品命名實體識別的研究主要是基于有指導(dǎo)的方法,然而這類方法需要標(biāo)注大規(guī)模的訓(xùn)練語料,由于產(chǎn)品命名實體中詞匯量比較大,新詞頻繁出現(xiàn),經(jīng)常出現(xiàn)縮略語,構(gòu)建足夠訓(xùn)練規(guī)模的產(chǎn)品命名實體訓(xùn)練集是比較困難的。這個問題對于消費對象識別來說同樣存在,由于社會媒體中用戶的內(nèi)容隨意,導(dǎo)致消費對象的成分多不完整,通常由縮略語等代替,故而諸如產(chǎn)品型號類:5s(指iPhone手機的型號5s)這種產(chǎn)品型號邊界未必能夠被識別出來。

在情感分析中有研究從評論中挖掘用戶的評價對象。一般而言,現(xiàn)有的方法將評價對象的范圍限定在名詞或名詞短語的范疇內(nèi),當(dāng)然并非所有的名詞或名詞短語都是評價對象,因而需要對其進行識別。有研究者基于經(jīng)驗性的規(guī)則[12]或關(guān)聯(lián)規(guī)則的方法找出頻繁出現(xiàn)的評價對象[13-14],然后基于經(jīng)驗性的剪枝方法從中過濾錯誤的評價對象實例。還有學(xué)者將評價對象與產(chǎn)品屬性之間關(guān)聯(lián)起來,即認為產(chǎn)品屬性可以作為評價對象的一種表達方式,如對一個手機來講,“手機的像素”是手機的一個屬性,而“觸屏手機”是手機的部件之一。首先,該方法獲取大量的名詞短語作為候選評價對象;繼而采用了某些關(guān)系指示短語(比如“屬性-從性”關(guān)系指示詞:attribute-of)來獲取評價對象,最后利用候選評價對象和關(guān)系指示短語之間的共現(xiàn)關(guān)系,得出該候選評價對象是否是真正的評價對象。

4 未來的研究方向

消費意圖識別作為產(chǎn)品推薦和自然語言處理領(lǐng)域的一個重要方向,還有許多有意義的問題值得研究,其中熱點的研究方向和問題主要包括:

(1)雖然研究者們已經(jīng)提出了多種方法用于消費意圖句的識別、消費意圖模板和消費對象識別等方法。然而總的來看識別出的準(zhǔn)確率較低,仍有許多噪聲數(shù)據(jù)無法過濾,特別是隱性消費意圖識別鮮有研究。因此接下來的一個主要目標(biāo)就是如何找到一種有效的方法對不同平臺中的消費意圖句進行準(zhǔn)確識別。同時,迫切需要其后的研究者把消費意圖識別的各項任務(wù)做細、做深。尤其是希望能找到一種對于各個平臺或各個不同領(lǐng)域都適用的識別方法。

(2)目前來看,消費意圖識別的大部分工作都集中在顯式消費意圖識別的研究任務(wù)中。然而與顯式消費意圖識別任務(wù)不同,隱式消費意圖識別的研究任務(wù)也是比較有意義的問題。即在一個用戶表達的文本中,挖掘出潛在的購買目標(biāo)。這方面的研究工作還比較少且仍未臻深入。此外,相對于消費意圖句的識別而言,基于用戶消費意圖的研究也還未展開,尤其是在跨平臺上的研究遠達到充分和全面。然而總的看來,基于隱式消費意圖的研究和基于用戶的消費意圖研究方面還有許多的問題有待解決。

(3)消費意圖研究中的評測問題一直是困擾研究者的一個主要問題。因此希望廣大研究者們能夠共同努力,推出一套大家都能認可和接受的評測體系和數(shù)據(jù),這樣定會極大的促進本研究的發(fā)展。本文基于內(nèi)容的消費意圖識別中各類實驗大都采用人工評測的方法,基于用戶的消費意圖識別評價中采用了自動評價的方法。由于人工評測主觀性強且費時費力,因此找到一種消費意圖研究的自動評測方法還是非常有必要的。

(4)消費意圖識別研究在眾多相關(guān)研究中都有很大的應(yīng)用潛力,如有研究是基于消費意圖的電影票房預(yù)測取得了不錯的性能。但這方面具體應(yīng)用的例子仍不多。所以在今后的研究中,應(yīng)該積極探索消費意圖識別在各種實際任務(wù)中的作用,這樣才能更好地推動此項研究深入開展。

6 結(jié)束語

社會媒體是一個基于用戶關(guān)系的信息分享、傳播以及獲取平臺,并實現(xiàn)即時分享。這即使得微博成為一個嶄新的信息傳播和用戶交互的方式:一方面,人們通過微博各種消費需求信息,向家人、朋友、同事等尋求幫助,期望從朋友中獲得產(chǎn)品的信息;另一方面,越來越多的用戶也樂于在微博上分享各種感興趣的話題和愛好進行即時分享。因而,迫切需要了解用戶的消費意圖或興趣。消費意圖識別作為產(chǎn)品推薦和自然語言處理領(lǐng)域的一個重要方向,目前的研究還遠未足夠。因此就需要在已有工作的基礎(chǔ)上進一步鉆研,針對尚且存在的問題展開攻關(guān)。另外,隨著消費意圖識別方法和技術(shù)的逐漸成熟,相應(yīng)研究成果也將更為廣泛地投入到實際應(yīng)用中去,以促進諸如產(chǎn)品推薦、信息抽取、在線廣告以及市場營銷等相關(guān)研究的發(fā)展。

參考文獻:

[1] B. Fu, T. LIU. Weakly-supervised Consumption Intent Detection in Microblogs [J]. Journal of Computational Information Systems, 2013, 6(9):2423C2431.

[2] X. Ding, T. Liu, J. Duan, et al. Mining User Consumption Intention from Social Media Using Domain Adaptive Convolutional Neural Network [C]// Proceedings of AAAI 2015, Austin, Texas,USA:AAAI,2015: 2389-2395.

[3] J. Ramanand, K. Bhavsar, N. Pedanekar. Wishful Thinking: Finding Suggestions and ‘buy’ Wishes from Product Reviews. [C]// Proceedings of NAACL HLT 2010 Workshop on Computational Approaches to Analysis and Generation of Emotion in Text, Los Angeles, California:ACL, 2010:54C61.

[4] A. Goldberg, N. Fillmore, D. Andrzejewski, et al. May all Your Wishes Come True: A Study of Wishes and How to Recognize Them. [C]// Proceedings of NAACL HLT 2009, Boulder, Colorado:ACL, 2009:263C271.

[5] J. Wang, W. X. Zhao, H. Wei, et al. Mining New Business Opportunities: Identifying Trend Related Products by Leveraging Commercial Intents from Microblogs [C]// Proceedings of EMNLP 2013, Seattle, USA:ACL, 2013:1337C1347.

[6] Z. Chen, B. Liu, M. Hsu, et al. Identifying Intention Posts in Discussion Forums [C]// Proceedings of HLT- NAACL2013, Atlanda, GA, USA:ACL, 2013:1041C1050.

[7] J. Wang, G. Cong, X. W. Zhao, et al. Mining User Intents in Twitter: A Semi-supervised Approach to Inferring Intent Categories for Tweets [C]// Proceedings of AAAI 2015, Austin, Texas, USA:AAAI, 2015: 318-324.

[8] 劉非凡, 趙軍, 呂碧波等. 面向商務(wù)信息抽取的產(chǎn)品命名實體識別研究[J].中文信息學(xué)報, 2006, 20(1):7C13.

[9] F. Luo, Q. Qiu, Q. Xiong. Introduction to the Product-entity Recognition Task [C]// Proceedings of Web Society (SWS), 2011 3rd Symposium on, Port Elizabeth, South Africa: Web Society,2011:122C126.

[10] F. Luo, H. Xiao, W. Chang. Product Named Entity Recognition Using Conditional Random Fields [C]// Proceedings of Business Intelligence and Financial Engineering (BIFE) 2011, Wuhan,China:[s.n.],2011:86C89.

[11] Y. Zhao, B. Qin, S. Hu, et al. Generalizing Syntactic Structures for Product Attribute Candidate Extraction [C]// Proceedings of NAACL 2010, Los Angeles, CA:ACL, 2010:377C380.

[12] J. Yi, T. Nasukawa, R. Bunescu, et al. Sentiment Analyzer: Extracting Sentiments about a Given Topic Using Natural Language Processing Techniques [C]// Proceedings of ICDM 2003, Melbourne, Florida, USA:ICDM, 2003:427C434.