前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的人工神經(jīng)網(wǎng)絡(luò)的起源主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞 誒爾曼神經(jīng)網(wǎng)絡(luò);人工神經(jīng)網(wǎng)絡(luò);隨機(jī)游走模型;組合預(yù)測(cè);金融時(shí)間序列
中圖分類號(hào) F224 文獻(xiàn)標(biāo)識(shí)碼 A
1 引 言
金融時(shí)間序列與經(jīng)濟(jì)環(huán)境及商業(yè)環(huán)境有關(guān),如股市,匯率,物價(jià)指數(shù),國(guó)民收入和凈出口等.選擇一個(gè)合適的金融數(shù)據(jù)模型,需要正確地識(shí)別金融市場(chǎng)與整體經(jīng)濟(jì)之間的內(nèi)在關(guān)系[1].在實(shí)踐中非常困難.因?yàn)橐粋€(gè)金融時(shí)序數(shù)據(jù)的動(dòng)態(tài)變化受到多個(gè)經(jīng)濟(jì)變量的影響,包括經(jīng)濟(jì)增長(zhǎng),利率,通貨膨脹,通貨緊縮,政治決策和心理因素等多個(gè)復(fù)雜的經(jīng)濟(jì)變量[1].
這些年來(lái),關(guān)于金融時(shí)間序列的分布特征、模型模擬及預(yù)測(cè)等已經(jīng)有了大量的研究工作[2,3].線性統(tǒng)計(jì)模型,如指數(shù)平滑法[4]和ARIMA[5]模型等,已經(jīng)大量應(yīng)用于金融數(shù)據(jù)的預(yù)測(cè).ARIMA模型的一個(gè)分支,即隨機(jī)游走模型(Random Walk model)[1,6],已經(jīng)成為這個(gè)領(lǐng)域的主流統(tǒng)計(jì)技術(shù).在一個(gè)簡(jiǎn)單的隨機(jī)游走模型中,每一期的預(yù)測(cè)值被認(rèn)為是最近一期的觀測(cè)值和隨機(jī)誤差項(xiàng)的總和.目前,簡(jiǎn)單隨機(jī)游走模型是金融時(shí)間序列分析中最主要的線性模型(尤其是匯率數(shù)據(jù))[7].對(duì)隨機(jī)游走模型的改進(jìn),如帶漂移項(xiàng)的隨機(jī)游走模型和誤差修正,也有了很多相關(guān)的研究[1].盡管隨機(jī)游走模型具有簡(jiǎn)單性和顯著的預(yù)測(cè)精度,但是其主要缺點(diǎn)是內(nèi)在的線性形式.隨機(jī)游走模型未能捕獲存在于金融時(shí)間序列中的非線性特征[2,7].非線性是金融時(shí)間序列的缺省特征,因此,通過一個(gè)隨機(jī)游走模型近似它是不充分的.在這種情況下,人工神經(jīng)網(wǎng)絡(luò)是一種不錯(cuò)的選擇.由于其非線性,非參數(shù),自適應(yīng)和噪聲耐受性,人工神經(jīng)網(wǎng)絡(luò)在金融時(shí)間序列預(yù)測(cè)領(lǐng)域獲得了廣泛的關(guān)注[2,3].這些顯著的特征使得人工神經(jīng)網(wǎng)絡(luò)模型能夠有效地識(shí)別解釋變量之間導(dǎo)致金融時(shí)序圖產(chǎn)生不規(guī)則波峰和波谷的內(nèi)在機(jī)理.與其他非線性統(tǒng)計(jì)模型不同的是,人工神經(jīng)網(wǎng)絡(luò)能夠在不了解底層數(shù)據(jù)計(jì)算過程的情況下進(jìn)行非線性模擬[8].不少研究者對(duì)比了人工神經(jīng)網(wǎng)絡(luò)和隨機(jī)游走模型預(yù)測(cè)金融數(shù)據(jù)時(shí)的表現(xiàn),也研究出了許多有益的結(jié)果:如Dunis and William發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)相對(duì)于一般的統(tǒng)計(jì)模型可以提供更高的預(yù)測(cè)精度;Sun[1]發(fā)現(xiàn)在預(yù)測(cè)匯率時(shí),人工神經(jīng)網(wǎng)絡(luò)表現(xiàn)出比隨機(jī)游走模型更差的預(yù)測(cè)精度等等.但是,對(duì)于預(yù)測(cè)金融數(shù)據(jù),一個(gè)金融時(shí)間序列一般包含了線性部分和非線性部分,單獨(dú)使用人工神經(jīng)網(wǎng)絡(luò)模型或隨機(jī)游走模型并不合適.上述研究無(wú)法確定人工神經(jīng)網(wǎng)絡(luò)模型和隨機(jī)游走模型中哪一個(gè)更適應(yīng)于預(yù)測(cè)這類金融數(shù)據(jù).從而激勵(lì)著去尋找一種組合機(jī)制去預(yù)測(cè)匯率.對(duì)于金融數(shù)據(jù)模型的預(yù)測(cè),zhang[7]首次將隨機(jī)游走模型和神經(jīng)網(wǎng)絡(luò)模型結(jié)合起來(lái),國(guó)內(nèi)學(xué)者熊志斌也做了ARIMA融合神經(jīng)網(wǎng)絡(luò)的人民幣匯率預(yù)測(cè)模型研究[9].
本文假設(shè)任何金融時(shí)間序列由線性部分和非線性自相關(guān)部分組成,且可以從時(shí)間序列中剝離、單獨(dú)建模.將隨機(jī)游走模型和神經(jīng)網(wǎng)絡(luò)模型結(jié)合起來(lái)對(duì)金融數(shù)據(jù)進(jìn)行預(yù)測(cè).主要步驟如下:首先,隨機(jī)游走模型用于擬合金融時(shí)間序列的線性部分,由觀察值和隨機(jī)游走模型擬合值之間的差計(jì)算樣本內(nèi)殘差.根據(jù)假設(shè),這些殘差只包含非線性關(guān)系;第二,F(xiàn)ANN和EANN將用于分別擬合這些殘差值,并由2個(gè)模型產(chǎn)生的預(yù)測(cè)值的平均值得到想要的殘差估計(jì);第三步,由隨機(jī)游走模型預(yù)測(cè)時(shí)間序列的線性部分;最后,將線性部分和非線性部分所得到的預(yù)測(cè)值加總,獲得期望的最終預(yù)測(cè).
2 隨機(jī)游走模型
隨機(jī)游走模型是金融時(shí)序分析最流行和有效的統(tǒng)計(jì)模型,也被廣大的研究生所研究和使用,這個(gè)模型假設(shè)最近的觀察值是對(duì)下一期預(yù)測(cè)值的最佳指南.在數(shù)學(xué)上,一個(gè)簡(jiǎn)單的RW模型被表示如下:
其中,和yt是時(shí)間序列中的觀察值,εt是一個(gè)白噪聲并且εt~N(0,σ2).
從式(1)中可以看出,一個(gè)隨機(jī)游走模型表明所有與未來(lái)相關(guān)的信息已經(jīng)包含在可用的數(shù)據(jù)里,這個(gè)模型因?yàn)楸皇褂幂^多,所以非常容易理解和實(shí)現(xiàn).根據(jù)有效市場(chǎng)的假說,隨機(jī)游走模型是外匯匯率預(yù)測(cè)中最主要的線性模型,而且大量研究指出許多基于線性結(jié)構(gòu)的預(yù)測(cè)技術(shù)并沒有比簡(jiǎn)單的隨機(jī)游走模型更有效.
一個(gè)隨機(jī)游走模型的成功很大程度上取決于隨機(jī)誤差項(xiàng),按照定義,隨機(jī)誤差項(xiàng)是獨(dú)立同分布的.在本文中將生成獨(dú)立同分布的偽隨機(jī)正態(tài)變量εt~N(0,σ2),其中σ2是樣本內(nèi)數(shù)據(jù)集的方差.
3 人工神經(jīng)網(wǎng)絡(luò)(ANN)模型
3.1 前饋神經(jīng)網(wǎng)絡(luò) (FANN)
在所有可用的仿生預(yù)測(cè)方法中,人工神經(jīng)網(wǎng)絡(luò)無(wú)疑是最流行且最成功的.人工神經(jīng)網(wǎng)絡(luò)最初起源于對(duì)人腦結(jié)構(gòu)的模仿,漸漸地,神經(jīng)網(wǎng)絡(luò)技術(shù)在眾多領(lǐng)域起到了極為重要的作用,如分類、識(shí)別和預(yù)測(cè).人工神經(jīng)網(wǎng)絡(luò)通過若干互相連接的分布在不同層的神經(jīng)元來(lái)學(xué)習(xí)數(shù)據(jù)的內(nèi)在關(guān)系.多層感知器(MLP)是最被認(rèn)可的人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),用于時(shí)間序列預(yù)測(cè)問題.一個(gè)MLP基本上是一個(gè)輸入層,一個(gè)或多個(gè)隱藏層和一個(gè)輸出層的前饋結(jié)構(gòu).在每層中有許多個(gè)處理結(jié)點(diǎn),其通過不可逆的鏈接連接到下一層.單層次的隱藏節(jié)點(diǎn)已經(jīng)足以解決許多最實(shí)際的問題.圖1描述了一個(gè)典型的MLP結(jié)構(gòu)(p個(gè)輸入結(jié)點(diǎn),h個(gè)隱藏結(jié)點(diǎn)和一個(gè)輸出結(jié)點(diǎn)).
在沒有任何限制條件的情況下,簡(jiǎn)單的多層感應(yīng)器模型或前饋神經(jīng)網(wǎng)絡(luò)模型能以任何給定的精度去近似逼近任何非線性函數(shù).考慮到計(jì)算的要求,簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)往往是更合適的.選擇合適的網(wǎng)絡(luò)結(jié)構(gòu)很重要,但并不是一個(gè)簡(jiǎn)單的工作.網(wǎng)絡(luò)結(jié)構(gòu)的選擇主要包括確定輸入節(jié)點(diǎn)、隱藏節(jié)點(diǎn)和輸出節(jié)點(diǎn)的個(gè)數(shù),以及隱藏層的層數(shù).在不同文獻(xiàn)中有著不同的參數(shù)優(yōu)化選擇方法,但這些方法并不簡(jiǎn)單,而且都是針對(duì)著具體的問題.
廣泛應(yīng)用的神經(jīng)網(wǎng)絡(luò)選擇方法包括了赤池信息準(zhǔn)則(AIC),貝葉斯信息準(zhǔn)則(BIC),施瓦茨的貝葉斯準(zhǔn)則(SBC)和偏差校正的赤池信息準(zhǔn)則(AICC-).這4種準(zhǔn)則基于對(duì)增加神經(jīng)網(wǎng)絡(luò)中參數(shù)個(gè)數(shù)的懲罰.在本文中,使用BIC準(zhǔn)則作為神經(jīng)網(wǎng)絡(luò)的選擇標(biāo)準(zhǔn),因?yàn)樗绕渌?種準(zhǔn)則更嚴(yán)重地懲罰了額外的參數(shù).對(duì)于一個(gè)的FANN模型,BIC的數(shù)學(xué)表達(dá)式由式(5)給出:
3.2 誒爾曼人工神經(jīng)網(wǎng)絡(luò)(EANN)
類似于常見的前饋型神經(jīng)網(wǎng)絡(luò)(FANNs),時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)在金融時(shí)間序列預(yù)測(cè)領(lǐng)域也相當(dāng)流行.誒爾曼人工神經(jīng)網(wǎng)絡(luò)是一種簡(jiǎn)單的時(shí)間遞歸神經(jīng)網(wǎng)絡(luò),除了3種常見的層次,還有額外的上下文層和反饋連接.在每一個(gè)計(jì)算步驟中,隱藏層的輸出被再次反饋到上下文層,如圖2所示.這種遞歸使得神經(jīng)網(wǎng)絡(luò)動(dòng)態(tài)化,從而能夠?qū)崿F(xiàn)對(duì)處理結(jié)點(diǎn)非線性時(shí)間依賴的映射.EANN模型通常比相同結(jié)構(gòu)的FANN提供了更好的預(yù)測(cè)性能.然而,EANNs比FANNs需要更多數(shù)量的網(wǎng)絡(luò)連接和記憶單元.
使用相同的網(wǎng)絡(luò)結(jié)構(gòu)的FANN和EANN模型,不同之處在于EANN模型隱藏層的神經(jīng)元是對(duì)應(yīng)FANN模型中神經(jīng)元的5倍.
4 組合方法的建模
在本文中,決定同時(shí)利用隨機(jī)網(wǎng)絡(luò)模型和神經(jīng)網(wǎng)路模型來(lái)預(yù)測(cè)金融數(shù)據(jù).雖然這些模型有著廣泛的應(yīng)用,但是他們之中沒有一個(gè)模型能夠在所有預(yù)測(cè)情況之下都最好.例如,RW模型不適合于識(shí)別非線性模式,類似地,使用人工神經(jīng)網(wǎng)絡(luò)處理線性問題時(shí)產(chǎn)生的結(jié)果也好壞參半.因此,更科學(xué)的做法是找一種組合方法去結(jié)合這兩種模型的長(zhǎng)處,而不是單獨(dú)地去應(yīng)用它們.假設(shè),一個(gè)金融時(shí)間序列由從線性和非線性兩部分構(gòu)成,能從時(shí)間序列中分離出來(lái)并單獨(dú)地建模.從數(shù)學(xué)上講:
這種組合方法的顯著特點(diǎn)如下:①任何金融時(shí)間序列都由線性部分和非線性部分組成,通過隨機(jī)游走模型擬合線性部分,神經(jīng)網(wǎng)絡(luò)模型擬合非線性殘差部分,提高了總體的預(yù)測(cè)精度;②類似的組合方法最早由Zhang推出,在他們的方法中,時(shí)間序列的線性部分由ARIMA模型來(lái)擬合而剩余的非線性殘差部分由FANN來(lái)擬合.然而,該組合方法同時(shí)結(jié)合了FANN模型和EANN模型兩種模型的優(yōu)勢(shì),能更好地識(shí)別非線性自回歸結(jié)構(gòu);③這種組合機(jī)制是基于一種簡(jiǎn)單而有效的想法,相當(dāng)容易實(shí)施和解釋.④值得注意的是,如果金融時(shí)間序列中的線性和非線性部分存在著適當(dāng)比例的自相關(guān)結(jié)構(gòu),那所提出的組合方法將能顯著改善預(yù)測(cè)精度.如果這2個(gè)部分自相關(guān)程度較弱,那該方法可能并不合適.
5 實(shí)驗(yàn)結(jié)果與討論
為了驗(yàn)證所提出的組合方法的有效性,本文用到了三組數(shù)據(jù):①港幣兌換美元匯率,包括了從1994年8月到2015年6月港幣兌換人民幣的每月匯率;②美元兌換人民幣匯率,包含從2005年5月到2015年6月美元兌換人民幣的每月匯率;③人民幣兌換港幣匯率,包括了從1995年1月到2015年6月人民幣兌換港幣的每月匯率.(數(shù)據(jù)來(lái)源:匯率數(shù)據(jù)取自國(guó)泰安數(shù)據(jù)庫(kù))(見表1)
從圖3中可以清楚地看到3個(gè)時(shí)間序列中不規(guī)則非平穩(wěn)的變化.
圖4和5中,畫出了3種時(shí)間序列的實(shí)際曲線和通過組合模型所描繪的預(yù)測(cè)值曲線.在每個(gè)圖中,實(shí)線和虛線分別表示實(shí)際和預(yù)測(cè)序列.港幣美元匯率與人民幣港幣匯率數(shù)據(jù)的預(yù)測(cè)誤差較小,預(yù)測(cè)值與原始值的走勢(shì)趨于一致.預(yù)測(cè)人民幣港幣匯率的預(yù)測(cè)效果沒有港幣美元匯率與人民幣港幣匯率好,預(yù)測(cè)值的總體走勢(shì)與原始值一致.三組匯率數(shù)據(jù)的原始值和他們的預(yù)測(cè)值之間的接近程度是顯而易見的.
6 總 結(jié)
眾所周知,設(shè)計(jì)一個(gè)合適的模型來(lái)預(yù)測(cè)金融數(shù)據(jù)是時(shí)間序列研究領(lǐng)域的一個(gè)重大挑戰(zhàn),也是極其不易之事.這主要是因?yàn)榻鹑跁r(shí)間序列中的不規(guī)則運(yùn)動(dòng)及突然的轉(zhuǎn)折點(diǎn)使得實(shí)際中很難去理解和預(yù)測(cè).基于金融數(shù)據(jù)獨(dú)特的隨機(jī)性特征,本文構(gòu)建了人工神經(jīng)網(wǎng)絡(luò)和隨機(jī)游走模型對(duì)中國(guó)的匯率數(shù)據(jù)進(jìn)行預(yù)測(cè).
本文構(gòu)建的新模型結(jié)合了隨機(jī)游走模型,F(xiàn)ANN模型和EANN模型3種模型的優(yōu)勢(shì)去預(yù)測(cè)金融數(shù)據(jù).并且從實(shí)證結(jié)果表明,預(yù)測(cè)值與原始值的走勢(shì)趨于一致,港幣與人民幣之間的預(yù)測(cè)誤差不大,但是對(duì)于相對(duì)于人民幣匯率的預(yù)測(cè),美元匯率的預(yù)測(cè)效果更好.從預(yù)測(cè)誤差看,均比每個(gè)單獨(dú)的模型效果要好.從三組真實(shí)的金融時(shí)間序列的實(shí)證結(jié)果清楚地表明,本文新構(gòu)建的組合方法極大地提高了整體的預(yù)測(cè)精度.因此,我們的新模型在匯率預(yù)測(cè)方面上有更高的準(zhǔn)確性和適用性.
參考文獻(xiàn)
[1] Y SUN. Exchange rate forecasting with an artificial neural network model: can we beat a random walk model? [D] New Zealand:Christchurch,Lincoln University, 2005.
[2] A HUSSAIN, A KNOWLES, P LISBOA,et al. Financial time series prediction using polynomial pipelined neural networks[J]. Expert Systems with Applications, 2008, 35(3): 1186-1199.
[3] M SEWELL. The application of intelligent systems to financial time series analysis[D].London:Department of Computer Science, UCL,2010.
[4] C LEMKE,B GABRYS. Metalearning for time series forecasting and forecast combination[J]. Neurocomputing, 2010, 73(10): 2006-2016.
[5] G BOX, G JENKINS, G REINSEL. Time series analysis: forecasting and control[M].London John Wiley & Sons, 2011. 734
[6] E TYREE, J LONG. Forecasting currency exchange rates: neural networks and the random walk model[J]. Citeseer, 1995(1):981-996.
[7] G ZHANG. Time series forecasting using a hybrid ARIMA and neural network model[J]. Neurocomputing, 2003, 50: 159-175.
關(guān)鍵詞 算法 智能 計(jì)算機(jī)
中圖分類號(hào):TP301.6 文獻(xiàn)標(biāo)識(shí)碼:A
1智能算法含義
智能計(jì)算也有人稱之為“軟計(jì)算”,是們受自然(生物界)規(guī)律的啟迪,根據(jù)其原理,模仿求解問題的算法。從自然界得到啟迪,模仿其結(jié)構(gòu)進(jìn)行發(fā)明創(chuàng)造,這就是仿生學(xué)。這是我們向自然界學(xué)習(xí)的一個(gè)方面。另一方面,我們還可以利用仿生原理進(jìn)行設(shè)計(jì)(包括設(shè)計(jì)算法),這就是智能計(jì)算的思想。這方面的內(nèi)容很多,如人工神經(jīng)網(wǎng)絡(luò)技術(shù)、遺傳算法、模擬退火算法、模擬退火技術(shù)和群集智能技術(shù)等。
2人工神經(jīng)網(wǎng)絡(luò)算法
“人工神經(jīng)網(wǎng)絡(luò)”(ARTIFICIALNEURAL-->WORK,簡(jiǎn)稱ANN)是在對(duì)人腦組織結(jié)構(gòu)和運(yùn)行機(jī)制的認(rèn)識(shí)理解基礎(chǔ)之上模擬其結(jié)構(gòu)和智能行為的一種工程系統(tǒng)。早在本世紀(jì)40年代初期,心理學(xué)家McCulloch、數(shù)學(xué)家Pitts就提出了人工神經(jīng)網(wǎng)絡(luò)的第一個(gè)數(shù)學(xué)模型,從此開創(chuàng)了神經(jīng)科學(xué)理論的研究時(shí)代。
其后,F(xiàn)Rosenblatt、Widrow和J.J.Hopfield等學(xué)者又先后提出了感知模型,使得人工神經(jīng)網(wǎng)絡(luò)技術(shù)得以蓬勃發(fā)展。
神經(jīng)系統(tǒng)的基本構(gòu)造是神經(jīng)元(神經(jīng)細(xì)胞),它是處理人體內(nèi)各部分之間相互信息傳遞的基本單元。據(jù)神經(jīng)生物學(xué)家研究的結(jié)果表明,人的一個(gè)大腦一般有1010~1011個(gè)神經(jīng)元。每個(gè)神經(jīng)元都由一個(gè)細(xì)胞體,一個(gè)連接其他神經(jīng)元的軸突和一些向外伸出的其它較短分支――樹突組成。軸突的功能是將本神經(jīng)元的輸出信號(hào)(興奮)傳遞給別的神經(jīng)元。其末端的許多神經(jīng)末梢使得興奮可以同時(shí)傳送給多個(gè)神經(jīng)元。樹突的功能是接受來(lái)自其它神經(jīng)元的興奮。神經(jīng)元細(xì)胞體將接受到的所有信號(hào)進(jìn)行簡(jiǎn)單處理(如:加權(quán)求和,即對(duì)所有的輸入信號(hào)都加以考慮且對(duì)每個(gè)信號(hào)的重視程度――體現(xiàn)在權(quán)值上――有所不同)后由軸突輸出。神經(jīng)元的樹突與另外的神經(jīng)元的神經(jīng)末梢相連的部分稱為突觸。
3遺傳算法
遺傳算法(Genetic Algorithms)是基于生物進(jìn)化理論的原理發(fā)展起來(lái)的一種廣為應(yīng)用的、高效的隨機(jī)搜索與優(yōu)化的方法。其主要特點(diǎn)是群體搜索策略和群體中個(gè)體之間的信息交換,搜索不依賴于梯度信息。它是在70年代初期由美國(guó)密執(zhí)根(Michigan)大學(xué)的霍蘭(Holland)教授發(fā)展起來(lái)的。1975年霍蘭教授發(fā)表了第一本比較系統(tǒng)論述遺傳算法的專著《自然系統(tǒng)與人工系統(tǒng)中的適應(yīng)性》(《Adaptationin Naturaland Artificial Systems》)。遺傳算法最初被研究的出發(fā)點(diǎn)不是為專門解決最優(yōu)化問題而設(shè)計(jì)的,它與進(jìn)化策略、進(jìn)化規(guī)劃共同構(gòu)成了進(jìn)化算法的主要框架,都是為當(dāng)時(shí)人工智能的發(fā)展服務(wù)的。迄今為止,遺傳算法是進(jìn)化算法中最廣為人知的算法。
近幾年來(lái),遺傳算法主要在復(fù)雜優(yōu)化問題求解和工業(yè)工程領(lǐng)域應(yīng)用方面,取得了一些令人信服的結(jié)果,所以引起了很多人的關(guān)注。在發(fā)展過程中,進(jìn)化策略、進(jìn)化規(guī)劃和遺傳算法之間差異越來(lái)越小。遺傳算法成功的應(yīng)用包括:作業(yè)調(diào)度與排序、可靠性設(shè)計(jì)、車輛路徑選擇與調(diào)度、成組技術(shù)、設(shè)備布置與分配、交通問題等等。
4模擬退火算法
模擬退火算法來(lái)源于固體退火原理,將固體加溫至充分高,再讓其徐徐冷卻,加溫時(shí),固體內(nèi)部粒子隨溫升變?yōu)闊o(wú)序狀,內(nèi)能增大,而徐徐冷卻時(shí)粒子漸趨有序,在每個(gè)溫度都達(dá)到平衡態(tài),最后在常溫時(shí)達(dá)到基態(tài),內(nèi)能減為最小。根據(jù)Metropolis準(zhǔn)則,粒子在溫度T時(shí)趨于平衡的概率為e-%=E/(kT),其中E為溫度T時(shí)的內(nèi)能,%=E為其改變量,k為Boltzmann常數(shù)。用固體退火模擬組合優(yōu)化問題,將內(nèi)能E模擬為目標(biāo)函數(shù)值f,溫度T演化成控制參數(shù)t,即得到解組合優(yōu)化問題的模擬退火算法:由初始解i和控制參數(shù)初值t開始,對(duì)當(dāng)前解重復(fù)“產(chǎn)生新解計(jì)算目標(biāo)函數(shù)差接受或舍棄”的迭代,并逐步衰減t值,算法終止時(shí)的當(dāng)前解即為所得近似最優(yōu)解,這是基于蒙特卡羅迭代求解法的一種啟發(fā)式隨機(jī)搜索過程。退火過程由冷卻進(jìn)度表(Cooling Schedule)控制,包括控制參數(shù)的初值t及其衰減因子%=t、每個(gè)t值時(shí)的迭代次數(shù)L和停止條件S。
5蟻群優(yōu)化算法
受螞蟻覓食時(shí)的通信機(jī)制的啟發(fā),90年代Dorigo提出了蟻群優(yōu)化算法(Ant Colony Optimization,ACO)來(lái)解決計(jì)算機(jī)算法學(xué)中經(jīng)典的“貨郎擔(dān)問題”。如果有n個(gè)城市,需要對(duì)所有n個(gè)城市進(jìn)行訪問且只訪問一次的最短距離。
在解決貨郎擔(dān)問題時(shí),蟻群優(yōu)化算法設(shè)計(jì)虛擬的“螞蟻”將摸索不同路線,并留下會(huì)隨時(shí)間逐漸消失的虛擬“信息素”。虛擬的“信息素”也會(huì)揮發(fā),每只螞蟻每次隨機(jī)選擇要走的路徑,它們傾向于選擇路徑比較短的、信息素比較濃的路徑。根據(jù)“信息素較濃的路線更近”的原則,即可選擇出最佳路線。由于這個(gè)算法利用了正反饋機(jī)制,使得較短的路徑能夠有較大的機(jī)會(huì)得到選擇,并且由于采用了概率算法,所以它能夠不局限于局部最優(yōu)解。
6粒子群優(yōu)化算法
粒子群優(yōu)化算法(PSO)是一種進(jìn)化計(jì)算技術(shù)(Evolutionary Computation),有Eberhart博士和Kennedy博士發(fā)明。源于對(duì)鳥群捕食的行為研究。
PSO同遺傳算法類似,是一種基于疊代的優(yōu)化工具。系統(tǒng)初始化為一組隨機(jī)解,通過疊代搜尋最優(yōu)值。但是并沒有遺傳算法用的交叉(crossover)以及變異(mutation)。而是粒子在解空間追隨最優(yōu)的粒子進(jìn)行搜索。
關(guān)鍵詞:crm;渠道偏好度;電信
一、 案例研究方法與模型介紹
西方學(xué)者的案例研究過程淵源已久,kyburz-graber(2004)將案例研究分為三類:描述性案例研究、探索性案例研究以及因果解釋性案例研究。本研究屬于探索性案例研究,希望以國(guó)內(nèi)一家電信運(yùn)營(yíng)商的crm管理過程實(shí)踐為研究對(duì)象,分析客戶對(duì)于渠道的偏好度。本案例企業(yè)為某電信運(yùn)營(yíng)商的一家地市分公司,擁有超過三百萬(wàn)用戶,主要從事移動(dòng)通信和數(shù)據(jù)服務(wù)業(yè)務(wù)。
這家電信運(yùn)營(yíng)商在完成基本的各種業(yè)務(wù)運(yùn)營(yíng)的生產(chǎn)性信息系統(tǒng)后,進(jìn)一步完成數(shù)據(jù)匯總并建設(shè)了涵蓋所有客戶互動(dòng)歷史數(shù)據(jù)的中央數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)作為企業(yè)級(jí)業(yè)務(wù)數(shù)據(jù)平臺(tái)。其市場(chǎng)營(yíng)銷部門充分利用這個(gè)統(tǒng)一集中的管理信息平臺(tái),對(duì)客戶作各種深度的數(shù)據(jù)挖掘研究。對(duì)于渠道的偏好度的研究分析方案如下:
1. 渠道的類型定為四類:營(yíng)業(yè)廳、電話客服中心、短信、網(wǎng)站。
2. 客戶渠道的偏好度模型,使用數(shù)據(jù)挖掘的人工神經(jīng)網(wǎng)絡(luò)技術(shù)(詳述如后),計(jì)算出每個(gè)用戶使用四種渠道辦理業(yè)務(wù)的傾向度評(píng)分。
3. 主要的數(shù)據(jù)來(lái)源包括客服中心呼叫記錄,短信請(qǐng)求記錄,網(wǎng)站渠道運(yùn)營(yíng)記錄,業(yè)務(wù)支撐系統(tǒng)工單,服務(wù)使用數(shù)據(jù),以及客戶基本屬性數(shù)據(jù)等。
4. 時(shí)間分析窗口數(shù)據(jù),利用渠道偏好度模型給每個(gè)分析用戶進(jìn)行渠道使用傾向評(píng)分,再通過驗(yàn)證窗口用戶使用渠道情況進(jìn)行模型驗(yàn)證。分析窗口:用于分析特征的歷史數(shù)據(jù)的時(shí)間跨度,需要3個(gè)月的歷史數(shù)據(jù);驗(yàn)證窗口:用于驗(yàn)證用戶使用渠道情況,需要2個(gè)月的歷史數(shù)據(jù)。
5. 本案例研究所使用的技術(shù)方法為人工神經(jīng)網(wǎng)絡(luò)(ann)。人工神經(jīng)網(wǎng)絡(luò)的研究發(fā)展起源于20世紀(jì)40年代,是一種模仿人腦神經(jīng)系統(tǒng)的非線性映射結(jié)構(gòu)。它不依賴于精確數(shù)學(xué)模型,而顯示出自適應(yīng)和自學(xué)習(xí)功能。1943年,法國(guó)心理學(xué)家w.s.mcculoch和w.pitts提出了第一個(gè)神經(jīng)元數(shù)學(xué)模型,開創(chuàng)了人類自然科學(xué)史上的一門新興科學(xué)ann的研究。
人工神經(jīng)網(wǎng)絡(luò)會(huì)不斷檢驗(yàn)預(yù)測(cè)結(jié)果與實(shí)際情況是否相符。把與實(shí)際情況不符合的輸入輸出數(shù)據(jù)作為新的樣本,對(duì)新樣本進(jìn)行動(dòng)態(tài)學(xué)習(xí)并動(dòng)態(tài)改變網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù),這樣使網(wǎng)絡(luò)適應(yīng)環(huán)境或預(yù)測(cè)對(duì)象本身結(jié)構(gòu)和參數(shù)的變化,從而使預(yù)測(cè)網(wǎng)絡(luò)模型有更強(qiáng)的適應(yīng)性。而在ann的實(shí)現(xiàn)過程中,往往需要大量的數(shù)據(jù)來(lái)產(chǎn)生充足的訓(xùn)練和測(cè)試樣本模式集,以有效地訓(xùn)練和評(píng)估ann的性能,這正好是建立在數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘工具所能提供的。由于ann和數(shù)據(jù)挖掘兩者的優(yōu)勢(shì)互補(bǔ),將神經(jīng)網(wǎng)絡(luò)用于數(shù)據(jù)挖掘具有現(xiàn)實(shí)意義和實(shí)用價(jià)值。人工神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)挖掘中的優(yōu)勢(shì)是:對(duì)于噪聲數(shù)據(jù)的強(qiáng)承受能力,對(duì)數(shù)據(jù)分類的高準(zhǔn)確性,以及可用各種算法進(jìn)行規(guī)則提取。
人工神經(jīng)網(wǎng)絡(luò)方法常用于分類、聚類、特征挖掘、預(yù)測(cè)和模式識(shí)別。神經(jīng)網(wǎng)絡(luò)模型大致可分為以下三種:(1)前饋式網(wǎng)絡(luò):以感知機(jī)、反向傳播模型和函數(shù)型網(wǎng)絡(luò)為代表,主要用于預(yù)測(cè)和模式識(shí)別等領(lǐng)域;(2)反饋式網(wǎng)絡(luò):以hopfield離散模型和連續(xù)模型為代表,主要用于聯(lián)想記憶和優(yōu)化計(jì)算;(3)自組織網(wǎng)絡(luò):以自適應(yīng)共振理論:(adaptive resonance theory,art)模型為代表,主要用于聚類分析。
在本案例應(yīng)用中,主要是用前饋式網(wǎng)絡(luò)來(lái)進(jìn)行多變量的概率分布預(yù)測(cè)。因?yàn)楸疚哪繕?biāo)是對(duì)用戶使用幾種渠道的可能性高低進(jìn)行預(yù)測(cè)。
二、 案例研究的實(shí)施與分析
1. 業(yè)務(wù)規(guī)劃的考量。對(duì)客戶使用渠道的習(xí)慣偏好進(jìn)行分析具有重大意義,可以對(duì)營(yíng)銷活動(dòng)提供有力的支持。通過客戶行為特征分析,尋找客戶選擇渠道的偏好,提供客戶營(yíng)銷渠道的最優(yōu)路徑。不但有利于優(yōu)化渠道資源,降低營(yíng)銷成本,更能提高營(yíng)銷成功率,提升客戶滿意度。
目前電信客戶可以使用的移動(dòng)通信服務(wù)渠道包括營(yíng)業(yè)廳、電話客服、短信、網(wǎng)站、自助服務(wù)終端等,其中營(yíng)業(yè)廳提供服務(wù)功能最為齊全,但成本也是最高;電話客服使用最為廣泛,幾乎每個(gè)客戶都有使用電話客服的經(jīng)驗(yàn),也是提供最多服務(wù)的渠道,對(duì)于電信公司的用戶滿意度非常重要。因此,研究應(yīng)用的重點(diǎn)之一就是如何發(fā)揮電話客服的優(yōu)勢(shì),以有限資源服務(wù)更多的高價(jià)值客戶和業(yè)務(wù),減少低價(jià)值客戶和業(yè)務(wù)占用客服資源的比例。同時(shí),重點(diǎn)發(fā)展電子渠道,著重提高電子渠道的普及率,培養(yǎng)用戶使用電子渠道的習(xí)慣,引導(dǎo)用戶從傳統(tǒng)渠道(營(yíng)業(yè)廳、電話客服)向電子渠道(短信和網(wǎng)站)轉(zhuǎn)變。
2. 具體的技術(shù)實(shí)現(xiàn)方案:
(1)數(shù)據(jù)準(zhǔn)備:基于業(yè)務(wù)理解以及數(shù)據(jù)分析,選取以下變量為構(gòu)建模型的基礎(chǔ)變量;(詳細(xì)列表如表1所示)
(2)數(shù)據(jù)質(zhì)量分析:對(duì)預(yù)處理之后的基礎(chǔ)變量進(jìn)行數(shù)據(jù)質(zhì)量分析以剔除質(zhì)量較差的變量;
(3)數(shù)據(jù)探索:通過可視化(visualization)工具及統(tǒng)計(jì)分析等方法來(lái)展示及探索各個(gè)變量的可用性,從而獲得模型的輸入變量。從中了解變量的重要性及業(yè)務(wù)發(fā)展規(guī)律;
(4)數(shù)據(jù)處理流程:按照挖掘任務(wù)的要求,將數(shù)據(jù)從中央數(shù)據(jù)倉(cāng)庫(kù)抽取生成挖掘?qū)S玫臄?shù)據(jù)集市?;镜臄?shù)據(jù)處理流程有:數(shù)據(jù)源的匯總合并;執(zhí)行數(shù)據(jù)探索抽樣;透過人工神經(jīng)網(wǎng)絡(luò)(ann)進(jìn)行模型打分;產(chǎn)生模型并進(jìn)行模型驗(yàn)證整體技術(shù)方案的關(guān)鍵點(diǎn)體現(xiàn)在兩個(gè)方面:建模過程:為渠道偏好的分類預(yù)測(cè)找到合適的基礎(chǔ)變量,有助于模型收斂更快更好;模型應(yīng)用過程:應(yīng)用最小長(zhǎng)度原理,控制隱藏節(jié)點(diǎn)數(shù),以達(dá)到擬合最優(yōu)。另借助sas軟件工具實(shí)現(xiàn)模型打分。
3. 具體應(yīng)用實(shí)現(xiàn)案例。根據(jù)電話、網(wǎng)站、短信和營(yíng)業(yè)廳渠道各個(gè)評(píng)分前10%的用戶,取各渠道用戶的評(píng)分值、每用戶平均收入(arpu)、以及在網(wǎng)時(shí)長(zhǎng)的信息設(shè)計(jì)營(yíng)銷方案。
(1)對(duì)偏好電話的客戶,通過電話營(yíng)銷中心外呼進(jìn)行營(yíng)銷,完成后需要對(duì)客戶進(jìn)行短信感謝,同時(shí)介紹網(wǎng)站渠道的便利性和信息豐富的特點(diǎn)。
(2)對(duì)偏好網(wǎng)站的客戶,通過短信提醒用戶登錄網(wǎng)上營(yíng)業(yè)廳辦理業(yè)務(wù)的優(yōu)惠信息,在客戶登錄網(wǎng)上營(yíng)業(yè)廳時(shí)進(jìn)行營(yíng)銷推薦,同時(shí)考慮發(fā)展響應(yīng)較高的用戶群作為網(wǎng)站營(yíng)銷的種子客戶,進(jìn)行持續(xù)的優(yōu)惠激勵(lì)。
(3)對(duì)偏好短信的客戶,通過短信進(jìn)行營(yíng)銷推薦,給予短信辦理業(yè)務(wù)的優(yōu)惠條件,提醒客戶可以嘗試使用信息更加豐富的渠道——網(wǎng)站,并提供網(wǎng)站辦理的簡(jiǎn)單指引。
(4)對(duì)偏好營(yíng)業(yè)廳的客戶,通過短信提醒客戶最近的營(yíng)業(yè)廳,同時(shí)推薦客戶使用電話渠道,而后再通過電話引導(dǎo)客戶使用營(yíng)業(yè)廳之外的渠道,并考慮對(duì)這些客戶給予業(yè)務(wù)優(yōu)惠吸引他們采用。
4. 渠道模型分析結(jié)果與驗(yàn)證。
(1)電話客服中心渠道的偏好度分析。在電話客服中心的營(yíng)銷活動(dòng)中,電話外呼的目標(biāo)客戶優(yōu)先選擇具有電話偏好度的客戶群,其次是沒有明顯渠道偏好的客戶群,再次是營(yíng)業(yè)廳偏好的客戶群,針對(duì)營(yíng)業(yè)廳偏好客戶,可以在電話營(yíng)銷的時(shí)候加入向用戶推薦就近的營(yíng)業(yè)廳的資料。
通過電話渠道偏好客戶分析,歸納出影響偏好電話客服渠道最明顯的前10個(gè)參數(shù)如表2示。
其中,撥打客服次數(shù)、在網(wǎng)時(shí)長(zhǎng)、總計(jì)費(fèi)分鐘數(shù)、是否vip客戶、撥打客服平均時(shí)長(zhǎng)、撥打聲訊臺(tái)次數(shù)、呼轉(zhuǎn)次數(shù)這7個(gè)因素對(duì)客戶的電話偏好產(chǎn)生正影響,也就是客戶的這些參數(shù)的值越大,其偏好電話渠道的可能性就越大;而網(wǎng)站操作業(yè)務(wù)類型數(shù)、短信操作次數(shù)、網(wǎng)站登錄次數(shù)這3個(gè)因素對(duì)電話偏好產(chǎn)生負(fù)影響,與正影響相反。
以“撥打客服次數(shù)”為例,t統(tǒng)計(jì)量基本顯著(p-值小于顯著性水平0.05),即“撥打客服次數(shù)”對(duì)因變量具有顯著的解釋能力,參數(shù)估計(jì)值為0.102 3,即在其他控制其他變量不變的情況下,對(duì)數(shù)發(fā)生比隨著“撥打客服次數(shù)”的增加而增加。
從電話渠道模型驗(yàn)證的角度,前10%的用戶數(shù)量明顯較多,因此選擇前模型得分前10%的客戶作為電話偏好的目標(biāo)客戶。從圖2的曲線來(lái)看,模型得分前10%的客戶覆蓋實(shí)際具有電話渠道偏好客戶比例達(dá)到了30%以上,因此模型提升率達(dá)到3倍以上,說明選擇前10%是可以滿足目前的要求。
(2)短信渠道的偏好度分析。通過短信渠道偏好客戶分析,歸納出影響偏好短信渠道最明顯的前9個(gè)參數(shù):其中短信操作業(yè)務(wù)類型數(shù)、wlan使用分鐘數(shù)、是否使用中文秘書、漫游計(jì)費(fèi)分鐘4個(gè)參數(shù),對(duì)短信偏好產(chǎn)生正影響;而在網(wǎng)時(shí)長(zhǎng)、網(wǎng)站操作業(yè)務(wù)類型數(shù)、總計(jì)費(fèi)分鐘數(shù)、撥打客服次數(shù)、是否使用留言信箱5個(gè)參數(shù)對(duì)短信偏好產(chǎn)生負(fù)影響。
由于短信辦理業(yè)務(wù)的方式比較容易被年輕人接受,而在網(wǎng)時(shí)長(zhǎng)比較大的客戶通常是老客戶,他們比較習(xí)慣使用電話,使用短信的可能性比較小,因此對(duì)比可以看出,在網(wǎng)時(shí)長(zhǎng)對(duì)電話渠道是正影響,對(duì)短信渠道是負(fù)影響。
對(duì)短信渠道模型進(jìn)行驗(yàn)證,幾乎所有的短信業(yè)務(wù)辦理的用戶都是模型得分在20%以內(nèi)的,采用短信方式辦理業(yè)務(wù)的用戶的得分都很高,模型覆蓋率非常精確,模型評(píng)分前20%的用戶幾呼覆蓋100%的短信辦理用戶,模型提升率接近5倍。說明短信渠道偏好的模型評(píng)價(jià)用戶是否有短信偏好的能力較強(qiáng),具有很好的預(yù)測(cè)能力。
(3)網(wǎng)站渠道的偏好度分析。通過網(wǎng)站渠道偏好的客戶分析,歸納出影響偏好網(wǎng)站渠道最明顯的前10個(gè)參數(shù):其中網(wǎng)站操作業(yè)務(wù)類型數(shù)、數(shù)據(jù)業(yè)務(wù)使用種類數(shù)、是否使用號(hào)碼管理3個(gè)參數(shù)對(duì)網(wǎng)站偏好產(chǎn)生正影響;而撥打客服次數(shù)、總計(jì)費(fèi)分鐘數(shù)、撥打客服平均時(shí)長(zhǎng)、訂購(gòu)的wap服務(wù)數(shù)、是否vip客戶、短信操作業(yè)務(wù)類型數(shù)、彩鈴ivr買歌次數(shù)7個(gè)參數(shù)對(duì)網(wǎng)站偏好產(chǎn)生負(fù)影響。
前10大參數(shù)中,網(wǎng)站偏好影響為正的參數(shù)只有3個(gè),負(fù)影響的因素則有7個(gè),原因是參數(shù)的設(shè)置和選擇目前主要來(lái)自于客戶屬性和使用手機(jī)的信息,這些內(nèi)容通常與網(wǎng)站操作沒有太多關(guān)聯(lián)性,與網(wǎng)站相關(guān)的許多數(shù)據(jù)目前的系統(tǒng)中難以取到;另一個(gè)原因可能是網(wǎng)站營(yíng)業(yè)廳的出現(xiàn)時(shí)間比較晚,能夠提供的服務(wù)內(nèi)容比較少。針對(duì)熟練使用網(wǎng)站辦理業(yè)務(wù)的用戶,可以提供目標(biāo)性的營(yíng)銷發(fā)展成為公司的網(wǎng)站業(yè)務(wù)使用的“種子客戶”,通過他們?nèi)ビ绊懡煌Φ钠渌蛻簦瑥亩嵘W(wǎng)站辦理的數(shù)量和比例,減輕對(duì)電話渠道的壓力,使得電話營(yíng)銷中心的資源可以投放到更有生產(chǎn)力的活動(dòng)中。
網(wǎng)站渠道模型評(píng)分排名前10%的客戶實(shí)際驗(yàn)證中通過網(wǎng)站辦理數(shù)明顯高于排名靠后的其他客戶,說明模型評(píng)分的準(zhǔn)確度比較高。
三、 研究案例總結(jié)
掌握好渠道偏好度的工作,能夠有效地以有限的資源盡可能的服務(wù)更多的高價(jià)值的客戶和業(yè)務(wù),減少低價(jià)值客戶和業(yè)務(wù)占用客服渠道資源的比例。同時(shí),重點(diǎn)發(fā)展電子渠道,培養(yǎng)引導(dǎo)用戶從傳統(tǒng)渠道(營(yíng)業(yè)廳和電話客服)向電子渠道(網(wǎng)站和短信)轉(zhuǎn)變,對(duì)于電信運(yùn)營(yíng)商就必能產(chǎn)生關(guān)鍵性的績(jī)效提升。
利用數(shù)據(jù)倉(cāng)庫(kù)再進(jìn)行數(shù)據(jù)挖掘可以突破以往的技術(shù)困難限制,有效地建立高精確度的模型。構(gòu)建模型時(shí)基礎(chǔ)變量選取得當(dāng)能夠產(chǎn)生很好的適應(yīng)性和普及彈性,體現(xiàn)涵蓋不同省、市的區(qū)域差別。從上述實(shí)際的案例,也驗(yàn)證了應(yīng)用這種crm信息技術(shù)的優(yōu)越能力,一旦建立了標(biāo)準(zhǔn)模型和技術(shù)方案的實(shí)施機(jī)制,將會(huì)易于其推廣便利為運(yùn)營(yíng)商創(chuàng)造顯著績(jī)效。
參考文獻(xiàn):
1. armstrong, g, kotler, p. marketing: an introduction,2005.
2. eisenhardt, k. building theories from case study research. academy of management review, 1989,14(4):532-550.
3. kyburz-graber, r. does case-study methodology lack rigour? the need for quality criteria for sound case-study research, as illustrated by a recent case in secondary and higher education. environmental education research,2004,10(1):53-65.
關(guān)鍵詞:客戶流失;數(shù)據(jù)挖掘
中圖分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)13-3437-02
1 引言
在目前,電信運(yùn)營(yíng)商面臨激烈的市場(chǎng)競(jìng)爭(zhēng),客戶爭(zhēng)奪愈演愈烈,每個(gè)企業(yè)都存在客戶流失的問題。傳統(tǒng)意義上來(lái)講,留住一個(gè)客戶所需要的成本是爭(zhēng)取一個(gè)新用戶成本的1/5,尤其對(duì)于增量客戶越來(lái)越少的通信市場(chǎng)來(lái)說,減少客戶流失就意味著用更少的成本減少利潤(rùn)的流失。
電信業(yè)客戶流失預(yù)測(cè)是利用客戶的歷史記錄數(shù)據(jù),對(duì)潛在的流失客戶進(jìn)行判斷的過程,相關(guān)系統(tǒng)實(shí)現(xiàn)通常是基于數(shù)據(jù)挖掘技術(shù),數(shù)據(jù)挖掘技術(shù)與傳統(tǒng)數(shù)據(jù)分析的區(qū)別在于前者是在未有任何假設(shè)和前提條件下完成的,有效的數(shù)據(jù)挖掘預(yù)測(cè)系統(tǒng)可更客觀的對(duì)實(shí)際的市場(chǎng)情況進(jìn)行分析和描述。在歐美等發(fā)達(dá)國(guó)家,由于其移動(dòng)通信市場(chǎng)已經(jīng)比較成熟,電信運(yùn)營(yíng)商的經(jīng)營(yíng)模式已經(jīng)由傳統(tǒng)的“技術(shù)驅(qū)動(dòng)”過渡到了“市場(chǎng)驅(qū)動(dòng)”和“客戶驅(qū)動(dòng)”的運(yùn)營(yíng)模式。這就從客觀上推動(dòng)了客戶流失行為預(yù)測(cè)技術(shù)的發(fā)展。例如,英國(guó)電信(BT)、美國(guó)的西南貝爾、Vanguard Cellular,AT&T Wireless等公司都逐步開始使用客戶流失行為預(yù)測(cè)技術(shù)對(duì)客戶流失進(jìn)行管理和控制,實(shí)施差異化、一對(duì)一的營(yíng)銷。在我國(guó),電信行業(yè)處于特定的歷史發(fā)展階段,我國(guó)在數(shù)據(jù)挖掘方面的研究雖落后于國(guó)外運(yùn)營(yíng)商,但該技術(shù)的重要性已越來(lái)越受國(guó)內(nèi)運(yùn)營(yíng)商重視。中國(guó)移動(dòng)自2007年開始,已在其中國(guó)移動(dòng)研究院中專門成立了一個(gè)進(jìn)行用戶數(shù)據(jù)挖掘的小組。廣東省電信公司研究院在數(shù)據(jù)挖掘技術(shù)基礎(chǔ)上研發(fā)的“電信客戶洞察系統(tǒng)”,也已成為廣東電信CRM(客戶關(guān)系管理)系統(tǒng)的核心子系統(tǒng)。
2 數(shù)據(jù)挖掘技術(shù)
2.1 數(shù)據(jù)挖掘技術(shù)簡(jiǎn)介
數(shù)據(jù)挖掘是數(shù)據(jù)庫(kù)領(lǐng)域中最重要的課題之一,它是一種知識(shí)發(fā)現(xiàn)的過程,主要基于統(tǒng)計(jì)學(xué)、人工智能、機(jī)器學(xué)習(xí)等技術(shù),高度自動(dòng)化地分析數(shù)據(jù),做出歸納性的推理,從海量數(shù)據(jù)中挖掘出潛在的、有價(jià)值的知識(shí)、模型或規(guī)則,并對(duì)未來(lái)情況進(jìn)行預(yù)測(cè),以輔助決策者評(píng)估風(fēng)險(xiǎn)、做出正確的決策?!皵?shù)據(jù)挖掘包含了一系列旨在從數(shù)據(jù)集中發(fā)現(xiàn)有用而尚未發(fā)現(xiàn)的模式(Pattern)的技術(shù)”[1],對(duì)于企業(yè)而言,數(shù)據(jù)挖掘有助于發(fā)現(xiàn)業(yè)務(wù)發(fā)展的趨勢(shì),揭示已知的事實(shí),預(yù)測(cè)未知的結(jié)果,并幫助企業(yè)分析出完成任務(wù)所需的關(guān)鍵因素,以達(dá)到增加收入、降低成本,使企業(yè)處于更有利的競(jìng)爭(zhēng)位置的目的。
數(shù)據(jù)挖掘主要有以下類型:
1) 分類。這是最常見的數(shù)據(jù)挖掘類型,其中數(shù)據(jù)的目標(biāo)數(shù)據(jù)項(xiàng)表示數(shù)據(jù)所代表的對(duì)象的類型。例如在醫(yī)學(xué)應(yīng)用中,對(duì)象可分為有病和沒病兩類;在金融應(yīng)用中,對(duì)象可分為低風(fēng)險(xiǎn)和高風(fēng)險(xiǎn)兩類。分類數(shù)據(jù)挖掘先從一個(gè)己分類的數(shù)據(jù)集(訓(xùn)練集)得到一個(gè)模型,這個(gè)模型就包含了從該訓(xùn)練集中得到的知識(shí)。然后應(yīng)用這個(gè)模型(知識(shí))對(duì)新的未分類的數(shù)據(jù)進(jìn)行分類。
2) 聚類。聚類是把數(shù)據(jù)按照相似性歸納成若干類別,同一類中的數(shù)據(jù)彼此相似,不同類中的數(shù)據(jù)相異。聚類分析可以建立宏觀的概念,發(fā)現(xiàn)數(shù)據(jù)的分布模式,以及可能的數(shù)據(jù)屬性之間的相互關(guān)系。
3) 預(yù)測(cè)。通過分析代表對(duì)象過去和現(xiàn)在行為的數(shù)據(jù)來(lái)預(yù)測(cè)對(duì)象未來(lái)的行為。這實(shí)際上是一種特殊的分類或估計(jì),其目標(biāo)數(shù)據(jù)項(xiàng)就是要預(yù)測(cè)的值.
4) 關(guān)聯(lián)分析。確定哪些數(shù)據(jù)對(duì)象存在關(guān)聯(lián),典型的應(yīng)用是確定在超級(jí)市場(chǎng)中顧客會(huì)將哪些商品放在一個(gè)購(gòu)物車或購(gòu)物籃中,即他們會(huì)同時(shí)購(gòu)買那些商品。
2.2 部分?jǐn)?shù)據(jù)挖掘算法
1) 決策樹
決策樹,又稱判定樹,是一種類似二叉樹或多叉樹的樹結(jié)構(gòu)。它起源于概念學(xué)習(xí)系統(tǒng)(CLS:Concept Leaning System)。決策樹使用的是“分而治之”的策略。它將一個(gè)復(fù)雜的問題分成更簡(jiǎn)單的問題并重復(fù)使用這一戰(zhàn)術(shù)來(lái)解決子問題,從而將復(fù)雜的問題瓦解。
2) 貝葉斯定理
貝葉斯定理是一種對(duì)屬性集和類變量的概率關(guān)系建模方法,主要解決在已知相關(guān)項(xiàng)目B的資料,而缺乏論證項(xiàng)目A的直接資料時(shí),通過對(duì)B項(xiàng)目的有關(guān)狀態(tài)及發(fā)生概率分析推導(dǎo)A項(xiàng)目的狀態(tài)及發(fā)生概率,即當(dāng)已知事件Bi的概率P(Bi)和事件Bi已發(fā)生條件下事件A的概率P(A│Bi),則可運(yùn)用貝葉斯定理計(jì)算出在事件A發(fā)生條件下事件Bi的概率P(Bi│A)。
3) 人工神經(jīng)網(wǎng)絡(luò)
一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。這種網(wǎng)絡(luò)依靠系統(tǒng)的復(fù)雜程度,通過調(diào)整內(nèi)部大量節(jié)點(diǎn)之間相互連接的關(guān)系,從而達(dá)到處理信息的目的。人工神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)和自適應(yīng)的能力,可以通過預(yù)先提供的一批相互對(duì)應(yīng)的輸入-輸出數(shù)據(jù),分析掌握兩者之間潛在的規(guī)律,最終根據(jù)這些規(guī)律,用新的輸入數(shù)據(jù)來(lái)推算輸出結(jié)果。
3 基于數(shù)據(jù)挖掘技術(shù)的客戶流失預(yù)測(cè)系統(tǒng)實(shí)現(xiàn)
3.1 客戶流失類型
客戶流失情況分為主動(dòng)離網(wǎng)流失、被動(dòng)離網(wǎng)流失和潛在話務(wù)流失三類,其中主動(dòng)離網(wǎng)流失是客戶主動(dòng)辦理拆機(jī)銷戶手續(xù)轉(zhuǎn)入他網(wǎng)的流失。被動(dòng)離網(wǎng)流失是客戶由于已經(jīng)轉(zhuǎn)入他網(wǎng)但并未辦理相關(guān)手續(xù),造成客戶欠費(fèi)停機(jī)、或成為零次戶(即通話次數(shù)為零的客戶)。潛在話務(wù)流失是由于客戶使用意愿的轉(zhuǎn)移而明顯減少使用業(yè)務(wù)導(dǎo)致該客戶雖然保持在網(wǎng)但話務(wù)量(通話使用量)出現(xiàn)大幅度下降。主動(dòng)離網(wǎng)流失和被動(dòng)離網(wǎng)流失是一種可測(cè)量的流失現(xiàn)象,而潛在話務(wù)流失由于很難度量客戶使用量是否由于使用意愿的轉(zhuǎn)換導(dǎo)致,而相對(duì)比較難測(cè)量。
3.2 預(yù)測(cè)分析的流程
1) 數(shù)據(jù)采集
數(shù)據(jù)采集對(duì)象主要包括用戶數(shù)據(jù)和話單數(shù)據(jù),計(jì)費(fèi)側(cè)數(shù)據(jù)庫(kù)在一定周期內(nèi)產(chǎn)生用戶數(shù)據(jù)和話單數(shù)據(jù)(含通話、短信、數(shù)據(jù)增值業(yè)務(wù)及用戶狀態(tài)變更Log),采集目的是將上述數(shù)據(jù)分類導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)的用戶原始數(shù)據(jù)庫(kù)。
2) 數(shù)據(jù)清洗
數(shù)據(jù)清洗主要在用戶原始數(shù)據(jù)庫(kù)中根據(jù)各類算法的需要挑選合適的數(shù)據(jù),將數(shù)據(jù)轉(zhuǎn)換為算法所需的格式并建立數(shù)據(jù)集市。
3) 模型訓(xùn)練
模型訓(xùn)練是發(fā)現(xiàn)數(shù)據(jù)內(nèi)在規(guī)律的過程,它主要通過挑選已知結(jié)果的數(shù)據(jù),即已發(fā)生流失用戶的相關(guān)數(shù)據(jù),輸入算法模型進(jìn)行計(jì)算分析(此過程稱為訓(xùn)練,所挑選的數(shù)據(jù)稱為訓(xùn)練集),通過挑選合適數(shù)量進(jìn)行訓(xùn)練后即可獲取一個(gè)符合當(dāng)前數(shù)據(jù)集合的算法參數(shù)模型。
4) 模型測(cè)試
模型測(cè)試是通過選取一定數(shù)量的已知結(jié)果的數(shù)據(jù)作為測(cè)試集,并對(duì)訓(xùn)練過程中或已訓(xùn)練完成的算法模型進(jìn)行測(cè)試,通常做法為邊訓(xùn)練邊測(cè)試。
5) 數(shù)據(jù)分析
數(shù)據(jù)分析是在模型訓(xùn)練并測(cè)試完成后,輸入未知結(jié)果的數(shù)據(jù),即需要預(yù)測(cè)離網(wǎng)可能性的客戶數(shù)據(jù),并最終得出用戶是否會(huì)離網(wǎng)或離網(wǎng)概率。
6) 結(jié)果處理
根據(jù)預(yù)測(cè)結(jié)果確定針對(duì)客戶群的政策導(dǎo)向,如采用多種算法進(jìn)行預(yù)測(cè),則需要制定規(guī)則確定對(duì)不同算法得出的預(yù)測(cè)離網(wǎng)用戶集合的處理方式,同時(shí)針對(duì)每個(gè)預(yù)測(cè)離網(wǎng)用戶的不同情況給出相應(yīng)的處理建議并最終建立專門的數(shù)據(jù)庫(kù)記錄每次預(yù)測(cè)分析的情況。
3.3 算法選擇
選擇合適的算法是數(shù)據(jù)挖掘系統(tǒng)的關(guān)鍵,國(guó)內(nèi)外學(xué)者針對(duì)應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行電信客戶流失分析已有相當(dāng)程度研究,使用相對(duì)較多的算法有人工神經(jīng)網(wǎng)絡(luò)、決策樹及貝葉斯定理等,其中普遍結(jié)論以決策樹及人工神經(jīng)網(wǎng)絡(luò)算法相對(duì)準(zhǔn)確率較高。由于預(yù)測(cè)無(wú)法做到絕對(duì)的準(zhǔn)確,所以通過各類適用算法得出的客戶流失預(yù)測(cè)結(jié)果必然不盡相同,使用單一算法命中率并不高,一對(duì)一營(yíng)銷的指導(dǎo)意義也相對(duì)較弱。因此,在硬件資源相對(duì)富裕的情況下,建議通過多種算法分別分析再將結(jié)果按照一定的規(guī)律進(jìn)行組合來(lái)提高預(yù)測(cè)的準(zhǔn)確率,如采用人工神經(jīng)網(wǎng)絡(luò)、決策樹及貝葉斯分類器分別得出預(yù)測(cè)結(jié)論,在不考慮客戶保留成本的情況下,可以通過并集的方式得出最終需要進(jìn)行政策維系的客戶群,反之可通過交集的方式得出。當(dāng)然也可通過各類算法所需求的輸入數(shù)據(jù)不一致的情況,通過不同算法進(jìn)行互補(bǔ),如決策樹模型對(duì)于數(shù)值類參數(shù)(如網(wǎng)間通話數(shù)、每月充值費(fèi)用等)分析不盡完全,人工神經(jīng)網(wǎng)絡(luò)算法則可進(jìn)行彌補(bǔ)。
3.4 關(guān)鍵問題及解決辦法
1) 在客戶分群的研究中,客戶隨著時(shí)間的變化分群業(yè)產(chǎn)生變化,從靜態(tài)的角度進(jìn)行客戶的分群容易導(dǎo)致分群不適應(yīng)實(shí)際結(jié)果,而且客戶在不同群之間的漂移過程研究對(duì)深入了解客戶的行為也具有重要作用,同一樣本客戶在不同月份消費(fèi)行為也存在一定的差異。
解決辦法:針對(duì)不同用戶群的典型時(shí)間周期確定不同的訓(xùn)練集,并每隔一個(gè)時(shí)間周期就對(duì)客戶進(jìn)行重新建模分群,以更新客戶分群以符合實(shí)際情況。另外針對(duì)合理周期內(nèi)可能發(fā)生了特殊事件,進(jìn)行單獨(dú)建模以防止其對(duì)正確模型的歪曲。
2) 預(yù)測(cè)結(jié)果僅僅得出流失客戶的名單,客戶離網(wǎng)的原因缺乏系統(tǒng)性的分析和市場(chǎng)調(diào)查,導(dǎo)致很多流失預(yù)測(cè)不能對(duì)電信企業(yè)的經(jīng)營(yíng)活動(dòng)帶來(lái)實(shí)實(shí)在在的效果。
解決辦法:通過決策樹這種白盒模型,記錄每個(gè)預(yù)測(cè)離網(wǎng)用戶完成預(yù)測(cè)的路徑,對(duì)其離網(wǎng)原因作出相應(yīng)解釋并給出有針對(duì)性的維系手段。
4 結(jié)束語(yǔ)
數(shù)據(jù)挖掘技術(shù)在電信客戶流失預(yù)測(cè)中的應(yīng)用是數(shù)據(jù)挖掘技術(shù)在數(shù)據(jù)統(tǒng)計(jì)預(yù)測(cè)分析方面的典型應(yīng)用,也是目前市場(chǎng)的熱點(diǎn),在商業(yè)環(huán)境日益復(fù)雜,競(jìng)爭(zhēng)日益激烈,增量用戶越來(lái)越少的情況下,該技術(shù)的優(yōu)勢(shì)會(huì)得到進(jìn)一步的發(fā)揮。
參考文獻(xiàn):
關(guān)鍵詞:遙感;圖像解譯;方法;分析
Abstract: The author describes the direction of the computer interprets several new methods, and analysis of remote sensing image computer interprets the trends.Keywords: remote sensing; Image Interpretation; method; analysis
中圖分類號(hào):P25文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-2104(2012)
利用計(jì)算機(jī)對(duì)遙感圖像進(jìn)行解譯是遙感圖像解譯的必然趨勢(shì)。它可以實(shí)現(xiàn)智能化地快速獲取地表的不同專題信息,具有重要的理論意義和應(yīng)用前景。
1遙感圖像計(jì)算機(jī)解譯的新方法
1.1人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(Artifical Neural Networks,ANN)是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。人工神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)和自適應(yīng)的能力,可以通過預(yù)先提供的一批相互對(duì)應(yīng)的輸入-輸出數(shù)據(jù),分析掌握兩者之間潛在的規(guī)律,最終根據(jù)這些規(guī)律,用新的輸入數(shù)據(jù)來(lái)推算輸出結(jié)果。
它由大量處理單元互聯(lián)組成非線性、自適應(yīng)的信息處理系統(tǒng),通過模擬大腦神經(jīng)網(wǎng)絡(luò)處理、記憶信息的方式進(jìn)行信息處理。具有非線性、非局限性、非常定性、非凸性四個(gè)基本特征。其本質(zhì)是通過網(wǎng)絡(luò)的變換和動(dòng)力學(xué)行為得到一種并行分布式的信息處理功能。人工神經(jīng)網(wǎng)絡(luò)是并行分布式系統(tǒng),采用了與傳統(tǒng)人工智能和信息處理技術(shù)完全不同的機(jī)理,克服了傳統(tǒng)的基于邏輯符號(hào)的人工智能在處理直覺、非結(jié)構(gòu)化信息方面的缺陷,具有自適應(yīng)、自組織和實(shí)時(shí)學(xué)習(xí)的特點(diǎn)。
其在遙感圖像計(jì)算機(jī)解譯中的應(yīng)用有兩個(gè)功能:一是用于遙感圖像目標(biāo)地物特征抽取與選擇,即通過ANN的自適應(yīng)功能用遙感圖像訓(xùn)練網(wǎng)絡(luò),將提取的特征貯存在各個(gè)神經(jīng)元的連接中;另一個(gè)是用于學(xué)習(xí)訓(xùn)練及分類器的設(shè)計(jì),這是因?yàn)锳NN分類器具有非線性的特點(diǎn),可以為我們提供多種復(fù)雜的類間分界面,為多目標(biāo)地物識(shí)別提供可能。
1.2小波分析
小波分析的“小波”理論起源于信號(hào)處理。信號(hào)一般為離散的,通過分析認(rèn)為信號(hào)是由多個(gè)小波組成的,這些小波代表著不同的頻率特征。小波變換是時(shí)間(空間)頻率的局部化分析,小波函數(shù)平移、組合形成了小波函數(shù)庫(kù),通過小波函數(shù)庫(kù)中區(qū)間的變化可以對(duì)某些感興趣的頻率特征局部放大,即對(duì)信號(hào)逐步的進(jìn)行多尺度細(xì)化,最終達(dá)到高頻處時(shí)間細(xì)分,低頻處頻率鋅粉,自動(dòng)適應(yīng)時(shí)頻信號(hào)分析的要求,聚焦信號(hào)的任意細(xì)節(jié)。
小波分析是一種時(shí)間——尺度分析方法,解決了經(jīng)典的Fourier分析的確定局部頻率的問題,實(shí)現(xiàn)了在時(shí)間和頻率上的取樣步長(zhǎng)隨數(shù)字信號(hào)的性態(tài)不同而自適應(yīng)地調(diào)整。其基本思想是將圖像進(jìn)行多分辨率分解,分解成不同空間、不同頻率的子圖像,然后再對(duì)子圖像進(jìn)行系數(shù)編碼。
小波變換實(shí)現(xiàn)圖像壓縮的步驟為:首先,利用二維小波變換將圖像分解成低頻分量和高頻細(xì)節(jié)分量,然后,根據(jù)視覺特性對(duì)這些分量做不同策略的量化及編碼處理。利用小波變換實(shí)現(xiàn)圖像數(shù)據(jù)壓縮常用的方法有:閾值量化、分塊矢量量化、網(wǎng)格矢量量化、零數(shù)法等。
小波變換的實(shí)際作用是對(duì)信號(hào)解相關(guān),并將信號(hào)的全部信息集中到一小部分具有大幅值的小波系數(shù)中。從而在信號(hào)的沖溝中,大系數(shù)比小系數(shù)更重要。
另外,小波變換可用于多源遙感影像信息的融合,利用小波分析可以抑制影像噪聲,在檢測(cè)紋理邊界中也可以利用小波分解影像紋理信息而作為一種多分辨率分析工具等等。
1.3 分形技術(shù)
分形理論是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,其基本特點(diǎn)是承認(rèn)事物的局部可能性在一定條件或過程中,在某些方面表現(xiàn)出與整體的相似性。即物體存在形式上的有序?qū)哟位淖韵嗨铺卣?。人們通常把具有以下性質(zhì)的集合稱為分形:具有精細(xì)結(jié)構(gòu),具有某種自相似的結(jié)構(gòu),分形維數(shù)大于拓?fù)渚S數(shù),存在對(duì)分形的簡(jiǎn)單算法描述,例如可以由迭代產(chǎn)生。
遙感圖像中的地物分為兩大類:一類為具有規(guī)則的邊界光滑的人造地物,比如建筑物,另一類是不規(guī)則具有精細(xì)結(jié)構(gòu)和自相似特征的自然地物,如山脈等。目前,分形領(lǐng)域里的迭代函數(shù)系統(tǒng),在計(jì)算機(jī)上可以生成各種各樣圖案,實(shí)現(xiàn)計(jì)算機(jī)的自然景物的模擬刻畫。
另外,分形圖像編碼是一種新穎且有很大發(fā)展?jié)摿Φ膱D像壓縮技術(shù)。分形技術(shù)可以從圖像分割、快速分型編碼、分形碼的量化、碼本的灰度變換方法、快速分形解碼等實(shí)現(xiàn)遙感圖像的壓縮。而分形方法用于自動(dòng)目標(biāo)檢測(cè)與識(shí)別主要是基于離散分形布朗增量隨機(jī)模型(DFBIR),大多數(shù)自然物體的表面都能用DFBIR場(chǎng)模型較好地描述,而且DFBIR在局部區(qū)域內(nèi)的增量一、二階絕對(duì)矩具有冪指數(shù)特性,因此可據(jù)此估計(jì)分形維數(shù)。自然目標(biāo)的各個(gè)組成部分,由于其平滑性,呈現(xiàn)出較低的分維值,而人造目標(biāo)一般具有較強(qiáng)的邊緣,從而分維值很高,得到初步檢測(cè)結(jié)果。目前,這一技術(shù)提取自然地物特征仍在研究當(dāng)中。
1.4模糊分類方法
模糊理論用來(lái)描述是與非之間的中間狀態(tài),通過概率形式表示的不確定性事物的歸屬度來(lái)描述它的模糊性及不確定性。模糊分類法使用輸入的訓(xùn)練數(shù)據(jù)集得出分類函數(shù),進(jìn)而預(yù)測(cè)測(cè)試數(shù)據(jù)集的類別。
遙感圖像分類中,地物往往存在模糊邊界,利用模糊分類法就可以解決這些不能明確地判定地物分類類別的邊界的問題。
此外,還有一些其他新的方法,例如,利用二維字符串空間知識(shí)表示方法對(duì)物體空間關(guān)系特征進(jìn)行描述,這種方法將地物在二維空間的分布轉(zhuǎn)換為二維字符表示,便于進(jìn)行空間推理分析和空間特征相似形檢索。
遙感圖像的計(jì)算機(jī)解譯從研究思路上可根據(jù)目標(biāo)地物的特點(diǎn)從低、中、高三個(gè)層次進(jìn)行描述和表達(dá)。低層次的描述對(duì)象是圖像像素,它不含有任何語(yǔ)義信息,但通過計(jì)算機(jī)分類等方法可以將這些識(shí)別對(duì)象進(jìn)行重組,形成性質(zhì)均一的地物單元。中層次是在區(qū)域分割的基礎(chǔ)上抽取衛(wèi)星圖像形態(tài)、紋理特征、空間關(guān)系等特征,以描述和表達(dá)目標(biāo)地物。高層次描述和表達(dá)的目標(biāo)地物是與理解圖像有關(guān)的具有豐富語(yǔ)義的對(duì)象,它允許按分析目標(biāo)來(lái)解譯圖像。然后,構(gòu)造圖像識(shí)別專家系統(tǒng),實(shí)現(xiàn)圖像的特征匹配與多目標(biāo)地物的智能化識(shí)別。
目前,遙感圖像的計(jì)算機(jī)解譯的主要技術(shù)發(fā)展趨勢(shì)在提取圖像的多種特征并對(duì)特征進(jìn)行組合優(yōu)化,不同特征互為補(bǔ)充,以及逐步完成GIS各種專題數(shù)據(jù)庫(kù)的建設(shè)以減少自動(dòng)解譯中GIS數(shù)據(jù)的不確定性,專家系統(tǒng)也是其中的趨勢(shì)之一建立合適的遙感圖像解譯專家系統(tǒng),將模式識(shí)別與專家系統(tǒng)進(jìn)行結(jié)合等都是遙感圖像解譯的重要研究方向。
2 結(jié)束語(yǔ)
遙感圖像的計(jì)算機(jī)解譯是以遙感數(shù)字圖像為研究對(duì)象,將遙感圖像的地學(xué)信息獲取發(fā)展為計(jì)算機(jī)支持下的遙感圖像智能化識(shí)別從而實(shí)現(xiàn)遙感圖像解譯的一門技術(shù)。它是統(tǒng)計(jì)模式識(shí)別技術(shù)在遙感領(lǐng)域中的具體應(yīng)用,即提取待識(shí)別模式的一組統(tǒng)計(jì)特征值,然后按照一定準(zhǔn)則作出決策,從而對(duì)數(shù)字圖像予以識(shí)別。目前的遙感圖像計(jì)算機(jī)分類算法設(shè)計(jì)的主要依據(jù)是地物光譜數(shù)據(jù),而地物光譜數(shù)據(jù)還存在著一些問題:比如,遙感圖像像素所具有的多光譜特征;相鄰像素間的關(guān)系;圖像上地物的形狀;空間位置特征等的信息,另外,提高遙感圖像的分類精度受到大氣狀況,下墊面等因素的影響而具有一定的局限性。但是,遙感圖像的計(jì)算機(jī)解譯將始終是圖像解譯的重要發(fā)展方向。
參考文獻(xiàn):
[1] 郭德芳編著.遙感圖像的計(jì)算機(jī)處理和模式識(shí)別.北京:電子工業(yè)出版社,2007.
[2] 徐佩霞,孫功憲,《小波分析與應(yīng)用實(shí)例》,中國(guó)科技大學(xué)出版社,2007.
[3] 尚彩娥.淺談全數(shù)字?jǐn)z影測(cè)量系統(tǒng)及其產(chǎn)品.大地縱橫,2010,(02).
[4] 劉子剛.保護(hù)環(huán)境須測(cè)繪先行[J].北京測(cè)繪.2011,(4):43.
關(guān)鍵詞:統(tǒng)計(jì)學(xué);數(shù)據(jù)挖掘;案例驅(qū)動(dòng)
中圖分類號(hào):G712 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2014)40-0069-02
一、前言
近年來(lái),數(shù)據(jù)獲取和數(shù)據(jù)存儲(chǔ)技術(shù)快速發(fā)展,各種數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)的數(shù)據(jù)量飛速增長(zhǎng)。人們關(guān)注的焦點(diǎn)要從噪聲、模糊的隨機(jī)數(shù)據(jù)中提取重要的信息、知識(shí),數(shù)據(jù)挖掘的出現(xiàn),提供了一種有效解決“數(shù)據(jù)豐富而知識(shí)貧乏”問題的方法。
數(shù)據(jù)挖掘作為統(tǒng)計(jì)專業(yè)的核心課程,是學(xué)生必須掌握的職業(yè)能力課程。根據(jù)高職生的知識(shí)結(jié)構(gòu)體系和培養(yǎng)目標(biāo),我們采用案例驅(qū)動(dòng)教學(xué)方法,以學(xué)生為主體,案例為主線,教師為主導(dǎo),對(duì)案例進(jìn)行分析,學(xué)習(xí)案例所涉及的相關(guān)知識(shí)點(diǎn),從而會(huì)利用相關(guān)軟件工具對(duì)數(shù)據(jù)進(jìn)行分析,挖掘數(shù)據(jù)間的知識(shí)。
二、數(shù)據(jù)挖掘中案例驅(qū)動(dòng)教學(xué)的實(shí)施
(一)合理高職高專統(tǒng)計(jì)專業(yè)數(shù)據(jù)挖掘課程教學(xué)目標(biāo)
數(shù)據(jù)挖掘是集數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)學(xué)習(xí)、機(jī)器學(xué)習(xí)、模式識(shí)別、可視化等學(xué)科的一個(gè)新興交叉學(xué)科,又包含了聚類分析、關(guān)聯(lián)規(guī)則分析、分類等,每一種挖掘又有不同算法,是一門理論性、實(shí)踐性及綜合性較強(qiáng)的課程。其知識(shí)內(nèi)容豐富,內(nèi)容深淺不一,各種方法變化快,新方法層出不窮,這對(duì)師生都提出了嚴(yán)峻的挑戰(zhàn)。
高職高專將培養(yǎng)高等技術(shù)應(yīng)用型專門人才為根本任務(wù),以適應(yīng)社會(huì)行業(yè)發(fā)展需求為基本目標(biāo),結(jié)合本院統(tǒng)計(jì)專業(yè)學(xué)生的專業(yè)技能特點(diǎn),我們將本門課程的教學(xué)目標(biāo)定位為:掌握數(shù)據(jù)挖掘課程涉及的基本概念,提高信息分析能力,能從收集到的數(shù)據(jù)信息中利用有效的軟件工具CLEMENTINE進(jìn)行知識(shí)“挖掘”;要根據(jù)實(shí)際情況制定合理完整的數(shù)據(jù)模型并進(jìn)行評(píng)估,這些評(píng)估要具有可視性,才能有效地解決問題,而使數(shù)據(jù)挖掘更具有合理性。
(二)如何驅(qū)動(dòng)教學(xué)來(lái)設(shè)計(jì)數(shù)據(jù)挖掘案例
1.介紹案例驅(qū)動(dòng)教學(xué)法。案例驅(qū)動(dòng)法是在“哈佛大學(xué)”的情境案例教學(xué)課起源,是一種探索性和協(xié)作性學(xué)習(xí)的教學(xué)模式。整個(gè)授課過程圍繞著同一個(gè)目標(biāo)和幾項(xiàng)任務(wù)“教授”,學(xué)生通過對(duì)課程的學(xué)習(xí)、資料的查找和知識(shí)的整合,通過充分思考和與實(shí)踐相結(jié)合,提高自身能力。這種案例驅(qū)動(dòng)的教學(xué)法可以讓學(xué)生提高學(xué)習(xí)興趣,發(fā)展學(xué)生自身的能力。同時(shí)能讓教師更好地發(fā)揮促進(jìn)學(xué)生學(xué)習(xí)、引導(dǎo)學(xué)生成功的功能。
案例驅(qū)動(dòng)法是把教學(xué)內(nèi)容和目標(biāo)通過一個(gè)任務(wù)來(lái)體現(xiàn),把教材內(nèi)容重新整合,老師的授課和學(xué)生的接受都圍繞這個(gè)任務(wù)完成。
案例驅(qū)動(dòng)法可以充分發(fā)揮學(xué)生的主體地位,從而改變傳統(tǒng)的關(guān)于師生關(guān)系的觀念,讓學(xué)生從被動(dòng)學(xué)習(xí)到主動(dòng)學(xué)習(xí),真正愛上學(xué)習(xí),提高自己的創(chuàng)新、自學(xué)和實(shí)踐能力,同時(shí)要求老師在授課中給予學(xué)生正確的引導(dǎo)、促進(jìn)、組織和控制,這樣可以增強(qiáng)同學(xué)間的協(xié)作精神和學(xué)生的獨(dú)立意識(shí)。通過學(xué)生的自主學(xué)習(xí)和探索,可以改變?cè)瓉?lái)枯燥的學(xué)習(xí)方式。對(duì)于數(shù)據(jù)挖掘這門課程,內(nèi)容深?yuàn)W,既要求學(xué)習(xí)一定的理論知識(shí),又要求掌握數(shù)據(jù)挖掘的使用方法,因此我們引入使用案例驅(qū)動(dòng)的教學(xué)方法。
2.數(shù)據(jù)挖掘案例教學(xué)的實(shí)施規(guī)劃。利用CLEMENTINE軟件工具進(jìn)行數(shù)據(jù)挖掘,將數(shù)據(jù)挖掘看成一個(gè)以數(shù)據(jù)為中心的循序漸進(jìn)的螺旋式數(shù)據(jù)探索過程,該過程分為業(yè)務(wù)理解、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、建立模型、方案評(píng)估和方案實(shí)施六大部分。因此,在教學(xué)過程中,我們圍繞數(shù)據(jù)挖掘的六大部分,在每一部分,講解基本的數(shù)據(jù)挖掘技術(shù)原理;對(duì)于數(shù)據(jù)挖掘算法,只要求掌握相關(guān)算法使用的方法和使用的場(chǎng)合,并會(huì)使用專業(yè)的數(shù)據(jù)挖掘工具CLEMENTINE,此應(yīng)用的前提條件要求對(duì)學(xué)生進(jìn)行數(shù)據(jù)挖掘;將教學(xué)的亮點(diǎn)和重點(diǎn)放在案例分析和實(shí)際應(yīng)用上,要對(duì)學(xué)生進(jìn)行動(dòng)手能力的訓(xùn)練。
在教學(xué)的過程中,最重要的是案例的選取。通過參考教學(xué)大綱和教學(xué)目標(biāo),對(duì)教學(xué)案例進(jìn)行精心設(shè)計(jì),可以提高學(xué)生的分析能力,提高學(xué)生發(fā)現(xiàn)問題和解決問題的能力,才能更好地將教案落實(shí),并形成具體的項(xiàng)目。根據(jù)數(shù)據(jù)挖掘課程的特點(diǎn)和具體內(nèi)容,我們通過某些小案例引入一些相關(guān)知識(shí),并且采用學(xué)生能夠接受的一個(gè)大案例讓學(xué)生使用成績(jī)數(shù)據(jù)模型組織整個(gè)教學(xué)過程。
我們的課程內(nèi)容按數(shù)據(jù)挖掘過程分為六大部分,按照每一部分的教學(xué)目標(biāo)我們?cè)O(shè)計(jì)了多個(gè)不同的小案例如下。
(1)藥物研究數(shù)據(jù)和學(xué)生參加社會(huì)活動(dòng)數(shù)據(jù)案例:通過這兩個(gè)數(shù)據(jù)模型掌握在CLEMENTIME軟件工具中利用軟件中SOURCES選項(xiàng)卡的多種節(jié)點(diǎn)讀入多種文件類型(如TXT文件、EXCEL文件、SPSS文件等)的數(shù)據(jù),掌握讀入數(shù)據(jù)的數(shù)據(jù)類型,掌握APPEND節(jié)點(diǎn)、MERGE節(jié)點(diǎn)合并數(shù)據(jù)的方法。
(2)移動(dòng)客戶數(shù)據(jù)案例:通過利用移動(dòng)數(shù)據(jù)讓學(xué)生掌握TYPE節(jié)點(diǎn)進(jìn)行變量說明的方法,會(huì)使用該節(jié)點(diǎn)進(jìn)行有限變量值和無(wú)效值的調(diào)整,會(huì)使用DATA AUDIT節(jié)點(diǎn)對(duì)數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估和調(diào)整;掌握數(shù)據(jù)中對(duì)離群點(diǎn)、極端值和缺失值的調(diào)整,對(duì)數(shù)據(jù)進(jìn)行質(zhì)量管理;會(huì)使用AGGREATE對(duì)數(shù)據(jù)進(jìn)行分類匯總;利用FILLER節(jié)點(diǎn)對(duì)變量值重新計(jì)算,會(huì)用RECLASSIFY節(jié)點(diǎn)實(shí)現(xiàn)變量值進(jìn)行調(diào)整;會(huì)對(duì)數(shù)據(jù)進(jìn)行篩選、樣本子集劃分等處理;了解數(shù)據(jù)分析特征,把握數(shù)據(jù)間相關(guān)性強(qiáng)弱的基本手段;利用壓縮樣本量、簡(jiǎn)約變量值或變量降維等方法對(duì)樣本量龐大的數(shù)據(jù)進(jìn)行精簡(jiǎn)。
(3)決策樹模型案例:了解C5.0決策樹算法,會(huì)建立決策樹模型,學(xué)會(huì)歸納和提煉現(xiàn)有數(shù)據(jù)包含的規(guī)律,建立分類預(yù)測(cè)模型,會(huì)分析結(jié)論,用于對(duì)未來(lái)新數(shù)據(jù)的預(yù)測(cè)。
(4)人工神經(jīng)網(wǎng)絡(luò)模型案例:了解人工神經(jīng)網(wǎng)絡(luò)算法,掌握人工神經(jīng)網(wǎng)絡(luò)建立的步驟,建立B-P反向神經(jīng)網(wǎng)絡(luò)模型,預(yù)測(cè)分析結(jié)果。
(5)貝葉斯模型案例:了解貝葉斯網(wǎng)絡(luò)算法,掌握貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的組成和構(gòu)建,會(huì)用TAN貝葉斯和馬爾科夫毯網(wǎng)絡(luò)解決從龐大數(shù)據(jù)中尋找輸入變量之間的相關(guān)性,輸入變量的組合取值對(duì)輸出變量的影響,用網(wǎng)絡(luò)結(jié)構(gòu)直觀展示它們的關(guān)系。
在設(shè)計(jì)小案例的同時(shí),我們還選擇學(xué)生既熟悉又感興趣的綜合項(xiàng)目案例選題:學(xué)生成績(jī)數(shù)據(jù)、圖書管理數(shù)據(jù)、電信服務(wù)數(shù)據(jù)等,讓學(xué)生帶著問題進(jìn)一步學(xué)習(xí)課程,在學(xué)習(xí)中尋找方法解決項(xiàng)目中遇到的問題。當(dāng)課程結(jié)束后,各項(xiàng)目組呈交項(xiàng)目數(shù)據(jù)模型和報(bào)告,且項(xiàng)目組長(zhǎng)要向所有同學(xué)按數(shù)據(jù)挖掘的六大部分講解分析報(bào)告。
3.案例驅(qū)動(dòng)教學(xué)的成效。圍繞案例進(jìn)行教學(xué)的“數(shù)據(jù)挖掘”課程除了采用案例驅(qū)動(dòng)教學(xué)法,還要增加學(xué)生的實(shí)際訓(xùn)練能力,都取得了明顯的效果,從以下五個(gè)方面體現(xiàn):①學(xué)生要主動(dòng)提出問題,同時(shí)積極主動(dòng)地參與課堂教學(xué),才能提高學(xué)生分析和處理問題的能力;②增強(qiáng)學(xué)生的自主學(xué)習(xí)能力,要求學(xué)生通過小組討論的形式和實(shí)際訓(xùn)練讓學(xué)生以積極主動(dòng)的態(tài)度處理和解決一些技術(shù)問題,從而提高自學(xué)能力;③學(xué)生間要注意培養(yǎng)團(tuán)隊(duì)合作能力的,也要具有競(jìng)爭(zhēng)意識(shí);④課程學(xué)習(xí)結(jié)束后,普遍反映對(duì)利用CLEMENTIME軟件工具進(jìn)行數(shù)據(jù)挖掘的自信心提高,能夠進(jìn)一步提高對(duì)專業(yè)的認(rèn)知,獨(dú)立解決一些數(shù)據(jù)統(tǒng)計(jì)分析的問題。
三、結(jié)束語(yǔ)
數(shù)據(jù)挖掘是統(tǒng)計(jì)專業(yè)的專業(yè)課程,其內(nèi)容繁多、深?yuàn)W,把基于案例驅(qū)動(dòng)的教學(xué)模式引入《數(shù)據(jù)挖掘》課程,學(xué)生在學(xué)習(xí)過程中,實(shí)現(xiàn)了整個(gè)數(shù)據(jù)挖掘的流程,在基于項(xiàng)目的技術(shù)應(yīng)用中深入理解了數(shù)據(jù)挖掘的理論知識(shí)。學(xué)生要將所學(xué)的理論知識(shí)和實(shí)踐相結(jié)合,從而有效提高自己的操作技能和知識(shí)水平,培養(yǎng)了自己應(yīng)用數(shù)據(jù)挖掘技術(shù)解決實(shí)際問題的應(yīng)用能力和創(chuàng)新實(shí)踐能力。
從教學(xué)效果來(lái)看,通過將理論教學(xué)和實(shí)踐相結(jié)合,案例教學(xué)法整合了各種學(xué)習(xí)工具和教學(xué)資源,這樣才能充分發(fā)揮學(xué)生的主觀能動(dòng)性,培養(yǎng)和提高學(xué)生的主觀能動(dòng)性,同時(shí)增強(qiáng)學(xué)生分析和處理問題的能力,今后,我們將繼續(xù)完善數(shù)據(jù)挖掘的教學(xué)案例,研究和總結(jié)教學(xué)經(jīng)驗(yàn),使整個(gè)教學(xué)環(huán)節(jié)更加完善合理。
參考文獻(xiàn):
[1]劉云霞.統(tǒng)計(jì)學(xué)專業(yè)本科生開設(shè)“數(shù)據(jù)挖掘”課程的探討[J].吉林工程技術(shù)師范學(xué)院學(xué)報(bào),2010,(26).
[2]覃義,楊丹江,劉憶寧.《數(shù)據(jù)挖掘》本科教學(xué)的體會(huì)與創(chuàng)新[J].科技信息,2012,(10).
[3]李國(guó)榮.培養(yǎng)統(tǒng)計(jì)專業(yè)學(xué)生動(dòng)手能力和創(chuàng)新能力的探索[J].統(tǒng)計(jì)教育,2007,(9).
[4]白忠喜,魯越青,梁偉,等.校政企共建基地開展基于項(xiàng)目驅(qū)動(dòng)的實(shí)踐教學(xué)改革[J].中國(guó)大學(xué)教學(xué),2011,(2).
[5]焦國(guó)華,黃健柏,黃暉.數(shù)據(jù)挖掘技術(shù)在鋼鐵行業(yè)的應(yīng)用[J].系統(tǒng)工程,2010,(28).
【關(guān)鍵詞】泵;在線監(jiān)測(cè);故障診斷
0 引言
設(shè)備的故障診斷技術(shù)起源于19世紀(jì)產(chǎn)業(yè)革命時(shí)期,當(dāng)時(shí)的故障診斷技術(shù)主要依靠技術(shù)專家的知識(shí)水平和經(jīng)驗(yàn)水平,這種方法具有簡(jiǎn)單方便、經(jīng)濟(jì)實(shí)用的特點(diǎn),但對(duì)技術(shù)專家的知識(shí)水平要求較高。隨著計(jì)算機(jī)、信號(hào)處理、傳感器等技術(shù)的發(fā)展,當(dāng)今的機(jī)器的在線監(jiān)測(cè)及故障診斷技術(shù)已經(jīng)發(fā)展為多種學(xué)科交叉,理論與實(shí)踐緊密結(jié)合,并與現(xiàn)代測(cè)控技術(shù)同步發(fā)展的學(xué)科。水泵的狀態(tài)監(jiān)測(cè)與故障診斷技術(shù)的發(fā)展不僅促進(jìn)了其理論設(shè)計(jì)、制造方法的發(fā)展與提高,同時(shí)也是人們認(rèn)識(shí)到僅僅要求水泵具有優(yōu)良的性能是遠(yuǎn)遠(yuǎn)不夠的,一旦其發(fā)生故障,可能造成巨大的經(jīng)濟(jì)損失和社會(huì)危害。美國(guó)電力所(EPRI)進(jìn)行的調(diào)查表明:大型的電站鍋爐給水泵故障率高達(dá)30%以上,而且泵越大故障率越高。據(jù)某電力機(jī)構(gòu)調(diào)查,國(guó)產(chǎn)200MW火力發(fā)電機(jī)組配備的某類型的給水泵已有8次斷軸事故發(fā)生,造成了巨大的經(jīng)濟(jì)損失。因而,如何提高泵設(shè)備的可靠性,保證其安全的、穩(wěn)定的、長(zhǎng)期的、滿負(fù)荷的優(yōu)質(zhì)運(yùn)行,已成為泵的設(shè)計(jì)者及機(jī)械測(cè)控工程學(xué)科亟待解決的新課題。
1 泵類產(chǎn)品故障診斷概述
泵發(fā)生故障是指其功能失常,即其機(jī)械系統(tǒng)處于異常狀態(tài)。泵是有多個(gè)子系統(tǒng)和元素同特定的關(guān)系組成的系統(tǒng)。對(duì)同一臺(tái)泵,對(duì)于不同的工況,其運(yùn)行狀況也不同。泵發(fā)生故障的原因有多方面的因素,主要有:
1)泵的設(shè)計(jì)不合理( 結(jié)構(gòu)設(shè)計(jì)不當(dāng)、動(dòng)態(tài)性能差等)。例如,葉輪與誘導(dǎo)論配合不好時(shí),就會(huì)引起葉輪故障。
2)機(jī)械制造與裝配不當(dāng)(加工誤差大、配合性質(zhì)不合理等)例如,某紙業(yè)公司,購(gòu)買的泵由于軸沒有經(jīng)過調(diào)質(zhì)處理,運(yùn)行時(shí)間不長(zhǎng)久彎曲、斷裂 。
3)泵的安裝不當(dāng)(主要指與其他設(shè)備的連接超差、基礎(chǔ)變形等)。
4)泵的維修不當(dāng)。維修過程改變或破壞了原有的動(dòng)態(tài)性能和配合性質(zhì)等。
5)泵的運(yùn)行狀態(tài)不當(dāng),例如,狀態(tài)不良、工藝過程參數(shù)不匹配等。
6)泵經(jīng)長(zhǎng)期運(yùn)行,其零部件發(fā)生引力集中及磨損,性能變差,這種故障屬于自然故障。
7)泵的操作不當(dāng)(違章改變工況、超負(fù)荷運(yùn)轉(zhuǎn)等)。當(dāng)泵的設(shè)計(jì)工況與實(shí)際工況相差太大時(shí),會(huì)引起故障。例如,如果泵長(zhǎng)時(shí)間地小流量運(yùn)行,由于回流大,不僅效率低,還會(huì)引起泵的故障,產(chǎn)生的典型故障有:軸承壽命縮短或損壞、泵振動(dòng)大、泵轉(zhuǎn)子竄動(dòng)等。
由此可知泵的故障是由于多種原因引起的,而且往往是由于多種原因耦合的結(jié)果。所以,故障與其征兆也往往不是一一對(duì)應(yīng)的,這就給故障診斷帶來(lái)了困難。
泵的在線監(jiān)測(cè)和故障診斷主要是針對(duì)泵的整機(jī)性能,比如對(duì)泵的運(yùn)行參數(shù)(吸入真空度、效率等)、機(jī)械運(yùn)行狀態(tài)(位移、振動(dòng)、零件磨損、軸承油溫度和液位)以及噪聲進(jìn)行檢測(cè),采集信號(hào),進(jìn)行分析,預(yù)測(cè)故障發(fā)展趨勢(shì),并根據(jù)故障性質(zhì)和趨勢(shì),做出決策,干預(yù)其工作過程。
其具體診斷過程可用圖1表示。
當(dāng)前泵的在線檢測(cè)及故障診斷技術(shù)的主要內(nèi)容:選擇適當(dāng)?shù)谋O(jiān)測(cè)方式和合適的部位,以獲得泵運(yùn)行的最優(yōu)信息,從中提取泵的故障征兆,然后判斷泵運(yùn)行是否正常,進(jìn)行早期診斷和預(yù)報(bào)。根據(jù)征兆確認(rèn)故障的部位、程度、原因和性質(zhì),提出合理的治理和控制措施,防止或消除故障,對(duì)原設(shè)計(jì)、制造、裝配等提出改進(jìn)措施。由此看來(lái),泵的故障診斷不僅僅是其運(yùn)行和維修的新技術(shù),更為重要的是它提高和改進(jìn)了泵的設(shè)計(jì)及制造質(zhì)量。
2 泵類產(chǎn)品在線監(jiān)測(cè)及故障診斷方法的現(xiàn)狀
泵類產(chǎn)品的故障診斷的主要對(duì)象包括:泵軸振動(dòng)、滾動(dòng)軸承、機(jī)械密封裝置、葉輪、油系統(tǒng)等。
1)對(duì)于單行小型泵,目前對(duì)其診斷的方法主要是依靠技術(shù)人員的感覺器官,通過聽取運(yùn)行噪聲,對(duì)振動(dòng)的判斷以及停機(jī)檢查的方法來(lái)對(duì)泵進(jìn)行故障診斷。該方法具有操作方便,經(jīng)濟(jì)實(shí)用的特點(diǎn)。但是要求技術(shù)人具有較高的工作經(jīng)驗(yàn)水平,而且往往要定時(shí)檢查,浪費(fèi)人力資源,不能實(shí)現(xiàn)實(shí)時(shí)監(jiān)測(cè)。
2)對(duì)于大型的泵和泵站的泵的,目前已有了許多在線監(jiān)測(cè)和故障診斷系統(tǒng)。這些系統(tǒng)能夠?qū)崿F(xiàn)實(shí)時(shí)在線監(jiān)測(cè)和故障診斷功能 。但是也存在著不足之處,主要表現(xiàn)在以下幾點(diǎn):
(1)對(duì)機(jī)械密封裝置無(wú)能為力
機(jī)械密封故障是泵的多發(fā)故障之一,也是故障中最難解決的難題之一。目前尚無(wú)有效的措施予以解決,難點(diǎn)在于它的可監(jiān)測(cè)性差,沒有很好的參數(shù)來(lái)反映它的性能。因此,機(jī)械密封裝置的監(jiān)測(cè)與故障診斷是泵的在線監(jiān)測(cè)與故障診斷問題中亟待解決得的問題之一。
(2)泵的振動(dòng)監(jiān)測(cè)及故障診斷技術(shù)
泵的振動(dòng)監(jiān)測(cè)和故障診斷主要內(nèi)容包括:泵的轉(zhuǎn)軸和滾動(dòng)軸承的振動(dòng)監(jiān)測(cè)與故障診斷。目前許多水泵機(jī)組缺少振動(dòng)監(jiān)測(cè)系統(tǒng),一旦發(fā)生振動(dòng)故障,往往造成檢修困難,停機(jī)時(shí)間長(zhǎng)、經(jīng)濟(jì)損失較大的后果。雖然有工人定期檢查,由于人的主觀因素,會(huì)造成過度檢修,而且,對(duì)突發(fā)事件無(wú)能為力。由于泵的振動(dòng)機(jī)理及表現(xiàn)形式較為復(fù)雜,目前需要解決的難題有:(一)監(jiān)測(cè)方式;(二)防潮性能;(三)兼容性能。
(3)油系統(tǒng)
系統(tǒng)是泵設(shè)備中較為重要的一部分,它的好壞直接決定了泵的機(jī)械性能及其零部件的壽命,而且其零部件的磨損情況也可以通過對(duì)油的成分分析獲得。因此,選擇合適的參數(shù)及方法,獲得較為全面的故障信息,對(duì)泵的整機(jī)的在線監(jiān)測(cè)及故障診斷具有較為重要的意義。
(4)軸承溫度監(jiān)測(cè)
水泵水輪機(jī)的主要監(jiān)測(cè)項(xiàng)目之一是軸承溫度,采用的是對(duì)溫度的絕對(duì)值和變化率進(jìn)行監(jiān)測(cè),但是這種方式,往往是在軸承狀態(tài)發(fā)生異常,出現(xiàn)溫度上升之后才進(jìn)行監(jiān)測(cè),所以要在早期的微侯階段檢出異常情況就很困難。另外,由于軸承可能出現(xiàn)在啟動(dòng)時(shí)溫度高,停止時(shí)溫度低,也可能在啟動(dòng)時(shí)低,停止時(shí)高的現(xiàn)象,所以,如何設(shè)定軸承的溫度警報(bào)值也是一個(gè)很困難的問題。
3 泵類產(chǎn)品故障診斷技術(shù)的發(fā)展趨勢(shì)
故障診斷技術(shù)自問世以來(lái),特別時(shí)近30年來(lái)取得了長(zhǎng)足的發(fā)展,從對(duì)故障的機(jī)理研究,以信號(hào)分析為基礎(chǔ)的診斷方法到現(xiàn)今以知識(shí)處理為基礎(chǔ)的智能故障診斷系統(tǒng),特別是近年來(lái)迅速興起的人工神經(jīng)網(wǎng)絡(luò)方法在工程實(shí)際的應(yīng)用都取得了可喜的成果。但是現(xiàn)有的診斷方法都是以測(cè)取設(shè)備工作中的外部特征信號(hào)為基礎(chǔ),通過對(duì)信號(hào)的分析提取特征故障信號(hào)(征兆)。特征信號(hào)的提取主要是基于狀態(tài)響應(yīng),時(shí)域響應(yīng)或頻率響應(yīng),這些信號(hào)往往受到多種因素的干擾,難以取得可信的信息。而且故障于征兆之間也不是一一對(duì)應(yīng)的(如圖2所示),難以根據(jù)有限的信息(征兆)判斷故障的真正的原因。
計(jì)算機(jī)技術(shù)的日臻完善與成熟,為人工智能故障診斷方法的發(fā)展提供了廣闊的天地。這也給泵的故障診斷指明了方向。目前,人工智能的診斷方法包括以下幾種:(一)基于專家系統(tǒng)的診斷方法;(二)基于人工神經(jīng)網(wǎng)的方法;(三)基于案例的方法;(四)基于模糊數(shù)學(xué)的方法;(五)基于故障樹的方法。目前還存在以下幾個(gè)方面的問題 :
1)以解決強(qiáng)干擾、多故障、多征兆、突發(fā)條件下的故障為目的的故障診斷技術(shù)
隨著科學(xué)技術(shù)的發(fā)展,設(shè)備的向著精密、高效和機(jī)電一體化的方向發(fā)展,故障的類型也增多。強(qiáng)干擾、多故障、多征兆、突發(fā)條件下的診斷的不確定性,還需進(jìn)一步解決和研究。
2)魯棒性研究
基于模型的各種監(jiān)測(cè)分離方法對(duì)模型誤差的魯棒性是影響該類方法應(yīng)用的重要因素。研究魯棒型好、算法簡(jiǎn)單的監(jiān)測(cè)和診斷方法一直是研究的重要內(nèi)容和方向。
3)神經(jīng)網(wǎng)絡(luò)的故障診斷技術(shù)
神經(jīng)網(wǎng)絡(luò)在故障診斷系統(tǒng)中的應(yīng)用還有許多問題亟待解決。例如,網(wǎng)絡(luò)模型結(jié)構(gòu)、學(xué)習(xí)算法還有待于向可靠性、實(shí)用性方向發(fā)展,如何提高階譜 、實(shí)時(shí)辨別、非線性辨識(shí)、符號(hào)模型等與神經(jīng)網(wǎng)絡(luò)結(jié)合來(lái)解決故障診斷中的一些實(shí)際問題,還有待于進(jìn)一步解決。
【參考文獻(xiàn)】
[1]徐章遂,房立清,王希武,左.故障信息診斷原理及應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2001.
[2]王道平,張義忠.故障智能診斷系統(tǒng)的理論與方法[M].北京:冶金工業(yè)出版社,2001.
[3]王其成.泵運(yùn)行狀態(tài)監(jiān)測(cè)和故障診斷[J].化工裝備技術(shù),2001.
[4]李梅.轉(zhuǎn)軸故障診斷的頻譜分析和監(jiān)測(cè)系統(tǒng)的研究[J].紹興文理學(xué)院報(bào),2001.
[5]李平康.火電廠旋轉(zhuǎn)機(jī)械振動(dòng)監(jiān)測(cè)與故障診斷技術(shù)現(xiàn)狀及發(fā)展[J].電力自動(dòng)化.
〔關(guān)鍵詞〕知識(shí)圖譜;專家系統(tǒng);發(fā)展軌跡
DOI:10.3969/j.issn.1008-0821.2012.02.040
〔中圖分類號(hào)〕G250.71 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2012)02-0159-08
Knowledge-based Expert System Development Overview MapLiao Yi
(Political Department,National University of Defense Technology,Changsha 410073,China)
〔Abstract〕Artificial intelligence expert system is the most important and most active areas of an application,which implements the artificial intelligence research from theory to practice,turning from the general reasoning strategies of a major breakthrough in the use of expertise.This chronological order,the expert system into the 1980s before the 1980s,1990s,2000,after four stages.Articles using bibliometric methods,analysis of the expert system development process,development and trends,pointing out that the current phase is the development of expert systems,expert systems into a variety of commercial operation,need to address the knowledge acquisition bottleneck,matching conflicts and other issues for expert systems to understand and master the subject structure,evolution,development and so provide an unique perspective and knowledge.
〔Key words〕knowledge maps;expert systems;the development trajectory
專家系統(tǒng)作為人工智能的一個(gè)重要分支,發(fā)展已經(jīng)超過50年,在很多應(yīng)用領(lǐng)域都獲得了廣泛使用,取得了豐碩成果。本文運(yùn)用文獻(xiàn)計(jì)量這一獨(dú)特視角對(duì)專家系統(tǒng)進(jìn)行了再回顧和再分析,將智能科技劃分為初創(chuàng)期、成長(zhǎng)期、低谷期、發(fā)展期,利用詞頻分析、共引分析、作者共現(xiàn)分析等方法揭示專家系統(tǒng)的學(xué)科結(jié)構(gòu)、影響程度、關(guān)鍵節(jié)點(diǎn)與時(shí)間點(diǎn)等重要而獨(dú)特的知識(shí),為了解和掌握專家系統(tǒng)的發(fā)展與演化過程提供了獨(dú)特視角。
1 數(shù)據(jù)來(lái)源
SCI(Science Citation Index)是美國(guó)科學(xué)情報(bào)研究所ISI(Institute for Science Information)出版的期刊文獻(xiàn)檢索工具,所收錄的文獻(xiàn)覆蓋了全世界最重要和最有影響力的研究成果,成為世界公認(rèn)的自然科學(xué)領(lǐng)域最為重要的評(píng)價(jià)工具。本文以Web of Science中的SCI數(shù)據(jù)庫(kù)為數(shù)據(jù)來(lái)源,選用高級(jí)檢索方式,以“Expert System/Experts System”作為主題詞,于2011年5月在Web of Secience中進(jìn)行檢索,一共檢索到14 500篇相關(guān)文獻(xiàn)記錄。獲得的年度分布如圖1。所示。雖然,專家系統(tǒng)研究從20世紀(jì)五六十年代就開始了,但是從圖1可以看出直到1982年才有主題詞與專家系統(tǒng)相關(guān)的論文出現(xiàn)。圖1表明1991年左右,專家系統(tǒng)相關(guān)論文達(dá)到了峰值,但隨后呈逐年下降的趨勢(shì)。到1999年,只有494篇。但21世紀(jì)開始,專家系統(tǒng)相關(guān)論文又出現(xiàn)了增加的趨勢(shì),并維持在一個(gè)穩(wěn)定的水平中。圖1 專家系統(tǒng)在SCI數(shù)據(jù)庫(kù)文獻(xiàn)發(fā)表年度變化情況
2012年2月第32卷第2期基于知識(shí)圖譜的專家系統(tǒng)發(fā)展綜述Feb.,2012Vol.32 No.22 專家系統(tǒng)前40年的發(fā)展
本文利用基于JAVA平臺(tái)的引文分析可視化軟件Citespace,首先設(shè)定時(shí)間跨度為1950-1991年,時(shí)間切片長(zhǎng)度為1年,聚類方式為共被引聚類(Cited Reference),閾值選擇為(2,2,20)、(3,3,20)、(3,3,20)。Citespace得出這些引文的時(shí)間跨度為1950-1990年,可以繪制出該時(shí)間段的專家系統(tǒng)論文時(shí)區(qū)分布圖,如圖2所示。我們以年代先后為序,將20世紀(jì)80年代以前作為第一階段,80年代至90年代作為第二階段。圖2 1950-1991年各年度專家系統(tǒng)論文之間的時(shí)區(qū)分布圖
2.1 專家系統(tǒng)起源時(shí)期
根據(jù)圖2顯示,這段時(shí)期有7個(gè)突出節(jié)點(diǎn),既有7位代表人物。第一個(gè)節(jié)點(diǎn)代表的是“人工智能之父”――英國(guó)著名科學(xué)家阿蘭?麥席森?圖靈(Alan Mathison Turing),他于1950年在《心靈》雜志上《計(jì)算機(jī)器與智能》,提出了著名的“圖靈測(cè)試”,探討了機(jī)器智能的可能性,為后來(lái)的人工智能科學(xué)提供了開創(chuàng)性的構(gòu)思[1]。
第二個(gè)節(jié)點(diǎn)代表的是美國(guó)工程院院士、加州大學(xué)扎德(LA.Zadeh)教授,他于1965年在《信息與控制》雜志第8期上發(fā)表題為《模糊集》的論文,提出模糊集合理論,給出了模糊性現(xiàn)象定量描述和分析運(yùn)算的方法,從而誕生了模糊數(shù)學(xué)。1978年,扎德教授提出了“可能性理論”,將不確定性理解為可能性,為模糊集理論建立了一個(gè)實(shí)際應(yīng)用上的理論框架,這也被認(rèn)為是模糊數(shù)學(xué)發(fā)展的第二個(gè)里程碑。同年,國(guó)際性期刊《International Journal of Fuzzy Sets and System》誕生,這使得模糊理論得到普遍承認(rèn),理論研究高速發(fā)展,實(shí)際應(yīng)用迅速推廣。
第三個(gè)節(jié)點(diǎn)代表的美國(guó)兩院院士、卡內(nèi)基-梅隆大學(xué)教授艾倫?紐厄爾(Allen Newell),1972年,他出版了《人怎樣解題》(Human Problem Solving)一書,書中描述了他和西蒙試圖建立一個(gè)計(jì)算機(jī)化的“通用問題求解器”的歷程:20世紀(jì)50年代,他們發(fā)現(xiàn),人類的問題解決,在一定知識(shí)領(lǐng)域內(nèi)可以通過計(jì)算機(jī)實(shí)現(xiàn),所以他們開始用計(jì)算機(jī)編程來(lái)解決問題,1956年,他們研發(fā)出了邏輯理論家和通用問題求解器(General Problem Solver),并建立了符號(hào)主義人工智能學(xué)派。我們可以看出,這本書是對(duì)他以前所作工作的總結(jié)與歸納,而邏輯理論家和通用問題求解器正是專家系統(tǒng)的雛形,為專家系統(tǒng)的出現(xiàn)奠定了堅(jiān)實(shí)的基礎(chǔ)。
但是艾倫?紐厄爾的嘗試無(wú)法解決大的實(shí)際問題,也很難把實(shí)際問題改造成適合于計(jì)算機(jī)解決的形式,并且對(duì)于解題所需的巨大搜索空間也難于處理。為此,美國(guó)國(guó)家工程院院士、斯坦福大學(xué)教授費(fèi)根鮑姆(E.A.Feigenbaum)等人在總結(jié)通用問題求解系統(tǒng)成功與失敗的經(jīng)驗(yàn)基礎(chǔ)上,結(jié)合化學(xué)領(lǐng)域的專門知識(shí),于1965年研制了世界上第一個(gè)專家系統(tǒng)dendral,可以推斷化學(xué)分子結(jié)構(gòu)。專家系統(tǒng)進(jìn)入了初創(chuàng)期,其代表有dendral、macsyma(數(shù)學(xué)專家系統(tǒng))等,第一代專家系統(tǒng)以高度專業(yè)化、求解專門問題的能力強(qiáng)為特點(diǎn),向人們展示了人工智能應(yīng)用的廣闊前景[2]。
第四個(gè)節(jié)點(diǎn)代表人物是美國(guó)麻省理工學(xué)院著名的人工智能學(xué)者明斯基(Minsky)。1975年,他在論文《表示知識(shí)的框架》(A Framework for Representating Knowledge,McGraw-Hill)中提出了框架理論,框架理論的核心是以框架這種形式來(lái)表示知識(shí)。理論提出后,在人工智能界引起了極大的反響,并成為了基于框架的專家系統(tǒng)的理論基礎(chǔ),基于框架的專家系統(tǒng)適合于具有固定格式的事物、動(dòng)作或事件。
第五個(gè)節(jié)點(diǎn)代表人物是美國(guó)普林斯頓大學(xué)教授格倫謝弗(Glenn Shafer),他在1976年出版了《數(shù)學(xué)理論的證據(jù)》(A mathematical theory of evidence)一書,介紹了由他和Dempster于1967年提出的D-S理論(即證據(jù)理論)。證據(jù)理論可處理由不知道因素引起的不確定性,后來(lái),該理論被廣泛應(yīng)用于計(jì)算機(jī)科學(xué)和工程應(yīng)用,是基于D-S證據(jù)理論的專家系統(tǒng)的理論基礎(chǔ)。
第六個(gè)重要節(jié)點(diǎn)代表是美國(guó)斯坦福大學(xué)愛德華?漢斯?肖特利夫(Shortliff EH)教授,他于1975年在著名雜志《數(shù)學(xué)生物科學(xué)》上發(fā)表《A model of inexact reasoning in medicine》(《在醫(yī)學(xué)模型的不精確推理》)一文,他結(jié)合自己1972-1974年研制的世界第一個(gè)醫(yī)學(xué)專家系統(tǒng)――MYCIN系統(tǒng)(用于診斷和治療血液感染及腦炎感染,是第二代專家系統(tǒng)的經(jīng)典之作),提出了確定性理論,該理論對(duì)專家系統(tǒng)的發(fā)展產(chǎn)生了重大影響。
第七個(gè)節(jié)點(diǎn)代表人物是美國(guó)麻省理工學(xué)院計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室的戴維斯(Randall Davis)教授,他于1976年提出元知識(shí)的概念,并在專家系統(tǒng)的研制工具開發(fā)方面做出了突出貢獻(xiàn)――研制出知識(shí)獲取工具Teiresias,為專家系統(tǒng)獲取知識(shí)實(shí)現(xiàn)過程中知識(shí)庫(kù)的修改和添加提供了工具[3],關(guān)Teiresias,他于1977年在《Artificial Intelligence》雜志上中進(jìn)行了詳細(xì)介紹,而這也為本時(shí)期專家系統(tǒng)的快速增多和廣泛應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。
20世紀(jì)70年代后期,隨著專家系統(tǒng)應(yīng)用領(lǐng)域的不斷開拓,專家系統(tǒng)研發(fā)技術(shù)逐漸走向成熟。但同時(shí),專家系統(tǒng)本身存在的應(yīng)用領(lǐng)域狹窄、缺乏常識(shí)性知識(shí)、知識(shí)獲取困難、推理方法單一等問題也被逐漸暴露出來(lái)。人們從各種不同類型的專家系統(tǒng)和知識(shí)處理系統(tǒng)中抽取共性,人工智能又從具體研究逐漸回到一般研究。圍繞知識(shí)這一核心問題,人們重新對(duì)人工智能的原理和方法進(jìn)行探索,并在知識(shí)的獲取、表示以及知識(shí)在推理過程中的利用等方面開始出現(xiàn)一組新的原理、工具和技術(shù)。
2.2 專家系統(tǒng)發(fā)展的黃金時(shí)期
20世紀(jì)80年代是專家系統(tǒng)突飛猛進(jìn)、迅速發(fā)展的黃金時(shí)代,根據(jù)圖2顯示,這段時(shí)期共有論文982篇,有7個(gè)突出節(jié)點(diǎn)。
1980年,出現(xiàn)了第一個(gè)節(jié)點(diǎn)代表――美國(guó)斯坦福大學(xué)計(jì)算機(jī)科學(xué)系系主任尼爾森(NILS J.NILSSON),他出版的《人工智能原理》(《Principles of artificial intelligence》)一書,表明了拉近理論和實(shí)踐的距離的目標(biāo),書中對(duì)基于規(guī)則的專家系統(tǒng)、機(jī)器問題解決系統(tǒng)以及結(jié)構(gòu)對(duì)象的代表等都進(jìn)行了具體的論述。
1981年,出現(xiàn)了第二個(gè)節(jié)點(diǎn)代表――英國(guó)赫特福德大學(xué)教授Clocksin,威廉F,他出版的《PROLOG語(yǔ)言編程》一書,引起了計(jì)算機(jī)科學(xué)界的極大興趣,并已被證明是一個(gè)重要的編程語(yǔ)言和人工智能系統(tǒng)的新一代基礎(chǔ),是專家系統(tǒng)的重要編程語(yǔ)言。
1982年,出現(xiàn)了第三個(gè)節(jié)點(diǎn)代表――美國(guó)匹茲堡大學(xué)教授米勒(Miller RA),他在《英格蘭醫(yī)藥分冊(cè)》上發(fā)表了《基于計(jì)算機(jī)的醫(yī)學(xué)內(nèi)科實(shí)驗(yàn)診斷顧問》(An Experimental Computer based Diagnostic Consultant for General Internal Medicine.N Engl J Med,307,468-76,1982)一文,屬當(dāng)時(shí)診斷專家系統(tǒng)的代表力作,書中介紹了著名的內(nèi)科疾病診斷咨詢系統(tǒng)INTERNIST-1,之后將其不斷完善成改進(jìn)型INTERNIST-2,即后來(lái)的CADUCEUS專家系統(tǒng),其知識(shí)庫(kù)中包含了572種疾病,約4 500種癥狀。
1983年,出現(xiàn)了第四個(gè)節(jié)點(diǎn)代表――美國(guó)的海斯羅斯(Hayes-Roth,F(xiàn))教授,他于1983年發(fā)表著作《建立專家系統(tǒng)》,對(duì)專家系統(tǒng)建立的原則和要素、開發(fā)的生命周期等重要問題進(jìn)行了詳細(xì)講解,為研究與開發(fā)各種類型的專家系統(tǒng)提供了理論依據(jù)。
1984年,出現(xiàn)了第五個(gè)節(jié)點(diǎn)代表――美國(guó)匹茲堡大學(xué)計(jì)算機(jī)科學(xué)、哲學(xué)和醫(yī)學(xué)教授布魯斯?布坎南(Bruce G.Buchanan),他于1984年發(fā)表著作《規(guī)則的專家系統(tǒng):斯坦福啟發(fā)式編程項(xiàng)目Mycin實(shí)驗(yàn)》(《Rule Based Expert Systems:The Mycin Experiments of the Stanford Heuristic Programming Project》,這是有史以來(lái)關(guān)于醫(yī)療診斷系統(tǒng)MYCIN的實(shí)驗(yàn)規(guī)則庫(kù)公布?;谝?guī)則的專家系統(tǒng)MYCIN是專家系統(tǒng)開發(fā)過程中一個(gè)里程碑,研究其開發(fā)思路與方法具有非常重要的意義。
1985年,出現(xiàn)了第六個(gè)節(jié)點(diǎn)代表――美國(guó)人工智能專家、加州大學(xué)教授哈蒙(Harmon P),他出版了《專家系統(tǒng):人工智能業(yè)務(wù)》(《Expert systems:artificial intelligence in business》)一書。書中闡述了專家系統(tǒng)如何解決問題,代表知識(shí),并得出推論,并介紹了人工智能的具體制度,確定了專家系統(tǒng)的市場(chǎng)。
1986年,出現(xiàn)了第七個(gè)節(jié)點(diǎn)代表――著名的專家系統(tǒng)學(xué)者沃特曼(Waterman DA),他出版了《專家系統(tǒng)指南》一書,該書對(duì)專家系統(tǒng)的概念、組成、建立過程、建立工具、應(yīng)用領(lǐng)域等做了深入淺出的系統(tǒng)介紹與論述,是當(dāng)時(shí)全面介紹專家研發(fā)與應(yīng)用的經(jīng)典書籍。
20世紀(jì)80年代初,醫(yī)療專家系統(tǒng)占主流,主要原因是它屬于診斷類型系統(tǒng)且容易開發(fā)。80年代中期,出現(xiàn)大量投入商業(yè)化運(yùn)行的專家系統(tǒng),為各行業(yè)帶來(lái)了顯著的經(jīng)濟(jì)效益。從80年代后期開始,大量新技術(shù)成功運(yùn)用到專家系統(tǒng)之中,使得專家系統(tǒng)得到更廣泛的運(yùn)用。在這期間開發(fā)的專家系統(tǒng)按處理問題的類型可以分為:解釋型、預(yù)測(cè)型、診斷型、設(shè)計(jì)型等。應(yīng)用領(lǐng)域擴(kuò)展到農(nóng)業(yè)、商業(yè)、化學(xué)、通信、醫(yī)學(xué)等多個(gè)方面,成為人們常用的解決問題的手段之一。
然而,與此同時(shí),現(xiàn)有的專家系統(tǒng)也暴露出了自身嚴(yán)重的缺陷,使不少計(jì)算機(jī)界的知名學(xué)者對(duì)專家系統(tǒng)產(chǎn)生了懷疑,認(rèn)為專家系統(tǒng)存在的問題有以下幾點(diǎn):(1)專家系統(tǒng)中的知識(shí)多限于經(jīng)驗(yàn)知識(shí),極少有原理性的知識(shí),系統(tǒng)沒有應(yīng)用它們的能力;(2)知識(shí)獲取功能非常弱。為了建造專家系統(tǒng),必須依賴于專家獲取知識(shí), 不僅費(fèi)時(shí), 而且很難獲取完備性和一致性的知識(shí);(3)求解問題的方法比較單一,以推理機(jī)為核心的對(duì)問題的求解尚不能反映專家從認(rèn)識(shí)問題到解決問題的創(chuàng)造性過程;(4)解釋功能不強(qiáng)[4]。等到學(xué)者們回過頭重新審視時(shí),20世紀(jì)90年代的專家系統(tǒng)理論危機(jī)已然爆發(fā)。
3 90年代專家系統(tǒng)向多個(gè)方向發(fā)展
由于20世紀(jì)80年代專家系統(tǒng)研究迅猛發(fā)展,商業(yè)價(jià)值被各行各業(yè)看好,導(dǎo)致90年代大批專家系統(tǒng)從實(shí)驗(yàn)室走出來(lái),開始了它們的工程化市場(chǎng)化進(jìn)程。從圖1看以看出,在20世紀(jì)90年代,專家系統(tǒng)的相關(guān)論文不增反減,進(jìn)入一個(gè)局部低谷期,這期間以“Expert System/Experts System”為主題詞的論文共7 547篇。本文利用Citespace軟件,設(shè)置參數(shù)為(4,4,20)(4,3,20)(4,4,20),獲取了該時(shí)期論文的引文聚類圖(如圖3所示)。圖2 專家系統(tǒng)1990-2000年的論文引文聚類圖
從圖3中我們可以看出,全圖的節(jié)點(diǎn)比較分散,沒有形成大的聚類,這表示該階段沒有形成重點(diǎn)研究方向,也沒有重大科研成果和標(biāo)志性著作產(chǎn)生,專家系統(tǒng)的市場(chǎng)化進(jìn)程嚴(yán)重牽引了研究者們的注意力,這是專家系統(tǒng)研究陷入低谷期的重要原因。
這段時(shí)間專家系統(tǒng)的研究工作大致分以下幾個(gè)方面:第一個(gè)研究方向依舊是建立在扎德(LA.Zadeh)教授模糊理論上的模糊專家系統(tǒng),它同樣是該年代專家系統(tǒng)研究的重點(diǎn)方向。
第二個(gè)研究方向是骨架專家系統(tǒng),代表人物有美國(guó)斯坦福大學(xué)的愛德華?漢斯?肖特利夫(Shortliff EH)教授。1974年末,MYCIN系統(tǒng)基本建成后,MYCIN的設(shè)計(jì)者們就想到用其它領(lǐng)域的知識(shí)替換關(guān)于感染病學(xué)的知識(shí),可能會(huì)得到一個(gè)新的專家系統(tǒng),這種想法導(dǎo)致了EMYCIN骨架系統(tǒng)的產(chǎn)生。EMYCIN的出現(xiàn)大大縮短了專家系統(tǒng)的研制周期,隨后,AGE、OPS5、KEE、KBMS、GESDE等骨架系統(tǒng)應(yīng)運(yùn)而生,它們?cè)?0世紀(jì)90年代專家系統(tǒng)的研究進(jìn)程中,發(fā)揮著重要作用。
第三個(gè)研究方向是故障診斷專家系統(tǒng),代表人物有美國(guó)麻省理工學(xué)院的蘭德爾?戴維斯(Randall Davis)教授。他于1984年在《人工智能》雜志上發(fā)表了《基于結(jié)構(gòu)和行為的診斷推理 》(《Diagnostic Reasoning Based on Structure and Behavior》)一文,該論文描述了一個(gè)利用知識(shí)結(jié)構(gòu)和行為,在電子電路領(lǐng)域進(jìn)行故障診斷排除的專家系統(tǒng)。之后,故障診斷專家系統(tǒng)在電路與數(shù)字電子設(shè)備、機(jī)電設(shè)備等各個(gè)領(lǐng)域已取得了令人矚目的成就,已成為當(dāng)今世界研究的熱點(diǎn)之一。
第四個(gè)研究方向是基于規(guī)則的專家系統(tǒng),布魯斯?布坎南(Bruce G.Buchanan)的著作對(duì)基于規(guī)則的專家系統(tǒng)在這個(gè)時(shí)期的發(fā)展仍有著積極的指導(dǎo)作用。多種基于規(guī)則的專家系統(tǒng)進(jìn)入了試驗(yàn)階段。傳統(tǒng)基于規(guī)則的專家系統(tǒng)只是簡(jiǎn)單的聲明性知識(shí),而目前,規(guī)則的形式開始向產(chǎn)生式規(guī)則轉(zhuǎn)變,并趨向于提供較完善的知識(shí)庫(kù)建立和管理功能。
第五個(gè)研究方向是知識(shí)工程在專家系統(tǒng)中的運(yùn)用。代表人物是美國(guó)斯坦福大學(xué)的克蘭西教授(Clancy W J),他于1985年在《人工智能》雜志上發(fā)表了重要論文《啟發(fā)式分類》(《Heuristis classification》),啟發(fā)式分類即對(duì)未知領(lǐng)域情況的類的識(shí)別過程。它是人類思維解決問題的重要方法,在人工智能、專家系統(tǒng)中可常用啟發(fā)式設(shè)計(jì)計(jì)算機(jī)程序,模擬人類解決問題的思維活動(dòng)。
第六個(gè)研究方向是機(jī)器學(xué)習(xí)在專家系統(tǒng)中的運(yùn)用。代表人物是機(jī)器學(xué)習(xí)領(lǐng)域前輩、澳洲悉尼大學(xué)著名教授John Ross Quinlan。他于1986年在《機(jī)器學(xué)習(xí)》(《Mach.Learn》)雜志上發(fā)表《決策樹算法》(《Induction of Decision Trees》)一文,文中他詳細(xì)描述了決策樹算法的代表――ID3算法。之后,有大量學(xué)者圍繞該算法進(jìn)行了廣泛的研究,并提出多種改進(jìn)算法,由于決策樹的各類算法各有優(yōu)缺點(diǎn),在專家系統(tǒng)的實(shí)際應(yīng)用中,必須根據(jù)數(shù)據(jù)類型的特點(diǎn)及數(shù)據(jù)集的大小,選擇合適的算法。
第七個(gè)研究方向是神經(jīng)網(wǎng)絡(luò)專家系統(tǒng),代表人物有人工智能專家Stephan I.Gallant和美國(guó)加利福尼業(yè)大學(xué)教授巴特?卡斯科(Bart Kosko)。Gallant于1988年在《ACM的通信》上發(fā)表了《連接主義專家系統(tǒng)》(《Connectionist expert systems》)一文,文中講述Gallant 設(shè)計(jì)了一個(gè)連接主義專家系統(tǒng)(Connectionist expert system),其知識(shí)庫(kù)是由一個(gè)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的(即神經(jīng)網(wǎng)絡(luò)知識(shí)獲?。?,開創(chuàng)了神經(jīng)網(wǎng)絡(luò)與專家系統(tǒng)相結(jié)合的先例。
第八個(gè)研究方向是遺傳算法在專家系統(tǒng)中的運(yùn)用。代表人物是遺傳算法領(lǐng)域著名學(xué)者、美國(guó)伊利諾伊大學(xué)David Goldberg教授和人工智能專家L.Davis。1989年,Goldberg出版了專著《搜索、優(yōu)化和機(jī)器學(xué)習(xí)中的遺傳算法》,該書系統(tǒng)總結(jié)了遺傳算法的主要研究成果,全面而完整地論述了遺傳算法的基本原理及其應(yīng)用;1991年,Davis編輯出版了《遺傳算法手冊(cè)》,書中包含了遺傳算法在科學(xué)計(jì)算、工程技術(shù)和社會(huì)經(jīng)濟(jì)中的大量應(yīng)用實(shí)例,該書為推廣和普及遺傳算法的應(yīng)用起到了重要的指導(dǎo)作用。這些都推動(dòng)了基于遺傳算法的專家系統(tǒng)的研發(fā)推廣。
第九個(gè)研究方向是決策支持系統(tǒng)在專家系統(tǒng)中的運(yùn)用,代表人物是美國(guó)加利福尼亞大學(xué)伯克利分校教授埃弗雷姆?特班(Efraim Turban)。他于1990年出版了《決策支持和專家系統(tǒng)的管理支持系統(tǒng)》(《Decision support and expert systems:management support systems》)一書。20世紀(jì)80年代末90年代初,決策支持系統(tǒng)開始與專家系統(tǒng)相結(jié)合,形成智能決策支持系統(tǒng),該系統(tǒng)充分做到了定性分析和定量分析的有機(jī)結(jié)合,將解決問題的范圍和能力提高到一個(gè)新的層次。
第十個(gè)研究方向是各種理論知識(shí)在專家系統(tǒng)中的綜合運(yùn)用,代表人物是美國(guó)加利福尼業(yè)大學(xué)教授巴特?卡斯科(Bart Kosko)和美國(guó)伊利諾伊州研究所教授Abdul-Rahman K.H??ㄋ箍疲↘osko)于1992年出版《神經(jīng)網(wǎng)絡(luò)和模糊系統(tǒng):一個(gè)擁有機(jī)器智能的動(dòng)力系統(tǒng)方法》(《Neural networks and fuzzy systems:a dynamical systems approach to machine intelligence》)一書,這是第一本將神經(jīng)網(wǎng)絡(luò)和模糊系統(tǒng)結(jié)合起來(lái)的讀本,也是神經(jīng)網(wǎng)絡(luò)與模糊理論綜合應(yīng)用于專家系統(tǒng)建設(shè)的經(jīng)典著作;Abdul-Rahman K.H教授于1995年,在美國(guó)電氣和電子工程師協(xié)會(huì)的《電力系統(tǒng)及自動(dòng)化》(《Transactions on Power Systems》)會(huì)議刊上發(fā)表了《人工智能模糊無(wú)功負(fù)荷的最優(yōu)VAR控制方法 》(《AI approach to optimal VAR control with fuzzy reactive loads》)一文,論文提出了一個(gè)解決無(wú)功功率(VAR)控制問題,這個(gè)方法包含了專家系統(tǒng)、模糊集理論和人工神經(jīng)網(wǎng)絡(luò)的重要知識(shí)。
雖然專家系統(tǒng)大量建造,但投入實(shí)際運(yùn)行的專家系統(tǒng)并不多,且效率較低,問題求解能力有待進(jìn)一步提高。原因之一就是專家系統(tǒng)主要是模擬某一領(lǐng)域中求解特定問題的專家的能力,而在模擬人類專家協(xié)作求解方面很少或幾乎沒有做什么工作。然而在現(xiàn)實(shí)世界中,協(xié)作求解具有普遍性,針對(duì)特定領(lǐng)域、特定問題的求解僅僅具有特殊性,專家系統(tǒng)雖然在模擬人類專家某一特定領(lǐng)域知識(shí)方面取得了成功,但它仍然不能或難以解決現(xiàn)實(shí)世界中的問題。其次,開發(fā)的專家系統(tǒng)的規(guī)模越來(lái)越大,并且十分復(fù)雜。這樣就要求將大型專家系統(tǒng)的開發(fā)變成若干小的、相對(duì)獨(dú)立的專家系統(tǒng)來(lái)開發(fā),而且需要將許多不同領(lǐng)域的專家系統(tǒng)聯(lián)合起來(lái)進(jìn)行協(xié)作求解。然而,與此相關(guān)的分布式人工智能理論和實(shí)用技術(shù)尚處在科研階段。只有分布式系統(tǒng)協(xié)作求解問題得以解決,才能克服由于單個(gè)專家系統(tǒng)知識(shí)的有限性和問題求解方法的單一性等導(dǎo)致系統(tǒng)的“脆弱性”,也才能提高系統(tǒng)的可靠性,并且在靈活性、并行性、速度等方面帶來(lái)明顯的效益[5]。
4 21世紀(jì)專家系統(tǒng)進(jìn)入穩(wěn)定發(fā)展時(shí)期
進(jìn)入21世紀(jì),專家系統(tǒng)開始緩慢發(fā)展,這期間以“Expert System/Experts System”為主題詞的論文共5 964篇。本文利用Citespace軟件,設(shè)置參數(shù)為(6,6,20)(5,5,20)(5,5,20),獲取了該時(shí)期論文的引文聚類圖(如圖4所示)。圖4 專家系統(tǒng)2000-2010年的論文引文聚類圖
這個(gè)時(shí)期專家系統(tǒng)有3個(gè)主要研究方向:第一個(gè)是研究方向是節(jié)點(diǎn)明顯的基于模糊邏輯的專家系統(tǒng)研究方向。90年代以來(lái),模糊控制與專家系統(tǒng)技術(shù)相結(jié)合,進(jìn)一步提高了模糊控制器的智能水平。基于模糊邏輯的專家系統(tǒng)有以下優(yōu)點(diǎn):一是具有專家水平的專門知識(shí),能表現(xiàn)專家技能和高度的技巧以及有足夠的魯棒性(即健壯性);二是能進(jìn)行有效的推理,能夠運(yùn)用人類專家的經(jīng)驗(yàn)和知識(shí)進(jìn)行啟發(fā)性的搜索和試探性的推理;三是具有靈活性和透明性。
第二個(gè)是研究方向是Rete模式匹配算法在專家系統(tǒng)中的應(yīng)用,代表人物是美國(guó)卡內(nèi)基―梅隆大學(xué)計(jì)算機(jī)科學(xué)系的Charles L.Forgy教授,1979年,他首次提出Rete算法。專家系統(tǒng)工具中一個(gè)核心部分是推理機(jī),Rete算法能利用推理機(jī)的“時(shí)間冗余”特性和規(guī)則結(jié)構(gòu)的相似性,并通過保存中間運(yùn)算結(jié)果的方法來(lái)提高推理的效率。1982年,他在《人工智能》雜志上發(fā)表《Rete算法:許多模式/多對(duì)象的模式匹配問題的一個(gè)快速算法》(《Rete:A Fast Algorithm for the Many Pattern/Many Object Pattern Match Problem》)一文,該文解釋了基本算法的概念,介紹了詳細(xì)的算法,描述了模式和適當(dāng)?shù)膶?duì)象交涉算法,并說明了模式匹配的執(zhí)行操作。
第三個(gè)是研究方向是專家系統(tǒng)在電力系統(tǒng)中的運(yùn)用。世界各國(guó)的專家們開始熱衷于在電力生產(chǎn)的各個(gè)環(huán)節(jié)使用專家系統(tǒng),代表人物有日本的福井賢、T.Sakaguchi、印度的Srinivasan D、美國(guó)伊利諾伊州研究所的Abdul-Rahman K.H、希臘雅典國(guó)立技術(shù)大學(xué)的Protopapas C.A、和中國(guó)的羅旭,他們?cè)诿绹?guó)電氣和電子工程師協(xié)會(huì)的《電力傳輸》(《IEEE transactions on power delivery)會(huì)議刊及《電源設(shè)備系統(tǒng)》會(huì)議刊(《On Power Apparatus and Systems》)上發(fā)表了多篇有影響力的論文,內(nèi)容涉及系統(tǒng)恢復(fù)、電力需求預(yù)測(cè)、變電站故障診斷和報(bào)警處理等多方面。
這十年間,專家系統(tǒng)的研究不再滿足于用現(xiàn)有各種模型與專家系統(tǒng)進(jìn)行簡(jiǎn)單結(jié)合,形成基于某種模型的專家系統(tǒng)的固有模式。研究者們不斷探索更方便、更有效的方法,來(lái)解決困擾專家系統(tǒng)的知識(shí)獲取瓶頸、匹配沖突、組合爆炸等問題,而這也推動(dòng)了研究不斷向深層次、新方向發(fā)展。但是,由于專家系統(tǒng)應(yīng)用的時(shí)間長(zhǎng)、領(lǐng)域廣,他們?cè)庥龅钠款i問題一時(shí)得不到有效解決,導(dǎo)致了這一時(shí)期末,專家系統(tǒng)研究呈現(xiàn)出暫時(shí)的下滑現(xiàn)象。
5 專家系統(tǒng)發(fā)展趨勢(shì)分析
圖一發(fā)展曲線上第二個(gè)時(shí)間節(jié)點(diǎn)是1992年,從該年起專家系統(tǒng)相關(guān)論文呈下降趨勢(shì),然后在2002年又開始緩慢增長(zhǎng),近一年多來(lái)又開始下降,這標(biāo)志著專家系統(tǒng)研究在布滿荊棘的道路上前行,前景是光明的,但道路是曲折的。本文以5年為一個(gè)單位,統(tǒng)計(jì)了1990-2009年20年期間專家系統(tǒng)相關(guān)論文中高頻詞的變化情況,如表1所示,從該表可以獲得這個(gè)時(shí)期專家系統(tǒng)研究的一些特點(diǎn)。
(1)在1990-1999年期間,人工智能出現(xiàn)新的研究,由于網(wǎng)絡(luò)技術(shù)特別是國(guó)際互連網(wǎng)技術(shù)發(fā)展,人工智能開始由單個(gè)智能主體研究轉(zhuǎn)向基于網(wǎng)絡(luò)環(huán)境下的分布式人工智能研究,使人工智能更加實(shí)用,這給專家系統(tǒng)帶來(lái)了發(fā)展的希望。正因?yàn)槿绱?,我們從詞頻上可以看出,人工智能(artificial intelligence)一詞在這十年一直位居前兩位,在專家系統(tǒng)研究中處于主導(dǎo)地位,而與其相關(guān)的知識(shí)表示(knowledge representation)、知識(shí)獲取(knowledge acquisition)等,也成為了學(xué)者們研究的重點(diǎn)方向。
(2)該時(shí)期的第二個(gè)特點(diǎn)是神經(jīng)網(wǎng)絡(luò)研究的復(fù)蘇。神經(jīng)網(wǎng)絡(luò)是通過模擬人腦的結(jié)構(gòu)和工作模式,使機(jī)器具有類似人類的智能,如機(jī)器學(xué)習(xí)、知識(shí)獲取、專家系統(tǒng)等。我們從詞頻上可以看出神經(jīng)網(wǎng)絡(luò)(neural network)一詞得以快速增長(zhǎng),1995年時(shí)位列第一,進(jìn)入21世紀(jì)也是穩(wěn)居第二位,神經(jīng)網(wǎng)絡(luò)很好地解決了專家系統(tǒng)中知識(shí)獲取的瓶頸問題,能使專家系統(tǒng)具有自學(xué)習(xí)能力,它的出現(xiàn)為專家系統(tǒng)提供了一種新的解決途徑[6],同時(shí)也顯示出他獨(dú)有的生機(jī)與活力。
(3)該時(shí)期是模糊邏輯的發(fā)展時(shí)期。模糊理論發(fā)展至今已接近三十余年,應(yīng)用范圍非常廣泛,它與專家系統(tǒng)相結(jié)合,在故障診斷、自然語(yǔ)言處理、自動(dòng)翻譯、地震預(yù)測(cè)、工業(yè)設(shè)計(jì)等方面取得了眾多成果。我們從詞頻上可以看出,模糊邏輯(fuzzy logic)一詞,除在1990-1994年期間位居第六位外,之后都位居前三甲,2000-2004年期間更是位列第一。模糊控制與專家系統(tǒng)技術(shù)相結(jié)合,進(jìn)一步提高了模糊控制器智能水平,這種控制方法既保持了基于規(guī)則的方法的價(jià)值和用模糊集處理帶來(lái)的靈活性,同時(shí)把專家系統(tǒng)技術(shù)的表達(dá)與利用知識(shí)的長(zhǎng)處結(jié)合起來(lái),能處理更廣泛的控制問題。
(4)故障診斷成為專家系統(tǒng)研究與應(yīng)用的又一重要領(lǐng)域。故障診斷專家系統(tǒng)的發(fā)展起始于20世紀(jì)70年代末,雖然時(shí)間不長(zhǎng),但在電路與數(shù)字電子設(shè)備、機(jī)電設(shè)備等各個(gè)領(lǐng)域已取得了令人矚目的成就,已成為當(dāng)今世界研究的熱點(diǎn)之一。這從高頻詞分布可以開出,故障診斷(fault diagnosis)從1995-1999年間的最后一位攀升至2005-2009年間的第一位,足見其強(qiáng)大的生命力。在專家系統(tǒng)己有較深厚基礎(chǔ)的國(guó)家中,機(jī)械、電子設(shè)備的故障診斷專家系統(tǒng)已基本完成了研究和試驗(yàn)的階段,開始進(jìn)入廣泛應(yīng)用。
(5)遺傳算法的應(yīng)用逐漸增多。20世紀(jì)90年代,遺傳算法迎來(lái)了發(fā)展時(shí)期,無(wú)論是理論研究還是應(yīng)用研究都成了十分熱門的課題。尤其是遺傳算法的應(yīng)用研究顯得格外活躍,不但應(yīng)用領(lǐng)域擴(kuò)大,而且利用遺傳算法進(jìn)行優(yōu)化和規(guī)則學(xué)習(xí)的能力也顯著提高。進(jìn)入21世紀(jì),遺傳算法的應(yīng)用研究已從初期的組合優(yōu)化求解擴(kuò)展到了許多更新、更工程化的應(yīng)用方面。這在高頻詞分布中可以看出,以2000作為臨界點(diǎn),遺傳算法(genetic algorithms)從20世紀(jì)90年代的10名之后,到位于高頻詞前六強(qiáng)之中,充分反映出它發(fā)展的良好勢(shì)頭。
6 小 結(jié)
專家系統(tǒng)是20世紀(jì)下半葉發(fā)展起來(lái)的重大技術(shù)之一,它不僅是高技術(shù)的標(biāo)志,而且有著重大的經(jīng)濟(jì)效益?!爸R(shí)工程之父”E.Feignbaum在對(duì)世界許多國(guó)家和地區(qū)的專家系統(tǒng)應(yīng)用情況進(jìn)行調(diào)查后指出:幾乎所有的ES都至少將人的工作效率提高10倍,有的能提高100倍,甚至300倍[7]。
專家系統(tǒng)技術(shù)能夠使專家的專長(zhǎng)不受時(shí)間和空間的限制,以便推廣稀缺的專家知識(shí)和經(jīng)驗(yàn);同時(shí),專家系統(tǒng)能促進(jìn)各領(lǐng)域的發(fā)展,是各領(lǐng)域?qū)<覍I(yè)知識(shí)和經(jīng)驗(yàn)的總結(jié)和提煉。
專家系統(tǒng)發(fā)展的近期目標(biāo),是建造能用于代替人類高級(jí)腦力勞動(dòng)的專家系統(tǒng);遠(yuǎn)期目標(biāo)是探究人類智能和機(jī)器智能的基本原理,研究用自動(dòng)機(jī)模擬人類的思維過程和智能行為,這幾乎涉及自然科學(xué)和社會(huì)科學(xué)的所有學(xué)科,遠(yuǎn)遠(yuǎn)超出了計(jì)算機(jī)科學(xué)的范疇。
隨著人工智能應(yīng)用方法的日漸成熟,專家系統(tǒng)的應(yīng)用領(lǐng)域也不斷擴(kuò)大。有人類活動(dòng)的地方,必將有智能技術(shù)包括專家系統(tǒng)的應(yīng)用,專家系統(tǒng)將成為21世紀(jì)人類進(jìn)行智能管理與決策的工具與助手。
參考文獻(xiàn)
[1]百度百科[EB].http:∥baike.省略/view/2130.htm.
[2]黃可鳴.專家系統(tǒng)二十年[J].計(jì)算機(jī)科學(xué),1986,(4):26-37.
[3]路耀華.思維模擬與知識(shí)工程[M].北京:清華大學(xué)出版社,1997.
[4]趙致琢.專家系統(tǒng)研究[J].貴州大學(xué)學(xué)報(bào):自然科學(xué)版,1990,(6):40-48.
[5]鄒光宇.專家系統(tǒng)發(fā)展現(xiàn)狀及其應(yīng)用前景[J].電力勘測(cè),1994,(3):21-26.
【關(guān)鍵詞】機(jī)器人;科學(xué)技術(shù);發(fā)展;領(lǐng)域;高智能;
1.1智能機(jī)器人的定義及分類
智能機(jī)器人:以人工智能決定其行動(dòng)的人。 我國(guó)的機(jī)器人專家從應(yīng)用環(huán)境出發(fā),將機(jī)器人分為兩大類,即工業(yè)機(jī)器人和特種機(jī)器人。所謂工業(yè)機(jī)器人就是面向工業(yè)領(lǐng)域的多關(guān)節(jié)機(jī)械手或多自由度機(jī)器人。而特種機(jī)器人則是除工業(yè)機(jī)器人之外的、用于非制造業(yè)并服務(wù)于人類的各種先進(jìn)機(jī)器人,包括:服務(wù)機(jī)器人、水下機(jī)器人、娛樂機(jī)器人、軍用機(jī)器人、農(nóng)業(yè)機(jī)器人、機(jī)器人化機(jī)器等。在特種機(jī)器人中,有些分支發(fā)展很快,有獨(dú)立成體系的趨勢(shì),如服務(wù)機(jī)器人、水下機(jī)器人、軍用機(jī)器人、微操作機(jī)器人等。目前,國(guó)際上的機(jī)器人學(xué)者,從應(yīng)用環(huán)境出發(fā)將機(jī)器人也分為兩類:制造環(huán)境下的工業(yè)機(jī)器人和非制造環(huán)境下的服務(wù)與仿人型機(jī)器人,這和我國(guó)的分類是一致的??罩袡C(jī)器人又叫無(wú)人機(jī),近年來(lái)在軍用機(jī)器人家族中,無(wú)人機(jī)是科研活動(dòng)最活躍、技術(shù)進(jìn)步最大、研究及采購(gòu)經(jīng)費(fèi)投入最多、實(shí)戰(zhàn)經(jīng)驗(yàn)最豐富的領(lǐng)域。80多年來(lái),世界無(wú)人機(jī)的發(fā)展基本上是以美國(guó)為主線向前推進(jìn)的,無(wú)論從技術(shù)水平還是無(wú)人機(jī)的種類和數(shù)量來(lái)看,美國(guó)均居世界之首位。
1.2智能機(jī)器人的起源與發(fā)展
機(jī)器人的起源要追溯到3000多年前?!皺C(jī)器人”是存在于多種語(yǔ)言和文字的新造詞,它體現(xiàn)了人類長(zhǎng)期以來(lái)的一種愿望,即創(chuàng)造出一種像人一樣的機(jī)器或人造人,以便能夠代替人去進(jìn)行各種工作。直到四十多年前,“機(jī)器人”才作為專業(yè)術(shù)語(yǔ)加以引用,然而機(jī)器人的概念在人類的想象中卻已存在三千多年了。春秋時(shí)代(公元前770~前467)后期,被稱為木匠祖師爺?shù)聂敯?,利用竹子和木料制造出一個(gè)木鳥,它能在空中飛行,“三日不下”,這件事在古書《墨經(jīng)》中有所記載,這可稱得上世界第一個(gè)空中機(jī)器人。
在1920年,原捷克斯洛伐克劇作家卡雷爾·凱培克在他的科幻情節(jié)劇《羅薩姆的萬(wàn)能機(jī)器人》中,第一次提出了“機(jī)器人” (Robot)這個(gè)名詞,被當(dāng)成了機(jī)器人一詞的起源。在捷克語(yǔ)中,Robot這個(gè)詞是指一個(gè)賦役的努力。
20世紀(jì)初期,機(jī)器人已躁動(dòng)于人類社會(huì)和經(jīng)濟(jì)的母胎之中,人們含有幾分不安地期待著它的誕生。他們不知道即將問世的機(jī)器人將是個(gè)寵兒,還是個(gè)怪物。針對(duì)人類社會(huì)對(duì)即將問世的機(jī)器人的不安,美國(guó)著名科學(xué)幻想小說家阿西莫夫于1950年在他的小說《我是機(jī)器人》中,首先使用了機(jī)器人學(xué)(Robotics)這個(gè)詞來(lái)描述與機(jī)器人有關(guān)的科學(xué),并提出了有名的“機(jī)器人三守則”:
(1) 機(jī)器人必須不危害人類,也不允許他眼看人將受害而袖手旁觀;
(2) 機(jī)器人必須絕對(duì)服從于人類,除非這種服從有害于人類;
(3) 機(jī)器人必須保護(hù)自身不受傷害,除非為了保護(hù)人類或者是人類命令它做出犧牲。
這三條守則,給機(jī)器人社會(huì)賦以新的倫理性,并使機(jī)器人概念通俗化更易于為人類社會(huì)所接受。至今,它仍為機(jī)器人研究人員、設(shè)計(jì)制造廠家和用戶,提供了十分有意義的指導(dǎo)方針。
1.3我國(guó)智能機(jī)器人取得的成就
我國(guó)是從20世紀(jì)80年代開始涉足機(jī)器人領(lǐng)域的研究和應(yīng)用的。1986年,我國(guó)開展了“七五”機(jī)器人攻關(guān)計(jì)劃,1987年,我國(guó)的“863”高技術(shù)計(jì)劃將機(jī)器人方面的研究開發(fā)列入其中。目前我國(guó)從事機(jī)器人研究和應(yīng)用開發(fā)的主要是高校及有關(guān)科研院所等。最初我國(guó)在機(jī)器人技術(shù)方面研究的主要目的是跟蹤國(guó)際先進(jìn)的機(jī)器人技術(shù)。隨后,我國(guó)在機(jī)器人技術(shù)及應(yīng)用方面取得了很大的成就,主要研究成果有:哈爾濱工業(yè)大學(xué)研制的兩足步行機(jī)器人,北京自動(dòng)化研究所1993年研制的噴涂機(jī)器人,1995年完成的高壓水切割機(jī)器人,沈陽(yáng)自動(dòng)化研究所研制完成的有纜深潛300m機(jī)器人、無(wú)纜深潛機(jī)器人、遙控移動(dòng)作業(yè)機(jī)器人。
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:北大期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:北大期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)