公務(wù)員期刊網(wǎng) 精選范文 統(tǒng)計學(xué)決策規(guī)則范文

統(tǒng)計學(xué)決策規(guī)則精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的統(tǒng)計學(xué)決策規(guī)則主題范文,僅供參考,歡迎閱讀并收藏。

統(tǒng)計學(xué)決策規(guī)則

第1篇:統(tǒng)計學(xué)決策規(guī)則范文

Abstract: The classification research of regional shape after image segmentation is brought forward in this paper based on RS theory. Data discrimination is the character of RS,considering distributed information of class,and continual condition attributes are described according to information entropy theory. On the basis of that,redundancy attributes are eliminated by RS reduction algorithm. Reduction attributes and rules are gained. Finally,the result indicates that the classification is valid through selecting test sample and analyzing the imitation experiment.

關(guān)鍵詞:區(qū)域形狀;粗集;分類;信息熵

Key words: regional shape;rough set;classification;information entropy

中圖分類號:TP30 文獻(xiàn)標(biāo)識碼:A文章編號:1006-4311(2010)21-0028-02

0引言

在有關(guān)視覺信息的討論中,目標(biāo)的形狀具有特殊的意義。圖像分割后,圖像中一個區(qū)域的形狀就是該目標(biāo)邊界上的點所組成的模式。要對形狀進(jìn)行分類,首先要對目標(biāo)的形狀特征進(jìn)行描述。由于形狀很難給出精確的數(shù)學(xué)定義,所以對形狀的度量往往是相對的,而不是絕對的。為了對目標(biāo)的形狀描述更加精確,需要同時使用多種特征,然而特征越多,計算量越大,實現(xiàn)也越復(fù)雜。因此,能用最少的特征來完成形狀分類的目的有著重要的意義。

粗糙集理論是一種嶄新的智能信息處理理論,它為研究不精確知識的表達(dá)、學(xué)習(xí)、約簡,分類歸納等提供了一種新的方法。鑒于形狀描述的特點及粗糙集理論在處理不確定性信息方面的優(yōu)勢,本節(jié)提出一種基于粗集理論的區(qū)域形狀分類策略。將目標(biāo)圖像的統(tǒng)計學(xué)特性作為條件屬性,形狀分類作為決策屬性,并針對連續(xù)屬性進(jìn)行離散化,屬性約簡,最終從訓(xùn)練樣本中提取出決策規(guī)則,進(jìn)而對測試樣本進(jìn)行分析。

1基于粗集的處理過程

在給定一幅含有多個物體的數(shù)字圖像的條件下,處理過程由三個主要階段組成[1]:

①圖像分割的預(yù)處理階段

在該階段中檢測出各個物體,以獲得精確的分析目標(biāo)。

②特征抽取階段

對物體進(jìn)行度量。一個度量是指一個物體某個可度量性質(zhì)的度量值,而特征是一個或多個度量的函數(shù)。計算特征是為了對物體的一些重要特征進(jìn)行定量估計。特征抽取過程產(chǎn)生了一組特征,把它們組合在一起,就形成了特征向量,即產(chǎn)生條件屬性和決策屬性。

③分類階段

基于粗集的一種決策,主要確定每個物體應(yīng)該歸屬的類別,其中包括對知識的約簡,獲取及分析決策。

在物體從圖像中分割出來后,進(jìn)一步就可以對它的幾何特征進(jìn)行測量和分析,在此基礎(chǔ)上可以識別物體,也可以對物體分類,結(jié)合區(qū)域形狀的分析特征及粗集理論的特點,給出基于粗集的區(qū)域形狀的分類處理過程,如圖1所示。

在特征抽取階段建立基于粗集理論的區(qū)域形狀分類信息系統(tǒng)S=(U,C,D,V,F),其中U為論域,是區(qū)域形狀對象的非空有限集合,C∪D=A為屬性集合,子集C和D分別稱為條件屬性和決策屬性,V=∪a∈Va是屬性值的集合,Va表示了屬性a∈A取值的范圍,F為U與A之間的關(guān)系集。信息系統(tǒng)的數(shù)據(jù)可以以關(guān)系表的形式來表示,即決策表[2]。決策表的列表示條件屬性和決策屬性。行表示對象,每個單元格表示對象的屬性值??梢钥闯?一個屬性對應(yīng)一個等價關(guān)系,一個決策表看作是一族等價關(guān)系,即知識庫。知識等價可以用不同的屬性集描述論域中的對象,表達(dá)關(guān)于論域相同的事實。

2仿真實驗

2.1 區(qū)域形狀分類信息系統(tǒng)的建立

描述區(qū)域形狀特征的因素復(fù)雜且難以測量,本文采用對形狀變化比較敏感的形狀特征來描述區(qū)域形狀,并利用部分區(qū)域形狀特征建立決策表,其中,條件屬性C包括五個形狀特征,分別代表外觀比C1,形狀因子C2,偏心率C3,矩形度C4及飽和度C5,決策屬性D為形狀類別,分別是1為圓形,2為矩形,3為三角形,4為橢圓形。

2.2 基于信息熵的連續(xù)條件屬性離散化

區(qū)域形狀決策表中條件屬性是連續(xù)的,而粗集研究離散數(shù)據(jù),所以采用的離散算法好壞直接影響預(yù)測結(jié)果的正確性,一般意義上經(jīng)常采取等寬度或等頻率方法進(jìn)行離散,這種形式斷點形式簡單,但因為忽略了對象的類別信息,使其容易丟失信息,也就難以獲得較好的離散化結(jié)果。

本文采用基于信息熵的離散化方法[3],此方法是一種監(jiān)督的、自頂向下的分裂技術(shù)。它在計算和確定斷點時利用類分布信息。

設(shè)x?哿u為子集,其實例個數(shù)為|X|,其中決策屬性為j(j=1,2,…,r(d))的實例個數(shù)為kj,定義此子集的信息熵[4]為

H(X)=-pjlog2pj,pj=(1)

設(shè)P為已選取的斷點的集合,L為實例被斷點集合P所劃分成的等價類集合,B為候選斷點的集合,H為決策表信息熵,初值由公式(1)取為H=H(U)。

基于信息熵的數(shù)據(jù)離散化算法如下:

step1:P= ;L={U};H=H(U);

step2:對每一個c∈B,計算H(c,L);

step3:若H≤min{H(c,L)},則結(jié)束;

step4:選擇使H(c,L)最小的斷點cmin加到P中;H=H(c,L);B=B-{c};

step5:對所有X∈L,如果cmin把等價類X劃分為X1和X2,那么,從L中去掉X,把等價類X1和X2加到L中;

step6:如果L中各個等價類中的實例都具有相同的決策,則結(jié)束;否則轉(zhuǎn)到步2。

根據(jù)如上算法針對表1進(jìn)行基于信息熵的離散化,得到離散化區(qū)間如下:

①C1的斷點:[*, 1.4115),[1.4115, 1.4922),[1.4922, 1.5278),[1.5278, 1.6528),[1.6528, *)

②C2的斷點:[*, 1.2017),[1.2017, 1.5447),[1.5447, *)

③C3的斷點:[*, 0.7066),[0.7066, 0.7201),[0.7201, 0.7955),[0.7955, *)

④C4的斷點:[*, 0.7699),[0.7699, 0.7734),[0.7734, 0.7753),[0.7753, 0.8911),[0.8911, *)

⑤C5的斷點:[*, 0.0984),[0.0984, 0.1410),[0.1410, 0.1658),[0.1658, *)

2.3 知識約簡和知識獲取

知識約簡是在保持決策表分類或決策能力不變的前提下,刪除冗余屬性,即進(jìn)行屬性約簡。本文采用約簡算法可以求出一個相對較小長度約簡,算法可以由用戶來定義屬性的權(quán)重。約定B表示約簡;S表示分辨函數(shù)中的每一個集合;w(S)表示S的權(quán)重。算法描述如下:

step1:算出給定決策表的分辨矩陣;

step2: ;

step3:令a為在S中出現(xiàn)頻率與權(quán)值w(S)乘積最大的屬性,如果兩個屬性的值一樣大,則隨機地取一個屬性;

step4:把屬性a添加到集合B中;

step5:將S中所有包含屬性a的項去掉;

step6:如果 ,則返回B,否則轉(zhuǎn)到3。

由此可得到(基于表2的)屬性約簡為{C2,C4,C5},即{形狀因子,矩形度,飽和度}。

知識約簡結(jié)果有利于進(jìn)一步進(jìn)行知識獲取,即決策規(guī)則的提取,除去冗余屬性值,所得決策規(guī)則如下:

Rule1:IF C2

Rule2:IF C2

Rule3:IF C2

Rule4:IF 1.2017

Rule5:IF 1.2017

Rule6:IF 1.2017=0.1658 THEN D=2

Rule7:IF C2>=1.5447 AND C4< 0.7699 AND 0.0984

Rule8:IF C2

Rule9:IF C2

選取測試樣本,應(yīng)用決策規(guī)則,通過對測試結(jié)果的分析可知,分類規(guī)則能以較高精度將測試樣本按其形狀正確分類,說明該分類決策是有效的。Rule1是一種特殊情況,在判斷圓形和橢圓形時,三個屬性值,形狀因子小于1.2017,矩形度小于0.7699,飽和度小于0.0984,即三個屬性值在最小區(qū)間范圍內(nèi),說明形狀相近。

3結(jié)論

主要利用粗集的約簡理論及分類功能,對圖像分割后的區(qū)域幾何形狀進(jìn)行分類,文中所用到的是規(guī)則的幾何圖形,因此形狀特征明顯,通過仿真實驗證明,只用三個形狀特征就能以較高精度完成分類任務(wù),此方法是有效的。當(dāng)然對于復(fù)雜形狀,在以后的研究中,需要通過改進(jìn)算法,增加形狀特征的因素等手段進(jìn)一步進(jìn)行研究。

參考文獻(xiàn):

[1]CostaLF,CesarRM.ShaPeAnalysisandClassification:heoryandPraetiee.CRCPress 2001.

[2]史忠植.知識發(fā)現(xiàn)[M].第一版.北京:清華大學(xué)出版社,2002.

[3]謝宏,程浩忠,牛東曉.基于信息熵的粗糙集連續(xù)屬性離散化算法[J].計算機學(xué)報,2005,28(9):1570-1573.

第2篇:統(tǒng)計學(xué)決策規(guī)則范文

一、任務(wù)的復(fù)雜性與分析性程序績效

有關(guān)審計理論研究表明,工作業(yè)績會隨著任務(wù)復(fù)雜性的提高而降低,同時審計師的經(jīng)驗會減輕任務(wù)的復(fù)雜性對績效的負(fù)面影響。然而,尚缺乏經(jīng)驗證據(jù)證明任務(wù)復(fù)雜性與業(yè)績之間的關(guān)系是否會受到知識和激勵的綜合影響,只有與激勵、技能結(jié)合在一起研究,任務(wù)的復(fù)雜性才有實際意義。

(一)分析程序績效任務(wù)復(fù)雜性的提出 目前審計理論中關(guān)于任務(wù)復(fù)雜性的模型揭示了任務(wù)的復(fù)雜性、審計師的技能、激勵三者之間的相互作用機制。國外學(xué)者對任務(wù)復(fù)雜性、激勵、技能與業(yè)績之間的關(guān)系也進(jìn)行了許多經(jīng)驗研究,得出了富有意義的成果:第一類經(jīng)驗研究認(rèn)為,經(jīng)驗和知識可以與任務(wù)的復(fù)雜性相互作用,在復(fù)雜的任務(wù)環(huán)境中,具有更多知識和經(jīng)驗的審計師比更少知識和經(jīng)驗的審計師其業(yè)績更好。該類研究沒有檢驗激勵是如何與知識相互作用以減輕任務(wù)的復(fù)雜性對業(yè)績的影響。第二類研究則將激勵作為一個變量納入其視野,其結(jié)果暗示了激勵和任務(wù)的復(fù)雜性之間存在相互作用,但關(guān)于相互作用的證據(jù)是模糊的。

(二)分析程序績效任務(wù)復(fù)雜性的具體分析Pelham和Neter(1995)發(fā)現(xiàn),在任務(wù)復(fù)雜性程度較低時,作為被測試的大學(xué)本科在校生更不容易做出錯誤判斷。Ashton也指出,當(dāng)審計師執(zhí)行一個債券等級評估任務(wù)時,激勵的增加可以導(dǎo)致工作業(yè)績的提升,但前提是在一個不需要借助決策輔助系統(tǒng)的環(huán)境(即任務(wù)復(fù)雜性較低)中。與之相對照的是,Chang(1997)沒有發(fā)現(xiàn)任務(wù)的復(fù)雜性和激勵之間存在相互作用的關(guān)系。上述研究的缺陷在于,都沒有對完成特定任務(wù)所需要的知識進(jìn)行測度,并且沒有進(jìn)行經(jīng)驗性的檢驗以證實是否技能和激勵結(jié)合在一起是否可以減輕任務(wù)的復(fù)雜性對工作業(yè)績的影響。比較完整的關(guān)于任務(wù)復(fù)雜性的模型是Booner(1994)提出來的,她認(rèn)為任務(wù)的復(fù)雜性對工作業(yè)績的影響度是技能與激勵的函數(shù),預(yù)測了任務(wù)的復(fù)雜性與技能之間、任務(wù)的復(fù)雜性和激勵之間的雙向相互作用。就任務(wù)的復(fù)雜性和技能的相互作用而言,她認(rèn)為隨著任務(wù)復(fù)雜性的增加,技能對工作績效的正面推動作用也愈來愈大。該論斷認(rèn)為,恰當(dāng)?shù)募寄芩娇梢跃徑馊蝿?wù)的復(fù)雜性給業(yè)績造成的負(fù)面影響。當(dāng)技能處于高水平時,增加的任務(wù)復(fù)雜程度不會對業(yè)績產(chǎn)生顯著負(fù)面影響;當(dāng)技能水平很低時,隨著業(yè)務(wù)復(fù)雜程度的提高,業(yè)績將下降。就激勵和工作業(yè)績而言,當(dāng)工作復(fù)雜性提升時,激勵對業(yè)績的效果和影響將下降。這個論斷指出,當(dāng)任務(wù)的復(fù)雜性很低時,激勵最初可以導(dǎo)致很高的業(yè)績水平,而后隨著任務(wù)復(fù)雜性的提高,其對業(yè)績的影響性也逐漸下降。該領(lǐng)域的第三類研究則將關(guān)注重點集中在審計人員責(zé)任心、任務(wù)的復(fù)雜性與分析程序績效的關(guān)系的研究上,如Ton和Kao就認(rèn)為,業(yè)績和責(zé)任心之間的聯(lián)系只當(dāng)審計師擁有的技能與審計任務(wù)的復(fù)雜程度相匹配時,才能觀察出來,他們實驗研究的結(jié)果與假設(shè)完全吻合,這就說明,技能、激勵和任務(wù)復(fù)雜性之間確實存在互動。

上述經(jīng)驗研究文獻(xiàn)在揭示任務(wù)復(fù)雜性對分析性程序績效的影響時都將激勵、責(zé)任心、技能納入其研究視野,雖然都沒有具體闡明這些因素的相互作用機制,但都從不同角度充分揭示了任務(wù)的復(fù)雜性對分析性程序執(zhí)行績效的影響。從這些研究結(jié)果可知,任務(wù)的復(fù)雜性是影響分析性程序績效的重要變量。既然任務(wù)的復(fù)雜性會對審計師業(yè)績產(chǎn)生顯著影響,那么就有必要對各種分析性程序任務(wù)按復(fù)雜性程度的不同進(jìn)行劃分,在此基礎(chǔ)上進(jìn)一步探討提高績效的途徑。

二、任務(wù)復(fù)雜性的分類、決策輔助系統(tǒng)與分析程序績效

為進(jìn)一步提高分析性程序績效,指導(dǎo)審計師針對不同復(fù)雜程度的分析性程序任務(wù)采取不同的策略,有必要對分析性程序所面臨的任務(wù)按復(fù)雜性程度進(jìn)行劃分。

(一)任務(wù)復(fù)雜性的分類 Wright提出了一個關(guān)于任務(wù)的結(jié)構(gòu)化水平、決策過程和決策方案之間關(guān)系的模型。根據(jù)該模型,如果在某些任務(wù)中,解決問題的決策方案只包括有限數(shù)量的項目,則該任務(wù)就是結(jié)構(gòu)化的;而在某些任務(wù)中,所面臨的要解決的問題往往很難被精確定義,這類任務(wù)就稱為非結(jié)構(gòu)化任務(wù),介于兩者之間的是半結(jié)構(gòu)化任務(wù)。根據(jù)任務(wù)復(fù)雜性程度的不同可以將分析性程序任務(wù)劃分為三類,如表1所示。結(jié)構(gòu)化任務(wù)所面對的任務(wù)帶有很大的慣例性,這類任務(wù)可以充分地定義所要解決的問題,其線索是有限的,充分地說明可選擇的方案、選擇決策方案的過程中只需要很少的專業(yè)判斷;半結(jié)構(gòu)化任務(wù)包含有一定的重復(fù)性、可合理定義的問題,配備有限的指南可供使用,可供選擇的方案雖然很多,但可以詳細(xì)地說明,選擇方案需要一定程度的職業(yè)判斷;非結(jié)構(gòu)化任務(wù)是復(fù)雜性程度最大的一類,這類任務(wù)所要解決的是獨特的、未被定義的問題,很少或沒有指南可遵循,擁有無限的或未被定義的決策方案,選擇決策方案需要深刻的判斷力和洞察力。在執(zhí)行分析性程序任務(wù)時,如果原始假設(shè)束包含的假設(shè)數(shù)量極其龐大,而且報表數(shù)據(jù)之間的關(guān)系很復(fù)雜,使得難以得出精簡假設(shè)束時,此時面臨的任務(wù)就是非結(jié)構(gòu)化任務(wù),要圓滿解決它就必須收集更多的信息(如與被審計單位管理當(dāng)局進(jìn)行溝通),進(jìn)行更多的信息反饋,以進(jìn)一步確定異常波動原因。如果分析性程序所面臨的情況比較簡單時,也就是審計師可以很確定地依據(jù)所掌握的財務(wù)與非財務(wù)信息迅速判斷造成異常波動的所有可能原因,并采用相關(guān)技術(shù)確定最有可能的原因時,這種情況下,審計師所面臨的這類任務(wù)就叫做結(jié)構(gòu)化任務(wù)。在解決相關(guān)任務(wù)時,針對不同復(fù)雜程度的任務(wù),審計師都可以借助不同類型的決策輔助系統(tǒng)來提升尋找異常波動原因的效率。

第3篇:統(tǒng)計學(xué)決策規(guī)則范文

【關(guān)鍵詞】數(shù)據(jù)挖掘  ;決策樹算法  ;員工離職

一、數(shù)據(jù)挖掘理論及其常用技術(shù)

數(shù)據(jù)挖掘是一種有效地利用信息的工具,它主要是基于數(shù)據(jù)庫理論、機器學(xué)習(xí)、統(tǒng)計學(xué)、人工智能、可視化和并行計算等技術(shù)的理論基礎(chǔ),對各種原有數(shù)據(jù)進(jìn)行組織、分析、歸納、整理,從中挖掘潛在的規(guī)則、模式,預(yù)測客戶的行為,幫助組織者和決策者正確判斷即將出現(xiàn)的機會,抓住機遇,調(diào)整策略,減少風(fēng)險,進(jìn)行正確的決策。

數(shù)據(jù)挖掘最常用的技術(shù)手段是決策樹,決策樹是對數(shù)據(jù)進(jìn)行分類,以此達(dá)到預(yù)測的目的,該決策樹方法先根據(jù)訓(xùn)練集數(shù)據(jù)形成決策樹,如果該樹不能對所有對象給出正確的分類,那么選擇一些例外加入到訓(xùn)練集數(shù)據(jù)中,重復(fù)該過程一直到形成正確的決策集。決策樹代表著決策集的樹形結(jié)構(gòu)。決策樹由決策結(jié)點、分支和葉子組成。決策樹中最上面的結(jié)點為根結(jié)點,每個分支是一個新的決策結(jié)點,或者是樹的葉子。每個決策結(jié)點代表一個問題或決策,通常對應(yīng)于待分類對象的屬性。每一個葉子結(jié)點代表一種可能的分類結(jié)果。沿決策樹從上到下遍歷的過程中,在每個結(jié)點都會遇到一個測試,對每個結(jié)點上問題的不同的測試輸出導(dǎo)致不同的分支,最后會到達(dá)一個葉子結(jié)點,這個過程就是利用決策樹進(jìn)行分類的過程,利用若干個變量來判斷所屬的類別。

決策樹算法主要是用來學(xué)習(xí)以離散型變量作為屬性類型的學(xué)習(xí)方法,連續(xù)型變量必須被離散化才能被學(xué)習(xí)。

ID3算法決策樹中最常見的分類算法,該算法是以信息論為基礎(chǔ),ID3算法中最主要的部分就是信息熵和信息增益的計算,以信息熵和信息增益度為衡量標(biāo)準(zhǔn),從而實現(xiàn)對數(shù)據(jù)的歸納分類。

信息熵的計算公式為: , ,其中P(ui)為ui在樣本S中出現(xiàn)的概率。

信息增益的計算公式為:  ;  ;  ;  ;  ;  ;  ;  ;  ;  ; ,其中A是樣本的屬性,Value(A)是屬性A所有取值的集合,v是A得其中一個屬性值。Sv是S中A的值為v的樣例集合,|Sv|為Sv中所含樣例數(shù)。

ID3算法大概的流程就是在屬性集A中尋找信息增益值最大的屬性,作為根節(jié)點,按照根節(jié)點屬性的取值將樣本集合分成幾個子集,將此屬性從屬性集中去掉,在每個子集中選擇信息增益值最大的屬性,作為當(dāng)前子集的根節(jié)點,上層集合的根節(jié)點的子節(jié)點,如此循環(huán)遞歸,如果得到的子集中所有的樣本屬于一個類別,則遞歸停止。

二、決策樹算法在員工離職中的應(yīng)用

(一)數(shù)據(jù)獲取與歸納

從數(shù)據(jù)源中得到的歷史數(shù)據(jù)存在著量大、屬性繁多、定義復(fù)雜、不完整等特性。通過采用面向?qū)傩缘臍w納法進(jìn)行數(shù)據(jù)歸納,對基礎(chǔ)數(shù)據(jù)表中數(shù)據(jù)的各屬性進(jìn)行分析和泛化,找出與決策規(guī)則由關(guān)聯(lián)的屬性,構(gòu)造出分類樣本模型。該模型是一個有效的、通過壓縮或泛化了的數(shù)據(jù)集合,此數(shù)據(jù)集合只與屬性值有關(guān)系,而與原始的數(shù)據(jù)量無關(guān),為更有效的產(chǎn)生決策樹提供了極大的方便。

決策樹算法不能處理連續(xù)型屬性,必須將其進(jìn)行離散化處理,如屬性年齡,按照以往區(qū)分年齡的方法,將連續(xù)性數(shù)據(jù)劃分為三個區(qū)間,即35歲以下、36至45歲、45歲以上。

歸納后的數(shù)據(jù)表

(二)構(gòu)建分類模型

根據(jù)歸納后的數(shù)據(jù)表作為模型創(chuàng)建輸入訓(xùn)練集,該訓(xùn)練集描述員工的屬性有四個:職稱、性別、學(xué)歷、年齡。員工分類分為正例和反例兩類:離職員工(P)和非離職員工(N)。

具體計算過程如下:

1.計算給定樣本的信息熵

初始時刻屬于P類和N類的實例個數(shù)都為122個,根據(jù)決策樹中計算信息熵公式,得到給定樣本的信息熵是:

2.計算每個屬性的信息增益

在這個例子中,第一次分裂存在四種可能,分別計算每個屬性的熵值,與給定的樣本信息熵做比較,確定根節(jié)點。

四種屬性的名稱、類型以及正反例

照同樣算法分別計算選取職稱、性別、學(xué)歷和年齡作為分類屬性,計算信息熵,得出:E(職稱)=0.92884;E(性別)=0.98369;E(學(xué)歷)=0.90961;E(年齡)=0.99606。

3.計算信息增益

Gain(職稱)=1-0.92884=0.07116

Gain(性別)=1-0.98369=0.01631

Gain(學(xué)歷)=1-0.90961=0.09039(最大)

Gain(年齡)=1-0.99606=0.00394

從中可以看出屬性學(xué)歷的信息增益最大,也就是說屬性學(xué)歷提供的信息量最大,對于分類幫助最大,故選其作為根節(jié)點。

4.建立決策樹的根枝和分支

選擇屬性學(xué)歷作為根節(jié)點,并引出三個分枝,此時,將訓(xùn)練實例集分為三個子集,生成包含三個葉結(jié)點的決策樹。

繼續(xù)將葉結(jié)點的數(shù)據(jù)按照學(xué)歷分別分類,選取職稱、性別、年齡作為分裂屬性,計算信息熵和信息增益,確定結(jié)點1、2、3的屬性。

以此類推,繼續(xù)對所產(chǎn)生的所有結(jié)點進(jìn)行分類,直到產(chǎn)生整棵決策樹。

三、研究分析結(jié)論

從構(gòu)建的局部決策樹能夠分析出:(1)數(shù)據(jù)挖掘技術(shù)能夠從系統(tǒng)的數(shù)據(jù)中提取員工的特征信息,并發(fā)現(xiàn)其中的聯(lián)系和模式,從而客觀的反映員工離職的因素,對于此案例研究過程中筆者發(fā)現(xiàn)員工離職分析的四個關(guān)鍵因素中學(xué)歷是最為關(guān)鍵的影響因素,其次是職稱和年齡,性別因素與分類目標(biāo)的關(guān)聯(lián)性比較弱,影響度最小,這與該單位屬科研性質(zhì)有關(guān),專業(yè)技術(shù)職務(wù)通道為主要職業(yè)發(fā)展通道,近年招聘的畢業(yè)生又多為高學(xué)歷,而且與擁有學(xué)位授予權(quán)有關(guān);(2)數(shù)據(jù)挖掘技術(shù)能夠比較客觀的對員工離職進(jìn)行評估,并根據(jù)特征分類,找到了一條最具代表性的數(shù)據(jù)路徑,也最能體現(xiàn)出目前員工流失的分類傾向,具備本科學(xué)歷、高級職稱、介于35到45歲之間的員工離職的風(fēng)險較大,原因是此類員工個人事業(yè)發(fā)展已到一定高度,未來前景不明朗,外界的工作環(huán)境和物質(zhì)條件又相對較高,此類員工波動性較大;(3)數(shù)據(jù)挖掘技術(shù)能夠彌補以往定性分析不足的特性,將定性和定量相結(jié)合,以往對離職的原因都是通過離職員工定性的分析得出結(jié)論,而通過建立的員工離職模型,可以通過數(shù)據(jù)真實的定量反映離職趨勢,而不去了解真實的原因,為今后政策的制訂提供定量數(shù)據(jù)依據(jù);(4)數(shù)據(jù)挖掘技術(shù)能夠幫助人力資源管理者改進(jìn)工作目標(biāo)和方式,通過調(diào)查和座談方式,了解離職風(fēng)險大的員工的真實思想和客觀因素,通過制定政策、采取激勵機制留住人才,建立合理的薪酬結(jié)構(gòu),提供有競爭力的薪酬水平,重視人本管理,給員工的發(fā)展提供更多的機會。

至此,運用決策樹對員工離職這一管理問題所進(jìn)行的挖掘工作已基本完成,利用數(shù)據(jù)庫中的數(shù)據(jù),通過對員工職稱、性別、學(xué)歷、年齡等因素的分析,經(jīng)過數(shù)據(jù)選取、數(shù)據(jù)歸納、數(shù)據(jù)轉(zhuǎn)化等過程,運用決策樹中的ID3算法建立員工分類模型,提出分類規(guī)則,發(fā)現(xiàn)離職員工的主要特性,為今后利用現(xiàn)有模型對在職員工數(shù)據(jù)進(jìn)行分析預(yù)測,挖掘出其中潛在的離職員工,也為今后對此類人員在政策的制訂上提供參考。從以上分析來看,決策樹的結(jié)果客觀的反映了實際情況,這也說明數(shù)據(jù)挖掘技術(shù)是一個強有力的輔助決策工具。

參考文獻(xiàn):

[1]中國就業(yè)培訓(xùn)技術(shù)指導(dǎo)中心.企業(yè)高級人力資源管理師.中國勞動社會保障出版社,2009.

第4篇:統(tǒng)計學(xué)決策規(guī)則范文

關(guān)鍵詞:風(fēng)險度量,正負(fù)偏差,綜合風(fēng)險偏差

一,研究的目的和意義

本文的研究目的在于識別和度量證券投資中的風(fēng)險,按照投資組合理論,通過組合可以分散掉的風(fēng)險被稱作"非系統(tǒng)性風(fēng)險"或者"公司特別風(fēng)險",它源自于各個公司內(nèi)部的特別事項的發(fā)生,比如,訴訟,罷工,營銷策略的成功或失敗,合同簽署及履行情況.由于公司各自的情況不同,導(dǎo)致這種風(fēng)險在各個公司之間的差距較大.進(jìn)行投資組合的一個基本思路就是通過證券組合使一種股票報酬率的不好的變化被另一種股票報酬率好的變化抵消掉,從而將這種風(fēng)險最大程度地分散掉.當(dāng)然,仍存在一部分組合難以消除的風(fēng)險,被稱作"系統(tǒng)性風(fēng)險"或"市場風(fēng)險".這種風(fēng)險通常源自公司外部的一些宏觀經(jīng)濟或非經(jīng)濟事項,比如戰(zhàn)爭,通貨膨脹,經(jīng)濟衰退,利率的波動.這些事項的發(fā)生會對所有的企業(yè)的經(jīng)營狀況產(chǎn)生影響,因而無法通過投資組合予以分散.本文主要討論前一種風(fēng)險,分析它對于投資者投資決策的影響.這有助于管理部門進(jìn)行證券投資風(fēng)險管理,提供一個管理的客觀標(biāo)準(zhǔn),有利于規(guī)范證券市場,優(yōu)化資源配置,從而促進(jìn)經(jīng)濟的穩(wěn)定發(fā)展.

二,目前研究的現(xiàn)狀

1,風(fēng)險研究的發(fā)展【13】

自從Markowitz于1952年創(chuàng)立了投資組合以來,風(fēng)險度量和金融資本配置模型的研究一直是金融投資研究的熱點之一,到目前為止,金融投資專家和學(xué)者已提出很多種不同的度量風(fēng)險模型.從各種模型提出的動因看,推動風(fēng)險的度量模型發(fā)展的主要因素有:(1)對風(fēng)險含義認(rèn)識的深化.Markowitz將風(fēng)險視為投資收益的不確定性.方差因可以很好衡量這種不確定性的程度而成為風(fēng)險的度量方法.隨著對投資者風(fēng)險感受心理的研究,人們認(rèn)識到風(fēng)險來源于投資項目損失的可能性,因此,出現(xiàn)了半方差等變化了的風(fēng)險度量模型.(2)風(fēng)險心理學(xué)的研究成果.由于每個投資者的風(fēng)險偏好和風(fēng)險承受能力不同,金融界,投資界和理論研究者對此做了大量的研究,希望能找到更符合現(xiàn)實狀況的風(fēng)險度量方法和能更高效獲取投資回報的資產(chǎn)配置模型.因此,在風(fēng)險度量模型中,引進(jìn)了反映投資者風(fēng)險偏好和風(fēng)險承受能力的風(fēng)險基準(zhǔn)點,由此形成另一類風(fēng)險度量模型.如ExpectedRegret方法等.(3)數(shù)學(xué)處理簡化的需要.在對各種風(fēng)險度量模型進(jìn)行理論分析時,經(jīng)常要用數(shù)學(xué)方法對其進(jìn)行處理,為了便于應(yīng)用數(shù)學(xué)方法,在不影響模型的特征的前提下,盡可能采用一些數(shù)學(xué)上較容易處理的模型.如方差與標(biāo)準(zhǔn)離差,其特征基本類似,但方差的數(shù)學(xué)處理要比標(biāo)準(zhǔn)離差容易,因此在理論上和實際應(yīng)用中,方差比標(biāo)準(zhǔn)差普遍.最近提出的CVaR風(fēng)險度量方法,也是在VaR方法遇到數(shù)學(xué)處理困難時提出的.(4)風(fēng)險管理實踐上的需要.風(fēng)險度量模型要能夠應(yīng)用于投資實踐,其度量結(jié)果必須有很好的經(jīng)濟解釋,以前的很多風(fēng)險度量方法.如方差,半方差,標(biāo)準(zhǔn)離差之所以未能得到現(xiàn)實投資者的廣泛接受,很大原因在于它們不能給投資者提供一個可理解的風(fēng)險評價值.90年代以來出現(xiàn)的VaR盡管在理論界受到廣泛的批評,但仍然得到監(jiān)管部門和現(xiàn)實投資者的廣泛接受,其原因在于它提供一種易于理解的描述風(fēng)險的普通語言.

2,風(fēng)險的定義

關(guān)于風(fēng)險概念,學(xué)者們下過許多定義.可歸納為以下七種【11】:

將事件本身存在不確定性視為風(fēng)險;

將未來結(jié)果的變動可能性視為風(fēng)險;

將各種可能出現(xiàn)的結(jié)果中的不利結(jié)果視為風(fēng)險;

將不利結(jié)果出現(xiàn)的可能性及不利程度視為風(fēng)險;

將各種可能結(jié)果之間的差異本身視為風(fēng)險;

以客觀實際結(jié)果為參照對象,將主觀預(yù)期結(jié)果與客觀實際結(jié)果的距離視為風(fēng)險;

以主觀預(yù)期結(jié)果為參照對象,將未來結(jié)果與主觀預(yù)期結(jié)果的差距視為風(fēng)險.

概念①和②主要關(guān)注事件結(jié)果的不確定性;概念③則關(guān)注與預(yù)期不一致的不利結(jié)果;概念④進(jìn)一步強調(diào)不利結(jié)果發(fā)生的程度;概念⑤,⑥,⑦是一類,主要關(guān)注結(jié)果與某種參照標(biāo)準(zhǔn)之間的差距.由于出發(fā)點和認(rèn)識上的不同,上述定義并沒有準(zhǔn)確界定風(fēng)險的一般性.因此,保險業(yè)說的是可能導(dǎo)致財產(chǎn)損失的風(fēng)險,金融管理界說的則是可能導(dǎo)致金融體系動蕩甚至崩潰的風(fēng)險,證券投資者說的又是投機交易可能出現(xiàn)巨額虧損的風(fēng)險,風(fēng)險投資者說的卻是可能因投資失敗導(dǎo)致血本無歸的風(fēng)險.還有諸如技術(shù)風(fēng)險,市場風(fēng)險,管理風(fēng)險,財務(wù)風(fēng)險,政策風(fēng)險等等.用的雖是同一個詞匯,但敘述的內(nèi)容則有差異,對風(fēng)險概念和定義的描述不盡相同.因此,本文的研究對象主要集中在③,④兩種概念范疇,以縮小范圍,集中注意力研究這個問題.

3,風(fēng)險的量化

目前,常見的風(fēng)險度量指標(biāo)可分為三類.

第一類:用風(fēng)險分布的數(shù)字特征來構(gòu)造風(fēng)險度量指標(biāo),而不直接涉及行為主體對風(fēng)險的偏好特性程度.典型的有:

(1)方差風(fēng)險度量及其引申

馬克維茲(Markowitz)在投資組合理論中以投資收益率r的均值(mean)E(r)度量投資組合的收益,以投資收益率r的方差(variance)σ2(r)度量投資組合的風(fēng)險.這被稱為均值-方差決策規(guī)則.

方差是用來衡量一個隨機變量波動大小的指標(biāo),當(dāng)隨機變量的波動呈對稱性分布時,收益波動越大的隨機變量,其潛在的損失也就越大.因此,當(dāng)隨機變量的分布為對稱型時,用方差來表示風(fēng)險是恰當(dāng)?shù)?由于Markowitz在1952年進(jìn)行投資組合分析時,假設(shè)投資組合的各項資產(chǎn)的收益率的聯(lián)合分布為正態(tài)分布.因此,它的分析方法是恰當(dāng)?shù)?標(biāo)準(zhǔn)離差(standardderivation)與方差的特征一樣,只是標(biāo)準(zhǔn)離差在數(shù)學(xué)分析時較容易處理,因此傳統(tǒng)上,度量隨機變量的波動性一般采用方差而不采用標(biāo)準(zhǔn)離差.不過,方差雖然在分析其性質(zhì)時容易數(shù)學(xué)處理,但利用它進(jìn)行投資組合優(yōu)化時,存在計算上的困難,因為必須求解二次規(guī)劃問題,Konno和Yamazaki(1991),胡日東(2000)提出,利用標(biāo)準(zhǔn)離差作為風(fēng)險度量指標(biāo),可以簡化投資組合優(yōu)化的運算.因為只需求解線性規(guī)劃問題即可.

舉個例子,設(shè)有兩個投資方案,其收益率分別為隨機變量X和Y,數(shù)學(xué)期望分別是x和y,標(biāo)準(zhǔn)差分別為σX和σY,則在均值-方差決策規(guī)則中,所謂X優(yōu)于Y,是指其滿足如下兩個準(zhǔn)則:

準(zhǔn)則1:x≥y,σX≤σY

準(zhǔn)則2:

其中:rf為市場上的無風(fēng)險利率.

雖然方差度量具有良好的特性,但是自從Markowitz提出方差作為風(fēng)險度量指標(biāo)后,還是受到眾多的批評和質(zhì)疑.其焦點在于投資收益率的正態(tài)分布特性,它對收益率波動的好壞不分(將高于均值的收益率也視為風(fēng)險).法瑪,依波持森和辛科費爾德等人對美國證券市場投資收益率分布狀況的研究和布科斯特伯,克拉克對含期權(quán)投資組合的收益率分布的研究等,基本否定了投資收益的正態(tài)分布假設(shè).半方差(semivariance),半標(biāo)準(zhǔn)離差(standardsemiderivation)---半方差的平方根,正是在這種背景下提出來的,哈洛提出半方差的概念用來度量風(fēng)險,即只關(guān)注損失邊的風(fēng)險值(DownsideRisk).用于解決收益率分布不對稱時的風(fēng)險度量問題,但從模型包含的變量看,這兩種方法并不"純凈",因為模型中含有投資收益的均值,風(fēng)險量值的大小不僅取決于各種損失及其可能性等不利情景,而且還與投資收益的有利情景有關(guān).而人們廣泛所接受的仍然是以方差作為風(fēng)險的度量.均值-方差決策規(guī)則也在投資決策中得到了廣泛的應(yīng)用.

(2)含基準(zhǔn)點的風(fēng)險度量

從風(fēng)險的原始語意出發(fā),風(fēng)險應(yīng)該反映投資資產(chǎn)出現(xiàn)不利變化的各種可能性,從投資收益率角度看,風(fēng)險應(yīng)該反映投資收益率在某一收益水平下的各種可能性高低,從投資組合價值變化角度看,風(fēng)險應(yīng)反映投資組合價值損失超過某一基準(zhǔn)點的可能性大小.因此,對投資者而言,關(guān)注風(fēng)險,就是關(guān)注其投資收益率或其投資價值出現(xiàn)在某一基準(zhǔn)點以下的分布狀況.基準(zhǔn)下方風(fēng)險度量(downsideriskmeasure)被認(rèn)為是對傳統(tǒng)證券組合理論的一個主要改進(jìn).但是由于各投資者的風(fēng)險偏好和風(fēng)險承受能力不同,所以每個投資者都有和他對世界認(rèn)知相容的與眾不同的基準(zhǔn)點.包含基準(zhǔn)點的風(fēng)險度量模型很多,最普遍的和經(jīng)常使用的基準(zhǔn)下方風(fēng)險度量是半方差(特殊情況)和LPM―――LowerPartialMoment(一般情況).其中半方差是一個更合理的風(fēng)險度量標(biāo)準(zhǔn)(連Markowitz自己都承認(rèn)這一點).無論從理論上,經(jīng)驗上,還是實踐上,半方差都是和期望效用最大化(ExpectedUtilityMaximization)幾乎完全一致的【4】【5】.它的一個改進(jìn)―――半標(biāo)準(zhǔn)離差性質(zhì)也很好,與基于偏好風(fēng)險厭惡的一個公理化模型―――二階隨機占優(yōu)(SeconddegreeStochasticDominance---SSD)也幾乎是一致的【1】.但是哈洛(Harlow)的LPM模型更為成熟.哈洛在投資組合理論中引入風(fēng)險基準(zhǔn)(riskbenchmark)———投資收益率r的某個目標(biāo)值T(targetrate),用LPM(lowerpartialmoments)度量投資組合的風(fēng)險:

這里r為投資組合的收益率,F()為收益率r的分布函數(shù),v為基準(zhǔn)收益率.當(dāng)n=0時,LPM0=P{r0,稱Ri為綜合風(fēng)險偏差.那么上述的風(fēng)險組合偏差只不過是綜合風(fēng)險偏差在θ=1的特例罷了.我認(rèn)為,由于風(fēng)險是不對稱的,所以θ≠1.具體的結(jié)果,應(yīng)該通過實證分析得到.

綜合風(fēng)險偏差Ri將正偏差與負(fù)偏差有機地結(jié)合起來,反映了兩種不同性質(zhì)的偏差對投資決策的影響.Ri越大,說明投資項目越具風(fēng)險性;若Ri小于0,則非常具有投資價值.綜合風(fēng)險偏差都可以用來比較一系列投資項目的優(yōu)劣.特別是當(dāng)投資者比較注重投資的風(fēng)險性的時候.

四,實證分析

應(yīng)用上面介紹的理論模型度量金融資產(chǎn)或其組合面臨的風(fēng)險,前提條件是金融資產(chǎn)或其組合的價值變化或收益率分布必須是確定的,這在實際中往往是不可能的.在實踐中有兩種情況:一種是根據(jù)理論推導(dǎo)可以確定金融資產(chǎn)的價值或收益率變化的分布類型,只是分布參數(shù)未知.在這種情況下,可以利用統(tǒng)計學(xué)的參數(shù)估計方法(如點估計或極大似然估計法)來估計模型的分布參數(shù),然后將估計的參數(shù)代入上述理論模型就可以測算風(fēng)險量值.另一種情況是連金融資產(chǎn)的價值或收益率的分布類型也無法確定,在這種情況下,只能根據(jù)歷史數(shù)據(jù)或情景模擬數(shù)據(jù)來刻畫它們的經(jīng)驗分布,再根據(jù)經(jīng)驗分布測算其風(fēng)險量值.實踐中往往以后一種情況居多,因此在風(fēng)險管理或控制中,歷史資料的積累和相應(yīng)數(shù)據(jù)庫的建立是相當(dāng)重要的.

因此,我取的數(shù)據(jù)為,上證股票從中按同分布隨機抽樣抽出5只股票歷史數(shù)據(jù),取每周周末的收盤價,時間范圍為2001年1月5日-2003年4月30日經(jīng)過作一些調(diào)整共形成115周的數(shù)據(jù);同時在深證股票中進(jìn)行同樣的操作.分別計算它們的綜合風(fēng)險偏差,根據(jù)收益越大,風(fēng)險越大的原則(即無套利原則,否則存在套利機會.),估算它們的θ值.同時,可以按原來的各種方法,模擬它們的分布,計算風(fēng)險.最后用這些數(shù)據(jù)來比較各個風(fēng)險度量標(biāo)準(zhǔn)的優(yōu)劣.具體的數(shù)據(jù)表如下:

表一:上海證券交易所的股票

股票名稱

浦發(fā)銀行

啤酒花

九發(fā)股份

昆明制藥

龍頭股份

代號

1

2

3

4

5

20010105

14.41

28.96

12.24

17.85

19.55

14.33

28.20

13.15

17.45

19.01

13.99

27.30

12.75

16.85

18.60

13.19

25.02

11.56

15.58

17.45

11.98

24.60

11.40

15.30

17.92

11.68

24.37

11.40

15.65

17.49

20010302

11.64

25.35

11.84

15.79

17.60

12.12

24.98

11.85

16.00

18.35

12.04

26.78

12.08

15.84

17.67

12.74

27.00

11.52

15.96

17.79

13.06

27.01

12.04

16.87

18.30

12.65

27.96

12.00

16.50

18.29

12.60

27.93

12.01

17.25

18.45

12.98

28.10

11.71

16.75

18.20

12.57

28.12

11.49

16.35

18.20

12.52

28.28

11.40

16.38

18.23

20010511

13.15

28.12

11.68

16.41

18.24

12.99

29.87

11.58

16.50

18.12

13.08

31.02

11.83

16.97

18.54

13.20

31.12

12.04

16.84

18.63

13.10

30.10

11.99

18.00

19.08

12.95

30.58

11.90

18.16

19.77

12.70

31.02

11.74

18.49

20.38

13.18

31.92

11.86

18.88

21.05

20010706

13.69

30.80

11.71

18.70

20.30

13.70

31.12

11.65

18.70

22.08

13.93

31.42

11.75

18.15

22.38

13.65

28.73

11.02

17.78

21.39

13.06

27.57

10.25

17.30

20.79

13.21

28.42

10.29

17.38

21.28

12.84

27.88

9.89

17.25

20.87

12.33

27.67

9.80

16.85

19.88

11.63

27.20

9.11

16.68

19.28

20010907

11.36

27.40

8.97

16.52

19.15

11.96

27.33

9.13

16.84

21.13

11.60

27.47

8.94

16.97

20.56

11.25

26.77

8.84

16.82

19.88

10.46

24.07

8.64

15.00

19.78

9.55

22.50

8.03

13.19

18.52

10.34

23.78

9.76

15.45

20.35

20011102

11.38

24.02

9.71

14.89

21.22

10.77

22.92

9.35

15.18

21.00

10.10

22.74

9.25

14.28

21.10

10.71

24.38

9.60

14.75

20.99

10.80

24.03

9.89

14.82

21.73

11.09

24.45

9.66

15.32

20.99

10.39

23.88

9.10

14.61

21.44

9.95

24.72

8.95

14.11

20.78

9.90

25.21

8.92

13.91

20.62

20020104

9.76

24.57

8.79

13.89

20.63

9.09

23.63

8.03

11.70

19.40

7.95

21.13

8.57

11.60

17.92

8.17

21.92

8.75

12.65

17.71

8.41

22.72

8.24

12.36

18.17

8.87

22.22

8.46

12.19

17.40

20020301

8.81

22.34

8.29

11.80

17.75

9.77

23.72

9.30

13.58

18.97

9.55

23.13

8.78

13.52

19.99

9.85

23.65

8.98

14.09

19.73

10.09

21.95

8.56

13.66

19.51

9.20

22.33

8.58

14.22

19.68

9.58

22.12

8.83

13.93

19.26

9.22

21.34

8.73

13.55

18.68

9.32

21.70

8.72

13.71

18.72

9.43

21.89

8.89

13.92

20.46

20020510

9.16

21.12

8.67

13.76

20.90

8.69

20.69

9.41

13.04

20.94

8.45

19.94

9.77

12.89

20.09

8.23

18.99

9.54

12.77

19.28

8.33

19.39

9.71

13.27

19.72

8.00

18.74

9.48

12.99

19.18

8.56

20.45

10.22

13.50

19.70

9.75

20.91

11.03

15.52

20.11

20020705

9.77

20.57

10.92

15.41

19.56

9.40

20.54

10.51

14.97

19.54

9.39

20.84

10.49

15.00

19.72

9.10

19.74

10.03

15.10

18.95

9.12

19.76

10.10

15.37

18.07

8.99

19.50

9.75

15.30

17.81

8.96

19.95

9.78

15.41

17.35

9.24

20.45

9.88

15.69

17.74

9.19

20.66

9.60

15.85

17.52

20020906

8.88

20.14

9.17

15.50

16.57

8.62

20.38

9.24

15.25

15.96

8.54

19.98

9.42

14.93

15.97

8.54

19.98

9.16

15.35

15.18

8.12

18.62

9.25

14.55

14.33

8.14

18.37

9.43

14.25

13.72

8.10

18.44

9.61

14.22

13.66

20021101

7.92

18.08

9.60

14.40

13.66

7.91

18.26

9.63

14.73

13.40

7.62

16.82

8.43

14.25

13.13

7.19

15.85

8.02

13.85

12.13

7.30

16.39

8.31

14.21

12.68

7.13

15.64

7.93

14.03

12.20

7.09

15.72

7.86

13.98

12.08

7.22

16.24

8.09

14.06

12.92

6.92

15.85

7.72

14.06

12.25

20030102

6.45

15.25

7.37

12.84

11.84

6.77

15.54

7.61

13.41

12.55

7.14

16.33

8.44

14.61

13.40

7.04

16.55

8.07

14.78

14.09

7.17

16.54

8.11

14.78

14.22

7.30

16.40

8.14

14.63

14.20

7.15

16.13

8.13

14.28

13.94

7.30

16.80

8.18

14.37

13.79

20020307

7.14

16.35

7.92

14.36

13.45

6.83

15.97

7.70

13.97

13.10

6.81

16.14

7.89

14.16

12.96

6.94

15.73

7.92

14.27

13.01

6.90

16.42

8.05

14.37

13.12

7.03

16.58

8.10

14.94

12.89

6.98

17.27

8.02

15.59

13.69

6.55

16.29

7.55

13.40

13.30

6.33

17.75

7.31

13.72

12.98

均值

9.92

22.57

9.65

15.08

17.73

收益

-0.31

-0.22

-0.21

-0.16

-0.09

正偏差ui

0.24

0.19

0.15

0.10

0.11

負(fù)偏差di

0.17

0.17

0.11

0.08

0.19

方差

5.24

22.29

2.12

2.64

8.73

沒有參數(shù)的

-0.07

-0.02

-0.04

-0.02

0.09

加入?yún)?shù)的

-0.17

-0.13

-0.11

-0.07

-0.03

風(fēng)險組合偏差

0.72

0.89

0.72

0.83

1.80

表二:深圳證券交易所的股票

股票名稱

絲綢股份

江鈴汽車

桂林集琦

中成股份

吉林化纖

代號

1

2

3

4

5

20010105

27.80

8.45

22.17

23.28

7.29

24.30

8.34

22.21

23.66

7.89

25.88

8.73

20.90

24.22

7.90

24.36

8.54

20.09

23.00

7.47

25.13

8.42

20.14

22.58

7.68

25.58

8.30

19.97

25.65

7.33

20010302

27.70

8.47

21.60

24.07

7.43

28.58

8.38

21.42

24.05

7.60

28.50

8.32

21.82

24.96

8.16

27.04

8.51

21.10

24.84

8.18

27.86

8.73

22.28

25.36

8.53

29.19

8.67

21.28

25.52

8.94

26.69

8.93

21.50

27.40

8.91

26.82

8.61

21.80

26.37

8.90

25.38

8.45

20.65

25.56

8.45

25.41

8.40

20.73

26.16

8.34

20010511

26.47

8.65

21.08

26.43

8.69

25.83

8.54

22.13

26.76

8.95

25.03

9.00

21.83

23.96

8.55

26.24

8.93

22.98

23.68

8.80

25.57

8.91

23.98

23.77

8.54

24.75

8.82

24.11

23.28

8.73

25.43

9.22

25.15

23.73

9.00

25.43

9.24

24.65

24.21

8.86

20010706

25.34

8.81

24.61

24.14

8.54

26.11

8.86

26.14

23.66

8.44

25.79

8.83

26.54

24.09

8.38

25.74

8.50

23.85

23.56

8.03

24.76

7.89

22.22

23.88

7.36

24.57

7.85

23.87

23.58

7.39

24.19

7.69

23.59

23.35

7.29

23.95

7.49

22.99

23.28

7.48

23.56

6.79

22.13

23.14

7.45

20010907

22.55

6.92

21.21

23.01

7.19

21.97

6.98

20.62

23.14

7.15

21.31

6.76

20.65

23.01

6.98

21.45

6.49

20.39

22.27

6.40

21.36

5.93

18.93

22.02

5.66

20.77

5.70

15.15

21.36

5.87

20.64

6.10

16.73

21.78

6.16

20011102

20.55

6.47

17.06

21.87

6.57

20.43

6.15

15.39

21.74

6.68

20.37

6.15

15.36

21.88

6.80

20.41

6.38

18.36

22.05

7.12

20.98

6.60

19.28

22.28

7.17

20.79

6.66

18.63

22.51

7.05

20.25

6.36

18.23

22.27

6.70

19.18

6.30

16.94

22.23

6.80

18.91

6.08

16.92

23.35

6.44

20020104

18.59

6.02

16.79

23.42

6.37

16.00

5.52

15.11

23.06

5.93

10.94

4.54

12.87

22.63

6.07

10.26

4.32

14.42

22.72

6.43

12.56

4.53

15.03

23.13

6.67

11.89

4.64

15.09

23.12

6.72

20020301

12.34

4.65

15.17

24.10

6.56

14.45

5.55

17.66

24.37

7.08

14.67

5.48

16.83

24.32

6.94

14.63

5.50

18.33

24.81

7.10

14.85

5.24

18.20

24.50

6.75

15.58

5.73

18.08

24.74

6.68

15.17

5.63

18.02

25.16

6.89

14.68

5.52

17.60

24.12

7.74

14.41

5.77

17.48

24.37

8.60

14.65

5.82

18.17

23.64

9.33

20020510

14.47

5.76

17.45

23.89

8.91

13.82

5.61

16.46

23.57

8.39

13.50

5.67

15.87

23.56

8.27

13.19

5.96

15.32

24.32

7.93

13.28

6.19

15.74

25.86

8.31

12.83

5.95

14.99

25.24

8.59

13.98

6.35

16.01

27.03

9.18

14.92

7.02

16.73

27.75

9.44

20020705

15.03

6.94

16.67

28.21

10.04

14.77

6.82

17.66

28.56

9.62

14.81

6.95

18.84

28.32

9.88

14.16

6.87

19.01

27.84

9.36

14.20

6.78

20.01

27.83

9.64

13.89

6.81

20.30

27.54

9.79

14.25

6.79

19.59

28.05

9.58

14.54

6.74

20.01

28.52

9.86

14.56

6.97

19.47

28.50

9.64

20020906

14.04

6.68

19.52

28.12

9.20

13.82

6.52

19.83

27.99

8.80

13.37

6.27

19.88

27.68

8.83

13.23

6.10

19.79

27.83

8.56

12.83

5.76

19.23

27.11

8.19

12.72

5.70

19.22

26.74

8.39

12.65

5.78

19.61

26.69

8.55

20021101

12.63

5.77

19.02

26.34

8.80

12.49

5.65

19.77

26.24

8.31

11.34

5.19

20.03

25.73

8.74

10.62

4.80

19.19

25.24

7.82

11.14

5.15

19.77

26.42

8.15

10.94

4.99

19.82

26.04

8.05

11.19

4.96

19.95

25.64

8.11

11.62

5.12

19.79

26.02

8.19

11.01

4.94

18.65

26.12

7.71

20030102

11.12

4.73

17.58

25.20

7.30

11.55

4.98

17.57

25.94

7.62

11.97

5.34

17.03

26.36

8.23

12.09

5.31

15.96

26.16

8.22

12.15

5.34

16.70

26.71

8.29

12.47

5.35

16.32

26.68

8.41

12.16

5.30

16.16

25.96

8.40

12.33

5.57

16.74

25.83

8.96

20020307

12.06

5.30

16.35

25.24

8.93

11.61

5.19

14.79

25.46

9.16

11.55

5.16

14.13

25.35

9.02

11.53

5.21

14.45

25.68

9.30

11.71

5.18

14.37

25.19

9.51

12.04

5.33

14.40

26.55

10.30

11.89

5.46

15.44

26.21

10.15

11.01

5.06

13.85

25.56

10.68

10.83

5.04

12.68

24.35

12.77

均值

17.81

6.57

18.90

24.90

8.12

收益

-0.36

-0.22

-0.15

0.07

0.11

正偏差ui

0.35

0.21

0.12

0.06

0.10

負(fù)偏差di

0.27

0.16

0.14

0.06

0.13

方差

35.43

1.93

9.00

3.41

1.37

沒有參數(shù)的

-0.08

-0.05

0.01

0.00

0.03

加入?yún)?shù)的

-0.17

-0.11

-0.03

-0.02

-0.02

風(fēng)險組合偏差

0.77

0.74

1.09

0.95

1.28

備注:(1)所有的數(shù)據(jù)都不是原始數(shù)據(jù),均經(jīng)過處理,原因很簡單,因為在這兩年間,這些公司都派發(fā)了紅利,主要有送股和直接派送現(xiàn)金兩種方式,也有的公司進(jìn)行了配股,因此股價在派發(fā)紅利時產(chǎn)生劇烈變動,所以我根據(jù)派發(fā)紅利的方式和比例進(jìn)行了還原計算,將所有價格都調(diào)整到2001年未派發(fā)任何紅利的基準(zhǔn)情形.

(2)所有的數(shù)據(jù)都只保留兩位,但是計算并沒有簡化,只有最后結(jié)果才顯示兩位.所有有時會看到0.14-0.12=0.01的情況,這是正常的.

(3)收益是以均值作為最后價格進(jìn)行的計算,因為如果只用最后一周的收盤價,顯然有失偏頗.正負(fù)偏差也是以均值作為期望值的.

(4)由于這兩年中國的利息率非常之低,同時還征收利息稅,所以我忽略了利息的影響,令rf=0.

(5)兩個表格中,所有股票都是按收益從小到大進(jìn)行排序,編號,以便于比較各種風(fēng)險度量方式的優(yōu)劣.

所有的股票都是按收益排序的,根據(jù)無套利原則(收益越大,風(fēng)險也就應(yīng)該相應(yīng)的越大),他們的風(fēng)險也應(yīng)該是由小到大排序的.從表格的數(shù)據(jù)中我們可以明顯的看到,方差是紊亂的,與收益并沒有明顯的線性關(guān)系,所以可以斷定,投資者并沒有使用方差作為他們度量的依據(jù).風(fēng)險組合偏差比方差要好一些,在上海市場上,有一個數(shù)據(jù)沒有按照遞增排列,而在深圳市場上有兩個.說明這種度量風(fēng)險的方法也是不夠好的.再看看沒有參數(shù)的情形(也就是沒有θ,直接用di-ui來作為度量風(fēng)險的標(biāo)準(zhǔn)),在兩個市場上都有一個數(shù)據(jù)沒有按照遞增排列,所以這個情形也不夠好,但是相差也不遠(yuǎn),所以我引入?yún)?shù)θ.下面通過無套利原則(收益越大,風(fēng)險也就應(yīng)該相應(yīng)的越大)來估算θ的值.

由收益越大,風(fēng)險也就應(yīng)該相應(yīng)的越大的原則(無套利原則),那么,用這四個不等式組成的不等式組,分別計算上海和深圳兩個市場上的θ值,可得在上海市場上,0.09<θ<0.67,取中值,所以θ1=0.38;而在深圳市場上,0.57<θ<.75,取中值,所以θ2=0.66.更一般的,令,可得中國市場上,不對稱系數(shù)θ=0.52.

這個結(jié)果令我很迷惑,根據(jù)心理學(xué)和行為經(jīng)濟學(xué)的研究成果【6】,風(fēng)險是不對稱的,負(fù)偏差對人們效用造成的影響應(yīng)該比正偏差大,所以θ應(yīng)該比1大才對,但是現(xiàn)在居然只有一半,和心理學(xué)和行為經(jīng)濟學(xué)的研究成果完全不符.這很奇怪!我分析主要有以下幾個可能的原因:

1.中國的證券市場并不完備,這是大家公認(rèn)的.即使美國也只是弱完備市場.我收集不到美國的數(shù)據(jù),所以沒法進(jìn)行比較分析.可能市場的不完備性影響了數(shù)據(jù)的真實有效性.

2.心理學(xué)和行為經(jīng)濟學(xué)的研究成果可能討論的是普通人,也就是一般人在經(jīng)濟生活中的行為,比方說買菜,買衣服這一類,但是證券市場上全是投資者,可能他們的效用函數(shù)與普通人是不一樣的.特別是在中國市場上,存在相當(dāng)多的投機者,他們都想以小博大,一夜暴富.因此他們往往不在乎負(fù)偏差,而更關(guān)心正偏差有多大.這幾年股票的收益并不好,在上海市場上,全部五只股票收益都是負(fù)數(shù),而深圳市場上也有三只股票收益為負(fù).在這樣的情況下,投資者雖然有所減少,但是仍有相當(dāng)數(shù)量的投資者選擇留在市場中.這充分說明了他們并不關(guān)心負(fù)偏差,而更關(guān)心正偏差有多大,想抓住一個正偏的機會發(fā)一筆財.在這種情形下,θ=0.52<1也就不足為奇了.

3.當(dāng)正偏差超乎尋常的大時,人們就顧不上負(fù)偏差了.這就好像彩票,管理中心已經(jīng)說了,拿出50%作為彩金,也就是任何投資的理性預(yù)期收入應(yīng)該時投入的一半,但是由于有一個微乎其微的概率得到一個超乎尋常的正偏差――五百萬,人們對彩票樂此不疲.這實際上也是一個投資中不理性投機的行為.證券市場上也是如此,前些年,市場很不規(guī)范,有少數(shù)人鉆空子賺了不少錢,這就成了那個超乎尋常的正偏差.人們就紛紛仿效,根本沒有理性分析情況的變化,就忽視了負(fù)偏差.這可能也是θ相當(dāng)小的原因.

五,新的風(fēng)險度量標(biāo)準(zhǔn)在投資決策中的應(yīng)用

用綜合風(fēng)險偏差很容易解決在本文第一部分中所提到的例證.很明顯,基金A和基金B(yǎng)相對于rf的負(fù)偏差均為0,也就是說兩者都不存在絕對風(fēng)險,兩者的正偏差分別為rA=rf+0.5,rB=rf+1,從而兩者具有不同的綜合風(fēng)險偏差-0.5和-1.顯然B的綜合風(fēng)險偏差較小,故投資于基金B(yǎng)比較有利.

對于一般情況而言,顯然投資者應(yīng)該選擇綜合風(fēng)險偏差較小的證券組合.

下面就單一證券投資方案的選擇舉例,對證券投資組合的選擇可類似地討論.設(shè)有A,B,C三種證券,時間周期為半年,預(yù)期收益率及發(fā)生的概率如表1所示(預(yù)期收益率的概率分布可通過對歷史數(shù)據(jù)的觀察而得出,此處僅舉例說明風(fēng)險調(diào)整收益在投資決策中的應(yīng)用,故假設(shè)各種可能的收益率發(fā)生的概率均為1/6)【10】.

表1證券A,B,C半年期預(yù)期收益率(單位:%)

Si\Pj

1/6

1/6

1/6

1/6

1/6

1/6

A

-10

-3

20

6

-5

10

B

-20

-8

6

40

20

-2

C

-5

-2

2

8

4

-4

設(shè)基準(zhǔn)收益率rf=2%,取中國證券市場的不對稱系數(shù)θ=0.52,則計算如表2所示.

表2證券A,B,C半年期預(yù)期收益率的綜合計算指標(biāo)(單位:%)

Si

ri

Vari

di

ui

Rgi

Ri

A

3.00

1.23

8.00

10.00

0.80

-5.84

B

6.00

4.58

12.00

20.00

0.60

-13.76

C

0.50

0.26

5.67

4.00

1.42

-1.05

由上表可以看出:

若考慮平均收益率的大小,應(yīng)選擇證券B進(jìn)行投資;

若考慮用方差表示的風(fēng)險指標(biāo),應(yīng)選擇方差較小的證券C進(jìn)行投資;

若考慮以負(fù)偏差表示的證券的絕對風(fēng)險,就選擇證券C進(jìn)行投資;

若綜合考慮方差和風(fēng)險,則證券A的方差比較小,收益比較大,值得考慮投資;

若考慮風(fēng)險組合偏差,則證券B的風(fēng)險組合方差最小,應(yīng)優(yōu)先考慮投資;

若考慮綜合風(fēng)險偏差,則應(yīng)選擇證券C.證券C的綜合風(fēng)險偏差最小.

事實上,市場上能無風(fēng)險的獲得收益率2%,那么沒有人愿意去投資平均收益只有0.5%的證券C,因為這樣還要承擔(dān)一定的風(fēng)險,雖然有可能使自己的投資收益超過2%.

可以看出,風(fēng)險度量指標(biāo)及投資決策指標(biāo)的選擇對投資決策的結(jié)果有著決定性影響.因此,風(fēng)險度量指標(biāo)與投資決策指標(biāo)的選擇合理與否將直接決定投資行為的成敗.

RiskMeasureandItsInfluencetotheInvestmentDecision

JingFang

(BusinessSchool,WuhanUniversity,Wuhan,430072)

Abstract:Thispaperreviewthehistoricalmethodofriskmeasure,pointouttheirlimitation,supplyawaytorecomposeitandanewindexofriskmeasure---synthesisriskdeviation.AnddemonstrateandanalysewithmorethanonethousanddatainthestockmarketinChina,explaintheusageofitwithexample.

KeyWord:riskmeasure,positiveandnegativedeviation,synthesisriskdeviation

參考文獻(xiàn)

[1]WlodzimierzOgryczakandAndrzejRuszczynski,《FromStochasticDominancetoMean–RiskModels:SemideviationsasRiskMeasures》,InternationalInstituteforAppliedSystemsAnalysis,InterimReport,IR-97-027/June

[2]DavidNNawrocki,《ABriefHistoryofDownsideRiskMeasures》,JournalofInvesting,1999,Fall

[3]ZengjingChenandLarryG.Epstein,《Ambiguity,RiskandAssetReturnsinContinuousTime》,RochesterCenterforEconomicResearch(RCER),workingpaperNo.474,2000,(7)

[4]JavierEstrada,《Mean-SemivarianceBehavior:AnAlternativeBehavioralModel》,CentroInternacionaldeInvestigacionFinanciera(CIIF),ResearchPaperNo.492,2003(2)

[5]JavierEstrada,《Mean-SemivarianceBehavior(Ⅱ):TheD-CAPM》,CIIF,ResearchPaperNo.493,2003(2)

[6]RichmondHarbaugh,《Skillreputation,prospecttheory,andregrettheory》,2002,(3)

[7]EckhardPlaten,《AMinimalFinancialMarketModel》,2000,(9)

[8]ThomasJ.LinsmeierandNeilD.Pearson,《RiskMeasurement:AnIntroductiontoValueatRisk》,1996,(7)

[9]劉春章黃桐城陳漢軍,《風(fēng)險調(diào)整收益及其在投資決策中的應(yīng)用》,決策借鑒,2002,(10),75-77

[10]馬國順,《一種新的風(fēng)險度量指標(biāo)》,西北師范大學(xué)學(xué)報(自然科學(xué)版),1999,(2),19-21

[11]鄒輝文陳德棉,《關(guān)于風(fēng)險的若干問題及其在風(fēng)險投資中的應(yīng)用》,同濟大學(xué)學(xué)報,2002,(9),1145-1151

[12]張宏業(yè),《證券組合風(fēng)險的分析》,中央財經(jīng)大學(xué)學(xué)報,2000,(6),46-48

[13]陳金龍張維,《金融資產(chǎn)的市場風(fēng)險度量模型及其應(yīng)用》,華僑大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2002,(3),29-36

[14]曹永剛王萍類成曜,《現(xiàn)代金融風(fēng)險》,北京:中國金融出版社,2000

[15]韋廷權(quán),《風(fēng)險度量和投資組合構(gòu)造的進(jìn)一步實證》,南開經(jīng)濟研究,2001,(2),3-6

[16]黃威華,《β系數(shù)與證券投資風(fēng)險的度量》,內(nèi)蒙古財經(jīng)學(xué)院學(xué)報,2001,(3),36-38

[17]傅志超,《股票投資風(fēng)險的度量與控制》,經(jīng)濟數(shù)學(xué),1994,(1),60-63

[18]朱世武張堯庭徐小慶,《一種新的股市風(fēng)險度量指標(biāo)及其應(yīng)用》,經(jīng)濟數(shù)學(xué),2002,(6),1-9

[19]戴浩暉陸允生王化群,《單時期下一種新的風(fēng)險度量方法及其應(yīng)用》,華東師范大學(xué)學(xué)報(自然科學(xué)版),2001,(9),33-38

[20]吳開兵曹均華俞自由,《風(fēng)險度量與風(fēng)險控制》,上海經(jīng)濟研究,1999,(4),42-49

[21](意)皮埃特羅.潘澤(美)維普.K.班塞爾,《用VaR度量市場風(fēng)險》,綦相譯,北京:機械工業(yè)出版社,2001