公務(wù)員期刊網(wǎng) 精選范文 詩句分類范文

詩句分類精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的詩句分類主題范文,僅供參考,歡迎閱讀并收藏。

詩句分類

第1篇:詩句分類范文

以下的實(shí)例剖解,數(shù)據(jù)來自一個(gè)典型的中型超市:好佳(化名)。

好佳大約有2500個(gè)單品,分成數(shù)十個(gè)品類,每個(gè)品類下還有小類、單晶。其中飲料是好佳超市的重點(diǎn)品類,我們將以該品類數(shù)據(jù)為依據(jù)進(jìn)行分析舉例。為行文簡潔,省略大部分?jǐn)?shù)據(jù)列表。

飲料小類分析

利用EXCEL表格,將各個(gè)小類的“銷售占比”和“SKU占比”列出來,很容易得到圖1。

分析:

1.好佳超市飲料類銷售的主體是碳酸飲料和果汁,占飲料銷售額的61.95%,SKU數(shù)占飲料全體SKU的57.94%。

2.深入看:在兩大銷售主體中,碳酸飲料的銷售效率較高,SKU數(shù)占全體飲料的18.69%,卻帶來了37.52%的銷售額。相比之下,果汁銷售效率略低,SKU占飲料總SKU的39.25%,只帶來了24.43%的銷售額。

3.水奶(果奶、鈣奶等乳酸飲料)的SKU占比為15.89%,但銷售只占飲料銷售的10.9%,銷售效率略低。但從數(shù)值上看,只有16個(gè)SKU對(duì)于水奶這個(gè)類別不是多了,而是少了。由于水奶的個(gè)性化需求特點(diǎn)明顯,造成顧客可選擇余地少,因此銷售不高。

改進(jìn)建議:

1.進(jìn)一步提高果汁的單品銷售效率,也就是提高單品在單位時(shí)間里的銷售數(shù)量。當(dāng)然這里沒有提供各個(gè)小類的平均毛利率和供應(yīng)商返利數(shù)據(jù),如果某個(gè)小類的平均毛利率和返利水平不高,則可先不考慮銷售效率。

2.對(duì)水奶等乳酸飲料的商品結(jié)構(gòu)進(jìn)行市場調(diào)研(如考察競品店),內(nèi)容包括商品的品種、價(jià)格、包裝大小,找到熱銷的SKU,推動(dòng)這一類別達(dá)到平均銷售水平。

3.運(yùn)動(dòng)飲料毛利比較高,也是比較時(shí)尚的商品類別,只有在促銷上下工夫,才能刺激銷售。

改進(jìn)緊迫度:

ABC分類分析

實(shí)際上,應(yīng)該形成ABC分析的定期檢查制度,但多數(shù)企業(yè)卻疏于實(shí)施。

分析:

1.從圖2可以看出,47.7%的SKU貢獻(xiàn)了飲料總銷售的80.2%(A類商品),73.9%的SKU則貢獻(xiàn)了總銷售的94.8%(A類及B類商品)。

2.而有26.2%的SKU只為超市帶來了5.2%的銷售收入(C類商品)。

3.飲料平均銷售額為119.55,達(dá)到并超過平均銷售額的SKU數(shù)為42,占飲料總SKU的39.25%。

改進(jìn)建議:

1.報(bào)表中沒有單品對(duì)應(yīng)的庫存數(shù)據(jù),建議結(jié)合庫存進(jìn)一步分析,加強(qiáng)對(duì)貢獻(xiàn)了80%銷售的單品的庫存管理,防止缺斷貨。而對(duì)只貢獻(xiàn)了5%銷售額的單品庫存,要進(jìn)行整頓,清理高庫存商品,釋放被占?jí)旱馁Y金。

第2篇:詩句分類范文

關(guān)鍵詞: 半監(jiān)督; 圖模型; 局部聚類; 自適應(yīng); 圖像分類

中圖分類號(hào): TP391.41 文獻(xiàn)標(biāo)志碼: A

0引言

圖像分類是圖像處理的一個(gè)非常重要的研究方向。目前在機(jī)器學(xué)習(xí)[1]領(lǐng)域有很多方法來解決圖像分類問題,半監(jiān)督學(xué)習(xí)(SemiSupervisedLearning,SSL)[2-3]是其中重要的一種。半監(jiān)督學(xué)習(xí)通過標(biāo)簽數(shù)據(jù)和未知標(biāo)簽數(shù)據(jù)結(jié)合學(xué)習(xí),利用大量的未標(biāo)記樣本和少量的標(biāo)記樣本來建立分類器,通過利用未標(biāo)記樣本中隱藏的數(shù)據(jù)信息來提高分類器性能 于圖的半監(jiān)督學(xué)習(xí)是目前半監(jiān)督學(xué)習(xí)領(lǐng)域的一個(gè)主流方向。在當(dāng)今研究領(lǐng)域中,已有很多方法[4-7],并在圖像分類問題上取得了一定的效果。這類方法具有直觀、可解釋性,且分類能力比監(jiān)督的分類方法強(qiáng)。該類算法建立在圖論基礎(chǔ)上[8-13],在圖像分類中,基于圖的半監(jiān)督方法以圖像中的像素點(diǎn)作為節(jié)點(diǎn),像素點(diǎn)之間的空間距離作為邊,將圖像映射為一個(gè)無向加權(quán)圖,通過構(gòu)造圖上目標(biāo)函數(shù)來實(shí)現(xiàn)分類。線性近鄰傳遞(LinearNeighborhoodPropagation,LNP)[5]作為基于圖的半監(jiān)督方法中的一種,計(jì)算復(fù)雜度為O(n3),其中n為樣本個(gè)數(shù)。圖像的大小直接影響計(jì)算復(fù)雜度的高低;同時(shí),近鄰參數(shù)k的選擇是否恰當(dāng)將會(huì)直接影響最終分類結(jié)果。近年來對(duì)LNP算法的改進(jìn)大多都集中圖的構(gòu)造上,如何充分利用近鄰信息來提高分類效果成為大家共同關(guān)注的問題[14-16]。本文則在LNP中引入局部聚類和自適應(yīng)近鄰選取思想來解決以上問題。局部聚類的目的是將相同類別的樣本聚到一起,形成點(diǎn)簇集,從而大大減少建圖時(shí)的頂點(diǎn)數(shù)目,帶來計(jì)算上的優(yōu)勢(shì)。同時(shí),對(duì)于每一個(gè)節(jié)點(diǎn)的近鄰數(shù)目,采用測地距離和歐氏距離之間的關(guān)系來動(dòng)態(tài)確定,達(dá)到提高分類精度的目的。最后通過LNP算法實(shí)現(xiàn)圖像分類。實(shí)驗(yàn)結(jié)果驗(yàn)證了此方法的有效性和可行性,適于解決較大且復(fù)雜的圖像分類問題。

從表1可看出:隨著圖像的增大,LNP分類算法運(yùn)行時(shí)間將大大增加;雖然本文方法也是如此,但相對(duì)LNP來說,能夠大大縮短運(yùn)行時(shí)間,同時(shí)在分類結(jié)果上有更好的表現(xiàn)。從表1中可以發(fā)現(xiàn),本文方法比LNP方法在正確率上均有所提高,horse230、horse252正確率提高比較大,而horse109、horse263的正確率上提高較小。這是因?yàn)樵趆orse230、horse252中目標(biāo)內(nèi)部顏色信息、相似區(qū)域跳躍點(diǎn)較多,在手工標(biāo)記樣本時(shí),并不能完全涵蓋所有顏色信息。LNP分類時(shí),在這些區(qū)域并不能取得很好的效果,而本文方法局部聚類時(shí),得到至多包含一種標(biāo)記點(diǎn)簇的點(diǎn)簇集,并且將其標(biāo)記信息擴(kuò)散到整個(gè)點(diǎn)簇內(nèi),形成建圖的頂點(diǎn)集,這樣能夠去除跳躍點(diǎn),保護(hù)目標(biāo)內(nèi)在結(jié)構(gòu)信息。并且近鄰參數(shù)k的自適應(yīng)選擇,能夠更好地保護(hù)邊緣,因此取得了更好的分類效果。而horse109、horse263圖像簡單,顏色信息較少,且目標(biāo)與背景差異明顯,因此正確率提高較小。使用quickshift局部聚類大大減少了建圖時(shí)的頂點(diǎn)數(shù)目,降低了矩陣規(guī)模,在矩陣相乘求逆等運(yùn)算中用時(shí)更少,提高了運(yùn)算效率;同時(shí),k的自適應(yīng)選擇,能夠很好地保護(hù)圖像內(nèi)在結(jié)構(gòu)和邊緣,去除相鄰相似區(qū)域的一些跳躍點(diǎn),提高了分類正確率。這在圖1中有更為直觀的體現(xiàn)。

圖1表示的是分別運(yùn)用LNP方法及本文方法對(duì)表1中對(duì)應(yīng)的8幅圖像進(jìn)行分類的結(jié)果。從圖1可看出,本文方法在目標(biāo)內(nèi)部區(qū)域基本上可以正確分類,而邊緣、背景與目標(biāo)外觀相似的地方會(huì)有錯(cuò)分,而LNP方法在目標(biāo)內(nèi)部、邊緣以及背景均會(huì)出現(xiàn)明顯的錯(cuò)分。特別地,在目標(biāo)內(nèi)部顏色信息較多、背景與目標(biāo)相似信息較多的情況下,本文方法在邊緣、背景以及目標(biāo)內(nèi)部均有更好的分類結(jié)果。因?yàn)楸疚姆椒ㄔ诰植烤垲悤r(shí),得到的點(diǎn)簇作為建圖時(shí)的頂點(diǎn),這樣能夠去除局部區(qū)域的跳躍點(diǎn),減少局部顏色信息;同時(shí)自適應(yīng)選擇近鄰參數(shù)k,更好地保護(hù)圖像內(nèi)在結(jié)構(gòu)以及邊緣,得到更好的分類結(jié)果。這在圖1中(d)和(f)的對(duì)比中可以清楚地看到。因此,實(shí)驗(yàn)結(jié)果表明,基于局部聚類的自適應(yīng)LNP分類算法在分類正確率和運(yùn)行時(shí)間上,均要明顯優(yōu)于LNP分類算法 于局部聚類的自適應(yīng)LNP分類算法先進(jìn)行局部聚類,形成點(diǎn)簇集,以點(diǎn)簇集為節(jié)點(diǎn)建立圖模型,減小矩陣規(guī)模,大大降低運(yùn)算時(shí)間。同時(shí)采用鄰域信息來重構(gòu)權(quán)值,更好地保護(hù)圖像內(nèi)部結(jié)構(gòu),并且使其自適應(yīng)選擇近鄰數(shù)目;能夠更好地保護(hù)邊緣,達(dá)到提高分類效果的目的。

5結(jié)語

本文提出了一種基于局部聚類的自適應(yīng)LNP圖像分類方法。該方法首先通過局部quickshift算法將圖像進(jìn)行局部聚類,形成點(diǎn)簇集,然后以點(diǎn)簇集為節(jié)點(diǎn)建立圖模型。通過將整個(gè)圖模型裁剪成一個(gè)個(gè)局部線性小區(qū)域,而后將所有的局部線性區(qū)域重組來近似整個(gè)圖模型,鄰域數(shù)目的選擇通過自適應(yīng)算法實(shí)現(xiàn)。實(shí)驗(yàn)結(jié)果表明,與LNP分類算法相比,本文方法降低了計(jì)算復(fù)雜度,并且很好地保留了圖像的內(nèi)在結(jié)構(gòu)信息以及邊緣,使用更少的時(shí)間得到了較好的分類結(jié)果。

參考文獻(xiàn):

[1]ZHOUZH,WANGJ.Machinelearningandapplication[M].Beijing:TsinghuaUniversityPress,2007.(周志華,王玨.機(jī)器學(xué)習(xí)及其應(yīng)用[M].北京:清華大學(xué)出版社,2007.)

[2]CHAPELLEO,SCHOLKOPFB,ZIENA.Semisupervisedlearning[M].Cambridge:TheMITPress,2006:237-273.

[3]ZHUXJ.Semisupervisedlearningliteraturesurvey[EB/OL].[20120805].http://pages.cs.wisc.edu/~jerryzhu/pub/ssl_survey.pdf.

[4]ZHOUD,BOUSQUETO,LALTN,etal.Learningwithlocalandglobalconsistency[C]//Proceedingsofthe2003AdvancesinNeuralInformationProcessingSystems.Cambridge,MA:MITPress,2004:321-328.

[5]WANGF,ZHANGC.Labelpropagationthroughlinearneighborhoods[J].IEEETransactionsonKnowledgeandDataEngineering,2008,20(1):55-67.

[6]BELKINM,NIYOGIP,SINDHWANIV.Manifoldregularization:ageometricframeworkforlearningfromlabeledandunlabeledexamples[J].JournalofMachineLearningResearch,2006,7(11):2399-2434.

[7]ZHUXJ,GHAHARMANIZ,LAFFERTYJ.SemisupervisedlearningusingGaussianfieldsandharmonicfunctions[C]//Proceedingsofthe20thInternationalConferenceonMachineLearning.Madison:AAAIPress,2003:912-919.

[8]YONGL.Manifoldregularizedmultitasklearningforsemisupervisedmultilabelimageclassification[J].IEEETransactionsonImageProcessing,2013,22(2):523-536.

[9]BIJRALAS,RATLIFFN,SREBRON.Semisupervisedlearningwithdensitybaseddistances[EB/OL].[20130101].http:///abs/1202.3702.

[10]GONGYC,CHENCL.Graphbasedsemisupervisedlearningwithmanifoldpreprocessingforimageclassification[C]//SMC2008:Proceedingsofthe2008IEEEInternationalConferenceonSystems,ManandCybernetics.Piscataway,NJ:IEEEPress,2008:391-395.

[11]LIUW,HEJF,CHANGSF.Largegraphconstructionforscalablesemisupervisedlearning[C]//Proceedingsofthe27thInternationalConferenceonMachineLearning.Haifa,Israel:[s.n.],2010:679-686.

[12]ZHUXJ.Semisupervisedlearningwithgraphs[D].Pittsburgh:CarnegieMellonUniversity,LanguageTechnologiesInstitute,SchoolofComputerScience,2005.

[13]GOMEZCHOVAL.Meanmapkernelmethodsforsemisupervisedcloudclassification[J].IEEETransactionsonGeoscienceandRemoteSensing,2010,48(1):207-220.

[14]ZHANHR.Researchongraphbasedsemisupervisedlearning[D].Wuhan:HuazhongUniversityofScienceandTechnology,2009.

[15]WULX.Researchandimplementationoftimeseriesclassificationbasedonsemisupervisedlearning[D].Dalian:DalianUniversityofTechnology,2011.

[16]XUPP.LNPbasedsemisupervisedlearningalgorithms[D].Xian:XidianUniversity,2009.

[17]VEDALDIA,SOATTOS.Quickshiftandkernelmethodsformodeseeking[J].ECCV2008:Proceedingsofthe10thEuropeanConferenceonComputerVision,Marseille,LNCS5305.Berlin:SpringerVerlag,2008:705-718.

[18]COMANICIUD,MEERP,MEMBERS.Meanshift:arobustapproachtowardfeaturespaceanalysis[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2002,24(5):603-619.

[19]HAOJB.Researchongraphbasedsemisupervisedlearningmodelandclassifierdesign[D].Hefei:UniversityofScienceandTechnologyofChina,2009.

[20]TENENBAUMJB,deSILVAV,LANGFORDJC.Aglobalgeometricframeworkfornonlineardimensionalityreduction[J].Science,2000,290(5500):2319-2323.

[21]BELKINM,NIYOGIP.Laplacianeigenmapsandspectraltechniquesforembeddingandclustering[C]//Proceedingsofthe2002AdvancesinNeuralInformationProcessingSystems.Cambridge,MA:MITPress,2001:585-591.

[22]GOLUBGH,vanLOANCF.Matrixcomputations[M].3rded.London:TheJohnsHopkinsUniversityPress,1996.

第3篇:詩句分類范文

關(guān)鍵詞:時(shí)評(píng)論據(jù);日常累積型論據(jù);調(diào)查研究型論據(jù);文獻(xiàn)研究

中圖分類號(hào):G210 文獻(xiàn)標(biāo)識(shí)碼:A 文章編碼:1672-8122(2014)06-0047-03

時(shí)評(píng)論據(jù)的分類,新聞界通常是在本體視域內(nèi)進(jìn)行考察,即按照表述事實(shí)還是表述客觀規(guī)律,把論據(jù)分為事實(shí)性論據(jù)和理論性論據(jù)[1]。這種分類方式幾乎“統(tǒng)治”了所有關(guān)于論據(jù)的研究。這種分類方式界定清晰、科學(xué)合理,有助于研究者和受眾對(duì)論據(jù)的辨析。但是,評(píng)論者在實(shí)踐中往往更需要查尋、選擇論據(jù)而不是辨別論據(jù),因此這種分類方式對(duì)于評(píng)論者的實(shí)務(wù)操作幫助有限。

本文筆者認(rèn)為,時(shí)評(píng)的論據(jù)分類還需要從主體視域出發(fā),即從評(píng)論者獲取論據(jù)的過程和途徑著手。本文按照評(píng)論主體獲取論據(jù)途徑的不同,把論據(jù)分為日常累積型論據(jù)和調(diào)查研究型論據(jù)。日常累積型論據(jù)是指評(píng)論者通過日常學(xué)習(xí)、生活的經(jīng)歷所積累的認(rèn)識(shí)或知識(shí);調(diào)查研究型論據(jù)是指評(píng)論者通過調(diào)查研究所獲得的與論題相關(guān)的事實(shí)和認(rèn)識(shí)。這種分類方式可以促使評(píng)論者重視調(diào)查采訪的作用,并以研究型思維來查找論據(jù),更好地適應(yīng)時(shí)展的需要。

一、日常累積型論據(jù)

日常累積型論據(jù)包括評(píng)論者個(gè)人生活經(jīng)歷、評(píng)論者通過長期的閱讀學(xué)習(xí)所獲得的理論修養(yǎng)和知識(shí)儲(chǔ)備、評(píng)論者關(guān)注新聞時(shí)事所獲得的較新的新聞事實(shí)、評(píng)論者通過廣泛的人脈資源所獲得的重要資料等。

生活積累和個(gè)人經(jīng)歷是人們直接獲得的閱歷和體驗(yàn)。人們碰到的具體事件、所處的情境、與只是聽到的或看到的相比,更加真實(shí)、更富有意義,感受也最深刻。它往往是典型的、獨(dú)特的、生動(dòng)的、專業(yè)的、或有戲劇性效果的,容易吸引人和打動(dòng)人,通常也是真實(shí)的(除非評(píng)論者有意造假),因此是極為珍貴的論據(jù),對(duì)評(píng)論者至關(guān)重要。如現(xiàn)《紐約時(shí)報(bào)》專欄評(píng)論家克里斯托弗,生活閱歷非常豐富:哈佛畢業(yè)后在牛津大學(xué)學(xué)習(xí)法律,獲獎(jiǎng)學(xué)金并以一流成績畢業(yè)。隨后,他在開羅學(xué)過阿拉伯語,在臺(tái)北學(xué)過漢語。在學(xué)生時(shí)代,他就成為背包客,游歷過非洲和亞洲,以寫文章來貼補(bǔ)旅行開支。他曾在四個(gè)大洲居住過,報(bào)道過六個(gè)大洲的新聞;旅行超過150個(gè)國家;到過美國的50個(gè)州、中國的每一個(gè)省、日本的所有重要島嶼。在旅行過程中,他遇到過瘧疾、暴亂,在非洲遇到過空難。這樣豐富的閱歷,對(duì)他的專欄寫作大有幫助。另外,他的妻子為華裔,并且本人多次來到中國調(diào)研,這使他對(duì)中國問題相當(dāng)熟稔,在寫作相關(guān)論題時(shí)駕輕就熟。

學(xué)習(xí)和閱讀也是人們知識(shí)積累的重要方式。許多時(shí)評(píng)作者都有學(xué)者身份或背景,在某些領(lǐng)域中有精深的研究。如著名學(xué)者李敖博聞強(qiáng)記,著作等身。他深厚的學(xué)術(shù)積淀可說是他評(píng)論成功的最大因素。在《李敖有話說》中,他講到一個(gè)觀點(diǎn),就能拿出一本書來,找到出處;對(duì)歷史上的事件案例,如數(shù)家珍,信手拈來,令人嘆為觀止。

日常累積型論據(jù)具有以下特點(diǎn):一是使用方便,可以靈活運(yùn)用。日常累積型論據(jù)多數(shù)已經(jīng)“內(nèi)化”進(jìn)入評(píng)論者的知識(shí)體系,如同一個(gè)隨調(diào)隨取的圖書館。評(píng)論者面對(duì)時(shí)評(píng)論題時(shí),可以在最短的時(shí)間迅捷地把累積型論據(jù)調(diào)動(dòng)出來。這是調(diào)查研究型論據(jù)所無法替代的。二是日常累積型論據(jù)的收集重在日常積累,表現(xiàn)出鮮明的漸進(jìn)性。三是日常累積型論據(jù)依賴評(píng)論者的個(gè)人興趣和關(guān)注點(diǎn)。評(píng)論者因?yàn)樯罱?jīng)歷的不同,其所掌握的各種事實(shí)信息及理論儲(chǔ)備會(huì)有較大差異。評(píng)論者有可能憑借獨(dú)特資源或特殊經(jīng)歷獲得非常有價(jià)值的論據(jù),這些論據(jù)會(huì)增加評(píng)論的知識(shí)含量,甚至成為評(píng)論作品成功的決定性因素。

二、調(diào)查研究型論據(jù)

傳統(tǒng)的評(píng)論研究注重評(píng)論者知識(shí)的積累,強(qiáng)調(diào)日積月累之功,這是非常必要的。但是,時(shí)評(píng)自身的發(fā)展、多領(lǐng)域的滲透以及多元化的論題,決定了評(píng)論者必須擁有“取之不盡,用之不竭”的資料。這個(gè)功夫,不是光憑個(gè)人積累和腦筋的記憶力可以完成的,必須利用科學(xué)的方法,對(duì)論題進(jìn)行調(diào)查研究,更有效率地發(fā)現(xiàn)并尋找到與論題相關(guān)的論據(jù)。

如果把調(diào)查研究型論據(jù)進(jìn)一步細(xì)分,可以分為一手論據(jù)和二手論據(jù)。一手論據(jù)是那些在新聞事件發(fā)生或調(diào)查時(shí)所產(chǎn)生的資料,主要來自評(píng)論者的親身調(diào)查。包括采訪資料、現(xiàn)場照片、影像紀(jì)錄、廣播錄音、證人證詞等。二手論據(jù)是與新聞事件或所論現(xiàn)象相關(guān)的、他人制作的資料,主要來自評(píng)論者的文獻(xiàn)研究。包括關(guān)于某個(gè)新聞事件、人物或社會(huì)現(xiàn)象的書籍、論文、網(wǎng)頁、文件,由他人記述實(shí)際見聞所做的訪問或傳記等。

通過親身來到新聞發(fā)生地進(jìn)行采訪,從而獲得一手論據(jù),這是西方評(píng)論者已經(jīng)習(xí)以為常的做法。如美國學(xué)者芬克所說,這樣做可以為評(píng)論提供“附加值”[2]。仍以《紐約時(shí)報(bào)》專欄評(píng)論家克里斯托弗為例。他不僅生活閱歷豐富,還多次在重大事件中獲得直接采訪機(jī)會(huì)。2011年2月,埃及和巴林發(fā)生動(dòng)蕩。他先是來到新聞事件的中心――埃及開羅的塔拉廣場采訪,撰寫了專欄評(píng)論并發(fā)回了現(xiàn)場照片;隨后,他來到另一個(gè)新聞事件中心巴林進(jìn)行采訪,撰寫了專欄評(píng)論《在巴林,子彈在飛》(In Bahrain, the Bullets Fly)。2011年8月,利比亞局勢(shì)動(dòng)蕩之際,他又來到的黎波里采訪并撰寫了專欄評(píng)論。這些采訪雖然未必能保證其評(píng)論的公正客觀,但至少可以為他的寫作提供豐富的一手資料,同時(shí)向受眾暗示:他在這個(gè)問題上更有發(fā)言權(quán)。

與此相比,國內(nèi)的媒體評(píng)論員鮮有采訪機(jī)會(huì)。多位學(xué)者提出應(yīng)給予評(píng)論員采訪機(jī)會(huì)或建立相應(yīng)機(jī)制保證評(píng)論員獲得一手論據(jù)。如趙振宇教授提出應(yīng)建立新形勢(shì)下的評(píng)論記者工作機(jī)制,即融記者和評(píng)論員于一體,由評(píng)論記者完成對(duì)新聞事實(shí)的采制和評(píng)論的寫作[3]。這一問題已引起國內(nèi)評(píng)論界的關(guān)注并有所行動(dòng)。

對(duì)于國內(nèi)的評(píng)論者來說,即使沒有采訪機(jī)會(huì),進(jìn)行一些調(diào)查也會(huì)為評(píng)論提供一手資料。如2010年8月間,有媒體對(duì)國內(nèi)某旅游景點(diǎn)門票價(jià)格上漲提出批評(píng),提出“埃及金字塔對(duì)本國人只收相當(dāng)于人民幣1.3元的門票”。媒體人高明勇對(duì)此感到懷疑,他通過網(wǎng)絡(luò)搜索、致電旅行社和埃及駐華大使館,查明這個(gè)論據(jù)與事實(shí)不符:埃及本國國民進(jìn)入金字塔景區(qū)的費(fèi)用約合人民幣75元左右[4]。作者的評(píng)論正因?yàn)槭褂昧苏{(diào)查結(jié)果作論據(jù),才使事實(shí)更清楚,受眾也會(huì)更加認(rèn)同。

二手論據(jù)多來自文獻(xiàn)研究。這一研究方式在現(xiàn)代時(shí)評(píng)寫作中越來越重要。如學(xué)者李希光所說,評(píng)論者需要具備“深入文獻(xiàn)研究的能力”。每個(gè)人的知識(shí)結(jié)構(gòu)都有一定的局限性,即使是專業(yè)領(lǐng)域,也并非樣樣精通。評(píng)論者應(yīng)有研究能力,在評(píng)論中綜合運(yùn)用新獲得的知識(shí)[5]。時(shí)評(píng)的論題領(lǐng)域遍及社會(huì)各個(gè)層面,評(píng)論者不可能全部知曉;評(píng)論者再勤奮,對(duì)于一些專業(yè)性較強(qiáng)的領(lǐng)域,也很難有深厚的積累?,F(xiàn)實(shí)的應(yīng)對(duì)之策是:評(píng)論者除了要知識(shí)淵博、博聞強(qiáng)記、勤于積累之外,應(yīng)樹立一種研究思路,廣泛吸收前人智慧,在此基礎(chǔ)上立論和論證。

現(xiàn)代大型媒體,一般都會(huì)擁有一個(gè)規(guī)模宏大的資料室,幫助記者編輯和評(píng)論員查找資料,以協(xié)助完成報(bào)道和評(píng)論任務(wù)。隨著網(wǎng)絡(luò)時(shí)代的來臨,專業(yè)知識(shí)的搜索相對(duì)容易,這為評(píng)論者尋找論據(jù)提供了方便,當(dāng)然也提出了新的挑戰(zhàn)。《科學(xué)》雜志2011年的一項(xiàng)研究表明,互聯(lián)網(wǎng)已經(jīng)成為一種人與外部的交互記憶,信息被存儲(chǔ)在自身之外,人們更多的是記住信息的位置,而不是記住信息本身,被稱之為Google效應(yīng)[6]。換句話說,評(píng)論者本人未必要擁有太多的論據(jù)資料,但是,必須知道到哪里能夠獲得這些資料。

時(shí)評(píng)中的二手論據(jù)具有以下三個(gè)特點(diǎn):一是信息總量豐富。在知識(shí)爆炸的年代,各種信息和數(shù)據(jù)形成信息的海洋,任何專業(yè)領(lǐng)域、相關(guān)話題都隱藏其中,真正可謂“取之不竭,用之不盡”。二是查找不易。這些有效信息分散在圖書館、資料庫和互聯(lián)網(wǎng)的各個(gè)角落,如何迅速有效地把它們找出來,需要評(píng)論者掌握搜索技術(shù),也需要有一定的耐心和毅力。三是二手論據(jù)一般來說屬于公共信息,人人皆可獲取。評(píng)論者使用二手論據(jù)的優(yōu)勢(shì)不在于其獨(dú)特性,而在于對(duì)它們的理解和整合,即評(píng)論者是否可以在短時(shí)間內(nèi)將研究文獻(xiàn)融會(huì)貫通。這對(duì)評(píng)論者的研究能力提出了較高要求。

三、研究論據(jù)的查找

通過文獻(xiàn)研究獲得論據(jù),需要評(píng)論者通過科學(xué)、認(rèn)真的查找來獲得前人關(guān)于所要評(píng)論論題的論述,如書籍、論文、研究報(bào)告、統(tǒng)計(jì)數(shù)據(jù)等,要求評(píng)論者具有一定的研究能力。

(一)研究論據(jù)的資源

在知識(shí)爆炸的網(wǎng)絡(luò)時(shí)代,時(shí)評(píng)作者可以獲得研究論據(jù)的信息資源眾多,主要包括以下幾種:

1.圖書館資源

在可能的情況下,評(píng)論者可以通過《中國圖書資料分類法》在圖書館中找到與論題相關(guān)的書籍。通過網(wǎng)絡(luò),也可以訪問各圖書館的聯(lián)機(jī)公共檢索目錄(Online Public Catalog,簡稱OPAC)。只需登錄圖書館網(wǎng)站,進(jìn)入“聯(lián)機(jī)公共書目查詢”或“館藏書目數(shù)據(jù)庫檢索”即可查詢圖書館藏書。

2.互聯(lián)網(wǎng)資源

在搜索引擎的強(qiáng)大威力下,互聯(lián)網(wǎng)可以快速地為查詢者提供大量的信息。但是有優(yōu)勢(shì)有時(shí)候也是劣勢(shì)。由于互聯(lián)網(wǎng)信息來源龐雜,正式與非正式信息及其交叉渠道共存,信息缺乏有效的組織管理,因此在甄別信息有效性方面給檢索者帶來很大的挑戰(zhàn)。

除了提高網(wǎng)絡(luò)素養(yǎng)和熟練使用搜索引擎之外,評(píng)論者要盡可能熟悉所評(píng)論的領(lǐng)域的網(wǎng)絡(luò)資源。如通過中國政府網(wǎng)頁(http:///govinfo/)鏈接到各政府部門網(wǎng)站,可檢索到大量的有關(guān)信息;通過國家統(tǒng)計(jì)局網(wǎng)站(http://)可以獲取各年、月社會(huì)經(jīng)濟(jì)指標(biāo)等統(tǒng)計(jì)數(shù)據(jù)等;通過新華網(wǎng)等新聞媒體網(wǎng)站可以獲取免費(fèi)新聞信息及各領(lǐng)域動(dòng)態(tài)信息。評(píng)論者還可以通過搜索引擎查找專題信息,如中文的百度、搜狗,英文的Yahoo、Alta、Vista、Deja News,專業(yè)的Google Scholar、Philes、medscape等[8]。

3.專業(yè)學(xué)術(shù)數(shù)據(jù)庫資源

相比互聯(lián)網(wǎng)上資料的良莠不齊,專業(yè)學(xué)術(shù)數(shù)據(jù)庫匯集了許多有價(jià)值的資料,這些資料難以在互聯(lián)網(wǎng)上被檢測到。這些數(shù)據(jù)庫的用戶為了獲得服務(wù)必須支付一定的費(fèi)用?,F(xiàn)在一些教育研究機(jī)構(gòu)可以向社會(huì)提供服務(wù),如中國國家圖書館(http:///)就向社會(huì)公開了大量資源,只要辦理讀者卡(免費(fèi))的用戶,登錄后就可接觸大量中外文數(shù)據(jù)庫并在線閱讀一些學(xué)術(shù)著作、學(xué)位論文和期刊論文。

如中國知網(wǎng)提供了豐富的知識(shí)信息資源,使用最為廣泛。中國知網(wǎng)數(shù)據(jù)庫包括中國期刊全文數(shù)據(jù)庫、中國博士學(xué)位論文全文數(shù)據(jù)庫、中國優(yōu)秀碩士論文全文數(shù)據(jù)庫、中國重要報(bào)紙全文數(shù)據(jù)庫、中國重要會(huì)議論文全文數(shù)據(jù)庫等,可以對(duì)海量數(shù)據(jù)進(jìn)行簡單或高級(jí)檢索。

一些國外數(shù)據(jù)庫也包含著重要的信息資源。較為優(yōu)秀的英文數(shù)據(jù)庫有EBSCO、PROQUEST、SAGE數(shù)據(jù)庫等。EBSCO數(shù)據(jù)庫經(jīng)管類的文獻(xiàn)比較全,多為權(quán)威期刊,且大多能查到全文。PROQUEST系列(尤其是ABI和ARL)是非常好的數(shù)據(jù)庫,特點(diǎn)是比較全面,期刊追溯時(shí)間長,但有時(shí)只有題錄,沒有原文。SAGE數(shù)據(jù)庫涉及商業(yè)、人文科學(xué)、社會(huì)科學(xué)、自然科學(xué)、醫(yī)藥學(xué)等學(xué)科,同時(shí)包括特殊學(xué)科研究的數(shù)據(jù)庫等內(nèi)容。

(二)研究文獻(xiàn)的查找策略

對(duì)于時(shí)評(píng)來說,研究文獻(xiàn)的查找受到其文體寫作特點(diǎn)的限制,有一定的特殊要求,主要包括:1.時(shí)間要求。時(shí)評(píng)受時(shí)效性要求,需要盡快查找到相關(guān)信息,不能如學(xué)術(shù)研究那樣“慢工出細(xì)活”。2.通俗性要求。時(shí)評(píng)屬于大眾性文體,因此不能使用過于專業(yè)化的詞匯,這就要求評(píng)論者盡快“消化”這些文獻(xiàn)資料,使之通俗化,方便受眾接受。3.確定性要求。時(shí)評(píng)要求論點(diǎn)鮮明,以期得到具有確定性的觀點(diǎn)信息。評(píng)論者不需要對(duì)學(xué)術(shù)爭議過分涉及,應(yīng)避免在信息海洋中迷失,使自己的觀點(diǎn)猶疑不定。

結(jié)合時(shí)評(píng)的文體特點(diǎn),評(píng)論者在做文獻(xiàn)研究時(shí)應(yīng)盡量做到以下幾點(diǎn):

一是瞄準(zhǔn)新文獻(xiàn)資源。較新的文獻(xiàn)資源如果是事實(shí)性論據(jù),一般是比較新穎的事實(shí),往往引用者比較少,可以增加論據(jù)的新鮮性;如果是理論性論據(jù),新文獻(xiàn)較多反映理論前沿,理論價(jià)值較高。而且新文獻(xiàn)中新觀點(diǎn)較多,適應(yīng)時(shí)評(píng)“求新”的特點(diǎn)。

二是瞄準(zhǔn)權(quán)威文獻(xiàn)資源。限于時(shí)間要求,評(píng)論者應(yīng)選取比較經(jīng)典和最有權(quán)威性的文獻(xiàn)來進(jìn)行精讀。學(xué)術(shù)研究盡管論著多多,但真正很有價(jià)值的往往是少數(shù)。應(yīng)通過篩選,盡量保留權(quán)威文獻(xiàn),剔除檔次低的文獻(xiàn)。在選擇時(shí)可以有意識(shí)選擇那些較有信譽(yù)的期刊所發(fā)表的文章,或者由該領(lǐng)域的權(quán)威作者所著的文獻(xiàn),也可以咨詢相關(guān)領(lǐng)域?qū)<一驁D書館員。

三是文獻(xiàn)閱讀在精不在多。大批的文獻(xiàn)只需要研讀其摘要及關(guān)鍵詞。經(jīng)過篩選后,選擇少數(shù)文獻(xiàn)閱讀全文。如果有可能的話,找到權(quán)威的綜述性或述評(píng)性文獻(xiàn),可以幫助評(píng)論者更快地了解這個(gè)論題的研究發(fā)展及現(xiàn)狀。

四是評(píng)論者需要從資料中得出自己的見解和觀點(diǎn)。評(píng)論者不能局限于介紹他人觀點(diǎn)和研究成果,還要對(duì)各種論據(jù)進(jìn)行恰當(dāng)而中肯的評(píng)價(jià),并依據(jù)這些論據(jù)做出自己的判斷。時(shí)評(píng)不僅在于“述”,要點(diǎn)在于“評(píng)”,要根據(jù)論據(jù)得出自己的主要觀點(diǎn)、結(jié)論、存在問題、發(fā)展趨勢(shì),并提出自己的意見。

綜上所述,從主體視域出發(fā),時(shí)評(píng)作者在準(zhǔn)備論據(jù)時(shí)應(yīng)做到“一體兩翼”:即既要注重日常生活的深厚積累,也要具備強(qiáng)大的采訪和文獻(xiàn)研究能力。一方面,日常積累可以增加評(píng)論者的知識(shí)底蘊(yùn),為可能的調(diào)查研究提供幫助。評(píng)論者對(duì)議題的了解越多,知識(shí)積累越多,就越能夠得心應(yīng)手地開展采訪和研究;另一方面,通過調(diào)查研究可以增加評(píng)論者的知識(shí)廣度,使評(píng)論者能夠擴(kuò)大評(píng)論面,增加評(píng)論的附加值,開闊知識(shí)視野。評(píng)論者通過采訪和文獻(xiàn)研究所得到的知識(shí),必將進(jìn)一步沉淀為評(píng)論者的日常積累,增加對(duì)議題的理解,為未來的評(píng)論實(shí)踐所用,從而形成良性循環(huán),讓評(píng)論者保持知識(shí)積累上的“開放狀態(tài)”。

參考文獻(xiàn):

[1] 丁法章.當(dāng)代新聞評(píng)論教程[M].上海:復(fù)旦大學(xué)出版社,2012.

[2] (美)康拉德芬克著.柳珊,顧振凱,郝瑞譯.沖擊力―新聞評(píng)論寫作教程[M].北京:新華出版社,2002.

[3] 趙振宇.現(xiàn)代新聞評(píng)論[M].武漢:武漢大學(xué)出版社,2009.

[4] 高明勇.埃及金字塔門票真的才1.3元嗎?[N].新華每日電訊,2010-8-31.

[5] 李希光,孫靜惟,王晶.新聞采訪與寫作教程[M].北京:清華大學(xué)出版社,2011.

第4篇:詩句分類范文

[關(guān)鍵詞]系統(tǒng)聚類Q型因子分析生活質(zhì)量

1引言

居民生活的改善提高不只是體現(xiàn)在物質(zhì)生活上,還需要物質(zhì)、文化等方面的協(xié)調(diào)發(fā)展。廣東省經(jīng)濟(jì)發(fā)展一直走在全國前列,雖然廣東各城市的經(jīng)濟(jì)發(fā)展程度可能有所差異,但各市的生活質(zhì)量情況,不能只從經(jīng)濟(jì)發(fā)展程度進(jìn)行描述。因此,需要依據(jù)廣東省的情況提出有效的城市人口生活質(zhì)量水平的分類評(píng)定方法,一方面,可以給個(gè)人家庭提供生活方式改善的建議;另一方面,能給政府部門制定政策、資金投放提供建議。生活質(zhì)量水平的提高,體現(xiàn)了以人為本的科學(xué)發(fā)展觀思想,有助于推動(dòng)社會(huì)發(fā)展,推進(jìn)實(shí)現(xiàn)全面小康社會(huì)。

針對(duì)城市居民生活質(zhì)量評(píng)價(jià),國內(nèi)很多作者應(yīng)用了成熟的方法。張亮[1]的安徽城市居民生活質(zhì)量評(píng)價(jià)分析中,從經(jīng)濟(jì)、社會(huì)、環(huán)境三方面進(jìn)行指標(biāo)選??;秦嶺[2]的人口生活質(zhì)量水平綜合評(píng)價(jià)中,更具體地從物質(zhì)生活、社會(huì)環(huán)境、生態(tài)環(huán)境、精神生活四部分篩選;孫峰華[3]的中國省會(huì)城市人口生活質(zhì)量評(píng)價(jià)研究中將要素劃分為空間與非空間。上述研究選取的指標(biāo)內(nèi)涵豐富,但是多以經(jīng)濟(jì)、環(huán)境為主。所以,對(duì)于人口生活質(zhì)量評(píng)價(jià),本文選取的指標(biāo)更側(cè)向于居民生活方面以及精神文化方面,同時(shí)在經(jīng)濟(jì)方面融入房地產(chǎn)的潛在影響,考慮房價(jià)對(duì)居民生活質(zhì)量影響。

2指標(biāo)選取及數(shù)據(jù)預(yù)處理

生活質(zhì)量是以生活水平為基礎(chǔ),同時(shí)衡量人的精神文化等高級(jí)需求的滿足程度以及對(duì)環(huán)境狀況的評(píng)價(jià)。因此,本文從經(jīng)濟(jì)基礎(chǔ)、環(huán)境狀況、社會(huì)基建、居民生活進(jìn)行考慮,選取廣東省21個(gè)城市2015年的地區(qū)生產(chǎn)總值()、竣工房屋價(jià)值()、常住居民人均收入()、常住居民人均消費(fèi)支出()、郵電業(yè)務(wù)總量()、城市公共交通車輛標(biāo)準(zhǔn)運(yùn)營數(shù)()、餐飲業(yè)營業(yè)額()、城鄉(xiāng)基本養(yǎng)老保險(xiǎn)基金征繳額()、失業(yè)保險(xiǎn)基金征繳額()、衛(wèi)生技術(shù)人員數(shù)()、人均公園綠地面積()、城鎮(zhèn)生活垃圾無害化處理率()、城鎮(zhèn)污水處理率()、財(cái)政在教育方面的預(yù)算支出()、研究與開發(fā)機(jī)構(gòu)科技經(jīng)費(fèi)支出()旅游業(yè)營業(yè)額()、和人口密度()作為研究指標(biāo),考慮到數(shù)據(jù)的實(shí)效性、可得性及準(zhǔn)確性,本文數(shù)據(jù)均取自2016年《廣東省統(tǒng)計(jì)年鑒》。

由于選取的指標(biāo)原始數(shù)據(jù)單位不一致,為消除量綱影響,需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化預(yù)處理。本文將采用Z-score標(biāo)準(zhǔn)化方法。

3城市生活質(zhì)量等級(jí)分類

聚類分析能科學(xué)有效地反映客觀事物的內(nèi)在差別和聯(lián)系,反映各類事物之間的差異,因此,本文將采用實(shí)踐中被廣泛運(yùn)用的系統(tǒng)聚類方法,對(duì)廣東省21個(gè)城市的居民生活質(zhì)量狀況進(jìn)行劃分。

系統(tǒng)聚類的基本思想是:先將每個(gè)樣品各自看成一類,然后規(guī)定樣品間距離以及各類之間的距離后,選擇當(dāng)中距離最小的一對(duì)合并成新的一類,接著計(jì)算新類與其他類之間的距離,再將距離最近的兩類合并。每次減少一類,直至所有樣品合為一類。

本文采用人們普遍接受的直觀距離描述——?dú)W氏距離,度量樣品間距離;類之間的距離,采用基于方差分析方法的分類效果較好的Wald最小方差法。應(yīng)用SAS軟件進(jìn)行數(shù)據(jù)處理,所得結(jié)果見聚類結(jié)果樹狀圖及聚類歷史結(jié)果(因結(jié)果表格篇幅過長,下表只取前5類。)

根據(jù)聚類結(jié)果,由半偏統(tǒng)計(jì)量,可以發(fā)現(xiàn)n=1及n=2時(shí)統(tǒng)計(jì)量最大,說明這兩步合并效果不合理,應(yīng)采取上一步的分類,因此,合并為2或3類比較合適。由偽F統(tǒng)計(jì)量,在n=3時(shí),統(tǒng)計(jì)量出現(xiàn)了局部增大,因此,分成3類比較合適。

綜上,通過觀察分析,可以認(rèn)為,將21個(gè)城市分為3類比較合適,分別為廣州、深圳;東莞、佛山、惠州、中山、珠海;潮州、揭陽、云浮、河源、茂名、湛江、清遠(yuǎn)、汕尾、陽江、韶關(guān)、肇慶、江門、梅州、汕頭。

4城市生活質(zhì)量差異

為分析廣東省21個(gè)城市的人口生活質(zhì)量差異,本文采用多元統(tǒng)計(jì)中的Q型因子分析方法,多角度剖析城市人口生活質(zhì)量差異的共有原因,針對(duì)問題給出合理的改進(jìn)建議。因子分析是研究從變量群中提取共性因子的統(tǒng)計(jì)技術(shù),它可以從許多變量中,找出隱藏的具有代表性的因子。

根據(jù)計(jì)算結(jié)果,三個(gè)特征值累計(jì)方差貢獻(xiàn)比率達(dá)到90.697%。因此,根據(jù)主成分法,可以選取三個(gè)公共因子。

由于因子載荷矩陣并不是唯一的,為更好確定因子的實(shí)際內(nèi)容,對(duì)因子進(jìn)行適當(dāng)?shù)男D(zhuǎn),使因子載荷矩陣的結(jié)構(gòu)更加清楚,使每一個(gè)變量F盡量只負(fù)荷在一個(gè)因子上。本文采用方差最大正交旋轉(zhuǎn),旨在盡量使得任一個(gè)變量只在一個(gè)因子上有高貢獻(xiàn)率,在其它因子上的載荷幾乎為0,或任一因子只在少數(shù)變量上有高載荷,而在其它變量上的載荷幾乎為0。因子旋轉(zhuǎn)后的特征結(jié)果如上表2,因子載荷矩陣如下表3。

根據(jù)因子載荷矩陣,可以按公共因子將指標(biāo)分為三類。第一類F1包含人口密度、城鄉(xiāng)基本養(yǎng)老保險(xiǎn)基金征繳額、失業(yè)保險(xiǎn)基金征繳額、城市公共交通車輛標(biāo)準(zhǔn)運(yùn)營數(shù)、郵電業(yè)務(wù)總量、地區(qū)生產(chǎn)總值、財(cái)政在教育方面的預(yù)算支出、常住居民人均消費(fèi)支出、常住居民人均收入、餐飲業(yè)營業(yè)額,反映了居民生活的經(jīng)濟(jì)基礎(chǔ)以及基本的社會(huì)生活狀況,相當(dāng)于居民生活質(zhì)量的基礎(chǔ)評(píng)定。

第二類F2包含研究與開發(fā)機(jī)構(gòu)科技經(jīng)費(fèi)支出、旅游業(yè)營業(yè)額、衛(wèi)生技術(shù)人員數(shù)、竣工房屋價(jià)值,這是可以反映居民生活質(zhì)量提高程度的因子。科學(xué)是第一生產(chǎn)力。一個(gè)城市是否有源源不斷的發(fā)展動(dòng)力,很大程度上取決于該市的科技發(fā)展。只有不斷的創(chuàng)新,居民的生活質(zhì)量才能不斷地提升。其次,文化產(chǎn)業(yè)的崛起,也能反映居民生活質(zhì)量的提升。再者,居高不下的房地產(chǎn),實(shí)際上增加了居民的生活負(fù)擔(dān),對(duì)居民生活質(zhì)量的提升起到一定阻礙作用。綜合起來,第二類因子能夠反映城市當(dāng)前居民生活質(zhì)量的提高高度。

第三類F3包含城鎮(zhèn)生活垃圾無害化處理率、城鎮(zhèn)污水處理率、人均公園綠地面積,反映了居民的環(huán)境生活,其中的生活垃圾和污水處理刻畫了居民在生活上產(chǎn)生的污染,即生活成本,越低的損耗,可以從側(cè)面反映生活質(zhì)量的改善提高

根據(jù)所得的公共因子及其因子載荷,根據(jù)回歸分析法,可以計(jì)算各城市在三個(gè)公共因子上的得分,具體計(jì)算方法如下:

為了綜合21個(gè)城市的人口生活質(zhì)量情況,本文采取方差貢獻(xiàn)率占比作為權(quán)重,計(jì)算出它們的綜合得分。下表僅選取每類城市中的一個(gè)代表(結(jié)果保留三位有效數(shù)字)。

5結(jié)果分析

結(jié)合聚類和因子分析的結(jié)果,本文可將廣東省21個(gè)城市分為三個(gè)不同生活質(zhì)量水平類型,依據(jù)他們改進(jìn)方向分為:環(huán)境型、創(chuàng)新型、物質(zhì)型。

廣州、深圳屬于環(huán)境型,它們?cè)贔1、F2上得分較高,說明該類城市注重經(jīng)濟(jì)和社會(huì)發(fā)展,人民生活基礎(chǔ)較高,同時(shí),注意經(jīng)濟(jì)發(fā)展的可持續(xù)性,著力提高城市科技創(chuàng)新能力。然而,在居民生活環(huán)境方面,該類城市得分處在中等水平,這意味著,盡管該類城市人民生活基礎(chǔ)較高,但仍有一定提升空間,在對(duì)生活廢棄物處理方面,仍需改進(jìn)。建議該類城市均衡發(fā)展,找到經(jīng)濟(jì)發(fā)展與環(huán)境保護(hù)的平衡點(diǎn),推進(jìn)環(huán)保措施的落地實(shí)行。

中山等五個(gè)城市屬于創(chuàng)新型,它們?cè)贔3上得分較高,在F1上得分僅次于環(huán)境型城市,說明該類城市人民生活基礎(chǔ)較好,且注重居民生活環(huán)境的保護(hù)。然而,該類城市在F2上得分較低,說明該類城市在科技創(chuàng)新方面的投入不夠,導(dǎo)致其經(jīng)濟(jì)實(shí)力仍與環(huán)境型城市存在差距,需注意經(jīng)濟(jì)發(fā)展模式。建議該類城市加大科技創(chuàng)新、文化發(fā)展產(chǎn)業(yè)的投入,注重發(fā)展的可持續(xù)性。

韶關(guān)等14個(gè)城市屬于物質(zhì)型,這些城市在三個(gè)公共因子上的得分普遍不太理想,它們僅在F2上差強(qiáng)人意,這說明該類城市人民生活基礎(chǔ)、生活質(zhì)量相對(duì)較低,因此該類城市的人民生活質(zhì)量有較大改善空間,但與此同時(shí),該類城市注重科技發(fā)展,相信假以時(shí)日,該類城市的人民生活水平將會(huì)有較大幅度的提升。建議該類城市加快經(jīng)濟(jì)發(fā)展,大力發(fā)展多元經(jīng)濟(jì),激發(fā)經(jīng)濟(jì)發(fā)展活力,同時(shí)堅(jiān)持原有教育、科技發(fā)展。

參考文獻(xiàn): 

[1]張亮,趙雪雁,張勝武,李定,侯彩霞. 安徽城市居民生活質(zhì)量評(píng)價(jià)及其空間格局分析[J]. 經(jīng)濟(jì)地理,2014,(04):84-90. 

[2]秦嶺,宋麗敏. 人口生活質(zhì)量水平綜合評(píng)價(jià)[J].市場與人口分析,2004,(06):37-40. 

[3]孫峰華,魏曉,王興中,邵舉平. 中國省會(huì)城市人口生活質(zhì)量評(píng)價(jià)研究[J].中國人口科學(xué),2005,(01):69-75+98. 

第5篇:詩句分類范文

關(guān)鍵詞:森林分類經(jīng)營;必要性;具體措施

1 林場實(shí)行森林分類經(jīng)營的必要性

1.1 實(shí)行森林分類經(jīng)營可使商品林真正走向市場

我國的林業(yè)是粗放型經(jīng)濟(jì)的代表,在長期的經(jīng)營過程中,林業(yè)的生產(chǎn)周期一般較長,很難在較短的時(shí)期內(nèi)見效,產(chǎn)出投入比例不高,不能保證正常的投資回報(bào)等因素影響,無法吸引到充足的資金投入,導(dǎo)致林業(yè)在低端產(chǎn)業(yè)中循環(huán)。受我國長期計(jì)劃經(jīng)濟(jì)體制的影響,林業(yè)的生產(chǎn)經(jīng)營部門沒有自主的經(jīng)營權(quán)和決策權(quán),在當(dāng)前的市場經(jīng)濟(jì)條件下,林業(yè)的生產(chǎn)經(jīng)營沒有根據(jù)市場的規(guī)律運(yùn)行,無法在市場經(jīng)濟(jì)中進(jìn)行優(yōu)勝劣汰的競爭,導(dǎo)致林業(yè)不能完全的走向市場。

進(jìn)行森林分類經(jīng)營,使林業(yè)的經(jīng)營走向市場,遵循市場的經(jīng)濟(jì)規(guī)律,實(shí)現(xiàn)林業(yè)的進(jìn)一步發(fā)展,實(shí)現(xiàn)林業(yè)的商品化經(jīng)營,林業(yè)部門可以根據(jù)市場的行情和需求來選擇那些經(jīng)濟(jì)效益好的樹種進(jìn)行經(jīng)營,使林業(yè)的經(jīng)營部門取得一定的經(jīng)濟(jì)利潤,在較高的林業(yè)投資回報(bào)的吸引下,也可以吸引社會(huì)生產(chǎn)資源參與到林業(yè)部門的投資,改變林業(yè)部門資金緊張的狀況。林場只有實(shí)行森林的分類經(jīng)營,才能確保商品林經(jīng)營走上一條市場化的發(fā)展道路,林業(yè)部門擁有自主的決策權(quán),林業(yè)的生產(chǎn)和企業(yè)生產(chǎn)行為一樣,經(jīng)濟(jì)效益是企業(yè)經(jīng)營活動(dòng)的重點(diǎn),在利潤的刺激下,林場經(jīng)營者的積極性就會(huì)大大提高,也可以防止在陌生的領(lǐng)域進(jìn)行盲目的投資,給林業(yè)部門帶來較大損失。

1.2 實(shí)行森林分類經(jīng)營可使生態(tài)公益林得到有效的經(jīng)營和保護(hù)

在我國生態(tài)公益林的主要作用是對(duì)環(huán)境和生態(tài)進(jìn)行保護(hù),經(jīng)營者不是直接的受益主體,因此,出現(xiàn)了受益者不經(jīng)營、不投入、而獲益,經(jīng)營者實(shí)行經(jīng)營和投入而不受益的矛盾。以往不實(shí)行森林分類經(jīng)營的時(shí)候,生態(tài)公益林,包括林場的防護(hù)林等,是林場中只有投入沒有產(chǎn)出的對(duì)象,沒有利潤的情況下,導(dǎo)致林場經(jīng)營者的積極性下降,不進(jìn)行人力、物力、財(cái)力的投入來確保林場的經(jīng)營。沒有進(jìn)行森林的分類經(jīng)營,導(dǎo)致林場權(quán)益與責(zé)任之間沒有進(jìn)行明確的劃分,防護(hù)林等生態(tài)公益林由于缺乏有效的經(jīng)營和管理,沒有發(fā)揮實(shí)際的生態(tài)效益。

對(duì)森林進(jìn)行分類經(jīng)營之后,明確林場的投入和產(chǎn)出關(guān)系,經(jīng)營者的責(zé)任權(quán)利關(guān)系,充分發(fā)揮政府在市場經(jīng)濟(jì)中進(jìn)行宏觀調(diào)控的手段和能力,加強(qiáng)對(duì)生態(tài)公益林的經(jīng)營和管理,實(shí)現(xiàn)生態(tài)林的效益,不但有利于提高對(duì)生態(tài)公益林的經(jīng)營和管理水平,而且使生態(tài)林的生態(tài)效益得到最大發(fā)揮。

1.3 森林分類經(jīng)營是有效利用林場林地資源的前提

林場最重要的生產(chǎn)資源是林地,林場為了實(shí)現(xiàn)自身的經(jīng)營活動(dòng),需要消耗大量的資源來維護(hù)林地的所有權(quán),增加了生產(chǎn)的成本。同時(shí),由于自身經(jīng)營管理水平的限制,林場對(duì)有限的林地資源利用效率不高,只有進(jìn)行森林的分類經(jīng)營,對(duì)有限的林地進(jìn)行科學(xué)合理的規(guī)劃,根據(jù)森林的主體功能劃分具體的經(jīng)營類型,加大對(duì)商品林中高效林業(yè)的經(jīng)營力度,提高對(duì)林場資源的使用率。

2 森林分類經(jīng)營措施

2.1 林場劃類經(jīng)營

林場可根據(jù)林場資源構(gòu)成情況,把林場劃分商品生產(chǎn)型和生態(tài)公益型林場2大類型。對(duì)前者進(jìn)行規(guī)范管理,若占用林地資源應(yīng)繳納林地占用費(fèi),國家投資形成的資產(chǎn)效益應(yīng)折成股份,在林場分配過程中,將國家股份所得上繳代表國家行使資產(chǎn)管理職能的相關(guān)部門,林場的經(jīng)營活動(dòng)照章納稅,林場對(duì)經(jīng)營活動(dòng)的投入應(yīng)通過國家計(jì)劃解決。為了增強(qiáng)林地的經(jīng)濟(jì)活力,在森林生態(tài)防護(hù)效益的基礎(chǔ)上,林場可以從事商品生產(chǎn)。

2.2 林場森林資源劃類經(jīng)營

對(duì)林場劃類經(jīng)營后,還應(yīng)對(duì)林場森林資源進(jìn)行劃類經(jīng)營。生態(tài)公益型林場的經(jīng)營投入主要通過經(jīng)營管理投入預(yù)算,由國家投資解決。商品經(jīng)營型林場由于存在2類資源,必須對(duì)森林資源劃類經(jīng)營。對(duì)于商品林,應(yīng)完全由林場自主經(jīng)營,行政主管部門要減少對(duì)其直接干預(yù);對(duì)于生態(tài)公益林,應(yīng)通過實(shí)行森林效益補(bǔ)償制度,對(duì)經(jīng)營投入問題進(jìn)行解決。

3 結(jié)語

當(dāng)前,對(duì)林場進(jìn)行綜合發(fā)展時(shí),如何進(jìn)行有效的分類運(yùn)作是一個(gè)需要重視的問題。對(duì)林場的分類運(yùn)作設(shè)置綜合化的管控體系,同時(shí)進(jìn)行合理的政策輔助,是活動(dòng)開展的關(guān)鍵點(diǎn)。林業(yè)的管理部門要實(shí)事求是根據(jù)林場當(dāng)?shù)氐膶?shí)際情況,在相關(guān)的理念體系的主導(dǎo)作用下,找到一個(gè)適合促進(jìn)當(dāng)?shù)亓謭鼋?jīng)濟(jì)效益的運(yùn)作體系。對(duì)林場實(shí)施分類運(yùn)作,重要的工作是前期做好綜合規(guī)劃,進(jìn)行分類設(shè)置。公益林的發(fā)展依然是林場分類經(jīng)營的難點(diǎn),吸引更多的資金加入到公益林的發(fā)展和維護(hù),是林場實(shí)現(xiàn)全面發(fā)展的重點(diǎn)。

參考文獻(xiàn)

1 陳火春.再談森林分類經(jīng)營林業(yè)[J].調(diào)查規(guī)劃,2001(7)

第6篇:詩句分類范文

【關(guān)鍵詞】經(jīng)濟(jì)實(shí)力;評(píng)價(jià)體系;因子分析;聚類分析;區(qū)域劃分

一、引言

作為全國的能源化工基地,山西省近年來的經(jīng)濟(jì)建設(shè)取得了較為顯著的成績,然而由于自然基礎(chǔ)、經(jīng)濟(jì)基礎(chǔ)等各方面原因,區(qū)域內(nèi)經(jīng)濟(jì)差異較大,因此,為實(shí)現(xiàn)山西省轉(zhuǎn)型跨越式發(fā)展,達(dá)到經(jīng)濟(jì)快速發(fā)展的目標(biāo),縮小區(qū)域內(nèi)經(jīng)濟(jì)差異、促進(jìn)各區(qū)域協(xié)調(diào)發(fā)展已成為全省開展各項(xiàng)工作的一個(gè)核心。而這一目標(biāo)的實(shí)現(xiàn),必須建立在對(duì)11個(gè)市區(qū)科學(xué)的經(jīng)濟(jì)分析基礎(chǔ)之上。本文正是利用因子分析和聚類分析對(duì)山西省各市區(qū)的經(jīng)濟(jì)實(shí)力進(jìn)行了綜合測評(píng),并通過劃分區(qū)域,找出各市區(qū)的優(yōu)勢(shì)和不足,以使山西實(shí)現(xiàn)可持續(xù)發(fā)展。

二、構(gòu)建經(jīng)濟(jì)指標(biāo)體系

所選取的評(píng)價(jià)指標(biāo)體系應(yīng)能客觀真實(shí)地反映各地區(qū)的實(shí)際情況,不僅包括投資產(chǎn)出狀況,也要反映該地區(qū)的居民支出水平,基于此,本文選取了各地區(qū)生產(chǎn)總值(X1)、地方財(cái)政收入(X2)、商品出口總額(X3)、人均生產(chǎn)總值(X4)、人均儲(chǔ)蓄存款(X5)、資本形成總額(X6)、固定資產(chǎn)投資總額(X7)[1]。其中人均儲(chǔ)蓄存款與人均消費(fèi)水平成相反關(guān)系,所以人均儲(chǔ)蓄存款在一定程度上也能反映居民支出水平。

三、因子分析

因子分析是通過研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個(gè)“抽象的變量”來表示其基本的數(shù)據(jù)結(jié)構(gòu),以達(dá)到降維、簡化數(shù)據(jù)的目的[2]。

由于旋轉(zhuǎn)前的因子載荷陣顯示的每個(gè)因子在不同變量上的載荷沒有明顯差異,為便于對(duì)因子命名,對(duì)因子載荷陣進(jìn)行了旋轉(zhuǎn)。

(四)由因子得分系數(shù)和原始變量的標(biāo)準(zhǔn)化值可求得各市區(qū)每個(gè)因子的得分?jǐn)?shù)。

四、聚類分析

根據(jù)因子得分分析區(qū)域發(fā)展的趨同程度,可對(duì)原始數(shù)據(jù)標(biāo)準(zhǔn)化后再進(jìn)行系統(tǒng)聚類,以輔助分析。對(duì)各市區(qū)的變量F1和變量F2的每個(gè)數(shù)據(jù)在SPSS中利用系統(tǒng)聚類法進(jìn)行聚類分析,其結(jié)果如下:

第一類:太原

第二類:大同、長治、晉中、運(yùn)城、忻州、臨汾、呂梁

第三類:陽泉、晉城、朔州

因子分析的綜合得分在一定程度上反映了各市區(qū)綜合經(jīng)濟(jì)實(shí)力,而聚類分析的結(jié)果對(duì)深入了解各市區(qū)在投資產(chǎn)出及支出方面的優(yōu)劣有重要的意義。太原作為省會(huì),在兩方面均占有優(yōu)勢(shì)。而第二類中的大同、長治、晉中、運(yùn)城、忻州、臨汾、呂梁在投資產(chǎn)出方面比較占優(yōu)勢(shì),在支出方面卻低于全省平均水平。第三類中的陽泉、晉城、朔州在投資產(chǎn)出方面低于全省平均水平,而消費(fèi)支出則高于全省平均水平。

五、結(jié)論與建議

1.結(jié)論

從11個(gè)市區(qū)經(jīng)濟(jì)實(shí)力因子分析的綜合得分可以看出,各市區(qū)綜合經(jīng)濟(jì)實(shí)力存在較大差異,排名第一的太原得分為1.887,而排名最后的忻州僅為-0.640。在公因子F1上的差距更為顯著,第一名太原與最后一名陽泉相差3.665,在公因子F2上的差距也較明顯,第一名太原與排在最后的運(yùn)城相差2.878。

而聚類分析不僅考慮到綜合得分,還考慮到各市區(qū)在產(chǎn)出與支出方面的特點(diǎn)。通過聚類分析,可以把山西省分為三類,在同一類別中的政策措施可以相互借鑒。

2.建議

(1)典型引路,整體推進(jìn)。從因子分析的綜合得分看,太原的經(jīng)濟(jì)實(shí)力很高,得分遠(yuǎn)遠(yuǎn)高于其他市區(qū),堪稱典范,其他市區(qū)應(yīng)向發(fā)展好的市區(qū)看齊,綜合考慮自身的地理位置、資源特點(diǎn)等,采取積極有效的措施,以促進(jìn)經(jīng)濟(jì)的跨越式發(fā)展。

(2)有針對(duì)性地采取策略。對(duì)于投資產(chǎn)出占優(yōu)勢(shì)支出水平較低的長治、呂梁、運(yùn)城等地,在保持優(yōu)勢(shì)的同時(shí),要促進(jìn)居民支出,在做精煤炭產(chǎn)業(yè)的同時(shí),大力發(fā)展諸如旅游業(yè)、制造業(yè)等多元產(chǎn)業(yè),創(chuàng)建低碳環(huán)保的循環(huán)經(jīng)濟(jì)模式。而陽泉、晉城、朔州等地,要鼓勵(lì)外資和本地民間資本進(jìn)入工業(yè)制造、基礎(chǔ)設(shè)施、生態(tài)建設(shè)、城市公用事業(yè)等領(lǐng)域,積極引進(jìn)戰(zhàn)略投資、優(yōu)勢(shì)企業(yè)及重大項(xiàng)目,認(rèn)真學(xué)習(xí)借鑒附著在資本載體上的管理、技術(shù)、企業(yè)文化和工業(yè)文明等,提升發(fā)展的活力和后勁。

(3)整體規(guī)劃、協(xié)調(diào)發(fā)展。山西省應(yīng)作為一個(gè)整體,用系統(tǒng)的觀點(diǎn)統(tǒng)一進(jìn)行規(guī)劃管理,針對(duì)各市區(qū)的優(yōu)勢(shì)與弱項(xiàng),從全局出發(fā),綜合考慮經(jīng)濟(jì)布局、經(jīng)濟(jì)發(fā)展目標(biāo)、三大產(chǎn)業(yè)結(jié)構(gòu)調(diào)整等各因素,構(gòu)建”一核一圈三群”為主體的城鎮(zhèn)化發(fā)展格局,將山西省打造成一個(gè)統(tǒng)籌兼顧、可持續(xù)發(fā)展的先進(jìn)省份。本文在聚類分析基礎(chǔ)上的經(jīng)濟(jì)實(shí)力分區(qū)可以為全省的整體規(guī)劃提供政策參考。

參考文獻(xiàn)

第7篇:詩句分類范文

關(guān)鍵詞:聚類技術(shù)、Java

中圖分類號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)08-1894-06

1 研究背景

JAVA是一種跨平臺(tái)的語言,靈活性比較大,運(yùn)用范圍廣,能運(yùn)用到各種系統(tǒng)和領(lǐng)域中。聚類技術(shù)最近幾年越來越受到大家的追捧,聚類算法的應(yīng)用也得到了推廣,在生物學(xué)上,聚類能通過基因和蛋白質(zhì)的這兩類的分類或者聚類,對(duì)種群中固定結(jié)果的重新認(rèn)識(shí)和分析,從而推導(dǎo)出不同的植物或者動(dòng)物種類:在市場關(guān)系上,市場分析人員也可以通過聚類發(fā)現(xiàn)客戶數(shù)據(jù)中不同的客戶群體,對(duì)這些群體的不相同類的特征進(jìn)行模式刻畫,從而能預(yù)測某客戶群體的購買類型。不僅如此,聚類也能對(duì)internet上的web中的文檔或者文件進(jìn)行分類,而發(fā)現(xiàn)對(duì)人們有價(jià)值的知識(shí),此外聚類還可以對(duì)其他方法進(jìn)行預(yù)處理過程,對(duì)這些方法起輔助作用。

基于JAVA的聚類分析的實(shí)現(xiàn),給聚類技術(shù)的推廣起到推風(fēng)助浪的作用,使得聚類技術(shù)能在更多的領(lǐng)域中拓寬。

2 聚類分析概念

聚類是運(yùn)用數(shù)據(jù)對(duì)象之間的距離,并運(yùn)用相關(guān)的聚類分析原則將對(duì)象逐一劃分到多個(gè)簇(clusters)中。每一個(gè)簇中中也包含了多個(gè)相同類屬對(duì)象,同一個(gè)簇鐘的對(duì)象之間的相似度要比不同簇的相似度大,最終的聚類能使得各簇種對(duì)象的相似度最小,這樣就達(dá)到聚類的目的了。這樣的聚類分析不僅可以對(duì)數(shù)據(jù)分析和知道的挖掘提供數(shù)據(jù)依據(jù),也可以解開事物數(shù)據(jù)之間的內(nèi)在聯(lián)系和區(qū)分,這使得聚類分析愛成為數(shù)據(jù)挖掘技術(shù)中不可缺少的成員。

3.2 層次聚類

層次聚類是根據(jù)凝聚或分裂的層次分解形式對(duì)數(shù)據(jù)對(duì)象集合進(jìn)行層次分解。分裂的方法是自頂向下的方法,首先把所有的數(shù)據(jù)對(duì)象點(diǎn)歸為一類,然后以此分裂成更小的類,分裂到每個(gè)對(duì)象能夠單獨(dú)在一個(gè)類中為止。凝聚與分裂的方法相反,是一種自底向上的方法,“底”在這里指的是單個(gè)數(shù)據(jù)點(diǎn),首先以單個(gè)數(shù)據(jù)點(diǎn)作為一個(gè)類,然后對(duì)相近的數(shù)據(jù)對(duì)象進(jìn)行合并歸納成新的類,直到所有的數(shù)據(jù)對(duì)象合并成一個(gè)類為止,這個(gè)類在層次上面叫著的最上層,整個(gè)運(yùn)作過程是自底向上的方式運(yùn)作。常用的算法有利用層次方法的平衡迭代歸約和聚類―BIRCH。

3.3 基于密度的方法

基于密度的方法就是讓最近區(qū)域密度值達(dá)到一定的標(biāo)準(zhǔn),也就是有一個(gè)具體的閥值即對(duì)象的個(gè)數(shù),還有就是該區(qū)域半徑值,以這些標(biāo)準(zhǔn)來對(duì)對(duì)象進(jìn)行聚類。用這種方法的好處是避免了劃分方法中發(fā)現(xiàn)球狀簇的局限。例如基于高密度連接區(qū)域的密度聚類方法――DBSCAN。

3.4 基于網(wǎng)格的方法

基于網(wǎng)格的方法就是在網(wǎng)格接結(jié)構(gòu)的基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行聚類,我們將采用量化的方式把空間對(duì)象分成有限的數(shù)目單元,這樣就是對(duì)空間對(duì)象進(jìn)行網(wǎng)格。這種算法有―CLIQUE算法。

3.5 基于模型的方法

基于模型的方式就是給定一個(gè)模型,根據(jù)模型的要求尋找最合適的對(duì)象的方法。在對(duì)象空間的密度數(shù)來構(gòu)建一個(gè)模型,通過統(tǒng)計(jì)數(shù)字自動(dòng)來決定聚類的數(shù)目,從而去掉不需要的噪聲數(shù)據(jù),使得聚類的方法更有力。這種方法有COBWEB算法,網(wǎng)絡(luò)神經(jīng)方法有SOM算法。

3.6 基于約束的方法

對(duì)數(shù)據(jù)的個(gè)體對(duì)象進(jìn)行約束,或者設(shè)置聚類參數(shù)來約束,來進(jìn)行聚類的方法。因?yàn)樵谖覀兊目陀^世界中聚類的問題存在很多的約束條件,但是這些條件都是很發(fā)雜的,往往不被有效的利用出來,從而不能對(duì)這方法進(jìn)行進(jìn)行廣泛的推廣和應(yīng)用。這種方法有COD (Clustering with Ob2structed Distance)。

第三步:計(jì)算每個(gè)聚類中所有對(duì)象的均值,得出新的聚類中心。

第四步:對(duì)新的聚類中心重復(fù)上面的第二和第三步,并得到新的聚類中心,直止新的聚類點(diǎn)不再更新。得出最終的聚類中心。

初值的好壞直接影響到K―Means算法的最后結(jié)果,也可以因?yàn)槌踔档膯栴}導(dǎo)致聚類的結(jié)果有天差萬別,因此要改變K―Means算法的初值的取法,是K―Means算法的改進(jìn)的關(guān)鍵。

中心點(diǎn)的選取不同直接影響到聚類結(jié)果不同,因此初始聚類中心的選擇在 K―Means算法中非常重要。實(shí)際應(yīng)用中,我們即希望中心點(diǎn)能夠盡量分散,也希望這些中心點(diǎn)具有一定的代表性,這也是我們聚類的目的。我們運(yùn)用一種基于試探性的算法---最大最小距離算法可以對(duì)初始聚類中心的選擇做出相對(duì)較好判斷,它能相對(duì)智能地確定最佳的初始聚類的中心,可以提高劃分初始數(shù)據(jù)集的效率,避免過去K―Means算法中選取初始聚類過于鄰近,而導(dǎo)致聚類結(jié)果不佳的情況。

參考文獻(xiàn):

[1] 朱福喜. Java程序設(shè)計(jì)技巧與開發(fā)實(shí)例[M].北京:人民郵電出版社,2004,2.

[2] 陸惠恩.實(shí)用軟件工程[M].北京:清華大學(xué)出版社,2006,5.

[3] (美)Bruce Eckel著,陳昊天譯.Java編程思想[M].北京:機(jī)械工業(yè)出版社,2007,6.

第8篇:詩句分類范文

1.1國外政策工具的發(fā)展歷史及成果

對(duì)于政策工具研究最早是在20世紀(jì)50年代中期由達(dá)爾和林德布洛姆撰寫的文章《論現(xiàn)代國家采取的政治——經(jīng)濟(jì)技術(shù)》中提出來的。但政策工具研究興起于20世紀(jì)80年代。20世紀(jì)80年代初的時(shí)候,荷蘭的吉爾霍德委員會(huì)便得出了以下結(jié)論:政策工具知識(shí)的缺乏和不足是導(dǎo)致政策失敗的重要原因。所以,為了解決這個(gè)問題我們需要建立和發(fā)展一門政策工具理論并將之付諸實(shí)踐。這時(shí)期最有影響力的著作要數(shù)1983年胡德的《政府的工具》。到了20世紀(jì)90年代及本世紀(jì)初,政策工具的研究得到了迅速地發(fā)展。目前,它已成為了當(dāng)代西方公共管理學(xué)和政策科學(xué)研究的一個(gè)焦點(diǎn)主題,同時(shí)也正在成長為一個(gè)新的學(xué)科分支。這一時(shí)期的代表作無非要數(shù)以下兩本了:一是20世紀(jì)90年代初的蓋伊·彼得斯和馮·尼斯潘主編的《公共政策工具;對(duì)公共管理工具的評(píng)價(jià)》;二是萊斯特·M·薩拉蒙主編的《政府工具——新治理指南》。其中筆者尤其要指出《公共政策工具——對(duì)公共管理工具的評(píng)價(jià)》一書,該書是1992年春在荷蘭鹿特丹大學(xué)舉行的政策工具研討會(huì)上的論文集,在眾多教材中較為全面地反映了當(dāng)時(shí)政策工具研究的狀況,是一本讓我們更好地了解公共政策工具并做進(jìn)一步研究的很好的參考書。

根據(jù)上文知道西方政策工具的真正興起與發(fā)展是在20世紀(jì)80年代之后,那么其原因有哪些呢?筆者借鑒了陳振民等學(xué)者的著作,將原因概述為以下四點(diǎn):一是政府的管理和政策的執(zhí)行是很復(fù)雜的,這就導(dǎo)致人們對(duì)政策執(zhí)行工具的反思;二是此時(shí)西方一些福利國家相繼失敗,政府的工作效率低下,政策時(shí)常失靈,人們產(chǎn)生了了解政策失靈的原因和解決方案的強(qiáng)烈要求,而不少解決方案就存在于政策工具的理論之中;三是現(xiàn)代的社會(huì)科學(xué)領(lǐng)域的學(xué)者們開始注重理論與實(shí)踐的緊密結(jié)合,導(dǎo)致他們對(duì)工具性知識(shí)的更多地追求;四是政策工具是政策科學(xué)研究領(lǐng)域的問題之一,政策科學(xué)自身發(fā)展到一定階段,自然會(huì)將政策工具納入研究重點(diǎn)之一。

1.2國內(nèi)政策工具的發(fā)展歷史及成果

在我國關(guān)于政策工具的研究是在本世紀(jì)初才慢慢被國內(nèi)學(xué)者所重視的,所以說它在我國的起步較晚,屬于新興研究領(lǐng)域,自然所取得的成果也是有限的。據(jù)我國國家圖書館和北京大學(xué)圖書館藏文獻(xiàn)進(jìn)行檢索發(fā)現(xiàn),我國目前還沒有真正意義上的政策工具專著,只有一本中文版譯著,是由顧建光翻譯《公共政策工具:對(duì)公共管理工具的評(píng)價(jià)》一書所得,于2007年1月由中國人民大學(xué)出版社出版。其余的成果主要是教材和論文。對(duì)公共政策研究進(jìn)行介紹的教材筆者所知道的主要有:張金馬主編的《政策科學(xué)導(dǎo)論》(1992年版);張國慶主偏的《現(xiàn)代公共政策導(dǎo)論》(1997版);陳振民主編的《政策科學(xué)》(1998年版);陳振民編著的《公共政策分析》(包括2002、2003年兩版);陳慶云主編的《公共政策分析》(2006);陶學(xué)榮主編的《公共政策學(xué)》(2006);郭紅玲主編的《公共政策學(xué)導(dǎo)論》(2007);陳潭主編的《公共政策學(xué)原理》(2008);嚴(yán)強(qiáng)主編的《公共政策學(xué)》(2008)等等。其中還有一本是2006年出版的由龐詩所譯的豪特利和拉米什的《公共政策研究——政策循環(huán)與政策子系統(tǒng)》一書,其內(nèi)容也有關(guān)于政策工具的介紹。至于論文也有數(shù)篇:2003年的主要是張成福的《論政府治理工具及其選擇》;2004年的主要有陳振民的《政府工具研究與政府管理方式》;2005年的主要有盧霞的《政府工具研究的新進(jìn)展》,徐程的《政府工具視角:一種審視政府治理的新途徑》,王偉昌的《新“治理”范式與政府工具研究》,儲(chǔ)亞萍的《論作為政府管理工具的合同》;2006年的主要有陳振民的《政府工具研究的新進(jìn)展》,呂志奎的《公共政策工具的選擇——政策執(zhí)行研究的新視角》,周奮進(jìn)等的《政府“治理工具”的選擇與行政行政制約》,余瑤的《當(dāng)代中國政府工具選擇芻議》,朱喜群的《論政府治理工具的選擇》;2007年主要有楊衛(wèi)玲的《公共信息;政府治理工具箱中最有效的“軟工具”》;2008年姜國兵的《對(duì)公共政策工具五大主題的理論反思》,等等。

2政策工具的內(nèi)涵

政策工具又稱為治理工具,政府工具,國內(nèi)外眾多學(xué)者都對(duì)其從不同的角度做了不同的定義,表述各異。國外主要有以下一些定義:尼德漢認(rèn)為工具是“公共機(jī)構(gòu)可以合法獲得的統(tǒng)治可能性”?;舾裢柗蛘J(rèn)為“工具是行動(dòng)者能夠使用或潛在地加以使用,以便達(dá)成一個(gè)或更多目標(biāo)的事物”。林格林將工具定義為:“致力于影響和治理社會(huì)過程的具有相似特征的一系列政策活動(dòng)”。美國學(xué)者萊斯特和斯圖爾特認(rèn)為政策工具是政策執(zhí)行的技術(shù)。澳大利亞學(xué)者歐文·E·休斯把政府工具定義為:“政府的行為方式,以及通過某種途徑用以調(diào)節(jié)政府行為的機(jī)制”。另一個(gè)美國學(xué)者薩拉蒙則認(rèn)為工具是“一個(gè)行動(dòng)者能夠使用或潛在地加以使用,以便達(dá)成一個(gè)或更多目的的任何事物”。而豪利特和拉米什則指出,政策工具是政府賴以推行政策的手段,是政府在部署和貫徹政策時(shí)擁有的實(shí)際方法和手段。

國內(nèi)知名學(xué)者陳振民、張成福、陶學(xué)榮、嚴(yán)強(qiáng)等等都對(duì)政策工具的內(nèi)涵作發(fā)表了自己的看法。有的認(rèn)為政策工具是實(shí)現(xiàn)政策目標(biāo)或結(jié)果的手段;有的認(rèn)為政策工具指的是政府將其實(shí)質(zhì)目標(biāo)轉(zhuǎn)化為具體行動(dòng)的路徑和機(jī)制,是政府治理的核心,沒有政策工具,便無法實(shí)現(xiàn)政府的目標(biāo){有的則認(rèn)為政策工具是“公共部門或社會(huì)組織為解決某一社會(huì)問題或達(dá)成一定的政策目標(biāo)而采用的具體手段和方式的總稱”等等。

從以上定義我們可以看出,雖然各個(gè)學(xué)者對(duì)政策工具的定義千差萬別,但這些定義都體現(xiàn)了共同的基本屬性一一公共政策主體在執(zhí)行政策過程中,在達(dá)成政策目標(biāo)中所采取的手段、方法和途徑。結(jié)合這些定義,筆者認(rèn)為政策工具是公共政策制定主體,尤其是執(zhí)政黨和政府部門選擇的并具體加以運(yùn)用以執(zhí)行公共政策,達(dá)成政策目標(biāo),從而解決政策問題的途徑和手段。

3政策工具的分類

3.1政策工具的分類簡介

關(guān)于政策工具的分類,學(xué)者們也是由于角度不同眾說紛蕓,表述各異。綜合起來有以下一些分類結(jié)果:荷蘭經(jīng)濟(jì)學(xué)家科臣(另一表述為德國經(jīng)濟(jì)學(xué)家基爾申)最早試圖對(duì)政策工具加以分類。他關(guān)注的是一系列執(zhí)行經(jīng)濟(jì)政策從而獲得最優(yōu)化結(jié)果的工具。他整理出了64種工具,但是只是列舉,并未作系統(tǒng)化的分類。美國政治學(xué)家羅威、達(dá)爾和林德布洛姆等人對(duì)這些工具進(jìn)行了寬泛的分類,認(rèn)為可以分為規(guī)制性工具和非規(guī)制性工具兩大類。薩拉蒙在前人研究的基礎(chǔ)之上又加上了開支性工具和非開支性工具兩種類型。胡德相比較前幾位學(xué)者來說提出了稍顯系統(tǒng)化的分類框架,他認(rèn)為所有的政策工具無一例外的都會(huì)使用到以下四種資源中的任一種或幾種。這四種資源是信息、權(quán)威、財(cái)力和可利用的正式組織。麥克唐納和艾莫爾則根據(jù)工具所要求達(dá)到的目標(biāo)將之分為四類:命令型工具、激勵(lì)型工具、能力建設(shè)型工具和系統(tǒng)變遷型工具。施耐德和英格拉姆等人的分類與之有些類似,他們認(rèn)為政策工具可分為激勵(lì)型工具、能力建設(shè)型工具、符號(hào)與規(guī)勸型工具和學(xué)習(xí)型工具四類。著名政策分析家狄龍將政策工具分為法律工具、經(jīng)濟(jì)工具和交流工具三類。這種分類方法在西方比較受推崇。另一種更新近的三分法是管制性工具、財(cái)政激勵(lì)工具和信息轉(zhuǎn)移工具。加拿大公共政策學(xué)者霍萊特和拉梅什根據(jù)政策工具的強(qiáng)制性程度將政策工具分為強(qiáng)制性工具、自愿性工具和混合性工具。此種分類方法在眾多方法中更具解釋力、更合理,在下文,筆者將對(duì)之進(jìn)行詳細(xì)介紹。加拿大政策科學(xué)布魯斯.德林和理查德.菲德也是根據(jù)政策工具的強(qiáng)制性程度將政府工具分為自律型政策工具和全民所有型政策工具,前者強(qiáng)制程度最低,而后者強(qiáng)制程度最高。這種分類為政策工具分類體現(xiàn)政府與社會(huì)之間的關(guān)系做了基礎(chǔ)性的貢獻(xiàn)。歐文.E.休斯認(rèn)為政府的干預(yù)都可以通過供應(yīng)、補(bǔ)貼、生產(chǎn)和管制這四方面的經(jīng)濟(jì)手段得以實(shí)現(xiàn)。林德和彼得斯則認(rèn)為政策工具是多元化的,它們可以包括命令條款、財(cái)政補(bǔ)助、管制規(guī)定、征稅、勸戒、權(quán)威和契約。奧斯本和蓋布勒在《改革政府》一書中將政策工具比作是“政府箭袋里的箭”,并將之分為以下三類:傳統(tǒng)類工具、創(chuàng)新類工具和先鋒類工具。E·S·薩瓦斯認(rèn)為政策工具有政府服務(wù)、政府間協(xié)議、契約、特許經(jīng)營、補(bǔ)助、市場、用戶付費(fèi)、志愿服務(wù)等等。

以上是西方對(duì)政策工具的大致分類情況,接下來我們看一下國內(nèi)主要的分類情況。國內(nèi)學(xué)者的分類總結(jié)起來主要有三種,一種是張成福在《公共管理學(xué)》中的分類,他政府介入的程度將政策工具分為政府部門直接提供財(cái)貨與服務(wù)、政府部門委托其他部門提供、簽約外包、補(bǔ)助或補(bǔ)貼、抵用券、經(jīng)營特許權(quán)、政府販?zhǔn)厶囟ǚ?wù)、自我協(xié)助、志愿服務(wù)和市場運(yùn)作。第二種是陳振民的分類,他認(rèn)為政策工具可分為三大類:市場化工具、工商管理技術(shù)和社會(huì)化手段。最后一種是陶學(xué)榮的分類,他將政策工具則分為:經(jīng)濟(jì)性工具、行政性工具、管理性工具、政治性工具和社會(huì)性工具五類。

3.2政策工具分類的不足和困難

(1)不足。

雖然很多學(xué)者對(duì)在政策工具分類上做出了嘗試,關(guān)于這方面的成果也不少,正如上文所述的那樣。但是我們不得不承認(rèn)政策工具的分類依然存在不少問題。有的分類太過于寬泛不夠具體,從而不便操作。比如說林德布洛姆等人作出的分類。有的分類選用的是列舉法,太過于具體。最大的弊端是難以窮盡,不科學(xué)嚴(yán)謹(jǐn)。有的分類沒有相互區(qū)別、相互排斥。有的分類又太注重借鑒企業(yè)的分類了,從而有忽視“公共性”的嫌疑。有的分類對(duì)諸如談判、說服等非正式工具沒有加以重視。

(2)困難。

政策工具分類有以上的諸多困難,是有其原因的,這些原因也可以說是現(xiàn)在政策分類不可避免的困難。筆者認(rèn)為大致有以下幾點(diǎn):一是政策工具本身包含的內(nèi)容太豐富了,以至于不同類別之間有時(shí)相互交叉。二是我們?cè)谘芯空吖ぞ邥r(shí)往往處在靜態(tài)的角度,這樣容易導(dǎo)致我們分類方式的僵化。三是政策工具分類研究中存在著“灰色領(lǐng)域”,這個(gè)領(lǐng)域?qū)儆谀膫€(gè)類別不好判斷。四是政策工具的分類不僅僅是一個(gè)技術(shù)層面的問題,還涉及很多價(jià)值因素在其中。在公共組織中不同價(jià)值的選擇和整合是很難的。五是現(xiàn)在社會(huì)的公共問題日趨復(fù)雜,要想解決這些復(fù)雜的問題需要整合不同的政策工具,這也是有一定難度的。總而言之,關(guān)于政策工具及其分類的研究依然有很長的路要走。本文借鑒前人的成果小談了一下政策工具的發(fā)展歷史和分類,首先是對(duì)之有個(gè)基礎(chǔ)性的了解,其次是為進(jìn)一步的研究做鋪墊。

第9篇:詩句分類范文

關(guān)鍵詞:核函數(shù);劃分聚類;k-折交叉驗(yàn)證;PAM(圍繞中心點(diǎn)的劃分);主成分分析

中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)27-6185-04

隨著智能化的到來,機(jī)器學(xué)習(xí)技術(shù)得到廣泛的重視。當(dāng)前,數(shù)據(jù)挖掘技術(shù)的發(fā)展,以及社會(huì)應(yīng)用對(duì)云計(jì)算、大數(shù)據(jù)等的要求也越來越高。分類、關(guān)聯(lián)規(guī)則、聚類、時(shí)間序列與序列模式、Web挖掘、空間挖掘技術(shù)等得到了較快發(fā)展。作為一種基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)(SVM)成為了數(shù)據(jù)挖掘的一種比較重要且有特色的方法,在分類、聚類方面有著很重要的意義。支持向量機(jī)使用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則代替經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,采用將低維空間映射到高維空間,在非線性、小樣本、二分類、高維模式應(yīng)用環(huán)境中具有一些明顯的優(yōu)勢(shì)。

支持向量機(jī)目前在二分類問題中得到了深入的研究,在多類分類問題的求解上也提出了很多解決辦法。聚類作為數(shù)據(jù)挖掘的另一個(gè)重要領(lǐng)域,則相對(duì)于分類而言,研究的較少。文獻(xiàn)[6]對(duì)將支持向量機(jī)的思想應(yīng)用于聚類做了簡單的介紹,并且提出了采用主成分分析(PCA)進(jìn)行特征提取的一種線性降維的簡單算法。

支持向量機(jī)具有的明顯優(yōu)勢(shì),有一個(gè)很重要的原因,就是采用了核函數(shù)(但核函數(shù)不一定只用在SVM上)。該文根據(jù)核函數(shù)在支持向量機(jī)上進(jìn)行有效分類的啟發(fā),將核函數(shù)思想應(yīng)用到劃分聚類上,在Matlab環(huán)境下進(jìn)行了應(yīng)用與實(shí)現(xiàn)。

1 核函數(shù)

核函數(shù)對(duì)支持向量機(jī)的分類性能有影響。核函數(shù)的形式的選取,參數(shù)的選擇,都是核函數(shù)的應(yīng)用必須考慮的問題。

核函數(shù)具有以下優(yōu)點(diǎn):

2)采用核函數(shù)可以處理高維數(shù)據(jù)。這是因?yàn)椴捎煤撕瘮?shù)后,輸入空間的維數(shù)對(duì)核函數(shù)的矩陣沒有影響。這樣就避免了所謂的“維數(shù)災(zāi)難”,并且計(jì)算量得到了減小。

3)核函數(shù)對(duì)于支持向量機(jī)是至關(guān)重要的,但核函數(shù)的思想絕不僅僅只用于支持向量機(jī)處理上。實(shí)際上,只要一個(gè)應(yīng)用,在建立模型后存在內(nèi)積形式,都可以采用K(x,x’)去替換,這樣就有可能改進(jìn)目標(biāo)算法。這樣,核函數(shù)思想就可以與聚類算法相結(jié)合,在聚類的預(yù)處理步驟上,能夠設(shè)計(jì)出各種基于核函數(shù)的子算法,更重要的是這兩部分的設(shè)計(jì)可以獨(dú)立開展,根據(jù)不同的應(yīng)用環(huán)境進(jìn)行篩選,找出合適的算法。

4)核函數(shù)有多種形式,相同的核函數(shù)的參數(shù)也會(huì)不同。有些應(yīng)用,適合采用某一種核函數(shù),而有些應(yīng)用可能要采用另一種核函數(shù)。

核函數(shù)應(yīng)用中,Mercer定理具有很重要的意義。Mercer定理指出:要證明K是一個(gè)核函數(shù),不必去尋找Φ變換函數(shù),只需要在數(shù)據(jù)訓(xùn)練集上求出各個(gè)內(nèi)積Kij,然后只要判斷一下矩陣K是不是半正定矩陣就可以了。滿足Mercer條件的函數(shù)就能作為核函數(shù)。

2 聚類

2.1 聚類簡介

聚類和分類一樣,是數(shù)據(jù)挖掘的一項(xiàng)重要功能。分類是一種有監(jiān)督的學(xué)習(xí)。而聚類與分類不同,聚類中要?jiǎng)澐值慕M(簇)事先是不確定的,而是由數(shù)據(jù)決定的,因此聚類是一種無監(jiān)督的學(xué)習(xí)。聚類分析又稱群分析,它是研究(樣品或指標(biāo))分類問題的一種統(tǒng)計(jì)分析方法。聚類具有重要的意義和普遍的價(jià)值。在日常生活中,經(jīng)常有“物以類聚,人以群分”的說法,聚類能夠很好地刻畫數(shù)據(jù)的屬性以及群體行為特征。聚類的目標(biāo)就是將數(shù)據(jù)采用某種算法,根據(jù)數(shù)據(jù)本身的屬性,劃分成若干組(簇),分組的依據(jù)是在同一個(gè)組(簇)中的數(shù)據(jù)之間具有較高的相似度,在不同的組(簇)中具有很低的相似度。

目前,數(shù)據(jù)挖掘技術(shù)以及大數(shù)據(jù)技術(shù)面對(duì)的是巨大的、復(fù)雜的、異構(gòu)的數(shù)據(jù)集,聚類分析算法面臨很大的挑戰(zhàn)。一個(gè)好的聚類分析算法應(yīng)該考慮以下一些方面:

1) 可伸縮性:聚類算法在小數(shù)據(jù)集和大數(shù)據(jù)集上均能得出有效的結(jié)論;

2) 能夠處理各種數(shù)據(jù)類型的屬性,并且能夠處理高維、稀疏數(shù)據(jù);

3) 能夠根據(jù)數(shù)據(jù)本身的特征,找出任意形狀的組(簇),而不是僅僅發(fā)現(xiàn)類球類的簇;

4) 對(duì)專業(yè)領(lǐng)域知識(shí)依賴性低;聚類的結(jié)果應(yīng)該是易于理解、便于應(yīng)用;

5)數(shù)據(jù)集輸入的順序?qū)垲惖慕Y(jié)果影響較??;

6) 能夠?qū)υ肼曔M(jìn)行處理;能夠根據(jù)實(shí)際應(yīng)用的約束條件進(jìn)行聚類。

2.2 距離與相似度的度量

從聚類的概念上可以看出,數(shù)據(jù)元素之間的相似度是聚類分析中很重要的因素。如何來定義數(shù)據(jù)對(duì)象之間的相似度,對(duì)聚類分析的質(zhì)量有決定作用。相似度在通常情況下可以用距離d(xi,xj)來衡量,當(dāng)xi與xj相似時(shí),d(xi,xj)值較小;而當(dāng)xi與xj不相似時(shí),d(xi,xj)較大。

常用的度量標(biāo)準(zhǔn)有:

1)兩個(gè)數(shù)據(jù)對(duì)象之間的距離函數(shù)(相似性測度)

對(duì)于具有連續(xù)特征的數(shù)據(jù)集空間,常用的距離函數(shù)有明科夫斯基距離、二次型距離、余弦距離等;對(duì)于二元類型的數(shù)據(jù)集,可以采用簡單匹配系數(shù)(SMC)、Jaccard系數(shù)和Rao系數(shù)進(jìn)行描述。

2) 簇間距離(不相似性測度)

描述兩個(gè)簇間的距離,可以有以下一些方法:

采用兩個(gè)簇中相距最遠(yuǎn)的兩個(gè)數(shù)據(jù)之間的距離來表示簇間距離(最遠(yuǎn)距離法);

采用兩個(gè)簇中相距最近的兩個(gè)數(shù)據(jù)之間的距離來表示簇間距離(最近距離法);

采用兩個(gè)簇中的中心點(diǎn)的距離作為簇間距離,簇的中心可以用該簇所有元素的算術(shù)平均表示(簇中心點(diǎn)法);

采用兩個(gè)簇中任意的兩個(gè)數(shù)據(jù)對(duì)象之間的距離表示簇間距離(簇平均法);

除了以上四種方法外,還可以采用離差平方和來描述簇間距離。

2.3 聚類的類型

聚類的類型按照不同的標(biāo)準(zhǔn),有不同的分法。這里根據(jù)聚類分析算法的設(shè)計(jì)思路,將聚類分成以下5種類型。

1)劃分聚類

這是最基本的聚類方法,劃分思想比較接近日常生活。若給定l個(gè)數(shù)據(jù)(可以是多維),將這l個(gè)數(shù)據(jù)劃分成k類,k

劃分聚類的方法常用的有:k-平均、k-原型、k-中心點(diǎn)、k-模、PAM、CLARA以及CLARANS等。

2)層次聚類

層次聚類就是采用自頂向下(分裂)或自底向上(凝聚)的方法,相繼地分裂或合并,直到終止條件滿足的一種聚類算法。分裂的算法有DIANA算法,凝聚的算法有AGNES。

3) 密度聚類

該方法不采用距離作為相似性度量,可以很好地解決前述算法偏向于得出類似于球類的聚類結(jié)果。密度聚類采用數(shù)據(jù)是否屬于相連的密度域,采用直接密度可達(dá)、密度可達(dá)來尋找相連密度域的數(shù)據(jù),將符合要求的數(shù)據(jù)插入到相應(yīng)的組(簇)中。典型的密度聚類算法是DBSCAN。

4)網(wǎng)格聚類

CLIQUE算法、STING算法等是常用的網(wǎng)格聚類算法。網(wǎng)格聚類算法首先將數(shù)據(jù)空間劃分成有限個(gè)單元的網(wǎng)格,以后的處理都是基于每個(gè)單元進(jìn)行。該類算法速度快,因?yàn)榕c所處理的數(shù)據(jù)個(gè)數(shù)沒有關(guān)系,而只與數(shù)據(jù)空間中的單元的個(gè)數(shù)有關(guān)。該類算法很有價(jià)值,不需要事先給定聚類的簇個(gè)數(shù),能夠發(fā)現(xiàn)任意形狀、任意大小的簇,且計(jì)算結(jié)果與數(shù)據(jù)輸入順序無關(guān)。

5)模型聚類

給一個(gè)簇先設(shè)定一個(gè)模型,然后以這個(gè)模型為依據(jù)去尋找滿足模型的數(shù)據(jù),將其歸于該模型對(duì)應(yīng)的簇?;谏窠?jīng)網(wǎng)絡(luò)的模型有SOM,基于統(tǒng)計(jì)學(xué)模型的方法有Gaussian Mixture Model(混合高斯模型)。

本文主要對(duì)劃分聚類的k-平均算法和PAM算法進(jìn)行。

3 核函數(shù)在劃分聚類中的應(yīng)用與實(shí)現(xiàn)

3.1 核函數(shù)與聚類結(jié)合研究現(xiàn)狀

文獻(xiàn)[1]對(duì)核函數(shù)在支持向量機(jī)上的應(yīng)用做了探討,并采用了k-折交叉驗(yàn)證與網(wǎng)格搜索法,對(duì)Breast Cancer數(shù)據(jù)集上采用多項(xiàng)式、RBF和Sigmoid核函數(shù)進(jìn)行了實(shí)驗(yàn)驗(yàn)證;文獻(xiàn)[2]采用最小包含球的思想,介紹了一種核向量機(jī)(CVM),并與SVM做了比較;文獻(xiàn)[3]認(rèn)為主成分分析(PCA)降維的目的是對(duì)原始數(shù)據(jù)的重構(gòu),而不是為了進(jìn)行分類,因此會(huì)降低分類效果,于是提出了采用高斯核函數(shù)和核化離散差判別分析的一種核化聚類判別分析方法(KSCDA);文獻(xiàn)[4]將多項(xiàng)式核函數(shù)、RBF核函數(shù)和Sigmoid核函數(shù)應(yīng)用到了遙感圖像幾何校正中并做了詳細(xì)的實(shí)驗(yàn)驗(yàn)證;文獻(xiàn)[5]將Gauss核函數(shù)的應(yīng)用到了航空AE3007發(fā)動(dòng)機(jī)一次引氣故障的診斷中,對(duì)Gauss核函數(shù)的參數(shù)和相應(yīng)的支持向量機(jī)的懲罰因子C的不同組合作了較為詳盡的論述;文獻(xiàn)[6]對(duì)核函數(shù)的原理與性質(zhì)作了較為深入的介紹,并對(duì)聚類和主成分分析(PCA)給出了應(yīng)用的一般思路;文獻(xiàn)[7]對(duì)數(shù)據(jù)挖掘中聚類的原理和算法做了較為詳細(xì)的介紹,特別是對(duì)劃分聚類、密度聚類、層次聚類和網(wǎng)格聚類做了較為詳盡的舉例;文獻(xiàn)[8]則采用基于余弦函數(shù)的夾角大小來進(jìn)行相似度測度定義,并應(yīng)用到了自底向上的凝聚層次聚類中,對(duì)6個(gè)元素的高維稀疏矩陣進(jìn)行了實(shí)驗(yàn)仿真;文獻(xiàn)[9]對(duì)常用的核函數(shù),運(yùn)用Libsvm工具箱,在Matlab平臺(tái)上做了一些實(shí)驗(yàn)驗(yàn)證,得出了一些直觀的效果;文獻(xiàn)[10]將核函數(shù)思想應(yīng)用到了自組織映射(SOM)網(wǎng)絡(luò)流量分析,提出了kSOM方法,能夠?qū)τ卸鄠€(gè)統(tǒng)計(jì)特征屬性的網(wǎng)絡(luò)流量在應(yīng)用層進(jìn)行分類。

3.2 核函數(shù)在聚類分析中的應(yīng)用要點(diǎn)

根據(jù)對(duì)聚類和核函數(shù)的特點(diǎn)分析,根據(jù)文獻(xiàn)[8],發(fā)現(xiàn)核函數(shù)的思想在聚類中的應(yīng)用可以通過對(duì)相似度度量上來進(jìn)行設(shè)計(jì)。例如,在判斷兩個(gè)向量的相似度時(shí),采用傳統(tǒng)的距離計(jì)算方法,對(duì)于復(fù)雜的高維稀疏矩陣,往往計(jì)算量大,由于有了核函數(shù)的思想,可以采用計(jì)算兩個(gè)向量的夾角的大小進(jìn)行數(shù)據(jù)對(duì)象的相似度判別。

于是根據(jù)空間解析幾何原理,夾角的大小cos(θ)=xi·xj/(||xi||*||xj||);

其中θ∈[0,π/2]。當(dāng)夾角越小時(shí),兩個(gè)數(shù)據(jù)對(duì)象越相似;夾角越大時(shí),兩個(gè)數(shù)據(jù)對(duì)象就越不相似。

更進(jìn)一步,借用支持向量機(jī)中核函數(shù)的應(yīng)用的思想,將相似度夾角的計(jì)算可以簡單地改成帶有核函數(shù)K(x,x’),這樣對(duì)于計(jì)算高維、稀疏空間向量的相似度帶來很大方便。

3.2.1 核函數(shù)在k-平均聚類算法上的應(yīng)用

k-平均算法,是一個(gè)最簡單、最基本的聚類算法。該算法的思想是初始隨機(jī)給定k個(gè)簇中心,按照最鄰近原則把待分類數(shù)據(jù)劃分到相應(yīng)的簇,然后按平均法重新計(jì)算各個(gè)簇的中心,確定新的簇心。一直迭代,直到準(zhǔn)則函數(shù)收斂。由于k-平均算法要頻繁計(jì)算兩個(gè)數(shù)據(jù)之間的距離,因此,核函數(shù)思想應(yīng)用到k-平均算法能夠解決高維稀疏數(shù)據(jù)之間的距離計(jì)算。算法如下:

算法目標(biāo):輸入l個(gè)數(shù)據(jù)和需要聚類出的簇的個(gè)數(shù)k,得出聚類的k個(gè)簇

1)輸入未聚類的l個(gè)初始數(shù)據(jù)點(diǎn)集和簇的個(gè)數(shù)k;

2)隨機(jī)選取k個(gè)數(shù)據(jù)作為初始的中心;

3)計(jì)算每個(gè)數(shù)據(jù)與簇中心的余弦相似測度,并聚類到與該數(shù)據(jù)最相似的簇中去;

這里由于采用了核函數(shù)思想,將傳統(tǒng)的距離用計(jì)算余弦夾角相似測度,而余弦夾角的相似測度的計(jì)算又引入了核函數(shù)的思想,對(duì)于內(nèi)積的計(jì)算可以通過所采用的核函數(shù)進(jìn)行。核函數(shù)可以選擇多項(xiàng)式核函數(shù)、RBF核函數(shù)和Sigmoid核函數(shù)等。

4)計(jì)算每個(gè)簇中所有數(shù)據(jù)的相似測度平均值,并將這個(gè)平均值作為新的聚類中心。若計(jì)算結(jié)果滿足所設(shè)定的準(zhǔn)則函數(shù),則轉(zhuǎn)7;

5)重復(fù)3,計(jì)算每個(gè)數(shù)據(jù)到簇中心的余弦相似測度,并聚類到與該數(shù)據(jù)最相似的簇中去;

6)重復(fù)4,計(jì)算每個(gè)簇中所有點(diǎn)的相似測度平均值,并將這個(gè)平均值作為新的簇中心

7)輸出聚類的結(jié)果k個(gè)簇

3.2.2核函數(shù)在圍繞中心點(diǎn)劃分(PAM)算法上的應(yīng)用

PAM算法選用簇中位置最靠近中心的數(shù)據(jù)作為中心點(diǎn),然后把l個(gè)對(duì)象劃分成k個(gè)簇??梢宰畛蹼S機(jī)選取k個(gè)對(duì)象作為中心點(diǎn),反復(fù)用非中心點(diǎn)數(shù)據(jù)來代替中心點(diǎn),這樣找出更加合理的中心點(diǎn)。從PAM的執(zhí)行過程中可以看出,PAM算法在替換中心點(diǎn)時(shí),計(jì)算代價(jià)非常高。PAM算法克服了k-平均聚類對(duì)噪聲數(shù)據(jù)和孤立點(diǎn)數(shù)據(jù)的敏感性,但在處理大數(shù)據(jù)集上,由于替換中心點(diǎn)的復(fù)雜性,失去了k-平均聚類對(duì)處理大數(shù)據(jù)集的相對(duì)高效與可伸縮性。

究其原因,PAM算法中在用非中心點(diǎn)替換中心點(diǎn)時(shí),在計(jì)算代價(jià)上的組合情況較多。因此,采用基于余弦相似測度的核函數(shù)應(yīng)用,在傳統(tǒng)PAM算法的兩點(diǎn)之間距離的計(jì)算上,采用核函數(shù)進(jìn)行,可能會(huì)對(duì)效率有所提高。

對(duì)于PAM算法,算法的步驟基本不需要改變,主要將算法中的用非中心點(diǎn)代替中心點(diǎn)試探時(shí),在計(jì)算代價(jià)和總代價(jià)時(shí),改為采用余弦相似測度來進(jìn)行度量。

3.3采用核函數(shù)的兩個(gè)劃分聚類算法性能

算法的實(shí)現(xiàn)采用了 Matlab 7.1,數(shù)據(jù)集采用了用Matlab 7.1隨機(jī)產(chǎn)生的100個(gè)5維空間的數(shù)據(jù)myData,并進(jìn)行了一些手工調(diào)整。在聚類時(shí),采用了標(biāo)準(zhǔn)的k-平均聚類、標(biāo)準(zhǔn)的PAM聚類,以及采用了改進(jìn)的核函數(shù)聚類的k-平均聚類和PAM聚類算法。核函數(shù)采用了RBF核函數(shù)、多項(xiàng)式核函數(shù)以及Sigmoid核函數(shù)。

4 結(jié)束語

將核函數(shù)的思想應(yīng)用到劃分聚類中,對(duì)k-平均聚類算法和PAM算法在距離的計(jì)算上改為采用了基于核函數(shù)的余弦相似測度的計(jì)算,從效果上看,在k-平均聚類算法性能的提高上要優(yōu)于PAM算法。這是因?yàn)镻AM對(duì)數(shù)據(jù)量較大的數(shù)據(jù)集效率下降的較快。下一步的工作,準(zhǔn)備將核函數(shù)的思想應(yīng)用到另外兩種能夠處理較大數(shù)據(jù)集的劃分聚類算法CLARA算法和CLARANS中去。

參考文獻(xiàn):

[1] 奉國和.SVM分類核函數(shù)及參數(shù)選擇比較[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(3):123-128.

[2] 許敏.核向量機(jī)算法研究及應(yīng)用[J].無錫職業(yè)技術(shù)學(xué)院學(xué)報(bào),2012,11(4):73-76.

[3] 李天恩,何楨.基于改進(jìn)的核化聚類判別分析的故障識(shí)別[J].管理工程學(xué)報(bào),2012,26(3):34-41.

[4] 孫軍,黎琪,李和睿.支持向量機(jī)遙感圖像幾何校正中的不同核算法的比較[J].四川兵工學(xué)報(bào),2012,33(8):76-80.

[5] 鄭波.基于Gauss核函數(shù)的SVM故障診斷技術(shù)研究[J].中國民航飛行學(xué)院學(xué)報(bào),2012,23(3):49-51.

[6] 鄧乃揚(yáng),田英杰.支持向量機(jī)-理論、算法與拓展[M].北京:科學(xué)出版社,2009:81-111

[7] 毛國君,段立娟.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005:156-181

[8] 陳森平,陳啟買,吳志杰.基于核函數(shù)的層次聚類算法[J].暨南大學(xué)學(xué)報(bào),2011,32(1):31-35.