前言:想要寫出一篇引人入勝的文章?我們特意為您整理了環(huán)境監(jiān)測(cè)數(shù)據(jù)分析中層次聚類分析應(yīng)用范文,希望能給你帶來靈感和參考,敬請(qǐng)閱讀。
摘要:層次聚類分析作為一種常用的聚類分析方法,能有效識(shí)別環(huán)境監(jiān)測(cè)數(shù)據(jù)集中的隱藏關(guān)系。文章主要介紹了層次聚類分析在水、大氣、土壤等環(huán)境監(jiān)測(cè)數(shù)據(jù)分析中的應(yīng)用,提出以熱圖形式優(yōu)化層次聚類分析可視化結(jié)果,并對(duì)熱圖在土壤污染狀況調(diào)查項(xiàng)目的應(yīng)用進(jìn)行展望。
關(guān)鍵詞:層次聚類分析;環(huán)境監(jiān)測(cè)數(shù)據(jù)分析;熱圖;應(yīng)用
引言
定期的環(huán)境監(jiān)測(cè)會(huì)積累龐大而復(fù)雜的化學(xué)數(shù)據(jù)集,越來越多的研究者開始關(guān)注數(shù)據(jù)集中的內(nèi)在關(guān)系。多元統(tǒng)計(jì)分析是研究多變量相互之間關(guān)系的統(tǒng)計(jì)分析方法,是環(huán)境監(jiān)測(cè)數(shù)據(jù)分析的有力工具。常用的多元統(tǒng)計(jì)分析包括聚類分析、主成分/因子分析、判別分析等,其中聚類分析不僅用于環(huán)境管理研究,而且在環(huán)境監(jiān)測(cè)領(lǐng)域發(fā)揮巨大作用。聚類分析可識(shí)別變量間的隱藏關(guān)系,僅用一小部分因子表示,且沒有損失太多數(shù)據(jù)信息,有利于研究者快速掌握環(huán)境介質(zhì)污染狀況,判別各介質(zhì)中潛在的污染來源[1]。
1聚類分析方法介紹
聚類分析也稱集群分析、分類分析或數(shù)值分類,其基本思想是按照所研究的樣品或變量之間存在相似性或不相似性,以一些能夠度量樣品或變量之間相似程度的統(tǒng)計(jì)量作為劃分類型的依據(jù),將數(shù)據(jù)分為若干類別,使類別內(nèi)樣品(或變量)差異盡可能小,類別間差異盡可能大。通常用距離來度量樣品之間的相似性,用相似性系數(shù)來度量變量之間的相似性,結(jié)果以聚類樹狀圖顯示。聚類分析是一種探索性分析,按聚類的方法可分為層次聚類法、非層次聚類法等。其中,常用的是層次聚類法,也稱系統(tǒng)聚類法,其實(shí)質(zhì)是根據(jù)變量或樣品之間的親疏程度,從最相似的對(duì)象開始,逐步聚成一類[2]。按照分析的對(duì)象不同聚類分析也可分為樣本聚類(Q型聚類)和變量聚類(R型聚類)。該文將主要介紹層次聚類分析在環(huán)境監(jiān)測(cè)數(shù)據(jù)分析中的應(yīng)用。
2層次聚類分析在環(huán)境監(jiān)測(cè)數(shù)據(jù)分析中的應(yīng)用
層次聚類分析作為一種常用的聚類分析方法,可有效降低原始監(jiān)測(cè)數(shù)據(jù)集的維度,簡(jiǎn)化數(shù)據(jù)的復(fù)雜程度,以監(jiān)測(cè)點(diǎn)位、時(shí)間、指標(biāo)和污染評(píng)價(jià)結(jié)果等為對(duì)象進(jìn)行聚類分析,便于分析各指標(biāo)時(shí)空分布特征及指標(biāo)間的相關(guān)性。適用于不同環(huán)境介質(zhì)監(jiān)測(cè)過程獲得的數(shù)據(jù)。近年來,層次聚類分析作為傳統(tǒng)多元統(tǒng)計(jì)方法,常用于地表水、地下水、大氣和土壤環(huán)境監(jiān)測(cè)數(shù)據(jù)分析[3]。對(duì)地表水體的監(jiān)測(cè)點(diǎn)位和時(shí)間進(jìn)行層次聚類分析,可得到若干點(diǎn)位集群和時(shí)間集群,監(jiān)測(cè)點(diǎn)位和時(shí)間的層次聚類分析結(jié)果可作為采樣斷面和頻率優(yōu)化的重要依據(jù),可有效降低采樣成本[4][5]。除分析監(jiān)測(cè)數(shù)據(jù)集的時(shí)空變化特征外,層次聚類分析也用于監(jiān)測(cè)指標(biāo)的統(tǒng)計(jì)分析,便于判別污染來源。秦文婧等對(duì)柳江煤礦所在區(qū)域的地下水中的離子進(jìn)行層次聚類分析,得到不同離子的相似來源,有助于分析煤礦對(duì)區(qū)域地下水水質(zhì)造成的影響[6]。層次聚類分析同樣適用于大氣污染物時(shí)空分布特征研究和污染溯源。陳楊歡等在分析上海市大氣PM2.5時(shí)空分布特征時(shí)引入層次聚類法,揭示不同季節(jié)和地理位置的大氣PM2.5濃度相互關(guān)系[7]。劉杰等對(duì)陜西省某工業(yè)園區(qū)春季大氣降塵中的重金屬進(jìn)行聚類分析,判斷該工業(yè)區(qū)重金屬污染主要受金屬冶煉、交通運(yùn)輸和燃煤等影響[8]。相對(duì)水和大氣環(huán)境的環(huán)境監(jiān)測(cè),土壤環(huán)境監(jiān)測(cè)頻次較少,監(jiān)測(cè)數(shù)據(jù)集通常由空間維度不同指標(biāo)監(jiān)測(cè)濃度組成。因此,層次聚類分析法也可適用于土壤環(huán)境污染物的空間分布特征分析和污染溯源方面。方淑波等在研究浦東新區(qū)土壤重金屬沿城鄉(xiāng)梯度分布特征時(shí)引入層次聚類分析不同金屬的空間差異性,識(shí)別出城市土壤重金屬環(huán)境風(fēng)險(xiǎn)的優(yōu)先控制區(qū)域[9]。通過對(duì)土壤污染物指標(biāo)的聚類分析,可協(xié)助識(shí)別污染源。如有研究者以鉛鋅尾礦區(qū)的11種重金屬為研究對(duì)象,采用層次聚類分析等統(tǒng)計(jì)學(xué)方法判斷尾礦區(qū)重金屬來源[10]。層次聚類分析在城市、農(nóng)村等土壤環(huán)境污染溯源方面取得了較好的效果,但該方法在建設(shè)用地土壤污染狀況調(diào)查數(shù)據(jù)統(tǒng)計(jì)分析中的應(yīng)用鮮有報(bào)道[11]。利用層次聚類分析具體地塊土壤污染調(diào)查監(jiān)測(cè)數(shù)據(jù)集,既可體現(xiàn)污染物在采樣點(diǎn)位的分布特征,又能判別檢出污染物之間的相似程度,有助于深入剖析地塊土壤污染狀況和污染來源。此外,土壤監(jiān)測(cè)數(shù)據(jù)層次聚類分析結(jié)果可佐證資料收集、人員訪談、現(xiàn)場(chǎng)踏勘等工作階段識(shí)別的污染源,間接反映出前期調(diào)查的完整度和準(zhǔn)確度。
3層次聚類分析可視化結(jié)果的優(yōu)化
層次聚類分析結(jié)果以聚類樹狀圖顯示,僅能顯示單個(gè)維度的分析結(jié)果。將樣本和變量之間的層次聚類分析結(jié)果進(jìn)行組合,可呈現(xiàn)兩個(gè)維度的聚類結(jié)果,對(duì)于數(shù)據(jù)的分析和表達(dá)將更有效。Laursen等建立了雙層次聚類分析,用于識(shí)別在正常情況和肝硬化時(shí)丹麥人、格陵蘭因紐特人體肝組織中的元素之間的相關(guān)性和協(xié)同作用[12]。雙層次聚類分析同樣適用于環(huán)境監(jiān)測(cè)領(lǐng)域。Ma等檢測(cè)了黃河的三個(gè)區(qū)域沉積物中重金屬的濃度,水平系統(tǒng)樹圖中包括重金屬與pH、總碳、總有機(jī)碳和地區(qū)生產(chǎn)總值的聚類結(jié)果;垂直系統(tǒng)樹圖是采樣位點(diǎn)的聚類結(jié)果[13]。由此可知,雙層次聚類分析結(jié)果體現(xiàn)更多的數(shù)據(jù)集信息和統(tǒng)計(jì)分析結(jié)果。熱圖是一種常見的可視化方法的形式,可將多維數(shù)據(jù)以二維的方式完全直觀地呈現(xiàn),并用顏色梯度變化來表示數(shù)值的大小[14]。熱圖已在在群落生態(tài)學(xué)、生物分類學(xué)與系統(tǒng)學(xué)等方面應(yīng)用廣泛[15]。環(huán)境監(jiān)測(cè)獲得的數(shù)據(jù)集通常包括時(shí)間、空間、指標(biāo)等多維度信息,熱圖對(duì)層次聚類分析結(jié)果的可視化也有利于解釋實(shí)際環(huán)境數(shù)據(jù),但將熱圖應(yīng)用于環(huán)境監(jiān)測(cè)數(shù)據(jù)集的統(tǒng)計(jì)分析的研究較少。采用熱圖解析環(huán)境監(jiān)測(cè)數(shù)據(jù)和相關(guān)污染指標(biāo)之間的相關(guān)性,既可保留原始數(shù)據(jù)的完整性,也能顯示雙層次聚類分析結(jié)果。因此,在環(huán)境監(jiān)測(cè)數(shù)據(jù)集的分析中利用熱圖分析監(jiān)測(cè)結(jié)果更為直觀,且有助于污染溯源分析。
結(jié)語
層次聚類分析有助于識(shí)別環(huán)境監(jiān)測(cè)數(shù)據(jù)集中的內(nèi)在聯(lián)系,能較好地應(yīng)用于環(huán)境污染物時(shí)空差異性分析和污染溯源。目前,該方法主要用于大尺度空間領(lǐng)域的環(huán)境監(jiān)測(cè)數(shù)據(jù)統(tǒng)計(jì)分析,而在實(shí)際項(xiàng)目中的應(yīng)用較少。鑒于熱圖在統(tǒng)計(jì)分析和可視化方面的優(yōu)勢(shì),該方法完全可用于具體土壤污染狀況調(diào)查項(xiàng)目。通過熱圖分析監(jiān)測(cè)數(shù)據(jù)集,挖掘闡釋污染物間的相似性以及空間上差異性,以提高污染源識(shí)別的有效性和精準(zhǔn)度。
作者:汪宇鵬 單位:上海市政工程設(shè)計(jì)研究總院