公務(wù)員期刊網(wǎng) 論文中心 正文

大數(shù)據(jù)在測繪地理信息方面應(yīng)用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數(shù)據(jù)在測繪地理信息方面應(yīng)用范文,希望能給你帶來靈感和參考,敬請閱讀。

大數(shù)據(jù)在測繪地理信息方面應(yīng)用

摘要:測繪地理信息數(shù)據(jù)量大、需要具備相對較強的數(shù)據(jù)處理能力才能獲得精準(zhǔn)的信息可視化表征,從而實現(xiàn)對相關(guān)地域地理知識的有效掌握。基于測繪地理數(shù)據(jù)分析結(jié)果可以有效掌握地表環(huán)境信息,從而開展科學(xué)研究與工業(yè)應(yīng)用。本文基于對測繪地理信息遙感大數(shù)據(jù)資源現(xiàn)狀的分析結(jié)果,研究了如何利用大數(shù)據(jù)技術(shù)實現(xiàn)關(guān)鍵信息的自動分析與深入挖局,提出了通用性的方法,可以在此基礎(chǔ)上進(jìn)行改進(jìn)以適應(yīng)具體工程項目的需求。

關(guān)鍵詞:測繪地理信息;數(shù)據(jù)分析;數(shù)據(jù)挖掘

測繪地理信息工作一直以來都是國民經(jīng)濟(jì)發(fā)展的基礎(chǔ),同時也是國防事業(yè)發(fā)展的基石。通過技術(shù)手段掌握地球關(guān)鍵點或相關(guān)面的坐標(biāo)、高程、方向等信息,探究其間的相互關(guān)聯(lián)關(guān)系并發(fā)現(xiàn)數(shù)據(jù)變化背后的規(guī)律性與科學(xué)性,基于這些數(shù)據(jù)信息開展科學(xué)研究與工業(yè)生產(chǎn),盡最大化滿足人們的使用需求并探索地球變化的奧秘,這是測繪地理信息的核心任務(wù)[1]。一般來說,測繪地理信息數(shù)據(jù)量大、需要具備相對較強的數(shù)據(jù)處理能力才能獲得精準(zhǔn)的信息可視化表征,從而實現(xiàn)對相關(guān)地域地理知識的有效掌握。傳統(tǒng)上,對于地理測繪信息的分析采用的是變量解析的方法,主要依靠人工計算來完成,不僅工作量大、占用人力資源多,而且計算精度不高。近年來,隨著信息技術(shù)的發(fā)展,尤其是大數(shù)據(jù)技術(shù)在信息技術(shù)發(fā)展中引領(lǐng)地位的確立,人們提出可以利用大數(shù)據(jù)技術(shù)進(jìn)行測繪地理信息數(shù)據(jù)的自動處理與深度挖掘。

1測繪地理信息遙感大數(shù)據(jù)資源基本現(xiàn)狀

利用衛(wèi)星對地球表面進(jìn)行高空掃描、獲得詳細(xì)的遙感數(shù)據(jù)后傳輸至地面工作站進(jìn)行分析與處理,是當(dāng)前地理信息測繪技術(shù)的主要手段。遙感大數(shù)據(jù)是測繪地理信息數(shù)據(jù)中的主要存在方式。這類數(shù)據(jù)在獲取的時候,由于地球表面環(huán)境的復(fù)雜性,必然存在無法進(jìn)行歸類與統(tǒng)一、相互之間缺乏聯(lián)動、無法共享等問題[2]。具體來說,測繪地理信息遙感大數(shù)據(jù)由于獲取方式的局限性,存在的特點如圖1所示。由圖1可以看出,測繪地理信息大數(shù)據(jù)在獲取方式、存儲方式、共享方式、擴(kuò)展方式、管理方式等方面都有不同于傳統(tǒng)測繪信息數(shù)據(jù)的特點,因此基于這些數(shù)據(jù)信息進(jìn)行地理環(huán)境分析時需要有針對性地采用改進(jìn)后的方法。為了獲得更加精確的測繪信息數(shù)據(jù)分析結(jié)果,本文提出了利用自動分析與數(shù)據(jù)挖掘技術(shù)處理大數(shù)據(jù)信息的方法。

2測繪地理信息遙感大數(shù)據(jù)自動分析方法

2.1遙感大數(shù)據(jù)的表達(dá)方法

隨著測繪技術(shù)的發(fā)展,尤其是衛(wèi)星遙感技術(shù)的提升,測繪信息不僅以文本的形式表現(xiàn),更多的時候采用影像的形式表現(xiàn)[3]。針對文本與影像相互混雜的遙感數(shù)據(jù)信息,進(jìn)行表達(dá)與特征分析時可以按照圖2所示的流程進(jìn)行。由圖2可以看出,遙感測繪數(shù)據(jù)信息進(jìn)行表達(dá)與特征分析時,主要是對文本與圖像信息的綜合處理。這兩類信息在獲取之后需要進(jìn)行特征聯(lián)合分析與本征表示,通過特征融合與歸一化表示獲得有效的數(shù)據(jù)流形和相關(guān)節(jié)點信息。其中,數(shù)據(jù)信息的融合主要是采用數(shù)據(jù)變換的方式將不同源、不同分辨率的多元特征離散化后統(tǒng)一到同一個分區(qū)特征空間中,實現(xiàn)數(shù)據(jù)維數(shù)的降低并易于提取主要特征,為獲得特征節(jié)點信息奠定基礎(chǔ)。

2.2遙感大數(shù)據(jù)的存儲與檢索方法

遙感大數(shù)據(jù)進(jìn)行特征表達(dá)之后,需要進(jìn)行存儲與檢索。數(shù)據(jù)存儲一般采用自建數(shù)據(jù)庫的方式進(jìn)行,通過對數(shù)據(jù)特征進(jìn)行編碼并歸類后進(jìn)行存儲,同時搭建專用網(wǎng)絡(luò)用于鏈接不同數(shù)據(jù)庫,方便不同數(shù)據(jù)庫之間信息的調(diào)取。對于存儲的信息,為了實現(xiàn)快速檢索,需要對信息數(shù)據(jù)之間的相似性和互異性進(jìn)行計算和表征??梢詫?shù)據(jù)設(shè)置標(biāo)簽,根據(jù)不同標(biāo)簽的內(nèi)容計算數(shù)據(jù)與標(biāo)簽之間的相似度,對標(biāo)簽相似度計算結(jié)果設(shè)置一定的閾值范圍,只有在閾值范圍以內(nèi)的數(shù)據(jù)才可以算作相互之間存在相似性,否則就是互異的。對數(shù)據(jù)的相似性和互異性進(jìn)行表征之后,同一標(biāo)簽下屬的數(shù)據(jù)都是相似的,不同標(biāo)簽之間的數(shù)據(jù)都是互異的,這樣就實現(xiàn)了對數(shù)據(jù)的有效分類。在對數(shù)據(jù)進(jìn)行有效分類之后,可以利用知識驅(qū)動的方法實現(xiàn)遙感大數(shù)據(jù)的快速檢索。具體來說,基于知識驅(qū)動方法的遙感大數(shù)據(jù)檢索方法主要由圖3所示的關(guān)鍵環(huán)節(jié)組成。由圖3可以看出,遙感大數(shù)據(jù)檢測主要是通過建立檢索服務(wù)鏈實現(xiàn)數(shù)據(jù)特征的自主學(xué)習(xí),通過構(gòu)建智能檢索系統(tǒng)輸出用戶所需場景,利用知識更新做好檢索系統(tǒng)的自學(xué)習(xí),為下一次信息檢索提供自主實現(xiàn)功能。對信息特征的處理可以利用標(biāo)簽相似度的方法實現(xiàn),之后利用人工神經(jīng)網(wǎng)絡(luò)構(gòu)建知識在線自主學(xué)習(xí)機制,通過對標(biāo)簽數(shù)據(jù)的反復(fù)訓(xùn)練實現(xiàn)底層特征與高層語義之間的高精度關(guān)聯(lián),最終使檢索系統(tǒng)具有自主檢索數(shù)據(jù)信息的能力,達(dá)到“智能檢索”的目的。

2.3遙感大數(shù)據(jù)的理解方法

傳統(tǒng)上遙感大數(shù)據(jù)是基于“面向特征”的處理方式進(jìn)行理解的,利用大數(shù)據(jù)分析技術(shù)可以實現(xiàn)“面向特征”到“面向?qū)ο蟆碧幚矸绞降霓D(zhuǎn)變,從而實現(xiàn)對對象層-目標(biāo)層的目標(biāo)信息提取與識別。為了實現(xiàn)“面向?qū)ο蟆睌?shù)據(jù)理解方式的轉(zhuǎn)變,需要對特征-目標(biāo)-場景語義進(jìn)行數(shù)學(xué)建模,解決語義信息與特征信息之間的鴻溝問題,通過輸入多元特征信息獲得遙感大數(shù)據(jù)場景多元認(rèn)知信息,為數(shù)據(jù)挖掘做好準(zhǔn)備。

3測繪地理信息遙感大數(shù)據(jù)挖掘方法

3.1遙感大數(shù)據(jù)挖掘方法流程

數(shù)據(jù)挖掘是基于特征分析的進(jìn)一步深化,通過對數(shù)據(jù)之間的相關(guān)性進(jìn)行分析可以獲得數(shù)據(jù)之間的規(guī)律變化,從而獲得科學(xué)的決策信息。遙感數(shù)據(jù)挖掘可以采用圖4所示的流程實現(xiàn)。由圖4可以看出,對數(shù)據(jù)信息挖掘之前需要進(jìn)行分類與回歸分析。當(dāng)前,數(shù)據(jù)的分類與回歸分析可以自己開發(fā)軟件實現(xiàn),也可以利用現(xiàn)有的軟件進(jìn)行,比如可以利用SPSS軟件實現(xiàn),也可以利用成熟的聚類方法、統(tǒng)計分析方法、云理論方法等實現(xiàn)。

3.2遙感大數(shù)據(jù)挖掘示例

對于采集到的某遙感圖像,該圖像中有山地、丘陵、湖泊、平原等四類地形特征。為了給地形特征進(jìn)行自動標(biāo)記與分類,首先對平面像素進(jìn)行歸一化,得到的數(shù)值如表1所示。對于歸一化得到的數(shù)值,經(jīng)過與實際數(shù)據(jù)對比,可以建立如下歸類關(guān)系:山地,數(shù)值≥1.0;丘陵,1.0>數(shù)值≥0.7;湖泊,0.7>數(shù)值≥0.4;平原,0.4>數(shù)值≥0。對于以上數(shù)據(jù),為了判定屬于某類數(shù)據(jù),可以利用直接分類的方法一一進(jìn)行判斷;但是,當(dāng)數(shù)據(jù)量比較大的時候,利用這種直接分類的方法必然會造成分類時間的增加,同時也會造成結(jié)果精度的下降,因此,可以采用K-means算法進(jìn)行自動分類。K-means算法計算步驟如下所示:Step1:計算樣本數(shù)據(jù)與待分類數(shù)據(jù)之間的距離,一般采用歐氏距離表示,即(1)其中,(x,y)表示待分類點坐標(biāo)值,(xi,yi)表示樣本數(shù)據(jù)坐標(biāo)值,di表示相互之間的距離。Step2:為待分類數(shù)據(jù)選擇k個與其距離最小的樣本;Step3:統(tǒng)計出k個樣本中大多數(shù)樣本所述的分類;Step4:依據(jù)統(tǒng)計結(jié)果確定待分類數(shù)據(jù)所屬的類別。按照以上步驟,對數(shù)據(jù)進(jìn)行迭代計算,就可以獲得理想的分類結(jié)果。按照該方法對表1中的數(shù)據(jù)進(jìn)行分類,結(jié)果如表2所示。由表2可以看出,利用K-means算法計算得到的分類結(jié)果與直接分類方法的分類結(jié)果相一致,證明了這種分類方法的正確性,當(dāng)數(shù)據(jù)量增大時可以直接進(jìn)行運用。

4結(jié)論

測繪地理信息數(shù)據(jù)分析具有一定的難度,其分析結(jié)果直接影響著對地理信息的判斷精度。本文基于大數(shù)據(jù)分析技術(shù)研究了測繪地理信息遙感數(shù)據(jù)的自動分析與數(shù)據(jù)挖掘方法,后續(xù)在進(jìn)行工程化應(yīng)用時可以根據(jù)數(shù)據(jù)類型進(jìn)行改進(jìn),通過不斷提升數(shù)據(jù)分類的準(zhǔn)確度,拓展大數(shù)據(jù)分析技術(shù)在測繪地理信息系統(tǒng)開發(fā)中的應(yīng)用空間。

參考文獻(xiàn)

[1]韓熙.遙感大數(shù)據(jù)自動分析與數(shù)據(jù)挖掘研究[J].數(shù)碼世界,2020,175(05):92.

[2]和樹繁.遙感大數(shù)據(jù)自動分析與數(shù)據(jù)挖掘研究[J].科技經(jīng)濟(jì)市場,2018,11(09):9-10.

[3]梁金,劉志國,楊曉路.芻議遙感大數(shù)據(jù)自動分析及數(shù)據(jù)挖掘研討[J].名城繪,2018(10):1.

作者:何駿 單位:江西省自然資源事業(yè)發(fā)展中心