公務(wù)員期刊網(wǎng) 論文中心 正文

大數(shù)據(jù)挖掘技術(shù)下的全國物流信息

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數(shù)據(jù)挖掘技術(shù)下的全國物流信息范文,希望能給你帶來靈感和參考,敬請閱讀。

大數(shù)據(jù)挖掘技術(shù)下的全國物流信息

摘要:科技信息技術(shù)的快速發(fā)展,為智慧物流興起和發(fā)展提供了契機(jī)。本文利用大數(shù)據(jù)挖掘技術(shù)全國物流網(wǎng)點(diǎn),貨源與車源信息進(jìn)行分析,得到物流網(wǎng)點(diǎn),貨源與車源在全國的分布規(guī)律,以更好的進(jìn)行資源配置,降本增效。

關(guān)鍵詞:大數(shù)據(jù);挖掘技術(shù);全國物流信息

一、研究方法

利用python中數(shù)據(jù)挖掘模塊[1]分別爬取中國物流網(wǎng)的物流網(wǎng)點(diǎn)名稱和地址、貨物始發(fā)地和需求地地址、貨物名稱、各地的車源信息,進(jìn)行數(shù)據(jù)統(tǒng)計和分析。

二、全國物流信息數(shù)據(jù)爬取及分析

1、物流網(wǎng)點(diǎn)數(shù)據(jù)分析

按照省份爬取物流網(wǎng)點(diǎn),共爬取1018個。廣東、江蘇、山東三省的物流網(wǎng)點(diǎn)最多,均為1000以上,其中廣東省最多,為2728個。上海、浙江、北京、天津等中東部省市次之,東北、西北、西南的省份物流網(wǎng)點(diǎn)相對較少,河南在內(nèi)陸地區(qū)的省份中物流網(wǎng)點(diǎn)數(shù)量居高位。通過數(shù)據(jù)爬取結(jié)果對物流網(wǎng)點(diǎn)數(shù)量分布的特點(diǎn)作出推斷,位于東部沿海的省份經(jīng)濟(jì)發(fā)達(dá),與國內(nèi)外貿(mào)易往來密切,產(chǎn)生了大量物流需求,因此物流網(wǎng)點(diǎn)數(shù)量多;而位于東北,西北,西南的省份,經(jīng)濟(jì)發(fā)展緩慢,物流量較小[2];河南的物流網(wǎng)點(diǎn)數(shù)量領(lǐng)先內(nèi)陸其他各省,究其原因,鄭州是中部地區(qū)交通樞紐,鐵路系統(tǒng)發(fā)達(dá),交通極為便利,因此物流量大,對物流網(wǎng)點(diǎn)的需求多。

2、貨物數(shù)據(jù)分析

按照省份爬取貨源信息,共4021條,無論是貨源還是其需求地,信息量大的地區(qū)依然是東部沿海省市及經(jīng)濟(jì)發(fā)達(dá)地區(qū),東北、西北、西南地區(qū)的省份貨源及需求量都比較少。將貨源信息與貨物需求地信息數(shù)量進(jìn)行對比,每個省份的貨物供給和需求在全國各省市中大致處于相同位次,供需比較平衡。

3、車源數(shù)據(jù)分析

按照省份爬取車源信息,共24699條。東南部沿海地區(qū)的省市車源信息量大,而內(nèi)陸地區(qū)都保持較低的水平,但重慶市高居內(nèi)陸榜首,結(jié)合原始數(shù)據(jù)來看,重慶市車源信息3732條,位列第三。此外值得一提的是廣東省,其車源信息量高達(dá)11840條,而車源信息數(shù)量共24699條,可見僅廣東一省便占據(jù)了半壁江山。

4、對比分析

將物流網(wǎng)點(diǎn)、貨源、車源信息按照省份統(tǒng)計數(shù)量(如圖1),三條線分別表示物流網(wǎng)點(diǎn)、貨源、車源數(shù)據(jù)??梢娢锪骶W(wǎng)點(diǎn)、貨源、車源之間大致表現(xiàn)為正相關(guān)。此外,廣東、江蘇、重慶三省的車源數(shù)據(jù)極為突出。廣東省和江蘇省都有雄厚的經(jīng)濟(jì)體量,同是沿海省份,對外貿(mào)易往來密切,區(qū)位優(yōu)勢明顯。而重慶市身居內(nèi)陸卻可與沿海發(fā)達(dá)省份媲美,這與其地理位置有關(guān),重慶市多山,鐵路運(yùn)營里程位居全國23,但對公路運(yùn)輸?shù)男枨筝^多,因此車源信息數(shù)量大。

三、總結(jié)

物流網(wǎng)點(diǎn)和貨源數(shù)據(jù)都呈現(xiàn)東多西少的特點(diǎn),即沿海、經(jīng)濟(jì)較發(fā)達(dá)的省市擁有較多物流網(wǎng)點(diǎn)和貨物往來,內(nèi)陸、經(jīng)濟(jì)欠發(fā)達(dá)的省份貨物往來較少。交通是除經(jīng)濟(jì)因素之外對物流網(wǎng)點(diǎn)和貨源分布影響較大的因素,交通便利的省份物流網(wǎng)點(diǎn)和貨物信息較多。物流網(wǎng)點(diǎn)、貨源、車源信息三者的地域分布大致呈現(xiàn)正相關(guān),物流網(wǎng)點(diǎn)多的省市,其貨源和車源信息數(shù)量也比較多。

參考文獻(xiàn)

[1]安子建.基于Scrapy框架的網(wǎng)絡(luò)爬蟲實(shí)現(xiàn)與數(shù)據(jù)抓取分析[D].吉林大學(xué),2017.

[2]郭茜,莊菁.我國物流業(yè)布局現(xiàn)狀、問題與對策[J].中國物流與采購,2013(12):66-67.

作者:李姝銘 單位:北京交通大學(xué)