公務(wù)員期刊網(wǎng) 論文中心 正文

電子商務(wù)Web數(shù)據(jù)挖掘技術(shù)研究

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了電子商務(wù)Web數(shù)據(jù)挖掘技術(shù)研究范文,希望能給你帶來靈感和參考,敬請閱讀。

電子商務(wù)Web數(shù)據(jù)挖掘技術(shù)研究

摘要:該文通過介紹電子商務(wù)及數(shù)據(jù)挖掘基本知識,分別從幾個(gè)方面分析了電子商務(wù)中web數(shù)據(jù)挖掘技術(shù)的應(yīng)用。

關(guān)鍵詞:電子商務(wù);數(shù)據(jù)挖掘;應(yīng)用

1概述

電子商務(wù)是指企業(yè)或個(gè)人以網(wǎng)絡(luò)為載體,應(yīng)用電子手段,利用現(xiàn)代信息技術(shù)進(jìn)行商務(wù)數(shù)據(jù)交換和開展商務(wù)業(yè)務(wù)的活動(dòng)。隨著互聯(lián)網(wǎng)的迅速發(fā)展,電子商務(wù)比傳統(tǒng)商務(wù)具有更明顯的優(yōu)勢,由于電子商務(wù)具有方便、靈活、快捷的特點(diǎn),使它已逐漸成為人們生活中不可缺少的活動(dòng)。目前電子商務(wù)平臺(tái)網(wǎng)站多,行業(yè)競爭強(qiáng),為了獲得更多的客戶資源,電子商務(wù)網(wǎng)站必須加強(qiáng)客戶關(guān)系管理、改善經(jīng)營理念、提升售后服務(wù)。數(shù)據(jù)挖掘是從數(shù)據(jù)集中識別出隱含的、潛在有用的、有效的,新穎的、能夠被理解的信息和知識的過程。由數(shù)據(jù)集合做出歸納推理,從中挖掘并進(jìn)行商業(yè)預(yù)判,能夠幫助電子商務(wù)企業(yè)決策層依據(jù)預(yù)判,對市場策略調(diào)整,將企業(yè)風(fēng)險(xiǎn)降低,從而做出正確的決策,企業(yè)利潤將最大化。隨著電子商務(wù)的應(yīng)用日益廣泛,電子商務(wù)活動(dòng)中會(huì)產(chǎn)生大量有用的數(shù)據(jù),如何能夠數(shù)據(jù)挖掘出數(shù)據(jù)的參考價(jià)值?研究客戶的興趣和愛好,對客戶分門別類,將客戶心儀的商品分別推薦給相關(guān)客戶。因此,如何在電子商務(wù)平臺(tái)上進(jìn)行數(shù)據(jù)挖掘成為研究的熱點(diǎn)問題。

2數(shù)據(jù)挖掘技術(shù)概述

數(shù)據(jù)挖掘(DataMining),也稱數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowl⁃edgeDiscoveryinDatabase,KDD)。數(shù)據(jù)挖掘一般是指從海量數(shù)據(jù)中應(yīng)用算法查找出隱藏的、未知的信息的過程。數(shù)據(jù)挖掘是一個(gè)在大數(shù)據(jù)資源中利用分析工具發(fā)現(xiàn)模型與數(shù)據(jù)之間關(guān)系的一個(gè)過程,數(shù)據(jù)挖掘?qū)Q策者尋找數(shù)據(jù)間潛在的某種關(guān)聯(lián),發(fā)現(xiàn)隱藏的因素起著關(guān)鍵作用。這些模式是有潛在價(jià)值的、并能夠被理解的。數(shù)據(jù)挖掘?qū)⑷斯ぶ悄堋C(jī)器學(xué)習(xí)、數(shù)據(jù)庫、統(tǒng)計(jì)、可視化、信息檢索、并行計(jì)算等多個(gè)領(lǐng)域的理論與技術(shù)融合在一起的一門多學(xué)科交叉學(xué)問,這些學(xué)科也對數(shù)據(jù)挖掘提供了很大的技術(shù)支撐。

3Web數(shù)據(jù)挖掘特點(diǎn)

Web數(shù)據(jù)挖掘就是數(shù)據(jù)挖掘在Web中的應(yīng)用。Web數(shù)據(jù)挖掘的目的是從萬維網(wǎng)的網(wǎng)頁的內(nèi)容、超鏈接的結(jié)構(gòu)及使用日志記錄中找到有價(jià)值的數(shù)據(jù)或信息。依據(jù)挖掘過程中使用的數(shù)據(jù)類別,Web數(shù)據(jù)挖掘任務(wù)可分為:Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘、Web使用記錄挖掘。

1)Web內(nèi)容挖掘指從網(wǎng)頁中提取文字、圖片或其他組成網(wǎng)頁內(nèi)容的信息,挖掘?qū)ο笸ǔ0谋?、圖形、音視頻、多媒體以及其他各種類型數(shù)據(jù)。

2)Web結(jié)構(gòu)挖掘是對Web頁面之間的結(jié)構(gòu)進(jìn)行挖掘,挖掘描述內(nèi)容是如何組織的,從Web的超鏈接結(jié)構(gòu)中尋找Web結(jié)構(gòu)和頁面結(jié)構(gòu)中的有價(jià)值模式。例如從這些鏈接中,我們可以找出哪些是重要的網(wǎng)頁,依據(jù)網(wǎng)頁的主題,進(jìn)行自動(dòng)的聚類和分類,為了不同的目的從網(wǎng)頁中根據(jù)模式獲取有用的信息,從而提高檢索的質(zhì)量及效率。

3)Web使用記錄挖掘是根據(jù)對服務(wù)器上用戶訪問時(shí)的訪問記錄進(jìn)行挖掘的方法。Web使用挖掘?qū)⑷罩緮?shù)據(jù)映射為關(guān)系表并采用相應(yīng)的數(shù)據(jù)挖掘技術(shù)來訪問日志數(shù)據(jù),對用戶點(diǎn)擊事件的搜集和分析發(fā)現(xiàn)用戶導(dǎo)航行為。它用來提取關(guān)于客戶如何瀏覽和使用訪問網(wǎng)頁的鏈接信息。如訪問了哪些頁面?在每個(gè)頁面中所停留的時(shí)間?下一步點(diǎn)擊了什么?在什么樣的路線下退出瀏覽的?這些都是Web使用記錄挖掘所關(guān)心要解決的問題。

4電子商務(wù)中Web挖掘中技術(shù)的應(yīng)用分析

1)電子商務(wù)中序列模式分析的應(yīng)用

序列模式數(shù)據(jù)挖掘就是要挖掘基于時(shí)間或其他序列的模式。如在一套按時(shí)間順序排列的會(huì)話或事務(wù)中一個(gè)項(xiàng)目有存在跟在另一個(gè)項(xiàng)目后面。通過這個(gè)方法,WEB銷售商可以預(yù)測未來的訪問模式,以幫助針對特定用戶組進(jìn)行廣告排放設(shè)置。發(fā)現(xiàn)序列模式容易使客戶的行為被電子商務(wù)的組織者預(yù)測,當(dāng)用戶瀏覽站點(diǎn)時(shí),盡可能地迎合每個(gè)用戶的瀏覽習(xí)慣并根據(jù)用戶感興趣的內(nèi)容不斷調(diào)整網(wǎng)頁,盡可能地使每個(gè)用戶滿意。使用序列模式分析挖掘日志,可以發(fā)現(xiàn)客戶的訪問序列模式。在萬維網(wǎng)使用記錄挖掘應(yīng)用中,序列模式挖掘可以用于捕捉用戶路徑之中常用的導(dǎo)航路徑。當(dāng)用戶訪問電子商務(wù)網(wǎng)站時(shí),網(wǎng)站管理員能夠搜索出這個(gè)訪問者的對該網(wǎng)站的訪問序列模式,將訪問者感興趣但尚未瀏覽的頁面推薦給他。序列模式分析還能分析出商品購買的前后順序,從而向客戶提出推薦。例如在搜索引擎是發(fā)出查詢請求、瀏覽網(wǎng)頁信息等,會(huì)彈出與這些信息相關(guān)的廣告。例如購買了打印機(jī)的用戶,一般不久就會(huì)購買如打印紙、硒鼓等打印耗材。優(yōu)秀的推薦系統(tǒng)將為客戶建立一個(gè)專屬商店,由每個(gè)客戶的特征來調(diào)整網(wǎng)站的內(nèi)容。也能由挖掘出的一些序列模式分析網(wǎng)站及產(chǎn)品促銷的效果。

2)電子商務(wù)中關(guān)聯(lián)規(guī)則的應(yīng)用

關(guān)聯(lián)規(guī)則是揭示數(shù)據(jù)之間隱含的相互關(guān)系,關(guān)聯(lián)分析的任務(wù)是發(fā)現(xiàn)事物間的關(guān)聯(lián)規(guī)則或相關(guān)程序。關(guān)聯(lián)規(guī)則挖掘的目標(biāo)是在數(shù)據(jù)項(xiàng)目中找出每一個(gè)數(shù)據(jù)信息的內(nèi)在關(guān)系。關(guān)聯(lián)規(guī)則挖掘就是要搜索出用戶在服務(wù)器上訪問的內(nèi)容、頁面、文件之間的聯(lián)系,從而改進(jìn)電子商務(wù)網(wǎng)站設(shè)計(jì)。可以更好在組織站點(diǎn),減少用戶過濾網(wǎng)站信息的負(fù)擔(dān),哪些商品顧客會(huì)可能在一次購物時(shí)同時(shí)購買?關(guān)聯(lián)規(guī)則技術(shù)能夠通過購物籃中的不同商品之間的聯(lián)系,分析顧客的購物習(xí)慣。例如購買牛奶的顧客90%會(huì)同時(shí)還購買面包,這就是一條關(guān)聯(lián)規(guī)則,如果商店或電子商務(wù)網(wǎng)站將這兩種商品放在一起銷售,將會(huì)提高它們的銷量。關(guān)聯(lián)規(guī)則挖掘目標(biāo)是利用工具分析出顧客購買商品間的聯(lián)系,也即典型購物籃數(shù)據(jù)分析應(yīng)用。關(guān)聯(lián)規(guī)則是發(fā)現(xiàn)同類事件中不同項(xiàng)目的相關(guān)性,例如手機(jī)加充電寶,鼠標(biāo)加鼠標(biāo)墊等購買習(xí)慣就屬于關(guān)聯(lián)分析。關(guān)聯(lián)規(guī)則挖掘技術(shù)可以用相應(yīng)算法找出關(guān)聯(lián)規(guī)則,例如在上述例子中,商家可以依據(jù)商品間的關(guān)聯(lián)改進(jìn)商品的擺放,如果顧客購買了手機(jī)則將充電寶放入推薦的商品中,如果一些商品被同時(shí)購買的概率較大,說明這些商品存在關(guān)聯(lián)性,商家可以將這些有關(guān)聯(lián)的商品鏈接放在一起推薦給客戶,有利于商品的銷售,商家也根據(jù)關(guān)聯(lián)有效搭配進(jìn)貨,提升商品管理水平。如買了燈具的顧客,多半還會(huì)購買開關(guān)插座,因此,一般會(huì)將燈具與開關(guān)插座等物品放在一個(gè)區(qū)域供顧客選購。依據(jù)分析找出顧客所需要的商品的關(guān)聯(lián)規(guī)則,由挖掘分析結(jié)果向顧客推薦所需商品,也即向顧客提出可能會(huì)感興趣的商品推薦,將會(huì)大大提高商品的銷售量。

3)電子商務(wù)中路徑分析技術(shù)的應(yīng)用

路徑分析技術(shù)通過對Web服務(wù)器的日志文件中客戶訪問站點(diǎn)的訪問次數(shù)的分析,用來發(fā)現(xiàn)Web站點(diǎn)中最經(jīng)常訪問的路徑來調(diào)整站點(diǎn)結(jié)構(gòu),從而幫助使用用戶以最快的速度找到其所需要的產(chǎn)品或是信息。例如在用戶訪問某網(wǎng)站時(shí),如果有很多用戶不感興趣的頁面存在,就會(huì)影響用戶的網(wǎng)頁瀏覽速度,從而降低用戶的瀏覽興趣,同時(shí)也會(huì)使整個(gè)站點(diǎn)的維護(hù)成本提高。而利用路徑分析技術(shù)能夠全面地掌握網(wǎng)站各個(gè)頁面之間的關(guān)聯(lián)以及超鏈接之間的聯(lián)系,通過分析得出訪問頻率最高的頁面,從而改進(jìn)網(wǎng)站結(jié)構(gòu)及頁面的設(shè)計(jì)。

4)電子商務(wù)中分類分析的應(yīng)用

分類技術(shù)在根據(jù)各種預(yù)定義規(guī)則進(jìn)行用戶建模的Web分析應(yīng)用中扮演著很重要的角色。例如,給出一組用戶事務(wù),可以計(jì)算每個(gè)用戶在某個(gè)期間內(nèi)購買記錄總和?;谶@些數(shù)據(jù),可以建立一個(gè)分類模型,將用戶分成有購買傾向和沒有購買傾向兩類,考慮的特征如用戶統(tǒng)計(jì)屬性以及他們的導(dǎo)航活動(dòng)。分類技術(shù)既可以用于預(yù)測哪些購買客戶對于哪類促銷手段感興趣,也可以預(yù)測和劃分顧客類別。在電子商務(wù)中通過分類分析,可以得知各類客戶的興趣愛好和商品購買意向,因而發(fā)現(xiàn)一些潛在的購買客戶,從而為每一類客戶提供個(gè)性化的網(wǎng)絡(luò)服務(wù)及開展針對性的商務(wù)活動(dòng)。通過分類定位模型輔助決策人員定位他們的最佳客戶和潛在客戶,提高客戶滿意度及忠誠度,最大化客戶收益率,以降低成本,增加收入。

5)電子商務(wù)中聚類分析的應(yīng)用

聚類技術(shù)可以將具有相同特征的數(shù)據(jù)項(xiàng)聚成一類。聚類分析是對數(shù)據(jù)庫中相關(guān)數(shù)據(jù)進(jìn)行對比并找出各數(shù)據(jù)之間的關(guān)系,將不同性質(zhì)特征的數(shù)據(jù)進(jìn)行分類。聚類分析的目標(biāo)是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類。根據(jù)具有相同或相似的顧客購買行為和顧客特征,利用聚類分析技術(shù)將市場有效地細(xì)分,細(xì)分后應(yīng)可每類市場都制定有針對性的市場營銷策略。聚類分別有頁面聚類和用戶聚類兩種。用戶聚類是為了建立擁有相同瀏覽模式的用戶分組,可以在電子中商務(wù)中進(jìn)行市場劃分或給具有相似興趣的用戶提供個(gè)性化的Web內(nèi)容,更多在用戶分組上基于用戶統(tǒng)計(jì)屬性(如年齡、性別、收入等)的分析可以發(fā)現(xiàn)有價(jià)值的商業(yè)智能。在電子商務(wù)中將市場進(jìn)行細(xì)化的區(qū)分就是運(yùn)用聚類分析技術(shù)。聚類分析可根據(jù)顧客的購買行為來劃分不同顧客特征的不同顧客群,通過聚類具有類似瀏覽行為的客戶,讓市場人員對顧客進(jìn)行類別細(xì)分,能夠給顧客提供更人性化的貼心服務(wù)。比如通過聚類技術(shù)分析,發(fā)現(xiàn)一些顧客喜歡訪問有關(guān)汽車配件網(wǎng)頁內(nèi)容,就可以動(dòng)態(tài)改變站點(diǎn)內(nèi)容,讓網(wǎng)絡(luò)自動(dòng)地給這些顧客聚類發(fā)送有關(guān)汽車配件的新產(chǎn)品信息或郵件。分類和聚類往往是相互作用的。在電子商務(wù)中通過聚類行為或習(xí)性相似的顧客,給顧客提供更滿意的服務(wù)。技術(shù)人員在分析中先用聚類分析將要分析的數(shù)據(jù)進(jìn)行聚類細(xì)分,然后用分類分析對數(shù)據(jù)集合進(jìn)行分類標(biāo)記,再將該標(biāo)記重新進(jìn)行分類,一直如此循環(huán)兩種分析方法得到相對滿意的結(jié)果。

5結(jié)語

隨著互聯(lián)網(wǎng)的飛速發(fā)展,大數(shù)據(jù)分析應(yīng)用越來越廣。商業(yè)貿(mào)易中電子商務(wù)所占比例越來越大,使用web挖掘技術(shù)對商業(yè)海量數(shù)據(jù)進(jìn)行挖掘處理,分析客戶購買喜好、跟蹤市場變化,調(diào)整銷售策略,對決策者做出有效決策及提高企業(yè)的市場競爭力有重要意義。

參考文獻(xiàn):

[1]龐英智.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].情報(bào)科學(xué),2011,29(2):235-240.

[2]馬宗亞,張會(huì)彥.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用研究[J].現(xiàn)代經(jīng)濟(jì)信息,2014(6):23-24.

[3]徐劍彬.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].時(shí)代金融,2013(4):234-235.208

[4]周世東.Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用研究[D].北京交通大學(xué),2008.

[5]段紅英.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].隴東學(xué)院學(xué)報(bào),2009(3):32-34.

作者:王凡帆 李小玲 單位:海南經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院