公務(wù)員期刊網(wǎng) 論文中心 正文

數(shù)據(jù)挖掘下的用戶(hù)行為分析

前言:想要寫(xiě)出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘下的用戶(hù)行為分析范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。

數(shù)據(jù)挖掘下的用戶(hù)行為分析

摘要:伴隨我國(guó)網(wǎng)絡(luò)信息化技術(shù)不斷創(chuàng)新,“數(shù)據(jù)挖掘”作為數(shù)據(jù)分析、發(fā)展趨勢(shì)及創(chuàng)新手段,其重要性不言而喻。通過(guò)近年來(lái)研究發(fā)現(xiàn),“數(shù)據(jù)挖掘”應(yīng)用的科學(xué)性與優(yōu)化性對(duì)數(shù)據(jù)質(zhì)量提升、應(yīng)用效率提高、誤差減低等影響頗大。本次研究將基于數(shù)據(jù)挖掘的用戶(hù)行為進(jìn)行分析研究,為下一步工作開(kāi)展提供依據(jù)參考。

關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;用戶(hù)行為

前言

“數(shù)據(jù)挖掘”應(yīng)用是當(dāng)下我國(guó)各行業(yè)重要應(yīng)用技術(shù)之一,具有較大的意義影響。然而現(xiàn)階段有關(guān)我國(guó)基于數(shù)據(jù)挖掘的用戶(hù)行為分析研究相對(duì)較少,基于該問(wèn)題現(xiàn)狀,要求行之有效的方法對(duì)其進(jìn)行分析研究,如網(wǎng)絡(luò)用戶(hù)行為分析、建模與算法分析、大數(shù)據(jù)未來(lái)發(fā)展等,本次研究對(duì)基于數(shù)據(jù)挖掘的用戶(hù)行為進(jìn)行分析,有十分重要的理論意義。

1、數(shù)據(jù)挖掘概述

隨著我國(guó)科學(xué)技術(shù)不斷提升及發(fā)展,計(jì)算機(jī)、網(wǎng)絡(luò)信息及大數(shù)據(jù)技術(shù)逐漸得以廣泛應(yīng)用及研發(fā)。其中,最為重要的是大數(shù)據(jù)技術(shù),數(shù)據(jù)技術(shù)不是單一片面的簡(jiǎn)單流程,而是更為科學(xué)、合理的系統(tǒng)布局。從當(dāng)下我國(guó)對(duì)數(shù)據(jù)技術(shù)及相關(guān)專(zhuān)業(yè)理論的研究中可以得出,如何利用與發(fā)揮好“數(shù)據(jù)挖掘”對(duì)其提升應(yīng)用效果十分重要。數(shù)據(jù)挖掘是基于大數(shù)據(jù)技術(shù)下的一種核心應(yīng)用手段,對(duì)大數(shù)據(jù)技術(shù)得以發(fā)揮起到重要的推動(dòng)作用。數(shù)據(jù)挖掘是指對(duì)海量大數(shù)據(jù)內(nèi)容進(jìn)行識(shí)別、尋找其規(guī)律的一種保障技術(shù)。主要包括:數(shù)據(jù)準(zhǔn)備階段、規(guī)律尋找階段、規(guī)律表示階段。“數(shù)據(jù)挖掘”不是簡(jiǎn)單的基礎(chǔ)技術(shù),而是一種較為復(fù)雜、繁瑣的科學(xué)流程,其目的主要是實(shí)現(xiàn)人類(lèi)對(duì)海量數(shù)據(jù)的掌握、調(diào)取及利用,主要任務(wù)包括聚類(lèi)分析、關(guān)聯(lián)分析、異常分析、演變分析、特異群組分析、關(guān)聯(lián)分析等,如圖1:數(shù)據(jù)挖掘具有以下特點(diǎn):第一、發(fā)現(xiàn)性特點(diǎn),發(fā)現(xiàn)性特點(diǎn)是數(shù)據(jù)挖掘主要特征之一。由于海量數(shù)據(jù)容量之大,在對(duì)其進(jìn)行處理、利用過(guò)程中必然會(huì)受到諸多阻礙。通過(guò)數(shù)據(jù)挖掘可以對(duì)數(shù)據(jù)庫(kù)知識(shí)進(jìn)行尋找、提取。在該過(guò)程中“發(fā)現(xiàn)”特點(diǎn)較為明顯,它規(guī)避了傳統(tǒng)數(shù)據(jù)挖掘的形式化與流程性,提升了其整體效果與綜合利用。第二、涉及性特點(diǎn),涉及性特點(diǎn)主要是指數(shù)據(jù)挖掘的運(yùn)行及工作方式種類(lèi)較多??梢圆捎枚喾N不同方式及手段對(duì)數(shù)據(jù)知識(shí)進(jìn)行尋找、發(fā)現(xiàn)。第三、穩(wěn)定性特點(diǎn),數(shù)據(jù)挖掘最為基本的保障為“穩(wěn)定性”,在數(shù)據(jù)挖掘過(guò)程中不會(huì)受其他因素影響,對(duì)發(fā)現(xiàn)數(shù)據(jù)知識(shí)及關(guān)聯(lián)分析的精準(zhǔn)、可靠起到一定的安全保障作用。這也是數(shù)據(jù)挖掘最為重要的基礎(chǔ)核心之一[1]。

2、基于網(wǎng)絡(luò)時(shí)代的用戶(hù)行為的作用分析

2.1用戶(hù)行為決定企業(yè)盈利

隨著現(xiàn)階段我國(guó)網(wǎng)絡(luò)信息技術(shù)不斷發(fā)展,諸多網(wǎng)絡(luò)平臺(tái)與網(wǎng)絡(luò)服務(wù)都將“用戶(hù)需求”作為重要發(fā)展目標(biāo)。這也是相關(guān)網(wǎng)絡(luò)企業(yè)得以發(fā)展及規(guī)模壯大的重要基礎(chǔ)。企業(yè)的盈利性在于市場(chǎng)穩(wěn)定與滿足用戶(hù)。而用戶(hù)正是市場(chǎng)的重要根基。因此,基于上述情況科學(xué)、合理的對(duì)用戶(hù)行為進(jìn)行分析研究十分重要。用戶(hù)行為是指用戶(hù)基于某種網(wǎng)絡(luò)服務(wù)或平臺(tái)所提供的服務(wù)、體驗(yàn),而發(fā)生的一種主動(dòng)性消費(fèi)訴求及實(shí)際行為,體現(xiàn)了用戶(hù)主觀思想與心理需求。企業(yè)只有對(duì)用戶(hù)行為進(jìn)行有效分析,并根據(jù)其數(shù)據(jù)統(tǒng)計(jì)情況進(jìn)行運(yùn)營(yíng)、發(fā)展戰(zhàn)略制定,才能成為提升企業(yè)盈利的重要推手[2]。

2.2用戶(hù)行為決定平臺(tái)良性發(fā)展

當(dāng)下我國(guó)信息化建設(shè)正在快速發(fā)展,各領(lǐng)域、各行業(yè)都在融入大量信息化元素。如教育、醫(yī)療、電子商務(wù)、軍事、工業(yè)、科研等。這些行業(yè)領(lǐng)域都離不開(kāi)對(duì)“用戶(hù)行為”的分析研究。通過(guò)對(duì)用戶(hù)行為進(jìn)行及時(shí)、科學(xué)分析,可以對(duì)用戶(hù)需求與情況進(jìn)行全面掌握。并對(duì)其行業(yè)平臺(tái)發(fā)展與網(wǎng)絡(luò)資源利用尤為關(guān)鍵。因此,從行業(yè)網(wǎng)絡(luò)平臺(tái)良性發(fā)展的角度來(lái)講,加強(qiáng)對(duì)用戶(hù)行為的分析研究,將重點(diǎn)問(wèn)題與用戶(hù)需求進(jìn)行尋找、發(fā)現(xiàn),可以快速提升該行業(yè)平臺(tái)的運(yùn)行能力[3]。

3、用戶(hù)行為具體研究——基于數(shù)據(jù)挖掘技術(shù)

3.1網(wǎng)絡(luò)用戶(hù)行為分析

用戶(hù)行為分析主要是指對(duì)網(wǎng)絡(luò)用戶(hù)行為、上網(wǎng)規(guī)律及心理訴求的預(yù)測(cè)、判定。利用數(shù)據(jù)挖掘技術(shù)對(duì)網(wǎng)路用戶(hù)進(jìn)行分析研究,主要采用算法或模型構(gòu)建等方式完成。在該過(guò)程中通過(guò)對(duì)其進(jìn)行數(shù)據(jù)發(fā)現(xiàn)、尋找及分析,可以將用戶(hù)興趣作為網(wǎng)絡(luò)平臺(tái)重要經(jīng)營(yíng)發(fā)展策略,并為用戶(hù)分區(qū)提供關(guān)鍵理論依據(jù)。由于網(wǎng)路具有一定的虛擬性,其用戶(hù)行為也與實(shí)際用戶(hù)行為具有明顯差異。所以,在對(duì)其進(jìn)行分析過(guò)程中一定要對(duì)網(wǎng)絡(luò)用戶(hù)特點(diǎn)進(jìn)行了解掌握,具體特點(diǎn)如下:第一、技術(shù)性特點(diǎn),網(wǎng)絡(luò)用戶(hù)多為具有一定的計(jì)算機(jī)、網(wǎng)絡(luò)知識(shí),且信息化接受程度較高,通??梢元?dú)立完成其網(wǎng)絡(luò)操作。第二、隱蔽性特點(diǎn),網(wǎng)絡(luò)用戶(hù)基于虛擬世界與心理規(guī)避感,往往具有隱蔽性特點(diǎn),如修改相關(guān)信息內(nèi)容、刪除痕跡等。第三、個(gè)性強(qiáng)特點(diǎn),網(wǎng)絡(luò)世界是開(kāi)放的,網(wǎng)絡(luò)用戶(hù)通常不必局限于現(xiàn)實(shí)生活中的束縛與規(guī)定,可以獨(dú)立進(jìn)行意識(shí)及個(gè)性塑造、發(fā)揮[4]。

3.2建模與算法分析

第一、建模是利用數(shù)據(jù)挖掘進(jìn)行網(wǎng)絡(luò)用戶(hù)行為分析的重要基礎(chǔ),主要從用戶(hù)行為特征、用戶(hù)興趣入手對(duì)其進(jìn)行模型構(gòu)建,其目的是提升規(guī)范分析力度。以用戶(hù)興趣模型為案例,該模型主要包括關(guān)鍵字模型、主體模型、基本本體論模型、向量空間模型等。例如:關(guān)鍵字模型主要通過(guò)對(duì)用戶(hù)行為關(guān)鍵字的提取,如“咖啡”一詞可以代表喜歡喝咖啡的用戶(hù)。主題模型是采用用戶(hù)興趣歸納與分區(qū)的方式,將用戶(hù)行為及特點(diǎn)進(jìn)行集中體現(xiàn)與合理分區(qū)。第二、算法主要采用K-Means算法。通過(guò)K-Means算法可以輕松完成其聚類(lèi)。另外,一個(gè)科學(xué)、合理的用戶(hù)興趣模型順利構(gòu)建,主要是需要對(duì)優(yōu)秀且高效率用戶(hù)興趣模型算法的選擇及應(yīng)用。通過(guò)對(duì)相關(guān)數(shù)據(jù)信息整理后發(fā)現(xiàn),其用戶(hù)興趣模型算法主要包括:遺傳算法、聚類(lèi)算法、決策樹(shù)算法、貝葉斯算法等。但其效果最為明顯,且采用率最高的為“聚類(lèi)算法”。聚類(lèi)算法是指通過(guò)建立不同群組的用戶(hù)的興趣簇來(lái)劃分各用戶(hù),主要借助K-Means算法對(duì)用戶(hù)根據(jù)其興趣程度的權(quán)重進(jìn)行聚類(lèi),從而達(dá)到對(duì)用戶(hù)進(jìn)行興趣的劃分[5]。

4、“數(shù)據(jù)挖掘”技術(shù)的未來(lái)發(fā)展

4.1時(shí)展的必然產(chǎn)物

隨著網(wǎng)絡(luò)信息技術(shù)不斷普及應(yīng)用,大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨。大數(shù)據(jù)時(shí)代是指通過(guò)數(shù)據(jù)共享、數(shù)據(jù)采集、數(shù)據(jù)海量存儲(chǔ)等實(shí)現(xiàn)資源互利、數(shù)據(jù)傳輸及應(yīng)用發(fā)展時(shí)代。大數(shù)據(jù)時(shí)代下最為代表性的就是“數(shù)據(jù)挖掘技術(shù)”。數(shù)據(jù)挖掘技術(shù)通常是指網(wǎng)絡(luò)技術(shù)、計(jì)算機(jī)技術(shù)、通訊技術(shù)及相關(guān)衍生出來(lái)的傳感技術(shù)、自動(dòng)電氣化及人工智能技術(shù)等[1]。數(shù)據(jù)挖掘技術(shù)范圍、范疇較寬。從其實(shí)用性及作用性角度來(lái)講,數(shù)據(jù)挖掘技術(shù)分為監(jiān)控、智能及保障三大方面。隨著我國(guó)科學(xué)技術(shù)水平不斷創(chuàng)新突破,數(shù)據(jù)挖掘技術(shù)也隨之日益更新,在諸多領(lǐng)域及行業(yè)中都較為常見(jiàn),已經(jīng)滲入到人們?nèi)粘I罴吧a(chǎn)建設(shè)中去[6]。

4.2實(shí)現(xiàn)數(shù)據(jù)信息化呈現(xiàn)

數(shù)據(jù)挖掘用戶(hù)行為分析的最大作用是為網(wǎng)絡(luò)平臺(tái)提供更為精準(zhǔn)的數(shù)據(jù)信息,并使其數(shù)據(jù)信息以立體性、數(shù)字化信息形式呈現(xiàn)出來(lái),我國(guó)現(xiàn)階段數(shù)據(jù)挖掘技術(shù)主要以數(shù)據(jù)智能分析為主,結(jié)束了以往的傳統(tǒng)分析模式,通過(guò)對(duì)用戶(hù)信息樣本、特征采集,通過(guò)尋找后以信息化數(shù)據(jù)形式呈現(xiàn)出來(lái),為網(wǎng)絡(luò)平臺(tái)戰(zhàn)略發(fā)展提供更為科學(xué)、準(zhǔn)確的信息參考。這種參考性主要體現(xiàn)在應(yīng)對(duì)經(jīng)營(yíng)預(yù)案明確方面。而通過(guò)數(shù)據(jù)信息化呈現(xiàn),可以讓相關(guān)技術(shù)人員更為立體、鮮明的掌握其用戶(hù)需求,為下一步工作開(kāi)展打下基礎(chǔ)[7]。其統(tǒng)計(jì)效率、統(tǒng)計(jì)質(zhì)量、統(tǒng)計(jì)速度之快、之準(zhǔn)、之全較為完善,可以為日后相關(guān)工作開(kāi)展及信息掌握起到積極參考作用,其價(jià)值性不言而喻。

結(jié)論

綜上所述,通過(guò)對(duì)基于數(shù)據(jù)挖掘的用戶(hù)行為進(jìn)行分析研究,主要包括:數(shù)據(jù)挖掘概述、基于網(wǎng)絡(luò)時(shí)代的用戶(hù)行為的作用分析,其包括用戶(hù)行為決定企業(yè)盈利、用戶(hù)行為決定平臺(tái)良性發(fā)展、基于數(shù)據(jù)挖掘技術(shù)用戶(hù)行為具體研究,其包括網(wǎng)絡(luò)用戶(hù)行為分析、建模與算法分析、大數(shù)據(jù)未來(lái)發(fā)展等,從多方面、多角度對(duì)基于數(shù)據(jù)挖掘的用戶(hù)行為進(jìn)行闡明,為下一步工作開(kāi)展奠定堅(jiān)實(shí)基礎(chǔ)。

參考文獻(xiàn):

[1]張利利,馬艷琴.基于數(shù)據(jù)挖掘技術(shù)的航空客戶(hù)流失與細(xì)分研究及R語(yǔ)言程序?qū)崿F(xiàn)[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2019(6).

[2]孫欣,李俊飚,張亞迪,等.基于數(shù)據(jù)挖掘技術(shù)的嘉定地區(qū)電動(dòng)汽車(chē)個(gè)人用戶(hù)充電樁信息分析[J].電力與能源,2019,40(02):75-77+110.

[3]周浩,林波榮,張仲宸,等.基于數(shù)據(jù)挖掘技術(shù)的北方寒冷地區(qū)居民用水、用氣數(shù)據(jù)處理方法探討[J].暖通空調(diào),2019,49(02):64-72.

[4]韋建國(guó),王玉瓊.基于網(wǎng)購(gòu)平臺(tái)大數(shù)據(jù)的電子商務(wù)用戶(hù)行為分析與研究[J].湖北理工學(xué)院學(xué)報(bào),2019(3).

[5]楊國(guó)勝,郭貝貝.機(jī)器學(xué)習(xí)增強(qiáng)的電子商務(wù)平臺(tái)用戶(hù)行為預(yù)測(cè)[J].科技與創(chuàng)新,2019,121(01):130-131.

[6]劉娜娜,張強(qiáng).基于電商平臺(tái)的消費(fèi)者需求及產(chǎn)品數(shù)據(jù)挖掘技術(shù)分析[J].內(nèi)蒙古統(tǒng)計(jì),2019(01):42-45.

[7]楊奕,張毅,李梅,等.基于LDA模型的公眾反饋意見(jiàn)采納研究——共享單車(chē)政策修訂與數(shù)據(jù)挖掘的對(duì)比分析[J].情報(bào)科學(xué),2019,37(01):88-95.

作者:金琳 單位:鹽城工學(xué)院