公務(wù)員期刊網(wǎng) 論文中心 正文

大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘思考分析

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘思考分析范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。

大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘思考分析

摘要:科學(xué)技術(shù)的發(fā)展與變化給人們的生活帶來(lái)了較多的便利,大數(shù)據(jù)時(shí)代的來(lái)臨也讓人們感受到了數(shù)據(jù)信息的重要性。結(jié)合當(dāng)前大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘技術(shù)的發(fā)展變化過(guò)程進(jìn)行分析,研究合理應(yīng)用數(shù)據(jù)挖掘技術(shù)的策略措施,期望通過(guò)對(duì)大數(shù)據(jù)時(shí)代未來(lái)的發(fā)展展望,展現(xiàn)出數(shù)據(jù)挖掘技術(shù)的有效作用以及相關(guān)信息價(jià)值,進(jìn)而讓人們體會(huì)到大數(shù)據(jù)等先進(jìn)技術(shù)的有效應(yīng)用與價(jià)值。

關(guān)鍵詞:大數(shù)據(jù)時(shí)代;數(shù)據(jù)挖掘技術(shù);應(yīng)用

大數(shù)據(jù)時(shí)代,信息數(shù)據(jù)處理水平已經(jīng)成為各行業(yè)發(fā)展的核心競(jìng)爭(zhēng)力與發(fā)展基礎(chǔ)。深入挖掘數(shù)據(jù)信息中存在的價(jià)值,合理運(yùn)用數(shù)據(jù)挖掘技術(shù)提升數(shù)據(jù)價(jià)值,不僅能夠及時(shí)掌握市場(chǎng)行業(yè)的未來(lái)發(fā)展動(dòng)向,也能夠幫助一些企業(yè)解決當(dāng)前存在的發(fā)展危機(jī)。尤其是一些對(duì)信息技術(shù)應(yīng)用要求比較高的重要發(fā)展領(lǐng)域,合理運(yùn)用數(shù)據(jù)挖掘技術(shù),不僅能夠在混亂的信息數(shù)據(jù)中發(fā)現(xiàn)隱藏的商機(jī)與未來(lái)發(fā)展市場(chǎng),也能夠直接結(jié)合企業(yè)的實(shí)際發(fā)展目標(biāo)與實(shí)力,創(chuàng)造出更多的生產(chǎn)價(jià)值與自我提升空間。

1數(shù)據(jù)挖掘

1.1概念

數(shù)據(jù)挖掘技術(shù)顧名思義,需要在大量且繁雜的數(shù)據(jù)中挖掘出具有價(jià)值意義的數(shù)據(jù)信息。就一般情況來(lái)說(shuō),數(shù)據(jù)挖掘主要應(yīng)用在文本數(shù)據(jù)以及圖像數(shù)據(jù)中,作為分析、整理或者預(yù)測(cè)風(fēng)險(xiǎn)的基礎(chǔ)技術(shù)手段,數(shù)據(jù)挖掘技術(shù)能夠在海量的信息數(shù)據(jù)中精確尋找到目標(biāo)數(shù)據(jù)內(nèi)容。當(dāng)然,面對(duì)不同的應(yīng)用領(lǐng)域,數(shù)據(jù)挖掘技術(shù)也需要根據(jù)實(shí)際情況做好具體的分析,甚至需要配合不同場(chǎng)景情況以及需求進(jìn)行合理升級(jí)、轉(zhuǎn)型應(yīng)用。其中,數(shù)據(jù)挖掘技術(shù)在商業(yè)市場(chǎng)的用途相對(duì)比較廣泛,一些企業(yè)或者公司為了提升企業(yè)或者品牌的核心競(jìng)爭(zhēng)力,可能會(huì)利用數(shù)據(jù)挖掘處理技術(shù)處理客戶信息,首先可以在客戶數(shù)據(jù)庫(kù)中提取眾多目標(biāo)信息類型,然后結(jié)合不同的公式算法分析出適合企業(yè)未來(lái)的商業(yè)發(fā)展目標(biāo),根據(jù)用戶的接受程度與營(yíng)銷業(yè)績(jī)進(jìn)行相應(yīng)的技術(shù)創(chuàng)新與管理改革,在有效提升企業(yè)業(yè)績(jī)的同時(shí),也能夠拓展市場(chǎng)影響力[1]。

1.2實(shí)際過(guò)程解析

當(dāng)前社會(huì),利用數(shù)據(jù)信息創(chuàng)造經(jīng)濟(jì)價(jià)值已經(jīng)比較常見(jiàn),作為時(shí)展的流行趨勢(shì),數(shù)據(jù)挖掘技術(shù)確實(shí)展現(xiàn)了比較突出的時(shí)展特征。(1)收集并提取信息。想要獲取有價(jià)值的信息內(nèi)容,海量的數(shù)據(jù)基礎(chǔ)是實(shí)現(xiàn)目標(biāo)的第一步,類似于傳統(tǒng)觀念中的“積累經(jīng)驗(yàn)”,大量的數(shù)據(jù)信息收集能夠減少眾多“試錯(cuò)”的成本,比如:商業(yè)營(yíng)銷項(xiàng)目方案在開(kāi)始設(shè)計(jì)之前可以利用現(xiàn)有的數(shù)據(jù)庫(kù)信息整理出適合的目標(biāo)區(qū)域或者客戶群體,在有效提升市場(chǎng)調(diào)查效率與成果質(zhì)量的同時(shí),也能夠保障營(yíng)銷方案的成功率。相對(duì)于傳統(tǒng)時(shí)期分發(fā)大量的征集表格,網(wǎng)絡(luò)信息傳播的效率也比較高,而且隱秘性的信息征集模式也能夠提升數(shù)據(jù)信息質(zhì)量。(2)利用合適的數(shù)據(jù)信息處理模型或者公式篩選有價(jià)值的信息數(shù)據(jù)。大數(shù)據(jù)時(shí)代,信息收集速度確實(shí)比較快,且相對(duì)應(yīng)的成本也比較低,但是,頻繁地進(jìn)行數(shù)據(jù)收集也存在一些弊端,尤其是在信息質(zhì)量問(wèn)題上,廣泛的來(lái)源可能意味著數(shù)據(jù)信息質(zhì)量也會(huì)存在參差不齊等問(wèn)題,甚至一些數(shù)據(jù)處理模型由于建立初期的方向比較不合適,處理后的信息結(jié)果也可能會(huì)存在一定的誤導(dǎo)性,為了避免后期呈現(xiàn)錯(cuò)誤結(jié)果,項(xiàng)目在初期階段,數(shù)據(jù)整理期間做好篩選工作,避免后期結(jié)果校對(duì)期間發(fā)現(xiàn)問(wèn)題原因,提升數(shù)據(jù)處理成本。(3)分析結(jié)果的處理與改進(jìn)。數(shù)據(jù)挖掘技術(shù)并不是簡(jiǎn)單工具,其本身就具有一定的學(xué)習(xí)能力,一些項(xiàng)目在不斷增加數(shù)據(jù)處理量的情況下,數(shù)據(jù)挖掘技術(shù)處理后的數(shù)據(jù)結(jié)果一般具有較高的精確性,但是,數(shù)據(jù)收集期間,系統(tǒng)可能也會(huì)由于算法的升級(jí)或者自主學(xué)習(xí)能力,運(yùn)用了一些模塊化的技術(shù)處理方式,忽視了信息數(shù)據(jù)中本身存在的差異性問(wèn)題,進(jìn)而技術(shù)應(yīng)用期間也需要注意及時(shí)維護(hù),不能由于過(guò)度依賴數(shù)據(jù)挖掘技術(shù)忽視數(shù)據(jù)信息的發(fā)展規(guī)律。可以定期進(jìn)行數(shù)據(jù)算法的調(diào)整分析,在有效提升數(shù)據(jù)模型準(zhǔn)確性的同時(shí),也能夠避免智能信息處理系統(tǒng)出現(xiàn)問(wèn)題。

2數(shù)據(jù)挖掘方式

2.1聚類分析

簡(jiǎn)化數(shù)據(jù)信息,通過(guò)將類似的信息數(shù)據(jù)進(jìn)行整理,能夠獲得具有較多共通性的數(shù)據(jù)信息內(nèi)容。大數(shù)據(jù)時(shí)代背景下,利用聚類分析的數(shù)據(jù)挖掘技術(shù)分析目標(biāo)數(shù)據(jù),就會(huì)發(fā)現(xiàn)不同信息數(shù)據(jù)存在的共通性特點(diǎn)。這種總結(jié)分析多種數(shù)據(jù)中潛在規(guī)律的方式就被稱作為聚類分析方式。一般來(lái)說(shuō),聚類分析方式會(huì)用于生物學(xué)、應(yīng)用心理學(xué)以及人工智能學(xué)習(xí)等領(lǐng)域,在實(shí)際應(yīng)用期間會(huì)根據(jù)不同層次或者類型的數(shù)據(jù)信息,進(jìn)行聚類整合分析,不僅能夠有效提升數(shù)據(jù)處理效率,也能夠及時(shí)總結(jié)信息數(shù)據(jù)中存在的潛在規(guī)律。

2.2關(guān)聯(lián)性分析

不同事物與信息數(shù)據(jù)中,往往會(huì)存在一定的關(guān)聯(lián)性,針對(duì)不同信息數(shù)據(jù)中存在的關(guān)聯(lián)性進(jìn)行挖掘,就會(huì)發(fā)現(xiàn)其中蘊(yùn)含的規(guī)律問(wèn)題,針對(duì)該類型的數(shù)據(jù)挖掘分析方式就被稱作為關(guān)聯(lián)性分析法。比如:在超市等大型營(yíng)銷環(huán)境中,收集用戶信息已經(jīng)成為行業(yè)發(fā)展共識(shí)。一般超市會(huì)利用后臺(tái)數(shù)據(jù)收集用戶的購(gòu)買數(shù)據(jù),并根據(jù)數(shù)據(jù)發(fā)展趨勢(shì)分析出不同年齡或者群體用戶的大概消費(fèi)習(xí)慣,精確性的營(yíng)銷方案能夠有效提升營(yíng)業(yè)業(yè)績(jī)。定期開(kāi)展會(huì)員積分兌換、會(huì)員日等優(yōu)惠活動(dòng),就能夠提升會(huì)員用戶的消費(fèi)積極性,進(jìn)而在數(shù)據(jù)采集期間利用關(guān)聯(lián)性的數(shù)據(jù)分析方式,了解范圍內(nèi)會(huì)員的消費(fèi)習(xí)慣趨勢(shì),通過(guò)數(shù)據(jù)信息的深入挖掘與整理,分析出不同商品之間的關(guān)聯(lián)性。其中,一些商超會(huì)利用“買一贈(zèng)一”、高低利潤(rùn)物品捆綁銷售等營(yíng)銷方案,激發(fā)消費(fèi)者的購(gòu)買欲望,提升營(yíng)業(yè)業(yè)績(jī),消耗積壓庫(kù)存,在不斷提升營(yíng)業(yè)業(yè)績(jī)的同時(shí),也能夠利用數(shù)據(jù)調(diào)查回饋調(diào)整采購(gòu)方案[2]。

2.3神經(jīng)網(wǎng)絡(luò)模擬分析

相對(duì)于其他物種,人類的大腦一直是各種高科技研究領(lǐng)域的核心研究對(duì)象,利用數(shù)據(jù)模型模擬人類大腦的神經(jīng)網(wǎng)絡(luò)工作模式,能夠在處理一些精細(xì)化數(shù)據(jù)、非線性數(shù)據(jù)或者特殊性數(shù)據(jù)應(yīng)用情境中發(fā)揮較強(qiáng)的優(yōu)勢(shì)。當(dāng)前,比較常見(jiàn)的人工神經(jīng)網(wǎng)絡(luò)的模擬系統(tǒng),一般都是由特殊算法以及反向的傳播網(wǎng)絡(luò)、函數(shù)算法神經(jīng)網(wǎng)絡(luò)等方式組合而成的。

2.4遺傳基因算法分析

遺傳基因與大腦神經(jīng)元網(wǎng)絡(luò)都是大數(shù)據(jù)時(shí)代數(shù)據(jù)分析期間主要研究、突破的方向,相對(duì)于比較系統(tǒng)化的人工神經(jīng)網(wǎng)絡(luò),遺傳基因具有較多變量特征,對(duì)于不同形式的信息數(shù)據(jù)演變變化也具有一定的預(yù)測(cè)能力。目前來(lái)說(shuō),遺傳基因式的算法分析主要應(yīng)用在信息系統(tǒng)中的風(fēng)險(xiǎn)評(píng)估等領(lǐng)域,在未來(lái)發(fā)展期間也具有較為廣闊的市場(chǎng)前景。

3應(yīng)用思考

大數(shù)據(jù)時(shí)代,數(shù)據(jù)挖掘技術(shù)的應(yīng)用價(jià)值具有較多隱藏的開(kāi)發(fā)空間,不同的領(lǐng)域與行業(yè)在實(shí)際應(yīng)用期間可能會(huì)遇到不同的問(wèn)題情況。針對(duì)不同領(lǐng)域的實(shí)際應(yīng)用情況進(jìn)行分析,研究數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用方式,不僅能夠有效促進(jìn)各行業(yè)的發(fā)展與進(jìn)步,也能夠根據(jù)時(shí)代技術(shù)發(fā)展變化進(jìn)行相應(yīng)的調(diào)整與整理[3]。

3.1商業(yè)市場(chǎng)發(fā)展

數(shù)據(jù)信息技術(shù)的發(fā)展價(jià)值起初就已經(jīng)應(yīng)用在市場(chǎng)營(yíng)銷領(lǐng)域,對(duì)于市場(chǎng)行業(yè)來(lái)說(shuō),商業(yè)價(jià)值是數(shù)據(jù)挖掘技術(shù)的主要應(yīng)用方向,眾多商業(yè)企業(yè)與單位想要保障營(yíng)銷業(yè)績(jī),可以通過(guò)加強(qiáng)大數(shù)據(jù)應(yīng)用的方式,分析總結(jié)消費(fèi)者的消費(fèi)習(xí)慣、消費(fèi)水平以及相關(guān)的消費(fèi)特點(diǎn)。結(jié)合實(shí)際的銷售業(yè)績(jī)與數(shù)據(jù)分析結(jié)果,選擇合適的營(yíng)銷策略以及方案,通過(guò)營(yíng)銷業(yè)績(jī)的不斷提升與進(jìn)步,推動(dòng)企業(yè)經(jīng)濟(jì)水平與核心競(jìng)爭(zhēng)力不斷提升與進(jìn)步。另外,關(guān)于商業(yè)投資方面,也可以應(yīng)用數(shù)據(jù)挖掘技術(shù),當(dāng)前信息化大量普及的社會(huì)發(fā)展背景下,眾多企業(yè)與經(jīng)營(yíng)者的信息都會(huì)被錄入信息數(shù)據(jù)庫(kù),想要了解投資項(xiàng)目中合作方的經(jīng)濟(jì)實(shí)力以及多方面信息,不僅可以利用數(shù)據(jù)分析結(jié)果了解,也能夠分析出合作方的未來(lái)發(fā)展形式,通過(guò)風(fēng)險(xiǎn)預(yù)估等方式最大程度減少企業(yè)經(jīng)濟(jì)損失風(fēng)險(xiǎn)。當(dāng)然,一些小型的金融貸款業(yè)務(wù)也可以利用數(shù)據(jù)分析結(jié)果,判定客戶是否具有經(jīng)濟(jì)還款實(shí)力,多維度以及高時(shí)效性的監(jiān)控管理,不僅能夠及時(shí)調(diào)整信貸策略,也能夠避免市場(chǎng)發(fā)展變化影響企業(yè)穩(wěn)定發(fā)展。

3.2科學(xué)項(xiàng)目研究

科學(xué)的發(fā)展與進(jìn)步離不開(kāi)技術(shù)水平的不斷上升,信息技術(shù)在當(dāng)前的科學(xué)研究領(lǐng)域的應(yīng)用已經(jīng)比較普遍,尤其是一些人工智能科學(xué)技術(shù)的研究,數(shù)據(jù)挖掘技術(shù)不僅能夠通過(guò)優(yōu)勢(shì)的信息數(shù)據(jù)基礎(chǔ),也能夠通過(guò)一些算法公式的優(yōu)化,提升技術(shù)發(fā)展水平。尤其是一些項(xiàng)目類型比較復(fù)雜的科學(xué)實(shí)驗(yàn),大量的數(shù)據(jù)信息不僅儲(chǔ)存記錄比較費(fèi)時(shí)費(fèi)力,人工數(shù)據(jù)處理可有力會(huì)由于各種不足造成數(shù)據(jù)結(jié)果的偏差,數(shù)據(jù)技術(shù)的應(yīng)用不僅解決了相關(guān)信息儲(chǔ)存問(wèn)題,也能夠直接處理數(shù)據(jù)信息之間存在的細(xì)微差別,通過(guò)對(duì)比分析,在有效提升實(shí)驗(yàn)質(zhì)量效率的同時(shí),也能夠?yàn)榭茖W(xué)實(shí)驗(yàn)結(jié)果提供一些預(yù)測(cè)分析,及時(shí)將實(shí)驗(yàn)風(fēng)險(xiǎn)進(jìn)行管控[4]。

3.3醫(yī)學(xué)

目前來(lái)說(shuō),醫(yī)學(xué)領(lǐng)域?qū)τ跀?shù)據(jù)挖掘技術(shù)的應(yīng)用場(chǎng)景比較多,尤其是一線醫(yī)務(wù)人員每天需要面臨大量患者的情況下,醫(yī)療工作者難免會(huì)由于工作壓力產(chǎn)生疲勞感,利用數(shù)據(jù)挖掘技術(shù)不僅能夠?qū)颊卟∏檫M(jìn)行多方面的癥狀匹配對(duì)比,也能夠緩解醫(yī)療工作者的工作壓力。尤其是一些簡(jiǎn)單的圖像處理工作,利用數(shù)據(jù)挖掘技術(shù)不僅能夠提升醫(yī)療行業(yè)的服務(wù)水平,也能夠利用大數(shù)據(jù)分析技術(shù),總結(jié)該地域易感的高發(fā)病癥,通過(guò)多元化的考察分析,研究導(dǎo)致該病癥問(wèn)題的核心元素,多元化的技術(shù)發(fā)展不僅能夠有效減少病癥患者人數(shù),也能夠根據(jù)不同季節(jié)規(guī)律制定相應(yīng)的人員調(diào)整計(jì)劃。另外,需要醫(yī)療人員注意的問(wèn)題是,過(guò)度依賴數(shù)據(jù)挖掘技術(shù)也不利于醫(yī)療領(lǐng)域快速發(fā)展,只有在不斷提升自身專業(yè)能力并合理應(yīng)用數(shù)據(jù)挖掘技術(shù)的同時(shí),才能夠不斷推動(dòng)醫(yī)療服務(wù)行業(yè)的穩(wěn)定發(fā)展與進(jìn)步。

3.4教育

數(shù)據(jù)挖掘技術(shù)不僅能夠應(yīng)用在教育專業(yè)改良方面,也能夠在校園環(huán)境之外為教師與學(xué)生營(yíng)造良好的教育發(fā)展環(huán)境。尤其是關(guān)于資源配置等方面,一些學(xué)生可能在家長(zhǎng)的帶領(lǐng)下,已經(jīng)在線上接觸了課程知識(shí)內(nèi)容,對(duì)于學(xué)生的自主學(xué)習(xí)教師應(yīng)當(dāng)給予合適的肯定與表?yè)P(yáng),但是一些家長(zhǎng)與學(xué)生可能由于本身的專業(yè)辨別能力有限,并不能在大量的教育資源中找到合適的學(xué)習(xí)資料。針對(duì)該問(wèn)題現(xiàn)象,作為課程教師以及相關(guān)的從業(yè)人員,可以利用大數(shù)據(jù)挖掘技術(shù),為學(xué)生尋找、匹配一些合適的數(shù)據(jù)信息,利用信息整合、篩選等方式,為學(xué)生篩選適合學(xué)生當(dāng)前學(xué)習(xí)水平的課外閱讀資源以及相關(guān)的習(xí)題資料。

3.5網(wǎng)絡(luò)安全

網(wǎng)絡(luò)安全一直是近年來(lái)大家比較關(guān)注的問(wèn)題,針對(duì)不同的網(wǎng)絡(luò)安全問(wèn)題,數(shù)據(jù)挖掘技術(shù)可以提前進(jìn)行排查,在為普通大眾營(yíng)造良好網(wǎng)絡(luò)環(huán)境的同時(shí),也能夠及時(shí)打擊違法犯罪活動(dòng)[5]。尤其是一些本身存在安全威脅的流氓軟件或者病毒網(wǎng)站,利用數(shù)據(jù)挖掘技術(shù)手段不僅能夠進(jìn)行防范,也能夠利用追蹤等技術(shù)手段,追蹤一些違法犯罪分子,打擊違法犯罪行為與活動(dòng)。

4結(jié)語(yǔ)

時(shí)代的發(fā)展與進(jìn)步,離不開(kāi)信息技術(shù)的升級(jí)與更新,大數(shù)據(jù)時(shí)代,數(shù)據(jù)挖掘技術(shù)已經(jīng)被大眾所認(rèn)知,想要充分發(fā)揮數(shù)據(jù)信息的重要價(jià)值,不僅需要為大眾群體營(yíng)造良好的信息互動(dòng)環(huán)境,也需要根據(jù)不同領(lǐng)域的實(shí)際需求進(jìn)行合理的改良完善,在有效促進(jìn)各行業(yè)穩(wěn)定發(fā)展的同時(shí),也能夠?yàn)樯鐣?huì)發(fā)展貢獻(xiàn)一份力量。

參考文獻(xiàn)

[1]孫福利.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘技術(shù)與應(yīng)用[J].電子技術(shù)與軟件工程,2018,123(1):180.

[2]劉銘,呂丹,安永燦.大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].科技導(dǎo)報(bào),2018,(9).

[3]周凌.淺析大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘技術(shù)與應(yīng)用[J].中小企業(yè)管理與科技,2018,540(05):189-190.

[4]葉昱希.關(guān)于大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘在銀行中的應(yīng)用研究[J].現(xiàn)代營(yíng)銷:信息版,2019.

[5]張澤平.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘及應(yīng)用問(wèn)題分析[J].數(shù)字化用戶,2018,24(48):188.

作者:郭秀峰 單位:河南牧業(yè)經(jīng)濟(jì)學(xué)院信息工程學(xué)院