公務員期刊網(wǎng) 論文中心 正文

數(shù)據(jù)挖掘技術(shù)下的網(wǎng)絡(luò)信息安全對策

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘技術(shù)下的網(wǎng)絡(luò)信息安全對策范文,希望能給你帶來靈感和參考,敬請閱讀。

數(shù)據(jù)挖掘技術(shù)下的網(wǎng)絡(luò)信息安全對策

摘要:隨著計算機信息技術(shù)的飛速發(fā)展,大數(shù)據(jù)時代已經(jīng)到來,在互聯(lián)網(wǎng)技術(shù)的影響下,各行各業(yè)的進步與革新越來越離不開互聯(lián)網(wǎng)技術(shù)的推動作用。數(shù)據(jù)挖掘技術(shù)是大數(shù)據(jù)時代的產(chǎn)物,是數(shù)據(jù)處理的先進技術(shù),為我國經(jīng)濟社會的發(fā)展提供了有力的支持。結(jié)合行業(yè)內(nèi)的學術(shù)研究現(xiàn)狀,分析了當前大數(shù)據(jù)背景下數(shù)據(jù)挖掘技術(shù)的特點以及相關(guān)內(nèi)涵,并結(jié)合當前互聯(lián)網(wǎng)發(fā)展的現(xiàn)狀對數(shù)據(jù)挖掘技術(shù)支持下的網(wǎng)絡(luò)信息安全對策進行了研究與分析。

關(guān)鍵詞:數(shù)據(jù)挖掘;網(wǎng)絡(luò)信息安全;技術(shù);對策

1概述

進入21世紀以來,互聯(lián)網(wǎng)信息技術(shù)快速發(fā)展,各行各業(yè)與互聯(lián)網(wǎng)信息技術(shù)的結(jié)合越來越緊密,在這樣的發(fā)展趨勢下,互聯(lián)網(wǎng)上的各類數(shù)據(jù)信息呈現(xiàn)出爆發(fā)式的增長,數(shù)據(jù)的處理、存儲、訪問方式均與之前發(fā)生了巨大的變化。面對著數(shù)量眾多的信息技術(shù),數(shù)據(jù)挖掘技術(shù)應運而生,但是在數(shù)據(jù)挖掘技術(shù)的應用過程中,如何從海量的數(shù)據(jù)中挖掘到對人類社會以及經(jīng)濟發(fā)展有價值的數(shù)據(jù)信息就顯得尤為重要,尤其是要實現(xiàn)快速挖掘數(shù)據(jù)的同時保證網(wǎng)絡(luò)信息的安全,因此,研究數(shù)據(jù)挖掘技術(shù)支持下網(wǎng)絡(luò)信息安全對策對于我國經(jīng)濟社會的發(fā)展十分具有理論意義與實踐意義。

2數(shù)據(jù)挖掘技術(shù)的相關(guān)理論

2.1數(shù)據(jù)挖掘技術(shù)的概念

數(shù)據(jù)挖掘,顧名思義,就是從浩瀚的數(shù)據(jù)海洋中迅速地找到人們所需要的、有價值的數(shù)據(jù)信息,通過先進的計算機技術(shù)以及云計算等方法快速地提煉出所需信息。數(shù)據(jù)挖掘技術(shù)的數(shù)據(jù)來源必須是真實且有效的,最終所查找出來的信息也必須是對人們的生活工作有價值的。從理論上來分析,當數(shù)據(jù)挖掘技術(shù)所面臨的數(shù)據(jù)庫越大、數(shù)據(jù)越隨機,那么最終挖掘的結(jié)果也將會更加具有說服力和代表性,所以,數(shù)據(jù)挖掘技術(shù)的關(guān)鍵內(nèi)容在于數(shù)據(jù)的處理效率,尤其對于計算機的算法有著較高的要求。從目前學術(shù)界的研究情況來看,數(shù)據(jù)挖掘技術(shù)是一門多學科交叉的技術(shù),其中包含著經(jīng)濟學、統(tǒng)計學、人工智能、數(shù)據(jù)庫、計算機技術(shù)的內(nèi)容,將數(shù)據(jù)庫中離散分布的、無序的數(shù)據(jù)信息通過技術(shù)手段將其提升到有序、有價值的知識,從而為數(shù)據(jù)的使用者提供良好的決策信息。通俗地來說,數(shù)據(jù)挖掘技術(shù)就是通過先進的計算機技術(shù)將海量數(shù)據(jù)信息處理,找出數(shù)據(jù)與之間的規(guī)律與聯(lián)系,數(shù)據(jù)挖掘技術(shù)一般需要包含3個方面的內(nèi)容,分別是數(shù)據(jù)準備階段、數(shù)據(jù)信息挖掘階段、數(shù)據(jù)信息結(jié)果表達階段,這3個階段構(gòu)成了數(shù)據(jù)挖掘技術(shù)的主要內(nèi)容。

2.2數(shù)據(jù)挖掘技術(shù)的主要工作任務

在目前的研究內(nèi)容中,數(shù)據(jù)挖掘技術(shù)主要包含著監(jiān)督學習、關(guān)聯(lián)分析、聚類分析、異常數(shù)據(jù)檢測等任務。其中在監(jiān)督學習過程中,主要是對數(shù)據(jù)的總體情況進行識別與分析,通過對數(shù)據(jù)庫中已知的數(shù)據(jù)樣本的大小和類型來預測出所需要新的樣本的相關(guān)信息。關(guān)聯(lián)分析主要是通過檢索工作將數(shù)據(jù)之間的相似情況快速地找出來,進而分析出數(shù)據(jù)與數(shù)據(jù)之間的關(guān)聯(lián)性。聚類分析指的是對于一些具有相似性的數(shù)據(jù)找到它們內(nèi)部的一些共性規(guī)律及特征,并且按照特征進行劃分,將這些數(shù)據(jù)源劃分為若干個數(shù)據(jù)群。而異常檢測也是數(shù)據(jù)挖掘技術(shù)中一項關(guān)鍵的任務,在數(shù)據(jù)挖掘的過程中往往會建立一個數(shù)據(jù)樣本,將挖掘得到的數(shù)據(jù)與該樣本中的正確數(shù)據(jù)進行比對,從而找出挖掘數(shù)據(jù)中存在的異常數(shù)據(jù),提高數(shù)據(jù)挖掘結(jié)果的準確性。

3當前時代背景下網(wǎng)絡(luò)安全的新技術(shù)

3.1爬蟲技術(shù)

爬蟲技術(shù)是當前網(wǎng)絡(luò)信息安全背景的一種新技術(shù),它是一個能夠自動下載網(wǎng)頁的程序。在互聯(lián)網(wǎng)中存在著數(shù)以億計的網(wǎng)頁,而這些網(wǎng)頁通常分布在全球各地的不同服務器上,用戶在瀏覽網(wǎng)頁的時候可以同時打開不同的服務器進行切換和瀏覽,而爬蟲技術(shù)則是對這一行為的模仿,將多個服務器上的數(shù)據(jù)進行批量下載和瀏覽,然后將搜集到的數(shù)據(jù)集中傳輸在數(shù)據(jù)庫中,以供下一步的處理。

3.2規(guī)則引擎技術(shù)

數(shù)據(jù)的獲取是數(shù)據(jù)挖掘技術(shù)中的基礎(chǔ)性工作,當數(shù)據(jù)獲取完畢之后就需要對這些海量數(shù)據(jù)進行處理和分析,在目前的應用過程中基于Python的規(guī)則引擎大致有以下幾種。PyKE是一個專業(yè)的知識專家系統(tǒng),主要是利用Prolog語言規(guī)范進行工作的。Pychinko是一項可以定義和處理語義網(wǎng)的規(guī)則引擎,通過使用RDF來進行定義。從整體上來說,規(guī)則引擎技術(shù)主要是在數(shù)據(jù)挖掘過程中創(chuàng)建一個存儲、管理數(shù)據(jù)的外部規(guī)則,然后計算機技術(shù)按照這個規(guī)則來執(zhí)行與推測其他事實的應用程序。這里所說的規(guī)則通常包含著企業(yè)和商務上的業(yè)務邏輯、法律規(guī)定的相關(guān)內(nèi)容等。規(guī)則引擎技術(shù)在當前的數(shù)據(jù)挖掘中已經(jīng)有了多年的發(fā)展,其中對成熟的就是Prolog和Rete算法兩大類,在目前的應用過程中,大多數(shù)規(guī)則的引擎技術(shù)都是以該兩種算法為基礎(chǔ)而展開的,但是在某些領(lǐng)域中,也會使用Clips體系和Prolog體系相互結(jié)合。

4數(shù)據(jù)挖掘技術(shù)支持下網(wǎng)絡(luò)信息安全對策

4.1構(gòu)建安全的網(wǎng)絡(luò)環(huán)境

安全的網(wǎng)絡(luò)環(huán)境是保證網(wǎng)絡(luò)信息安全的最重要條件,根據(jù)目前行業(yè)內(nèi)的發(fā)展情況來看,需要首先更新隔離和訪問控制技術(shù),不但要實現(xiàn)物理方面的隔離,更要進一步完善邏輯方面的隔離,只有經(jīng)過授權(quán)的用戶才能訪問網(wǎng)絡(luò)資金。其次,要廣泛應用反病毒技術(shù),網(wǎng)絡(luò)上各種各樣的病毒是危害網(wǎng)絡(luò)信息安全的重要殺手之一,為了使得網(wǎng)絡(luò)信息更加安全,必須構(gòu)建出一個完善的病毒預警與防護機制,當有外部病毒入侵的時候,病毒檢測技術(shù)能夠在短時間內(nèi)識別出來,并且還能夠?qū)崿F(xiàn)定期地對網(wǎng)絡(luò)信息進行安全性分析,及時安裝補丁。除此之外,網(wǎng)絡(luò)系統(tǒng)中還應當具有一定的數(shù)據(jù)統(tǒng)計功能,能夠詳細地記錄用戶訪問時間以及訪問次數(shù),同時還能夠?qū)W(wǎng)絡(luò)環(huán)境的使用狀態(tài)進行記錄與反饋,確認是否網(wǎng)絡(luò)具有被攻擊的危險。當然,為了使得數(shù)據(jù)信息在應急情況下不被破壞,網(wǎng)絡(luò)環(huán)境中還應當具有網(wǎng)絡(luò)備份和災難恢復系統(tǒng),可以保證在網(wǎng)絡(luò)受到外界攻擊后能夠在最短的時間內(nèi)將系統(tǒng)恢復至可用狀態(tài)。

4.2保證數(shù)據(jù)挖掘信息的安全

在數(shù)據(jù)挖掘的過程中,要保證所挖掘數(shù)據(jù)信息的安全,其中包含著數(shù)據(jù)的存儲安全、數(shù)據(jù)的傳輸安全以及數(shù)據(jù)的使用安全3大過程。在具體的操作過程中,首先需要保證數(shù)據(jù)信息具有物理方面的邏輯完整性,而保密性和邏輯完整性則是構(gòu)成數(shù)據(jù)存儲安全的重要內(nèi)容。保證數(shù)據(jù)傳輸過程中的安全對于整個挖掘過程來說十分重要,在當前的應用環(huán)境中,通常是使用傳輸加密技術(shù)、數(shù)據(jù)完整性技術(shù)、防抵賴性技術(shù)來保證傳輸過程中的安全性,同時,工作人員在操作的過程中也應當保證數(shù)據(jù)信息使用和傳遞的安全性,避免發(fā)生數(shù)據(jù)泄露現(xiàn)象。而使用安全則主要是指數(shù)據(jù)在被使用的過程中一定要對使用主體進行核驗和校準,嚴禁非授權(quán)主體擅自地使用數(shù)據(jù)資源,從而保證數(shù)據(jù)信息的安全。

4.3建立完善的模型

為了保證數(shù)據(jù)挖掘技術(shù)支持下網(wǎng)絡(luò)信息安全需要建立完善的挖掘模型,首先,應當根據(jù)關(guān)聯(lián)性的分析情況來構(gòu)建關(guān)聯(lián)分析模型,在目前的技術(shù)領(lǐng)域中,關(guān)聯(lián)數(shù)據(jù)模型主要是通過對外部攻擊要素的歸納和整合,結(jié)合當前所使用的數(shù)據(jù)挖掘技術(shù),體現(xiàn)出網(wǎng)絡(luò)上頻次最高、效果最強的攻擊行為態(tài)勢。在常見的攻擊行為中,攻擊類型、源地址、目的地址是最主要的3個要素,更是體現(xiàn)著攻擊行為的本質(zhì)特征,因此,為了保證網(wǎng)絡(luò)信息安全,必須對高頻次的攻擊行為進行分析與統(tǒng)計,從而做出相關(guān)的模型,進而建立起完善的解決體系。其次,要形成效果良好的事件預測機制。所謂事件的預測機制主要內(nèi)容是通過對發(fā)生的某一事件的未來走勢進行跟蹤性的調(diào)查,利用數(shù)據(jù)挖掘技術(shù)中的聚類算法,通過一定的演算過程來推斷出該事件是否能成為大規(guī)模的網(wǎng)絡(luò)攻擊事件,對于目前發(fā)生的大規(guī)模網(wǎng)絡(luò)安全事件來說,發(fā)生的次數(shù)并不是重點關(guān)注的對象,而發(fā)生的擴散程度、牽涉面積、蔓延速度則是需要重點關(guān)注的。舉個例子來說,如果在數(shù)據(jù)監(jiān)測的過程中發(fā)現(xiàn)了同一種木馬病毒的IP地址數(shù)量在急劇地上升,那么就必須引起警覺,因為這種現(xiàn)象的事件很可能就是一次嚴重的網(wǎng)絡(luò)攻擊事件。同時,還需要建立可控數(shù)量的預測模型。可控數(shù)量的預測模型主要是對觀察事件中的受控主機狀態(tài)的增長趨勢進行監(jiān)控,可以對事件的感染能夠做出準確的判斷。受控主機狀態(tài)增長主要說的是沒有發(fā)覺異常之前的主機狀態(tài),如果通過的相關(guān)監(jiān)測手段,發(fā)現(xiàn)主機已經(jīng)被攻擊而且隨后數(shù)量也發(fā)生大規(guī)模的增長,那么這就叫做受控主機狀態(tài)的增長趨勢。舉個例子來說,我們在日常監(jiān)測的過程中發(fā)現(xiàn)了某種病毒,而且經(jīng)過監(jiān)測發(fā)現(xiàn)該主機之前并未受到過這種感染,但是在監(jiān)測的周期內(nèi)發(fā)現(xiàn)了主機被感染,那么對于這一種類型的病毒來說,該主機就是受控主機狀態(tài)的增長狀態(tài)。最后,還需要建立分析與處理的模型。該模型的建立主要是對于一些數(shù)據(jù)與事件進行反饋,從而得出被控主機的處理能力,該模型在分析的過程中是對未處理主機、已經(jīng)處理主機、處理效率等方面進行綜合性地評定,從而得出其處理能力的強弱。

5結(jié)語

隨著信息技術(shù)的發(fā)展,計算機技術(shù)已經(jīng)深入到我們生活生產(chǎn)的方方面面,深刻地改變著社會經(jīng)濟發(fā)展的格局。但是隨著計算機網(wǎng)絡(luò)的普及,越來越多的不法分子也開始入侵到網(wǎng)絡(luò)中,做一些違法亂紀的事情,近些年來,黑客攻擊網(wǎng)絡(luò)的手段層出不窮,傳統(tǒng)的網(wǎng)絡(luò)信息安全技術(shù)也難以應對,而將數(shù)據(jù)挖掘技術(shù)應用到網(wǎng)絡(luò)信息安全策略中有著非常強的實踐價值,從這一角度出發(fā),對數(shù)據(jù)挖掘技術(shù)中的相關(guān)內(nèi)容進行了重點的研究,希望能夠為該技術(shù)的發(fā)展提供有價值的參考。

參考文獻

[1]曹子璽,陸琦,薛質(zhì).基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)信息安全策略研究[J].信息安全與技術(shù),2018,5(01):26-28.

[2]季民.整合Web數(shù)據(jù)挖掘技術(shù)與網(wǎng)絡(luò)信息安全防范技術(shù)的相關(guān)分析[J].信息化建設(shè),2019,(03):375.

[3]闕宏宇,梁波.入侵檢測技術(shù)網(wǎng)絡(luò)安全中的具體運用[J].電子技術(shù)與軟件工程,2017,(11):205.

[4]李勇,李建,曾銀.數(shù)據(jù)挖掘技術(shù)在入侵檢測系統(tǒng)中的應用[J].山西電子技術(shù),2016,(06):36-38.

[5]王江,樊向東,施偉.大數(shù)據(jù)時代的網(wǎng)絡(luò)信息安全與隱私保護研究[J].信息與電腦(理論版),2018,(24):213-214+217.

作者:郭秀峰 單位:河南牧業(yè)經(jīng)濟學院信息工程學院