公務(wù)員期刊網(wǎng) 精選范文 挖掘技術(shù)論文范文

挖掘技術(shù)論文精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的挖掘技術(shù)論文主題范文,僅供參考,歡迎閱讀并收藏。

挖掘技術(shù)論文

第1篇:挖掘技術(shù)論文范文

數(shù)據(jù)挖掘技術(shù)是一種新型的技術(shù),在現(xiàn)代數(shù)據(jù)存儲(chǔ)以及測量技術(shù)的迅猛發(fā)展過程中,人們可以進(jìn)行信息的大量測量并進(jìn)行存儲(chǔ)。但是,在大量的信息背后卻沒有一種有效的手段和技術(shù)進(jìn)行直觀的表達(dá)和分析。而數(shù)據(jù)挖掘技術(shù)的出現(xiàn),是對(duì)目前大數(shù)據(jù)時(shí)代的一種應(yīng)急手段,使得有關(guān)計(jì)算機(jī)數(shù)據(jù)處理技術(shù)得到加快發(fā)展。數(shù)據(jù)挖掘技術(shù)最早是從機(jī)器學(xué)習(xí)的概念中而產(chǎn)生的,在對(duì)機(jī)器的學(xué)習(xí)過程中,一般不采用歸納或者較少使用這種方法,這是一種非常機(jī)械的操作辦法。而沒有指導(dǎo)性學(xué)習(xí)的辦法一般不從這些環(huán)境得出反饋,而是通過沒有干預(yù)的情況下進(jìn)行歸納和學(xué)習(xí),并建立一種理論模型。數(shù)據(jù)挖掘技術(shù)是屬于例子歸納學(xué)習(xí)的一種方式,這種從例子中進(jìn)行歸納學(xué)習(xí)的方式是介于上述無指導(dǎo)性學(xué)習(xí)以及較少使用歸納學(xué)習(xí)這兩種方式之間的一種方式。因此,可以說,數(shù)據(jù)挖掘技術(shù)的特征在出自于機(jī)器學(xué)習(xí)的背景下,與其相比機(jī)器主要關(guān)心的是如何才能有效提高機(jī)器的學(xué)習(xí)能力,但數(shù)據(jù)挖掘技術(shù)主要關(guān)心如何才能找到有用、有價(jià)值的信息。其第二個(gè)特征是,與機(jī)器學(xué)習(xí)特點(diǎn)相比較而言,機(jī)器關(guān)心的是小數(shù)據(jù),而數(shù)據(jù)挖掘技術(shù)所面臨的對(duì)象則是現(xiàn)實(shí)中海量規(guī)模的數(shù)據(jù)庫,其作用主要是用來處理一些異常現(xiàn)象,特別是處理殘缺的、有噪音以及維數(shù)很高的數(shù)據(jù)項(xiàng),甚至是一些不同類型數(shù)據(jù)。以往的數(shù)據(jù)處理方法和現(xiàn)代的數(shù)據(jù)挖掘技術(shù)相比較而言,其不同點(diǎn)是以往的傳統(tǒng)數(shù)據(jù)處理方法前提是把理論作為一種指導(dǎo)數(shù)據(jù)來進(jìn)行處理,在現(xiàn)代數(shù)據(jù)挖掘技術(shù)的出發(fā)角度不同,主要運(yùn)用啟發(fā)式的歸納學(xué)習(xí)進(jìn)行理論以及假設(shè)來處理的。

2、數(shù)據(jù)挖掘技術(shù)主要步驟

數(shù)據(jù)挖掘技術(shù)首先要建立數(shù)據(jù)倉庫,要根據(jù)實(shí)際情況而定,在易出現(xiàn)問題的有關(guān)領(lǐng)域建立有效的數(shù)據(jù)庫。主要是用來把數(shù)據(jù)庫中的所有的存儲(chǔ)數(shù)據(jù)進(jìn)行分析,而目前的一些數(shù)據(jù)庫雖然可以進(jìn)行大量的存儲(chǔ)數(shù)據(jù),同時(shí)也進(jìn)行了一系列的技術(shù)發(fā)展。比如,系統(tǒng)中的在線分析處理,主要是為用戶查詢,但是卻沒有查詢結(jié)果的分析能力,而查詢的結(jié)果仍舊由人工進(jìn)行操作,依賴于對(duì)手工方式進(jìn)行數(shù)據(jù)測試并建模。其次,在數(shù)據(jù)庫中存儲(chǔ)的數(shù)據(jù)選一數(shù)據(jù)集,作為對(duì)數(shù)據(jù)挖掘算法原始輸入。此數(shù)據(jù)集所涉及到數(shù)據(jù)的時(shí)變性以及統(tǒng)一性等情況。然后,再進(jìn)行數(shù)據(jù)的預(yù)處理,在處理中主要對(duì)一些缺損數(shù)據(jù)進(jìn)行補(bǔ)齊,并消除噪聲,此外還應(yīng)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化的處理。隨后,再對(duì)數(shù)據(jù)進(jìn)行降維和變換。如果數(shù)據(jù)的維數(shù)比較高,還應(yīng)找出維分量高的數(shù)據(jù),對(duì)高維數(shù)數(shù)據(jù)空間能夠容易轉(zhuǎn)化為檢點(diǎn)的低維數(shù)數(shù)據(jù)空間進(jìn)行處理。下一步驟就是確定任務(wù),要根據(jù)現(xiàn)實(shí)的需要,對(duì)數(shù)據(jù)挖掘目標(biāo)進(jìn)行確定,并建立預(yù)測性的模型、數(shù)據(jù)的摘要等。隨后再?zèng)Q定數(shù)據(jù)挖掘的算法,這一步驟中,主要是對(duì)當(dāng)前的數(shù)據(jù)類型選擇有效的處理方法,此過程非常重要,在所有數(shù)據(jù)挖掘技術(shù)中起到較大作用。隨后再對(duì)數(shù)據(jù)挖掘進(jìn)行具體的處理和結(jié)果檢驗(yàn),在處理過程中,要按照不同的目的,選擇不同的算法,是運(yùn)用決策樹還是分類等的算法,是運(yùn)用聚類算法還是使用回歸算法,都要認(rèn)真處理,得出科學(xué)的結(jié)論。在數(shù)據(jù)挖掘結(jié)果檢驗(yàn)時(shí),要注意幾個(gè)問題,要充分利用結(jié)論對(duì)照其他的信息進(jìn)行校核,可對(duì)圖表等一些直觀的信息和手段進(jìn)行輔助分析,使結(jié)論能夠更加科學(xué)合理。需要注意的是要根據(jù)用戶來決定結(jié)論有用的程度。最后一項(xiàng)步驟是把所得出的結(jié)論進(jìn)行應(yīng)用到實(shí)際,要對(duì)數(shù)據(jù)挖掘的結(jié)果進(jìn)行仔細(xì)的校驗(yàn),重點(diǎn)是解決好以前的觀點(diǎn)和看法有無差錯(cuò),使目前的結(jié)論和原先看法的矛盾有效解除。

3、數(shù)據(jù)挖掘技術(shù)的方法以及在電力營銷系統(tǒng)中的應(yīng)用和發(fā)展

數(shù)控挖掘技術(shù)得到了非常廣泛的應(yīng)用,按照技術(shù)本身的發(fā)展出現(xiàn)了較多方法。例如,建立預(yù)測性建模方法,也就是對(duì)歷史數(shù)據(jù)進(jìn)行分析并歸納總結(jié),從而建立成預(yù)測性模型。根據(jù)此模型以及當(dāng)前的其他數(shù)據(jù)進(jìn)行推斷相關(guān)聯(lián)的數(shù)據(jù)。如果推斷的對(duì)象屬于連續(xù)型的變量,那么此類的推斷問題可屬回歸問題。根據(jù)歷史數(shù)據(jù)來進(jìn)行分析和檢測,再做出科學(xué)的架設(shè)和推定。在常用的回歸算法以及非線性變換進(jìn)行有效的結(jié)合,能夠使許多問題得到解決。電力營銷系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)應(yīng)用中關(guān)聯(lián)規(guī)則是最為關(guān)鍵的技術(shù)應(yīng)用之一。這種應(yīng)用可以有效地幫助決策人員進(jìn)行當(dāng)前有關(guān)數(shù)據(jù)以及歷史數(shù)據(jù)的規(guī)律分析,最后預(yù)測出未來情況。把關(guān)聯(lián)規(guī)則成功引入電力營銷分析,通過FP-Growth算法對(duì)電力營銷的有關(guān)數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析,從中得出各種電量銷售的影響因素以及外部因素、手電水平等的關(guān)聯(lián)信息,以便更好地為電力的市場營銷策略提供參謀和決策。對(duì)電力營銷系統(tǒng)的應(yīng)用中,時(shí)間序列挖掘以及序列挖掘非常經(jīng)典、系統(tǒng),是應(yīng)用最為廣泛的一種預(yù)測方法。這種方法的應(yīng)用中,對(duì)神經(jīng)網(wǎng)絡(luò)的研究非常之多。因此,在現(xiàn)實(shí)中應(yīng)用主要把時(shí)間序列挖掘以及神經(jīng)網(wǎng)絡(luò)兩者進(jìn)行有效地結(jié)合,然后再分析有關(guān)電力營銷數(shù)據(jù)。此外,有關(guān)專家還提出應(yīng)用一種時(shí)間窗的序列挖掘算法,這種方式可以進(jìn)行有效地報(bào)警處理,使電力系統(tǒng)中的故障能夠準(zhǔn)確的定位并診斷事故。此算法對(duì)電力系統(tǒng)的分析和挖掘能力的提高非常有效,還可判定電力系統(tǒng)的運(yùn)行是否穩(wěn)定,對(duì)錯(cuò)誤模型的分析精度達(dá)到一定的精確度。

4、結(jié)語

第2篇:挖掘技術(shù)論文范文

關(guān)鍵字:數(shù)據(jù)挖掘金融數(shù)據(jù)

金融部門每天的業(yè)務(wù)都會(huì)產(chǎn)生大量數(shù)據(jù),利用目前的數(shù)據(jù)庫系統(tǒng)可以有效地實(shí)現(xiàn)數(shù)據(jù)的錄入、查詢、統(tǒng)計(jì)等功能,但無法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測未來的發(fā)展趨勢。缺乏挖掘數(shù)據(jù)背后隱藏的知識(shí)的手段,導(dǎo)致了數(shù)據(jù)爆炸但知識(shí)貧乏”的現(xiàn)象。與此同時(shí),金融機(jī)構(gòu)的運(yùn)作必然存在金融風(fēng)險(xiǎn),風(fēng)險(xiǎn)管理是每一個(gè)金融機(jī)構(gòu)的重要工作。利用數(shù)據(jù)挖掘技術(shù)不但可以從這海量的數(shù)據(jù)中發(fā)現(xiàn)隱藏在其后的規(guī)律,而且可以很好地降低金融機(jī)構(gòu)存在的風(fēng)險(xiǎn)。學(xué)習(xí)和應(yīng)用數(shù)扼挖掘技術(shù)對(duì)我國的金融機(jī)構(gòu)有重要意義。

一、數(shù)據(jù)挖掘概述

1.數(shù)據(jù)挖掘的定義對(duì)于數(shù)據(jù)挖掘,一種比較公認(rèn)的定義是W.J.Frawley,G.PiatetskShapiro等人提出的。數(shù)據(jù)挖掘就是從大型數(shù)據(jù)庫的數(shù)據(jù)中提取人們感興趣的知識(shí)、這些知識(shí)是隱含的、事先未知的、潛在有用的信息,提取的知識(shí)表示為概念(Concepts),規(guī)則(Rules)、規(guī)律(Regularities)、模式(Patterns)等形式。這個(gè)定義把數(shù)據(jù)挖掘的對(duì)象定義為數(shù)據(jù)庫。

隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,其應(yīng)用領(lǐng)域也不斷拓廣。數(shù)據(jù)挖掘的對(duì)象已不再僅是數(shù)據(jù)庫,也可以是文件系統(tǒng),或組織在一起的數(shù)據(jù)集合,還可以是數(shù)據(jù)倉庫。與此同時(shí),數(shù)據(jù)挖掘也有了越來越多不同的定義,但這些定義盡管表達(dá)方式不同,其本質(zhì)都是近似的,概括起來主要是從技術(shù)角度和商業(yè)角度給出數(shù)據(jù)挖掘的定義。

從技術(shù)角度看,數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在的和有用的信息和知識(shí)的過程。它是一門廣義的交叉學(xué)科,涉及數(shù)據(jù)庫技術(shù)、人工智能、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、統(tǒng)計(jì)學(xué)、模式識(shí)別、知識(shí)庫系統(tǒng)、知識(shí)獲取、信息檢索、高性能計(jì)算和數(shù)據(jù)可視化等多學(xué)科領(lǐng)域且本身還在不斷發(fā)展。目前有許多富有挑戰(zhàn)的領(lǐng)域如文本數(shù)據(jù)挖掘、Web信息挖掘、空間數(shù)據(jù)挖掘等。

從商業(yè)角度看,數(shù)據(jù)挖掘是一種深層次的商業(yè)信息分析技術(shù)。它按照企業(yè)既定業(yè)務(wù)目標(biāo),對(duì)大量的企業(yè)數(shù)據(jù)進(jìn)行探索和分析,揭示隱藏的、未知的或驗(yàn)證已知的規(guī)律性并進(jìn)一步將其模型化,從而自動(dòng)地提取出用以輔助商業(yè)決策的相關(guān)商業(yè)模式。

2.數(shù)據(jù)挖掘方法

數(shù)據(jù)挖掘技術(shù)是數(shù)據(jù)庫技術(shù)、統(tǒng)計(jì)技術(shù)和人工智能技術(shù)發(fā)展的產(chǎn)物。從使用的技術(shù)角度,主要的數(shù)據(jù)挖掘方法包括:

2.1決策樹方法:利用樹形結(jié)構(gòu)來表示決策集合,這些決策集合通過對(duì)數(shù)據(jù)集的分類產(chǎn)生規(guī)則。國際上最有影響和最早的決策樹方法是ID3方法,后來又發(fā)展了其它的決策樹方法。

2.2規(guī)則歸納方法:通過統(tǒng)計(jì)方法歸納,提取有價(jià)值的if-then規(guī)則。規(guī)則歸納技術(shù)在數(shù)據(jù)挖掘中被廣泛使用,其中以關(guān)聯(lián)規(guī)則挖掘的研究開展得較為積極和深入。

2.3神經(jīng)網(wǎng)絡(luò)方法:從結(jié)構(gòu)上模擬生物神經(jīng)網(wǎng)絡(luò),以模型和學(xué)習(xí)規(guī)則為基礎(chǔ),建立3種神經(jīng)網(wǎng)絡(luò)模型:前饋式網(wǎng)絡(luò)、反饋式網(wǎng)絡(luò)和自組織網(wǎng)絡(luò)。這種方法通過訓(xùn)練來學(xué)習(xí)的非線性預(yù)測模型,可以完成分類、聚類和特征挖掘等多種數(shù)據(jù)挖掘任務(wù)。

2.4遺傳算法:模擬生物進(jìn)化過程的算法,由繁殖(選擇)、交叉(重組)、變異(突變)三個(gè)基本算子組成。為了應(yīng)用遺傳算法,需要將數(shù)據(jù)挖掘任務(wù)表達(dá)為一種搜索問題,從而發(fā)揮遺傳算法的優(yōu)化搜索能力。

2.5粗糙集(RoughSet)方法:Rough集理論是由波蘭數(shù)學(xué)家Pawlak在八十年代初提出的一種處理模糊和不精確性問題的新型數(shù)學(xué)工具。它特別適合于數(shù)據(jù)簡化,數(shù)據(jù)相關(guān)性的發(fā)現(xiàn),發(fā)現(xiàn)數(shù)據(jù)意義,發(fā)現(xiàn)數(shù)據(jù)的相似或差別,發(fā)現(xiàn)數(shù)據(jù)模式和數(shù)據(jù)的近似分類等,近年來已被成功地應(yīng)用在數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)研究領(lǐng)域中。

2.6K2最鄰近技術(shù):這種技術(shù)通過K個(gè)最相近的歷史記錄的組合來辨別新的記錄。這種技術(shù)可以作為聚類和偏差分析等挖掘任務(wù)。

2.7可視化技術(shù):將信息模式、數(shù)據(jù)的關(guān)聯(lián)或趨勢等以直觀的圖形方式表示,決策者可以通過可視化技術(shù)交互地分析數(shù)據(jù)關(guān)系??梢暬瘮?shù)據(jù)分析技術(shù)拓寬了傳統(tǒng)的圖表功能,使用戶對(duì)數(shù)據(jù)的剖析更清楚。

二、數(shù)據(jù)挖掘在金融行業(yè)中的應(yīng)用數(shù)據(jù)挖掘已經(jīng)被廣泛應(yīng)用于銀行和商業(yè)中,有以下的典型應(yīng)用:

1.對(duì)目標(biāo)市場(targetedmarketing)客戶的分類與聚類。例如,可以將具有相同儲(chǔ)蓄和貨款償還行為的客戶分為一組。有效的聚類和協(xié)同過濾(collaborativefiltering)方法有助于識(shí)別客戶組,以及推動(dòng)目標(biāo)市場。

2..客戶價(jià)值分析。

在客戶價(jià)值分析之前一般先使用客戶分類,在實(shí)施分類之后根據(jù)“二八原則”,找出重點(diǎn)客戶,即對(duì)給銀行創(chuàng)造了80%價(jià)值的20%客戶實(shí)施最優(yōu)質(zhì)的服務(wù)。重點(diǎn)客戶的發(fā)現(xiàn)通常采用一系列數(shù)據(jù)處理、轉(zhuǎn)換過程、AI人工智能等數(shù)據(jù)挖掘技術(shù)來實(shí)現(xiàn)。通過分析客戶對(duì)金融產(chǎn)品的應(yīng)用頻率、持續(xù)性等指標(biāo)來判別客戶的忠誠度;通過對(duì)交易數(shù)據(jù)的詳細(xì)分析來鑒別哪些是銀行希望保持的客戶;通過挖掘找到流失的客戶的共同特征,就可以在那些具有相似特征的客戶還未流失之前進(jìn)行針對(duì)性的彌補(bǔ)。

3.客戶行為分析。

找到重點(diǎn)客戶之后,可對(duì)其進(jìn)行客戶行為分析,發(fā)現(xiàn)客戶的行為偏好,為客戶貼身定制特色服務(wù)??蛻粜袨榉治鲇址譃檎w行為分析和群體行為分析。整體行為分析用來發(fā)現(xiàn)企業(yè)現(xiàn)有客戶的行為規(guī)律。同時(shí),通過對(duì)不同客戶群組之間的交叉挖掘分析,可以發(fā)現(xiàn)客戶群體間的變化規(guī)律,并可通過數(shù)據(jù)倉庫的數(shù)據(jù)清潔與集中過程,將客戶對(duì)市場的反饋?zhàn)詣?dòng)輸人到數(shù)據(jù)倉庫中。通過對(duì)客戶的理解和客戶行為規(guī)律的發(fā)現(xiàn),企業(yè)可以制定相應(yīng)的市場策略。

4.為多維數(shù)據(jù)分析和數(shù)據(jù)挖掘設(shè)計(jì)和構(gòu)造數(shù)據(jù)倉庫。例如,人們可能希望按月、按地區(qū)、按部門、以及按其他因素查看負(fù)債和收入的變化情況,同時(shí)希望能提供諸如最大、最小、總和、平均和其他等統(tǒng)計(jì)信息。數(shù)據(jù)倉庫、數(shù)據(jù)立方體、多特征和發(fā)現(xiàn)驅(qū)動(dòng)數(shù)據(jù)立方體,特征和比較分析,以及孤立點(diǎn)分析等,都會(huì)在金融數(shù)據(jù)分析和挖掘中發(fā)揮重要作用。

5.貨款償還預(yù)測和客戶信用政策分析。有很多因素會(huì)對(duì)貨款償還效能和客戶信用等級(jí)計(jì)算產(chǎn)生不同程度的影響。數(shù)據(jù)挖掘的方法,如特征選擇和屬性相關(guān)性計(jì)算,有助于識(shí)別重要的因素,別除非相關(guān)因素。例如,與貨款償還風(fēng)險(xiǎn)相關(guān)的因素包括貨款率、資款期限、負(fù)債率、償還與收入(payment——to——income)比率、客戶收入水平、受教育程度、居住地區(qū)、信用歷史,等等。而其中償還與收入比率是主導(dǎo)因素,受教育水平和負(fù)債率則不是。銀行可以據(jù)此調(diào)整貨款發(fā)放政策,以便將貨款發(fā)放給那些以前曾被拒絕,但根據(jù)關(guān)鍵因素分析,其基本信息顯示是相對(duì)低風(fēng)險(xiǎn)的申請(qǐng)。

6.業(yè)務(wù)關(guān)聯(lián)分析。通過關(guān)聯(lián)分析可找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng),銀行存儲(chǔ)了大量的客戶交易信息,可對(duì)客戶的收人水平、消費(fèi)習(xí)慣、購買物種等指標(biāo)進(jìn)行挖掘分析,找出客戶的潛在需求;通過挖掘?qū)蛻粜畔ⅲy行可以作為廠商和消費(fèi)者之間的中介,與廠商聯(lián)手,在掌握消費(fèi)者需求的基礎(chǔ)上,發(fā)展中間業(yè)務(wù),更好地為客戶服務(wù)。

7.洗黑錢和其他金融犯罪的偵破。要偵破洗黑錢和其他金融犯罪,重要的一點(diǎn)是要把多個(gè)數(shù)據(jù)庫的信息集成起來,然后采用多種數(shù)據(jù)分析工具找出異常模式,如在某段時(shí)間內(nèi),通過某一組人發(fā)生大量現(xiàn)金流量等,再運(yùn)用數(shù)據(jù)可視化工具、分類工具、聯(lián)接工具、孤立點(diǎn)分析工具、序列模式分析工具等,發(fā)現(xiàn)可疑線索,做出進(jìn)一步的處理。

數(shù)據(jù)挖掘技術(shù)可以用來發(fā)現(xiàn)數(shù)據(jù)庫中對(duì)象演變特征或?qū)ο笞兓厔?,這些信息對(duì)于決策或規(guī)劃是有用的,金融

行業(yè)數(shù)據(jù)的挖掘有助于根據(jù)顧客的流量安排工作人員。可以挖掘股票交易數(shù)據(jù),發(fā)現(xiàn)可能幫助你制定投資策略的趨勢數(shù)據(jù)。挖掘給企業(yè)帶來的潛在的投資回報(bào)幾乎是無止境的。當(dāng)然,數(shù)據(jù)挖掘中得到的模式必須要在現(xiàn)實(shí)生活中進(jìn)行驗(yàn)證。

參考文獻(xiàn):

丁秋林,力士奇.客戶關(guān)系管理.第1版.北京:清華人學(xué)出版社,2002

張玉春.數(shù)據(jù)挖掘在金融分析中的應(yīng)用.華南金融電腦.2004

第3篇:挖掘技術(shù)論文范文

關(guān)鍵詞:傳統(tǒng)裝飾藝術(shù);視覺傳達(dá)設(shè)計(jì);民族文化

傳統(tǒng)裝飾藝術(shù)源于生活,源于傳統(tǒng),有著悠久的歷史和深厚的民族底蘊(yùn),是與人們生活息息相關(guān)的一種藝術(shù)形態(tài)。早期工藝美術(shù)作品中的圖案就已經(jīng)具備了強(qiáng)烈的裝飾意味,隨著人們精神需求和審美意識(shí)的不斷提高,傳統(tǒng)裝飾藝術(shù)更是成為了人們生活的一部分。作為一門獨(dú)立的藝術(shù)形式,傳統(tǒng)裝飾藝術(shù)以其獨(dú)特的視覺符號(hào)和深厚的文化內(nèi)涵,重新引起了設(shè)計(jì)界的關(guān)注。特別是視覺傳達(dá)設(shè)計(jì),這門通過獨(dú)特的視覺傳播方式達(dá)到傳達(dá)信息,并且與受眾交流、溝通的目的的藝術(shù)學(xué)科,不僅要吸取和弘揚(yáng)傳統(tǒng)裝飾藝術(shù)中的民族文化,更要挖掘傳統(tǒng)裝飾藝術(shù)中對(duì)現(xiàn)代設(shè)計(jì)有借鑒價(jià)值的東西。

追溯傳統(tǒng)裝飾藝術(shù)發(fā)展的淵源,它首先是人們?yōu)榱松娑M(jìn)行的造物的主觀創(chuàng)造性活動(dòng),到后來為了審美需求而進(jìn)行裝飾創(chuàng)作,這是一個(gè)漫長的歷史過程。在人類發(fā)展史上的各個(gè)時(shí)期,傳統(tǒng)裝飾藝術(shù)作品往往成為見證該時(shí)期文化、工藝和藝術(shù)水平的代表。并且,傳統(tǒng)裝飾藝術(shù)作品不論其形式如何,都融入了原始先民為生存而激發(fā)的全部感情,都體現(xiàn)出了生命的本能、生活的理想和原始文化的底蘊(yùn)。[1]它不是純藝術(shù)現(xiàn)象,但經(jīng)過幾千年的積淀與傳承,傳統(tǒng)裝飾藝術(shù)在意識(shí)形態(tài)的轉(zhuǎn)變和新技術(shù)浪潮的沖擊下不斷更新拓展,具有了自己鮮明的藝術(shù)特征,反映了民族文化的精髓。

在設(shè)計(jì)語言日趨國際化的今天,視覺傳達(dá)設(shè)計(jì)由于本身所具有的對(duì)圖形、文字等元素的高度概括和簡約化特征而面臨著設(shè)計(jì)風(fēng)格一體化的尷尬趨勢,這就對(duì)現(xiàn)代設(shè)計(jì)家提出了更高的要求。由于不同的國家和民族有著不同的傳統(tǒng),其人文風(fēng)俗和文化底蘊(yùn)也大不相同,所以,設(shè)計(jì)家們驚訝地發(fā)現(xiàn),民族的東西是一種很好地區(qū)別于其它地域作品的設(shè)計(jì)語言。于是,一股回歸傳統(tǒng),弘揚(yáng)民族文化的設(shè)計(jì)思想席卷了整個(gè)設(shè)計(jì)界。不同國度和區(qū)域的設(shè)計(jì)家都在尋找最能反映其民族精神和文化底蘊(yùn)的設(shè)計(jì)符號(hào)。作為有幾千年文化積淀和傳承并反映民族文化精髓的傳統(tǒng)裝飾藝術(shù),它重新引起設(shè)計(jì)界的關(guān)注,并成為設(shè)計(jì)家們創(chuàng)作的靈感來源,也就不足為奇了。

首先,在對(duì)形的處理上,傳統(tǒng)裝飾藝術(shù)遵循“刪繁就簡”、“以簡代繁”的原則,也就是用簡潔的線條和規(guī)整的外形來表現(xiàn)各種自然形象。如興起于我國民間的皮影戲和剪紙,其造型多采用簡潔單純的線面,著重表現(xiàn)自然物象的基本特征,它把一些立體的東西作概括化和平面化處理,具有視覺傳達(dá)設(shè)計(jì)的意味。出土于西安半坡村仰韶文化時(shí)期的人面魚紋彩陶盆就采用了幾何圖形的構(gòu)成手法,將人面概括成圓形,頭上的發(fā)髻和人面兩側(cè)耳部的小魚都用三角形表示,眼睛瞇成一條線,這種抽象化和幾何化就是“刪繁就簡”的具體體現(xiàn)。在視覺傳達(dá)設(shè)計(jì)中,提倡用最簡潔的圖形語言傳達(dá)最豐富的思想內(nèi)涵,其實(shí)也就是強(qiáng)調(diào)對(duì)圖形的高度概括、提煉和簡化,而西方更是注重幾何和抽象的圖形表達(dá)。這些現(xiàn)代設(shè)計(jì)理念,與傳統(tǒng)裝飾藝術(shù)中對(duì)形的處理觀念是基本一致的,并且在幾千年前就已經(jīng)開始運(yùn)用了。另外,傳統(tǒng)裝飾藝術(shù)由于有漆畫、陶瓷、蠟染、刺繡、剪紙等多種藝術(shù)形式,其內(nèi)容比較豐富,處理“形”的手法也就各具特色。所以,傳統(tǒng)裝飾藝術(shù)中對(duì)“形”的處理手法,很多都是值得我們視覺傳達(dá)設(shè)計(jì)學(xué)習(xí)和借鑒的。其次,傳統(tǒng)裝飾藝術(shù)很注重形式美感,這種形式美感包括造型的獨(dú)特性、排列的秩序感,畫面空間的設(shè)計(jì)感和點(diǎn)、線、面等形式要素的組合關(guān)系。傳統(tǒng)裝飾藝術(shù)中,很多造型藝術(shù)本身具有很強(qiáng)的形式美,已經(jīng)很講究對(duì)稱、均衡、比例、線條、色彩等帶給人的審美情感。如陶器的造型就很講究對(duì)稱和均衡,上面的裝飾紋樣不僅很注重線條和塊面的對(duì)比,色彩的搭配也很和諧。并且,還有很多由于機(jī)械有節(jié)奏的運(yùn)動(dòng)和通過重復(fù)的構(gòu)成手法而創(chuàng)造的圖案,具有強(qiáng)烈的秩序美。[2]在敦煌壁畫中,隨處可見用于裝飾的各種卷草紋樣和適合圖案,尤其是藻井的裝飾,紋樣之豐富,裝飾之繁瑣可謂嘆為觀止,然而經(jīng)過藝術(shù)家的合理安排,整個(gè)畫面顯得井井有條。二方連續(xù)在不斷重復(fù)的過程中呈現(xiàn)出強(qiáng)烈的節(jié)奏感和秩序感,適合紋樣處處彰顯藝術(shù)家對(duì)畫面空間的把控,各種視覺元素遙相呼應(yīng),虛實(shí)相生,并且畫面中點(diǎn)、線、面關(guān)系處理到位,整體視覺效果統(tǒng)一。可見,傳統(tǒng)裝飾藝術(shù)中對(duì)形式美感的追求,就如同我們進(jìn)行視覺傳達(dá)設(shè)計(jì)時(shí)所考慮的畫面構(gòu)圖和版式編排,目的都是為了形成強(qiáng)烈的視覺美感,從而喚起人們審美心理的愉悅。所以,傳統(tǒng)裝飾藝術(shù)中對(duì)形式美感的追求為我們視覺傳達(dá)設(shè)計(jì)中的版式編排提供了參考的樣本,具有較高的藝術(shù)價(jià)值。

再次,傳統(tǒng)裝飾藝術(shù)中的紋樣往往具有象征意義,如盤子上的暗八仙,象征延年益壽;瓷器上的蓮花寓意高潔;民間工藝美術(shù)里的葡萄、石榴以及百子圖等象征家族繁榮,子孫眾多;還有用龍鳳表示吉祥如意,用蝙蝠直接表現(xiàn)“福在眼前”等等。[3]傳統(tǒng)裝飾藝術(shù)中的這種象征性與現(xiàn)代設(shè)計(jì)有異曲同工之處,如視覺傳達(dá)設(shè)計(jì)中的標(biāo)識(shí)設(shè)計(jì)就常采用象征圖形來傳達(dá)企業(yè)文化、發(fā)展方向或者管理理念等,海報(bào)設(shè)計(jì)中也常用具有一定象征意味的圖形傳達(dá)深刻的思想主題和文化內(nèi)涵。傳統(tǒng)裝飾藝術(shù)所具有的博大精深的寓意性,對(duì)現(xiàn)代視覺傳達(dá)設(shè)計(jì)來講,具有重大意義。一方面,它為我們的設(shè)計(jì)提供了眾多素材,豐富了我們的設(shè)計(jì)語言;另一方面,它為我們的設(shè)計(jì)提供了很多思考的切入點(diǎn),對(duì)設(shè)計(jì)創(chuàng)意具有較強(qiáng)的指導(dǎo)意義;另外,它使我們在面對(duì)不同文化背景進(jìn)行有針對(duì)性的設(shè)計(jì)時(shí),能準(zhǔn)確找到傳達(dá)設(shè)計(jì)意圖的最佳圖形符號(hào)。所以,傳統(tǒng)裝飾藝術(shù)中的象征性是很值得我們關(guān)注的。

另外,傳統(tǒng)裝飾藝術(shù)在造型上采用的夸張和變形,在構(gòu)圖上采用的重復(fù)、發(fā)射、漸變以及色彩的對(duì)比與調(diào)和等處理手法,與今天現(xiàn)代設(shè)計(jì)中的圖形語言和形式美的法則以及構(gòu)成有異曲同工之妙,可見,中國傳統(tǒng)裝飾藝術(shù)對(duì)現(xiàn)代視覺傳達(dá)設(shè)計(jì)來講,意義十分重大。

正是因?yàn)閭鹘y(tǒng)裝飾藝術(shù)有如此多的地方與現(xiàn)代視覺傳達(dá)設(shè)計(jì)保持一致性,才在現(xiàn)代社會(huì)顯示出了其特有的生命力。所以我們在設(shè)計(jì)中運(yùn)用傳統(tǒng)裝飾藝術(shù)宣揚(yáng)民族文化,弘揚(yáng)民族精神的同時(shí),更要不斷挖掘傳統(tǒng)裝飾藝術(shù)對(duì)現(xiàn)代視覺傳達(dá)設(shè)計(jì)有借鑒價(jià)值的東西。在設(shè)計(jì)中追求東西方文化的統(tǒng)一,追求傳統(tǒng)與現(xiàn)代的統(tǒng)一,才能夠在設(shè)計(jì)中既表現(xiàn)出民族的傳統(tǒng)精粹,又使自己的作品更具說服力。

參考資料:

[1]伍毅志.傳統(tǒng)裝飾藝術(shù)在現(xiàn)代社會(huì)的價(jià)值[OL].中國裝飾藝術(shù)網(wǎng)./Theoretical/ShowArticle.asp.ArticleID=772

第4篇:挖掘技術(shù)論文范文

文獻(xiàn)標(biāo)識(shí)碼:A  文章編號(hào):1673-7717(2007)12-2480-02

1.形神一體觀的理論內(nèi)涵

形神一體觀是中醫(yī)學(xué)基礎(chǔ)理論之一,形神學(xué)說肇始于《內(nèi)經(jīng)》,形與神是人體生命現(xiàn)象中最基本的現(xiàn)象,二者的關(guān)系是生命現(xiàn)象中最基本的關(guān)系。

1.1形的含義形的本義有二,一為形體、形質(zhì)。如《易?系辭上》說:“在天成象,在地成形,變化見矣?!倍感螤睢⑿蚊?。如《國語?越語》:“天有還形”?!盾髯?非相》:“故相形不如論心,論心不如擇術(shù)。”中醫(yī)學(xué)所稱的形,即是指視之可見、觸之可及之臟腑經(jīng)絡(luò)組織、五官九竅、四肢百骸等有形軀體,以及循行于臟腑之內(nèi)的精微物質(zhì),此外還指有形物質(zhì)資生助養(yǎng)下正常的臟腑經(jīng)絡(luò)組織功能活動(dòng)。

1.2神的含義神之本義,系指主宰天地自然變化的自然界本身所固有的客觀規(guī)律。中醫(yī)學(xué)在充分保留其有關(guān)自然界變化莫測規(guī)律為神明的同時(shí),還引申出神主宰人體生命活動(dòng),反應(yīng)生命活動(dòng)規(guī)律的生理外在表現(xiàn)以及精神意識(shí)思維等內(nèi)涵進(jìn)行了闡發(fā),從而進(jìn)一步豐富了形神理論。中醫(yī)學(xué)理論中,神的概念很廣泛,其含義有三:一是指自然界物質(zhì)變化功能。如荀子說:“萬物各得其和以生,各得其養(yǎng)以成,不見其事,而見其功,夫是謂之神。”(《荀子?天論》)天地的變化而生成萬物,這種現(xiàn)象是神的表現(xiàn),有天地之形,然后有神的變化。二是指人體生命的一切活動(dòng)。中醫(yī)學(xué)認(rèn)為人體本身就是一個(gè)陰陽對(duì)立統(tǒng)一體,陰陽之氣的運(yùn)動(dòng)變化,推動(dòng)了生命的運(yùn)動(dòng)和變化,而生命活動(dòng)的本身也稱之神。神去則氣化停止,生命也就完結(jié)??梢?,神是人體生命的根本,因此,只有積精全神氣才能“精神內(nèi)守,病安從來”。三是指人的精神意識(shí),精神活動(dòng)的高級(jí)形式是思維。

1.3形與神的關(guān)系 形與神的關(guān)系主要體現(xiàn)形為神之質(zhì)和神為形之主這兩方面。神的物質(zhì)基礎(chǔ)是氣血,氣血又是構(gòu)成形體的基本物質(zhì),而人體臟腑組織的功能活動(dòng),以及氣血的營行,又必須受神的主宰。這種“形與神”二者相互依附而不可分割的關(guān)系,稱之謂“形與神俱”。形乃神之宅,神乃形之主。無神則形不可活,無形則神無以附,二者相輔相成,不可分離。形神統(tǒng)一是生命存在的根本保證。中醫(yī)學(xué)理論中的形神一體觀,是養(yǎng)生防病,延年益壽,以及診斷治療的重要理論基礎(chǔ)。

神是機(jī)體生命活動(dòng)的體現(xiàn),神不能離開人體而獨(dú)立存在,有形才能有神,形健則神旺,形衰則神憊。故《素問?上古天真論》有“形神合一”及“形與神俱”的理論,說明形與神的關(guān)系。經(jīng)過無數(shù)實(shí)踐證明,神的盛衰的確是健康與否的重要標(biāo)志之一。反過來看,如形贏色敗,雖然兩目有神亦是假象。

2.文本挖掘的概念

文本挖掘是指利用數(shù)據(jù)挖掘技術(shù),從大量的、無結(jié)構(gòu)的文本信息中發(fā)現(xiàn)潛在的、可能的數(shù)據(jù)模式、內(nèi)在聯(lián)系、規(guī)律、發(fā)展趨勢等,抽取有效、新穎、可用、可理解的、散布在文本文件中的有價(jià)值知識(shí),并且利用這些知識(shí)更好地組織信息的過程。文本挖掘是從數(shù)據(jù)挖掘中發(fā)展來的,是信息挖掘的一個(gè)研究分支,用于基于文本信息的知識(shí)發(fā)現(xiàn)。它是利用智能算法,如神經(jīng)網(wǎng)絡(luò)、基于案例的推理、可能性推理等,并結(jié)合文字處理技術(shù),分析大量的非結(jié)構(gòu)化文本源抽取或標(biāo)記關(guān)鍵字概念、文字間的關(guān)系,并按照內(nèi)容對(duì)文檔進(jìn)行分類,獲取有用的知識(shí)和信息。

文本挖掘是一項(xiàng)綜合技術(shù),涉及數(shù)據(jù)挖掘技術(shù)、自然語言處理、計(jì)算語言學(xué)、信息檢索及分類、知識(shí)管理等多個(gè)領(lǐng)域。它主要處理半結(jié)構(gòu)化、無結(jié)構(gòu)化和字符型數(shù)據(jù),將數(shù)據(jù)挖掘技術(shù)與信息檢索技術(shù)相結(jié)合,開闊了數(shù)據(jù)挖掘劫的應(yīng)用領(lǐng)域,其特點(diǎn)是能夠更加有效地對(duì)文本數(shù)據(jù)(例如web頁面)進(jìn)行分析,從而彌補(bǔ)信息檢索技術(shù)的缺陷與不足。

3.文本挖掘的處理過程

文本挖掘是從數(shù)據(jù)挖掘發(fā)展而來的,但并不意味著將數(shù)據(jù)挖掘技術(shù)簡單應(yīng)用到文本集合上就可以實(shí)現(xiàn)文本挖掘。文本挖掘有兩個(gè)最基本的過程:文本檢索與智能分析。為了使最終用戶對(duì)結(jié)果有很好的理解和實(shí)用,通常還要列結(jié)果進(jìn)行集成和可視化。因此,實(shí)際中的文本挖掘就包合了3個(gè)過程,其基本模型見圖1。

這一處理過程實(shí)際上就是先對(duì)文本進(jìn)行處理。抽取出代表其特征的數(shù)據(jù),這些特征可以用結(jié)構(gòu)化的形式保存,作為文檔的中間表示形式,其目的在于從文本中掃描并抽取所需要的事實(shí)。由于該文檔特征向量的維數(shù)非常大,所以還需要對(duì)特征集進(jìn)行縮減。縮減完以后便可利用機(jī)器學(xué)習(xí)的各種方法來提取面向特定應(yīng)用目的的知識(shí)模式進(jìn)行分類或聚類操作。對(duì)所得的知識(shí)模型進(jìn)行質(zhì)量評(píng)價(jià),若評(píng)價(jià)的結(jié)果滿足一定的要求則保存該知識(shí)模型,若不滿足則進(jìn)行新一輪的挖掘工作。

4.文本挖掘在形神一體觀中的應(yīng)用

形神有著很緊密的聯(lián)系,在臨床實(shí)踐過程中,有指導(dǎo)臨床實(shí)踐的作用,因此在臨床實(shí)踐中運(yùn)用好形神一體觀的理論能很好地提高臨床療效。然而,在實(shí)際的臨床運(yùn)用中,有一部分能反應(yīng)形神一體的臨床指標(biāo)如面色、眼神、睡眠等常被我們臨床醫(yī)生所忽略。如何獲得這些指標(biāo),以便更好地指導(dǎo)臨床的辨證施治,這是本課題聽要解決的問題之一。由于中醫(yī)學(xué)語言是一種次語言,基于次語言的語言處理技術(shù)能對(duì)中醫(yī)文本進(jìn)行相當(dāng)深度的理解式分析和知識(shí)抽取,本課題將文本挖掘技術(shù)引入希望能在大量的中醫(yī)文獻(xiàn)中,篩選出在臨床實(shí)踐中被我們忽略掉而能反應(yīng)形神一體觀的臨床指標(biāo)。

第5篇:挖掘技術(shù)論文范文

統(tǒng)計(jì)學(xué)論文2000字(一):影響民族院校統(tǒng)計(jì)學(xué)專業(yè)回歸分析成績因素的研究論文

摘要:學(xué)習(xí)成績是評(píng)價(jià)學(xué)生素質(zhì)的重要方面,也是教師檢驗(yàn)教學(xué)能力、反思教學(xué)成果的重要標(biāo)準(zhǔn)。利用大連民族大學(xué)統(tǒng)計(jì)學(xué)專業(yè)本科生有關(guān)數(shù)據(jù)(專業(yè)基礎(chǔ)課成績、平時(shí)成績和回歸分析期末成績),建立多元線性回歸模型,對(duì)影響回歸分析期末成績的因素進(jìn)行深入研究,其結(jié)果對(duì)今后的教學(xué)方法改進(jìn)和教學(xué)質(zhì)量提高具有十分重要的指導(dǎo)意義。

關(guān)鍵詞:多元線性回歸;專業(yè)基礎(chǔ)課成績;平時(shí)成績;期末成績

為了實(shí)現(xiàn)教學(xué)目標(biāo),提高教學(xué)質(zhì)量,有效提高學(xué)生學(xué)習(xí)成績是很有必要的。我們知道專業(yè)基礎(chǔ)課成績必定影響專業(yè)課成績,而且平時(shí)成績也會(huì)影響專業(yè)課成績,這兩類成績與專業(yè)課成績基本上是呈正相關(guān)的,但它們之間的關(guān)系密切程度有多大?它們之間又存在怎樣的內(nèi)在聯(lián)系呢?就這些問題,本文主要選取了2016級(jí)統(tǒng)計(jì)專業(yè)50名學(xué)生的四門專業(yè)基礎(chǔ)課成績以及回歸分析的平時(shí)成績和期末成績,運(yùn)用SPSS統(tǒng)計(jì)軟件進(jìn)行分析研究,尋求回歸分析期末成績影響因素的變化規(guī)律,擬合出關(guān)系式,從而為強(qiáng)化學(xué)生的后續(xù)學(xué)習(xí)和提高老師的教學(xué)質(zhì)量提供了有利依據(jù)。

一、數(shù)據(jù)選取

回歸分析是統(tǒng)計(jì)專業(yè)必修課,也是統(tǒng)計(jì)學(xué)中的一個(gè)非常重要的分支,它在自然科學(xué)、管理科學(xué)和社會(huì)、經(jīng)濟(jì)等領(lǐng)域應(yīng)用十分廣泛。因此研究影響統(tǒng)計(jì)學(xué)專業(yè)回歸分析成績的相關(guān)性是十分重要的。

選取了統(tǒng)計(jì)專業(yè)50名學(xué)生的專業(yè)基礎(chǔ)課成績(包括數(shù)學(xué)分析、高等代數(shù)、解析幾何和概率論)、回歸分析的平時(shí)成績和期末成績,結(jié)合多元線性回歸的基礎(chǔ)理論知識(shí)[1-2],建立多元回歸方程,進(jìn)行深入研究,可以直觀、高效、科學(xué)地分析各種因素對(duì)回歸分析期末成績造成的影響。

二、建立多元線性回歸模型1及數(shù)據(jù)分析

運(yùn)用SPSS統(tǒng)計(jì)軟件對(duì)回歸分析期末成績的影響因素進(jìn)行研究,可以得到準(zhǔn)確、科學(xué)合理的數(shù)據(jù)結(jié)果,全面分析評(píng)價(jià)學(xué)生考試成績,對(duì)教師以后的教學(xué)工作和學(xué)生的學(xué)習(xí)會(huì)有較大幫助。自變量x1表示數(shù)學(xué)分析成績,x2表示高等代數(shù)成績,x3表示解析幾何成績,x4表示概率論成績,x5表示平時(shí)成績;因變量y1表示回歸分析期末成績,根據(jù)經(jīng)驗(yàn)可知因變量y1和自變量xi,i=1,2,3,4,5之間大致成線性關(guān)系,可建立線性回歸模型:

(1)

線性回歸模型通常滿足以下幾個(gè)基本假設(shè),

1.隨機(jī)誤差項(xiàng)具有零均值和等方差,即

(2)

這個(gè)假定通常稱為高斯-馬爾柯夫條件。

2.正態(tài)分布假定條件

由多元正態(tài)分布的性質(zhì)和上述假定可知,隨機(jī)變量y1服從n維正態(tài)分布。

從表1描述性統(tǒng)計(jì)表中可看到各變量的平均值1=79.68,2=74.66,3=77.22,4=78.10,5=81.04,1=75.48;xi的標(biāo)準(zhǔn)差分別為10.847,11.531,8.929,9.018,9.221,y1的標(biāo)準(zhǔn)差為8.141;有效樣本量n=50。

回歸分析期末成績y1的多元回歸模型1為:

y1=-5.254+0.221x1-0.4x2+0.154x3

+0.334x4+0.347x5

從表2中可以看到各變量的|t|值,在給定顯著水平?琢=0.05的情況下,通過t分布表可以查出,自由度為44的臨界值t?琢/2(44)=2.015,由于高等代數(shù)x2的|t|值為0.651小于t?琢/2(44),因此x2對(duì)y1的影響不顯著,其他自變量對(duì)y1都是線性顯著的。下面利用后退法[3]剔除自變量x2。

三、后退法建立多元線性回歸模型2及數(shù)據(jù)分析

從模型1中剔除了x2變量,多元回歸模型2為:

y1=-5.459+0.204x1+0.149x3+0.377x4+0.293x5(5)

在表4中,F(xiàn)統(tǒng)計(jì)量為90.326,在給定顯著水平?琢=0.05的情況下,查F分布表可得,自由度為p=4和n-p-1=45的臨界值F0.05(4,45)=2.579,所以F>F0.05(4,45),在表5中,所有自變量的|t|值都大于t?琢/2(45)=2.014,因此,多元回歸模型2的線性關(guān)系是顯著的。

四、結(jié)束語

通過對(duì)上述模型進(jìn)行分析,即各個(gè)自變量對(duì)因變量的邊際影響,可以得到以下結(jié)論:在保持其他條件不變的情況下,當(dāng)數(shù)學(xué)分析成績提高一分,則回歸分析成績可提高0.242分[4-5];同理,當(dāng)解析幾何成績、概率論成績和平時(shí)成績每提高一分,則回歸分析成績分別提高0.149分、0.377分和0.293分。

通過對(duì)學(xué)生專業(yè)基礎(chǔ)課成績、平時(shí)成績與回歸分析期末成績之間相關(guān)關(guān)系的研究,一方面有利于教師把控回歸分析教學(xué)課堂,提高教師意識(shí),注重專業(yè)基礎(chǔ)課教學(xué)的重要性,同時(shí),當(dāng)學(xué)生平時(shí)成績不好時(shí),隨時(shí)調(diào)整教學(xué)進(jìn)度提高學(xué)生平時(shí)學(xué)習(xí)能力;另一方面使學(xué)生認(rèn)識(shí)到,為了更好地掌握回歸分析知識(shí),應(yīng)加強(qiáng)專業(yè)基礎(chǔ)課的學(xué)習(xí),提高平時(shí)學(xué)習(xí)的積極性。因此,通過對(duì)回歸分析期末成績影響因素的研究能有效的解決教師教學(xué)和學(xué)生學(xué)習(xí)中的許多問題。

統(tǒng)計(jì)學(xué)畢業(yè)論文范文模板(二):大數(shù)據(jù)背景下統(tǒng)計(jì)學(xué)專業(yè)“數(shù)據(jù)挖掘”課程的教學(xué)探討論文

摘要:互聯(lián)網(wǎng)技術(shù)、物聯(lián)網(wǎng)技術(shù)、云計(jì)算技術(shù)的蓬勃發(fā)展,造就了一個(gè)嶄新的大數(shù)據(jù)時(shí)代,這些變化對(duì)統(tǒng)計(jì)學(xué)專業(yè)人才培養(yǎng)模式的變革起到了助推器的作用,而數(shù)據(jù)挖掘作為拓展和提升大數(shù)據(jù)分析方法與思路的應(yīng)用型課程,被廣泛納入統(tǒng)計(jì)學(xué)本科專業(yè)人才培養(yǎng)方案。本文基于數(shù)據(jù)挖掘課程的特點(diǎn),結(jié)合實(shí)際教學(xué)經(jīng)驗(yàn),對(duì)統(tǒng)計(jì)學(xué)本科專業(yè)開設(shè)數(shù)據(jù)挖掘課程進(jìn)行教學(xué)探討,以期達(dá)到更好的教學(xué)效果。

關(guān)鍵詞:統(tǒng)計(jì)學(xué)專業(yè);數(shù)據(jù)挖掘;大數(shù)據(jù);教學(xué)

一、引言

通常人們總結(jié)大數(shù)據(jù)有“4V”的特點(diǎn):Volume(體量大),Variety(多樣性),Velocity(速度快)和Value(價(jià)值密度低)。從這樣大量、多樣化的數(shù)據(jù)中挖掘和發(fā)現(xiàn)內(nèi)在的價(jià)值,是這個(gè)時(shí)代帶給我們的機(jī)遇與挑戰(zhàn),同時(shí)對(duì)數(shù)據(jù)分析技術(shù)的要求也相應(yīng)提高。傳統(tǒng)教學(xué)模式并不能適應(yīng)和滿足學(xué)生了解數(shù)據(jù)處理和分析最新技術(shù)與方法的迫切需要。對(duì)于常常和數(shù)據(jù)打交道的統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生來說,更是如此。

二、課程教學(xué)探討

針對(duì)統(tǒng)計(jì)學(xué)本科專業(yè)的學(xué)生而言,“數(shù)據(jù)挖掘”課程一般在他們?nèi)昙?jí)或者四年級(jí)所開設(shè),他們在前期已經(jīng)學(xué)習(xí)完統(tǒng)計(jì)學(xué)、應(yīng)用回歸分析、多元統(tǒng)計(jì)分析、時(shí)間序列分析等課程,所以在“數(shù)據(jù)挖掘”課程的教學(xué)內(nèi)容選擇上要有所取舍,同時(shí)把握好難度。不能把“數(shù)據(jù)挖掘”課程涵蓋了的所有內(nèi)容不加選擇地要求學(xué)生全部掌握,對(duì)學(xué)生來說是不太現(xiàn)實(shí)的,需要為統(tǒng)計(jì)學(xué)專業(yè)本科生“個(gè)性化定制”教學(xué)內(nèi)容。

(1)“數(shù)據(jù)挖掘”課程的教學(xué)應(yīng)該偏重于應(yīng)用,更注重培養(yǎng)學(xué)生解決問題的能力。因此,教學(xué)目標(biāo)應(yīng)該是:使學(xué)生樹立數(shù)據(jù)挖掘的思維體系,掌握數(shù)據(jù)挖掘的基本方法,提高學(xué)生的實(shí)際動(dòng)手能力,為在大數(shù)據(jù)時(shí)代,進(jìn)一步學(xué)習(xí)各種數(shù)據(jù)處理和定量分析工具打下必要的基礎(chǔ)。按照這個(gè)目標(biāo),教學(xué)內(nèi)容應(yīng)以數(shù)據(jù)挖掘技術(shù)的基本原理講解為主,讓學(xué)生了解和掌握各種技術(shù)和方法的來龍去脈、功能及優(yōu)缺點(diǎn);以算法講解為輔,由于有R語言、python等軟件,學(xué)生了解典型的算法,能用軟件把算法實(shí)現(xiàn),對(duì)軟件的計(jì)算結(jié)果熟練解讀,對(duì)各種算法的改進(jìn)和深入研究則不作要求,有興趣的同學(xué)可以自行課下探討。

(2)對(duì)于已經(jīng)學(xué)過的內(nèi)容不再詳細(xì)講解,而是側(cè)重介紹它們在數(shù)據(jù)挖掘中的功能及綜合應(yīng)用。在新知識(shí)的講解過程中,注意和已學(xué)過知識(shí)的融匯貫通,既復(fù)習(xí)鞏固了原來學(xué)過的知識(shí),同時(shí)也無形中降低了新知識(shí)的難度。比如,在數(shù)據(jù)挖掘模型評(píng)估中,把混淆矩陣、ROC曲線、誤差平方和等知識(shí)點(diǎn)就能和之前學(xué)過的內(nèi)容有機(jī)聯(lián)系起來。

(3)結(jié)合現(xiàn)實(shí)數(shù)據(jù),讓學(xué)生由“被動(dòng)接收”式的學(xué)習(xí)變?yōu)椤爸鲃?dòng)探究”型的學(xué)習(xí)。在講解每種方法和技術(shù)之后,增加一個(gè)或幾個(gè)案例,以加強(qiáng)學(xué)生對(duì)知識(shí)的理解。除了充分利用已有的國內(nèi)外數(shù)據(jù)資源,還可以鼓勵(lì)學(xué)生去搜集自己感興趣的或者國家及社會(huì)大眾關(guān)注的問題進(jìn)行研究,提升學(xué)生學(xué)習(xí)的成就感。

(4)充分考慮前述提到的三點(diǎn),課程內(nèi)容計(jì)劃安排見表1。

(5)課程的考核方式既要一定的理論性,又不能失掉實(shí)踐應(yīng)用性,所以需要結(jié)合平時(shí)課堂表現(xiàn)、平時(shí)實(shí)驗(yàn)項(xiàng)目完成情況和期末考試來綜合評(píng)定成績。采取期末閉卷理論考試占50%,平時(shí)實(shí)驗(yàn)項(xiàng)目完成占40%,課堂表現(xiàn)占10%,這樣可以全方位的評(píng)價(jià)學(xué)生的表現(xiàn)。

三、教學(xué)效果評(píng)估

經(jīng)過幾輪的教學(xué)實(shí)踐后,取得了如下的教學(xué)效果:

(1)學(xué)生對(duì)課程的興趣度在提升,課下也會(huì)不停地去思考數(shù)據(jù)挖掘有關(guān)的方法和技巧,發(fā)現(xiàn)問題后會(huì)一起交流與討論。

(2)在大學(xué)生創(chuàng)新創(chuàng)業(yè)項(xiàng)目或者數(shù)據(jù)分析的有關(guān)競賽中,選用數(shù)據(jù)挖掘方法的人數(shù)也越來越多,部分同學(xué)的成果還能在期刊上正式發(fā)表,有的同學(xué)還能在競賽中取得優(yōu)秀的成績。

(3)統(tǒng)計(jì)學(xué)專業(yè)本科生畢業(yè)論文的選題中利用數(shù)據(jù)挖掘有關(guān)方法來完成的論文越來越多,論文的完成質(zhì)量也在不斷提高。

(4)本科畢業(yè)生的就業(yè)崗位中從事數(shù)據(jù)挖掘工作的人數(shù)有所提高,說明滿足企業(yè)需求技能的人數(shù)在增加。繼續(xù)深造的畢業(yè)生選擇數(shù)據(jù)挖掘研究方向的人數(shù)也在逐漸增多,表明學(xué)生的學(xué)習(xí)興趣得以激發(fā)。

教學(xué)實(shí)踐結(jié)果表明,通過數(shù)據(jù)挖掘課程的學(xué)習(xí),可以讓學(xué)生在掌握理論知識(shí)的基礎(chǔ)上,進(jìn)一步提升分析問題和解決實(shí)際問題的能力。

第6篇:挖掘技術(shù)論文范文

1醫(yī)學(xué)論文的基本要求

1.1創(chuàng)新性醫(yī)學(xué)論文的創(chuàng)新性是指文章要有新意,要發(fā)展醫(yī)學(xué)成就,破解醫(yī)學(xué)問題。醫(yī)學(xué)論文有無創(chuàng)新,選題是關(guān)鍵。選題創(chuàng)新是醫(yī)學(xué)論文寫作的靈魂,是衡量醫(yī)學(xué)論文價(jià)值的重要標(biāo)準(zhǔn)??审w現(xiàn)在:①理論方面的選題應(yīng)有創(chuàng)新見解,既要反映作者在某些理論方面的獨(dú)創(chuàng)見解,又要提出這些見解的依據(jù);②應(yīng)用方面的選題應(yīng)有創(chuàng)新技術(shù)等,也就是要寫出新發(fā)明、新技術(shù)、新產(chǎn)品、新設(shè)備的關(guān)鍵,或揭示原有技術(shù)移植到新的醫(yī)學(xué)領(lǐng)域中的效果;③創(chuàng)新性還包括研究方法方面的改進(jìn)或突破。

1.2可行性所謂選題的可行性,是指能夠充分發(fā)揮作者的綜合條件和可以勝任及如期完成醫(yī)學(xué)論文寫作的把握程度。選題切忌好高鶩遠(yuǎn),脫離實(shí)際,但也不應(yīng)過低,影響主客觀的正常發(fā)揮,降低了醫(yī)學(xué)論文的水平。影響選題的可行性因素有:①主觀條件,包括作者知識(shí)素質(zhì)結(jié)構(gòu)、研究能力、技術(shù)水平及特長和興趣等;②客觀條件,包括經(jīng)費(fèi)、資料、時(shí)間、設(shè)備等。

1.3實(shí)用性撰寫醫(yī)學(xué)論文的目的是為了交流及應(yīng)用。要從實(shí)際出發(fā),選擇夠指導(dǎo)科研、指導(dǎo)臨床、造福人類的主題,因此,選題的實(shí)用性尤為重要。

1.4科學(xué)性醫(yī)學(xué)論文是臨床和醫(yī)學(xué)科學(xué)研究工作的客觀反映,其寫作的具體內(nèi)容應(yīng)該是取材客觀真實(shí)、主題揭示本質(zhì)、科研設(shè)計(jì)合理、論證科學(xué)嚴(yán)謹(jǐn)、表達(dá)邏輯性強(qiáng)、經(jīng)過實(shí)踐檢驗(yàn)。所以,嚴(yán)格遵守選題的科學(xué)性原則,是醫(yī)學(xué)論文寫作的生命。

1.5前瞻性要選擇有研究價(jià)值及發(fā)展前途的主題,應(yīng)積極開發(fā)研究新領(lǐng)域、新學(xué)科和新理論。

2選題的基本方法

2.1根據(jù)課題研究的結(jié)論來確定主題這是常用的方法,可分為:①以科研的結(jié)論或部分結(jié)論作為醫(yī)學(xué)論文的主題;②科研結(jié)果與開題時(shí)預(yù)測不一致,待查出原因后,再尋找主題;③科研達(dá)不到預(yù)期結(jié)果,可總結(jié)經(jīng)驗(yàn),從反面挖掘主題。

2.2在科研過程中選題醫(yī)學(xué)科研的過程中,有時(shí)會(huì)出現(xiàn)意外的現(xiàn)象或問題,作者如果能夠細(xì)心觀察、及時(shí)發(fā)現(xiàn),可以在這些偶然中獲得新的選題。

2.3在臨床實(shí)踐中選題臨床工作是醫(yī)學(xué)論文寫作取之不盡的源泉,作者在臨床中會(huì)經(jīng)常遇到許多需要解決的實(shí)際應(yīng)用問題或理論問題,對(duì)此,只要從本學(xué)科實(shí)際出發(fā),用心思考,會(huì)從中產(chǎn)生很多好的主題。其包括:①探討發(fā)病機(jī)制與預(yù)后情況;②分析臨床癥狀與表現(xiàn);③研究診斷方法和治療方法;④疾病的多因素分析等。

2.4從文獻(xiàn)資料中選題醫(yī)學(xué)文獻(xiàn)是人們長期積累的寶貴財(cái)富,是醫(yī)學(xué)論文選題的重要來源。閱讀最新文獻(xiàn)資料,可以了解當(dāng)前醫(yī)學(xué)科學(xué)研究的進(jìn)展情況,開拓思路、激發(fā)靈感,從而挖掘提煉出好的醫(yī)學(xué)論文主題。

3醫(yī)學(xué)論文的一般體裁

3.1實(shí)驗(yàn)研究一般為病因、病理、生理、生化、藥理、生物、寄生蟲和流行病學(xué)等實(shí)驗(yàn)研究。主要包括:①對(duì)各種動(dòng)物進(jìn)行藥理、毒理實(shí)驗(yàn),外科手術(shù)實(shí)驗(yàn);②對(duì)某種疾病的病原或病因的體外實(shí)驗(yàn);③某些藥物的抗癌、抗菌、抗寄生蟲實(shí)驗(yàn);④消毒、殺蟲和滅菌的實(shí)驗(yàn)。

3.2臨床分析對(duì)臨床上某種疾病病例(百例以上為佳)的病因、臨床表現(xiàn)、分型、治療方法和療效觀察等進(jìn)行分析、討論,總結(jié)經(jīng)驗(yàn)教訓(xùn),并提出新建議、新見解,以提高臨床療效。

3.3療效觀察指使用某種新藥、新療法治療某種疾病,對(duì)治療的方法、效果、劑量、療程及不良反應(yīng)等進(jìn)行觀察、研究,或設(shè)立對(duì)照組對(duì)新舊藥物或療法的療效進(jìn)行比較,對(duì)比療效的高低、療法的優(yōu)劣、不良反應(yīng)的種類及程度,并對(duì)是否適于推廣應(yīng)用提出評(píng)價(jià)意見。

3.4病例報(bào)告主要報(bào)告罕見病及疑難重癥;雖然曾有少數(shù)類似報(bào)道但尚有重復(fù)驗(yàn)證或加深認(rèn)識(shí)的必要。

3.5病例(理)討論臨床病例討論主要是對(duì)某些疑難、復(fù)雜、易于誤診誤治的病例,在診斷和治療方面進(jìn)行集體討論,以求得正確的診斷和有效的治療。臨床病理討論則以對(duì)少見或疑難疾病的病理檢查、診斷及相關(guān)討論為主。

3.6調(diào)查報(bào)告在一定范圍的人群里,不施加人工處理因素,對(duì)某一疾病(傳染病、流行病、職業(yè)病、地方病等)的發(fā)病情況、發(fā)病因素、病理、防治方法及其效果進(jìn)行流行病學(xué)調(diào)查研究,給予評(píng)價(jià),并對(duì)防治方案等提出建議。

第7篇:挖掘技術(shù)論文范文

開發(fā)科技創(chuàng)新決策分析服務(wù)系統(tǒng),其基礎(chǔ)性的工作是構(gòu)建元數(shù)據(jù)倉儲(chǔ)知識(shí)庫。從科技文獻(xiàn)數(shù)據(jù)庫種類來看,包括:科技期刊、學(xué)位論文、會(huì)議論文、標(biāo)準(zhǔn)、專利文獻(xiàn)數(shù)據(jù)庫及科技成果、企業(yè)產(chǎn)品、科研機(jī)構(gòu)、科技名人等事實(shí)型數(shù)據(jù)庫,從這些科技文獻(xiàn)中,挖掘其相互邏輯關(guān)系、交叉融合間的溝通脈絡(luò)是知識(shí)獲取、知識(shí)組織的關(guān)鍵。結(jié)合科技文獻(xiàn)資源的特性和文獻(xiàn)檢索導(dǎo)航需求分析,萬方軟件公司提出了基于“知識(shí)獲取五要素”的知識(shí)組織方法【4】,將學(xué)科、主題、人物、機(jī)構(gòu)、基金五要素作為知識(shí)獲取的分析主題,構(gòu)成二維空間,組成各個(gè)要素之間的相互關(guān)聯(lián)關(guān)系。五要素之間的相互關(guān)聯(lián)包含了多種科研信息,從各個(gè)角度,各個(gè)側(cè)面都有無窮的知識(shí)可以去挖掘分析。比如:機(jī)構(gòu)和學(xué)科關(guān)聯(lián),可以獲得各個(gè)機(jī)構(gòu)的研究學(xué)科,以及有哪些機(jī)構(gòu)在研究該學(xué)科的分析結(jié)果;機(jī)構(gòu)、學(xué)科和作者關(guān)聯(lián),可以獲得某個(gè)學(xué)科在某個(gè)機(jī)構(gòu)中有哪些人在做相關(guān)研究的分析結(jié)果等等。因此從知識(shí)的組織角度,在構(gòu)建元數(shù)據(jù)倉儲(chǔ)知識(shí)庫時(shí),以五要素知識(shí)元為基礎(chǔ),通過對(duì)海量科技文獻(xiàn)的處理(采集、轉(zhuǎn)換、清洗、質(zhì)量檢測)和對(duì)五要素的深度標(biāo)引,最終構(gòu)建基于五要素的元數(shù)據(jù)知識(shí)倉儲(chǔ),作為開發(fā)科技創(chuàng)新決策分析服務(wù)系統(tǒng)的基礎(chǔ)。

2科技創(chuàng)新決策分析服務(wù)體系架構(gòu)和功能設(shè)計(jì)

元數(shù)據(jù)倉儲(chǔ)知識(shí)庫的構(gòu)建為科技創(chuàng)新決策分析服務(wù)提供了基礎(chǔ)保障,在此基礎(chǔ)上,運(yùn)用數(shù)據(jù)挖掘技術(shù)、自動(dòng)分類∕聚類技術(shù)、信息可視化等技術(shù),開發(fā)基于WEB的科技創(chuàng)新決策分析服務(wù)系統(tǒng)。基于元數(shù)據(jù)倉儲(chǔ)知識(shí)庫的科技創(chuàng)新決策分析服務(wù)主要體現(xiàn)在對(duì)科技創(chuàng)新能力的定量評(píng)價(jià)。主要功能設(shè)計(jì)如下:⑴主題知識(shí)脈絡(luò)分析。主要對(duì)主題關(guān)鍵詞所代表的知識(shí)點(diǎn)或概念在各年度的研究發(fā)展趨勢和研究熱點(diǎn)進(jìn)行分析。包括:該主題各年度發(fā)文總量趨勢;該主題的相關(guān)關(guān)鍵詞;關(guān)注該主題的相關(guān)人物、機(jī)構(gòu)以及涉及該主題的重要發(fā)文期刊。系統(tǒng)可通過用戶輸入的主題關(guān)鍵詞,在主題知識(shí)庫中挖掘揭示主題相關(guān)的各類科研產(chǎn)出情況,并通過主題相關(guān)的創(chuàng)新實(shí)體分析,為用戶推薦權(quán)威的研究機(jī)構(gòu)和行業(yè)領(lǐng)域?qū)<?。?/p>

科研人員科研能力評(píng)估分析。主要對(duì)科研人員(作者)科研產(chǎn)出情況進(jìn)行統(tǒng)計(jì)分析。包括:科研人員的簡介;與作者合作過的相關(guān)科技人員信息;作者的研究主題、研究方向、主要發(fā)文期刊及參與基金項(xiàng)目情況。系統(tǒng)可通過用戶輸入的科研人員姓名,在人物庫中進(jìn)行機(jī)構(gòu)匯總,并經(jīng)過用戶篩選科研人員現(xiàn)在或歷史所在機(jī)構(gòu),對(duì)作者的科研產(chǎn)出能力和科研績效水平得出最全面和客觀的評(píng)估和總結(jié)。⑶

論文引用情況分析。主要對(duì)被引用情況進(jìn)行統(tǒng)計(jì)分析。包括:該論文被引論文具體信息(期刊、學(xué)位、會(huì)議、技術(shù)報(bào)告等)和比例、被引數(shù)量、被引用頻次等。系統(tǒng)按用戶輸入的論文標(biāo)題、作者、關(guān)鍵詞進(jìn)行檢索,按發(fā)文時(shí)間、相關(guān)度、題名進(jìn)行排序,從而可以對(duì)該論文進(jìn)行學(xué)術(shù)質(zhì)量的綜合、定量的評(píng)價(jià)。該功能即可獨(dú)立使用,也可嵌入在科研人員科研能力評(píng)估分析系統(tǒng)中使用。⑷機(jī)構(gòu)創(chuàng)新能力評(píng)估。主要對(duì)機(jī)構(gòu)的期刊論文、學(xué)位論文、會(huì)議論文、專利、成果及機(jī)構(gòu)承擔(dān)的國家基金項(xiàng)目進(jìn)行統(tǒng)計(jì)分析,從而反映出機(jī)構(gòu)的總體科學(xué)實(shí)力和科研績效水平。系統(tǒng)可通過用戶輸入的機(jī)構(gòu)名稱,通過簡稱俗稱的規(guī)范對(duì)應(yīng),按論文類別、基金類別等方式進(jìn)行機(jī)構(gòu)科研產(chǎn)出的揭示,得出機(jī)構(gòu)的科研能力和學(xué)術(shù)定位。

3科技創(chuàng)新決策分析服務(wù)系統(tǒng)的應(yīng)用

科技創(chuàng)新決策分析服務(wù)系統(tǒng)目前在科技文獻(xiàn)共享服務(wù)平臺(tái)中已開始應(yīng)用,平臺(tái)主要為用戶提供了作者科研協(xié)作關(guān)系、主題知識(shí)脈絡(luò)分析、機(jī)構(gòu)科研能力評(píng)估三種服務(wù)。⑴作者科研協(xié)作關(guān)系。在作者科研協(xié)作關(guān)系服務(wù)中,可以分析出用戶所關(guān)心作者的如下信息:①作者合作關(guān)系:通過可視化的與合作者的關(guān)系呈現(xiàn),可以分析出作者在科研工作中與合作者的合作關(guān)系,節(jié)點(diǎn)間的距離越近,表明與合作者合作發(fā)表的論文次數(shù)越多,合作關(guān)系越緊密。②作者科研產(chǎn)出統(tǒng)計(jì):可以統(tǒng)計(jì)出作者總體的數(shù)量。③作者研究主題和研究方向:可以分析出作者的研究主題和按學(xué)科分析的研究方向。④主要發(fā)文期刊:可以統(tǒng)計(jì)出作者在不同期刊的數(shù)量,獲得作者關(guān)注的期刊情況。⑤作者簡介:獲得作者單位、職稱、職務(wù)等基本信息。在知識(shí)脈絡(luò)分析服務(wù)中,以用戶輸入的主題詞為分析依據(jù),通過可視化信息展示,分析出主題詞所代表的知識(shí)點(diǎn)或概念在各年度的研究發(fā)展趨勢和研究熱點(diǎn)。并提供主題詞所關(guān)聯(lián)的相關(guān)詞、相關(guān)人物、相關(guān)期刊和機(jī)構(gòu)的知識(shí)脈絡(luò)。

4結(jié)語

第8篇:挖掘技術(shù)論文范文

>> 基于本體的網(wǎng)絡(luò)輿情觀點(diǎn)挖掘方法研究 基于熱點(diǎn)文件下載的網(wǎng)絡(luò)輿情信息挖掘方法研究 基于網(wǎng)頁文本獲取的高校網(wǎng)絡(luò)輿情監(jiān)控 基于OAG循環(huán)的網(wǎng)絡(luò)輿情管理模型研究 基于大規(guī)模文本數(shù)據(jù)情感挖掘的企業(yè)輿情研究 基于文本挖掘的網(wǎng)絡(luò)媒體報(bào)道研究 基于模糊神經(jīng)網(wǎng)絡(luò)的Web文本挖掘系統(tǒng) 基于PDCA循環(huán)的預(yù)算管理 基于PDCA循環(huán)的績效考評(píng) 基于 PDCA 循環(huán)方法的瀝青路面質(zhì)量動(dòng)態(tài)管理的研究 基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng) 基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)輿情智能監(jiān)測與引導(dǎo)平臺(tái)設(shè)計(jì)研究 基于Web挖掘的突發(fā)事件網(wǎng)絡(luò)輿情預(yù)警研究 基于Web數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情分析技術(shù)研究 基于Web挖掘的突發(fā)事件網(wǎng)絡(luò)輿情預(yù)警策略探討 基于數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)輿情預(yù)測中的應(yīng)用 基于數(shù)據(jù)挖掘的高校網(wǎng)絡(luò)輿情分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) 基于數(shù)據(jù)挖掘的輿情觀點(diǎn)挖掘研究 基于蛙鳴博弈的網(wǎng)絡(luò)輿情與政府監(jiān)管的模型淺析 基于PDCA循環(huán)的績效管理體系的構(gòu)建 常見問題解答 當(dāng)前所在位置:.

[2]張玉亮.突發(fā)事件網(wǎng)絡(luò)輿情的生成原因與導(dǎo)控策略――基于網(wǎng)絡(luò)輿情主體心理的分析視閾[J].情報(bào)雜志,2012,31(4):54-57.

[3]許鑫,章成志,李雯靜.國內(nèi)網(wǎng)絡(luò)輿情研究的回顧與展望[J].情報(bào)理論與實(shí)踐,2009,32(3):115-120.

[4]Hua Zhao,Qingtian Zeng.Micro-blog Hot Event Detection Based on Dynamic Event Model.Lecture Notes in Artificial Intelligence 8041,2013:161-172.

[5]鄭軍.網(wǎng)絡(luò)輿情監(jiān)控的熱點(diǎn)發(fā)現(xiàn)算法研究[D].哈爾濱哈爾濱工程大學(xué),2007.

[6]陳耘可,李博,鄭天翔.PDCA循環(huán)在煤炭企業(yè)質(zhì)量標(biāo)準(zhǔn)化建設(shè)中的研究與應(yīng)用[J].煤炭經(jīng)濟(jì)研究,2013,33(2):77-79.

[7]辛敏.PDCA理論在護(hù)理質(zhì)量管理中的應(yīng)用研究[D].碩士學(xué)位論文:山西醫(yī)科大學(xué),2010.

第9篇:挖掘技術(shù)論文范文

【關(guān)鍵詞】 科技文獻(xiàn) 評(píng)價(jià)體系 評(píng)價(jià)指標(biāo)

二十世紀(jì)八九十年代是科研評(píng)價(jià)發(fā)展的高峰時(shí)期,科研管理專家和經(jīng)濟(jì)學(xué)家提出了許多系統(tǒng)的評(píng)價(jià)方法[1]。科研評(píng)價(jià)是科研管理工作的重要環(huán)節(jié)和核心內(nèi)容之一,是推動(dòng)科技事業(yè)持續(xù)健康發(fā)展,促進(jìn)科技資源優(yōu)化配置,提高科技管理水平的重要手段和保障[2]。而在科研評(píng)價(jià)中,科研產(chǎn)出始終作為科研評(píng)價(jià)的主要內(nèi)容。本文通過對(duì)科技文獻(xiàn)的特點(diǎn)進(jìn)行分析,找出各個(gè)要素以及要素間的語義關(guān)系。通過對(duì)這些要素進(jìn)行深入分析,在原有的理論和實(shí)踐的基礎(chǔ)上,對(duì)科技文獻(xiàn)產(chǎn)出評(píng)價(jià)體系重新設(shè)計(jì),分別從科研機(jī)構(gòu)綜合科研實(shí)力、核心作者學(xué)術(shù)力、學(xué)科發(fā)展、最新科研動(dòng)向(領(lǐng)先研究領(lǐng)域),需求信息特點(diǎn)等五個(gè)方面,建立了一個(gè)相對(duì)系統(tǒng)全面的針對(duì)科研機(jī)構(gòu)的科研評(píng)價(jià)指標(biāo)體系。

1 科技文獻(xiàn)產(chǎn)出評(píng)價(jià)體系的作用

科技文獻(xiàn)是基礎(chǔ)性研究成果的主要表現(xiàn)形式,也是表征一個(gè)國家、地區(qū)基礎(chǔ)性研究實(shí)力的主要指標(biāo)[3]。近二十年,一直被高等院校、科研院所以及政府部門作為評(píng)價(jià)科研能力水平和科研成果的重要指標(biāo)??萍嘉墨I(xiàn)產(chǎn)出評(píng)價(jià)體系的作用主要體現(xiàn)在三個(gè)層次上:宏觀上評(píng)價(jià)國家的科研創(chuàng)新水平,反映一個(gè)國家基礎(chǔ)研究、應(yīng)用研究等方面的情況,在一定程度上反映了一個(gè)國家的科技技術(shù)水平和國際競爭力水平;中觀上評(píng)價(jià)科研機(jī)構(gòu)的科研業(yè)績,反映了科研機(jī)構(gòu)的學(xué)術(shù)、科研水平及科研機(jī)構(gòu)間的競爭力;微觀上評(píng)價(jià)科研人員的科研能力,反映某個(gè)機(jī)構(gòu)的團(tuán)隊(duì)或個(gè)人的學(xué)術(shù)地位和影響。

2 科技文獻(xiàn)產(chǎn)出的要素

本文通過對(duì)科技文獻(xiàn)的特點(diǎn)進(jìn)行分析,找到各種要素以及要素間的語義關(guān)系。通過對(duì)這些要素的統(tǒng)計(jì)分析,可以展開計(jì)量分析、主題揭示、關(guān)聯(lián)挖掘和綜合評(píng)價(jià),從而獲取對(duì)科技文獻(xiàn)產(chǎn)出相關(guān)要素更深入全面的認(rèn)識(shí)。

2.1 科技論文產(chǎn)出的相關(guān)要素

從科技文獻(xiàn)中可以獲得題名、摘要、作者、作者機(jī)構(gòu)(單位)、關(guān)鍵詞、參考文獻(xiàn)、分類號(hào)以及基金項(xiàng)目等相關(guān)要素??萍颊撐牡南嚓P(guān)要素如下:

(1)科技論文是學(xué)術(shù)刊物上發(fā)表的科學(xué)研究成果??萍颊撐模}名、作者、機(jī)構(gòu)(單位)、摘要、關(guān)鍵詞、參考文獻(xiàn)、發(fā)表期刊或會(huì)議)。

(2)作者,科技文獻(xiàn)的主要?jiǎng)?chuàng)作者,是科技文獻(xiàn)產(chǎn)出的源頭。作者(姓名、性別、出生年月、職稱、單位、郵箱、研究興趣)。

(3)期刊,科技文獻(xiàn)產(chǎn)出的媒介和主要載體。期刊(名稱、ISSN、主辦單位、地址、郵箱、出版周期、是否核心、影響因子)。

(4)機(jī)構(gòu)(單位),是科研人員聯(lián)系形成科研團(tuán)體的主要方式。機(jī)構(gòu)(名稱、地址、郵編)。

(5)基金,是資助基礎(chǔ)科研工作的主要方式?;穑Q、編號(hào)、類別、起止時(shí)間、額度、主持人、依托單位)。

(6)關(guān)鍵詞,作為科研人員對(duì)科研成果內(nèi)容提綱挈領(lǐng)的體現(xiàn),是科技文獻(xiàn)產(chǎn)出的主要內(nèi)容特征。

2.2 科技文獻(xiàn)產(chǎn)出要素間的語義關(guān)系

要素與要素之間關(guān)系有三種:父子關(guān)系(等級(jí))、相等關(guān)系(等同)和相關(guān)關(guān)系。相關(guān)關(guān)系根據(jù)緊密程度,又分為直接相關(guān)和間接相關(guān)。直接相關(guān)是指直接定義了概念間的關(guān)系,沒有經(jīng)過任何其他的概念;間接相關(guān)是指某兩個(gè)概念雖然沒有直接定義關(guān)系,卻通過其他概念產(chǎn)生了關(guān)聯(lián)。

科技文獻(xiàn)產(chǎn)出要素的間關(guān)系如下圖1,其中的父子關(guān)系如文獻(xiàn)與參考文獻(xiàn);相等關(guān)系如作者與項(xiàng)目參與人員;直接相關(guān)如作者與文獻(xiàn)之間是撰寫與被撰寫的關(guān)系;間接關(guān)系如基金項(xiàng)目與文獻(xiàn)之間通過作者產(chǎn)生關(guān)聯(lián)。

3 科技文獻(xiàn)產(chǎn)出評(píng)價(jià)指標(biāo)體系

根據(jù)科技文獻(xiàn)產(chǎn)出要素以及要素之間的關(guān)系,圍繞科技文獻(xiàn)產(chǎn)出分別從科研機(jī)構(gòu)綜合科研實(shí)力、核心作者學(xué)術(shù)力、學(xué)科發(fā)展、最新科研動(dòng)向(領(lǐng)先研究領(lǐng)域),科研人員需求信息特點(diǎn)等五個(gè)方面設(shè)計(jì)評(píng)價(jià)體系。

3.1 科研機(jī)構(gòu)綜合科研實(shí)力評(píng)估指標(biāo)

科研機(jī)構(gòu)是一個(gè)國家科技創(chuàng)新能力的重要體現(xiàn),在提升國家綜合實(shí)力、創(chuàng)新能力、科技競爭力等方面發(fā)揮著主導(dǎo)作用?;谖墨I(xiàn)計(jì)量的角度,通過文獻(xiàn)發(fā)表數(shù)量、被引篇數(shù)及頻次、專利數(shù)量以及合作論文數(shù)量等指標(biāo),對(duì)科研機(jī)構(gòu)的成果(科技文獻(xiàn))進(jìn)行分析得出科研機(jī)構(gòu)的綜合科研實(shí)力總體情況。

科研機(jī)構(gòu)綜合實(shí)力評(píng)估分別從產(chǎn)出力、影響力、創(chuàng)新力和合作力四個(gè)方面進(jìn)行評(píng)估,指標(biāo)包括:

(1)科研機(jī)構(gòu)生產(chǎn)力:反映科研機(jī)構(gòu)科研產(chǎn)出能力。論文產(chǎn)出數(shù)量:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)發(fā)表的論文數(shù)量;(2)科研機(jī)構(gòu)影響力:反映科研機(jī)構(gòu)的學(xué)術(shù)水平和影響力。引文量(篇/次):科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)發(fā)表的論文被引用的數(shù)量(篇/次);篇均引用次數(shù):科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)所篇均被引用次數(shù);SCI/EI收錄的論文數(shù)量:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)被SCI/EI收錄的論文數(shù)量;核心期刊刊載的論文數(shù)量:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)被核心期刊刊載的論文數(shù)量;(3)科研機(jī)構(gòu)創(chuàng)新力:反映科研機(jī)構(gòu)的自主創(chuàng)新能力和創(chuàng)新水平。專利數(shù)量:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)公開的專利數(shù)量;基金立項(xiàng)數(shù):科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)基金立項(xiàng)數(shù)量;科技成果數(shù)量:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)科技成果數(shù)量;(4)科研機(jī)構(gòu)合作力:反映科研機(jī)構(gòu)與國際、國內(nèi)交流的活躍程度;會(huì)議論文數(shù)量:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)發(fā)表會(huì)議論文數(shù)量;合作論文數(shù)量:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)與其他機(jī)構(gòu)合作的論文數(shù)量的比例。C=No/(No+Ns),式中C:合作率;No:合作論文總數(shù);Ns:獨(dú)立論文數(shù)。

3.2 核心作者群學(xué)術(shù)力評(píng)估指標(biāo)

科技文獻(xiàn)的作者是推動(dòng)學(xué)科發(fā)展的主體,對(duì)機(jī)構(gòu)或?qū)W科的核心作者研究無疑具有重要意義。核心作者群是具有較高的學(xué)術(shù)產(chǎn)出和學(xué)術(shù)影響力的作者集合,是學(xué)科發(fā)展和創(chuàng)新的主體。通過對(duì)作者的發(fā)文量、被引次數(shù)等多方面指標(biāo),采用文獻(xiàn)計(jì)量、引文分析、數(shù)理統(tǒng)計(jì)等方法,綜合以上指標(biāo)用定量的方法對(duì)核心作者學(xué)術(shù)力進(jìn)行綜合評(píng)估。核心作者群學(xué)術(shù)力評(píng)估指標(biāo)包括:

(1)發(fā)文方面。

作者論文產(chǎn)出數(shù)量:作者在一定時(shí)間范圍內(nèi)發(fā)表的論文數(shù)量;

作者合作論文數(shù)量:作者在一定時(shí)間范圍內(nèi)與他人合作創(chuàng)作的論文數(shù)量。

(2)引文方面。

總被引次數(shù):作者在一定時(shí)間范圍內(nèi)發(fā)表的論文被引用的數(shù)量

自引次數(shù):作者在一定時(shí)間范圍內(nèi)發(fā)表的論文自己引用自己文獻(xiàn)的數(shù)量

3.3 學(xué)科發(fā)展評(píng)價(jià)指標(biāo)

學(xué)科發(fā)展評(píng)價(jià)則在于客觀科學(xué)地分析被評(píng)學(xué)科目前的發(fā)展基礎(chǔ)、發(fā)展?fàn)顩r和態(tài)勢,預(yù)測將來發(fā)展可能達(dá)到的程度,發(fā)現(xiàn)學(xué)科發(fā)展過程中存在的問題,分析問題產(chǎn)生的原因,探討解決問題、促進(jìn)學(xué)科發(fā)展的對(duì)策。開展學(xué)科發(fā)展評(píng)價(jià),從而為制定學(xué)科發(fā)展戰(zhàn)略以及進(jìn)行學(xué)科建設(shè)和管理提供直接、有力的支撐。學(xué)科發(fā)展評(píng)價(jià)指標(biāo)包括:(1)學(xué)科文獻(xiàn)數(shù)量分布:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)發(fā)表的論文在各個(gè)學(xué)科分布數(shù)量;(2)學(xué)科文獻(xiàn)數(shù)量增長趨勢:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)各個(gè)學(xué)科論文數(shù)量的增長趨勢;(3)學(xué)科關(guān)鍵詞及頻次:該學(xué)科在一定時(shí)間范圍內(nèi)論文的主要關(guān)鍵詞以及關(guān)鍵詞的出現(xiàn)次數(shù);(4)學(xué)科題名及頻次:該學(xué)科在一定時(shí)間范圍內(nèi)論文題名以及題名的出現(xiàn)次數(shù);(5)學(xué)科文獻(xiàn)引文量:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)該文獻(xiàn)被引用的數(shù)量。

3.4 最新科研動(dòng)向(領(lǐng)先研究領(lǐng)域)分析指標(biāo)

基金論文的生產(chǎn)能力是衡量這個(gè)學(xué)科科研實(shí)力和水平、科研組織能力及學(xué)科社會(huì)地位的重要標(biāo)志,而權(quán)威期刊刊載基金資助論文往往代表著該研究領(lǐng)域的新動(dòng)向、新趨勢、制高點(diǎn)。研究科學(xué)基金資助研究論文生產(chǎn)能力,對(duì)了解科研機(jī)構(gòu)科學(xué)學(xué)發(fā)展動(dòng)向具有重要的現(xiàn)實(shí)意義。

基金論文總數(shù)量:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)發(fā)表基金論文數(shù)量;

基金論文增長趨勢:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)基金論文的增長趨勢;

基金論文主題分布:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)基金論文的主題分布;

基金論文高頻關(guān)鍵詞:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)基金論文的出現(xiàn)頻次高的關(guān)鍵詞;

基金論文被引用量:科研機(jī)構(gòu)在一定時(shí)間范圍內(nèi)基金論文被引用次數(shù)。

3.5 科研人員需求信息的特點(diǎn)分析指標(biāo)

分析引文是研究科研人員使用信息的一種重要途徑。根據(jù)科學(xué)文獻(xiàn)的引文可以研究人員的信息需求特點(diǎn)。一般來說,附在論文末尾的被引用文獻(xiàn)是科研人員所需要和利用的最有代表性的文獻(xiàn)。因此,引文的特點(diǎn)可基本反映出用戶利用正式渠道獲得信息的主要特點(diǎn)。通過對(duì)科研人員所發(fā)表的論文的大量引文統(tǒng)計(jì),可以獲得與信息需求有關(guān)的許多指標(biāo),如引文數(shù)量、引文的文獻(xiàn)類型、引文的語種分布、引文的時(shí)間分布、引文出處等。這樣就可以從中挖掘出科研人員需求信息的特點(diǎn)。

引文數(shù)量:反應(yīng)科研人員對(duì)已有研究成果和最新信息的利用能力;

引文國別:弄清與國際文獻(xiàn)交流的數(shù)量和流向;

引文語種:分布反映科研人員對(duì)外文文獻(xiàn)利用能力;

引文文獻(xiàn)類型:有利于確定文獻(xiàn)情報(bào)搜集的重點(diǎn);

引文時(shí)間分布:吸收新信息和新成果的能力。

4 結(jié)語

通過查閱大量文獻(xiàn)可以發(fā)現(xiàn),國內(nèi)外在基于科技論文產(chǎn)出評(píng)價(jià)體系研究已經(jīng)非常豐富,采用的研究方法和研究技術(shù)也已經(jīng)比較成熟,研究視角多種多樣,取得了許多重要的研究成果。但是可以發(fā)現(xiàn),我國對(duì)高??蒲性u(píng)價(jià)相對(duì)較多,對(duì)科研機(jī)構(gòu)的評(píng)價(jià)比較匱乏,在科研評(píng)價(jià)的建設(shè)上還缺乏一個(gè)系統(tǒng)全面的指標(biāo)體系。本課題在理論研究方面進(jìn)一步完善了科技文獻(xiàn)產(chǎn)出評(píng)價(jià)指標(biāo)體系研究,從科研機(jī)構(gòu)綜合科研實(shí)力、核心作者學(xué)術(shù)力、學(xué)科發(fā)展、最新科研動(dòng)向(領(lǐng)先研究領(lǐng)域),需求信息特點(diǎn)等五個(gè)方面,對(duì)科技文獻(xiàn)產(chǎn)出數(shù)據(jù)進(jìn)行分析和挖掘,建立一個(gè)相對(duì)系統(tǒng)全面的科研機(jī)構(gòu)的科技文獻(xiàn)產(chǎn)出評(píng)價(jià)指標(biāo)體系。

參考文獻(xiàn):

[1]劉作義,陳曉田.科學(xué)研究評(píng)價(jià)的性質(zhì)、作用、方法及程序[J].科研管理,2002,23(2):33-40.

[2]中國社會(huì)科學(xué)院外事局輯.美國社會(huì)科學(xué)現(xiàn)狀與發(fā)展[M].社會(huì)科學(xué)文獻(xiàn)出版社,2001:370-393.

[3]HENK E.Moed,Research Assessment in Social Science and Humanities[EB/OL].http://lingue.unibo.it/evaluationin-thehumanities/Research Assessment in Social Science and Humanities.pdf.2010-10-15.