公務(wù)員期刊網(wǎng) 精選范文 數(shù)據(jù)挖掘課程范文

數(shù)據(jù)挖掘課程精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的數(shù)據(jù)挖掘課程主題范文,僅供參考,歡迎閱讀并收藏。

數(shù)據(jù)挖掘課程

第1篇:數(shù)據(jù)挖掘課程范文

在傳統(tǒng)教育中,教師通過與學(xué)生面對面的交流,獲得學(xué)生學(xué)習(xí)行為的表現(xiàn)信息,較為容易掌握學(xué)生的學(xué)習(xí)情況和課程教學(xué)效果,但隨著現(xiàn)代教育技術(shù)的發(fā)展,網(wǎng)絡(luò)學(xué)習(xí)方式的普及,以及學(xué)生學(xué)習(xí)行為的變化,研究網(wǎng)絡(luò)課程的教學(xué)方法受到了越來越多的關(guān)注。本文以Moodle網(wǎng)絡(luò)課程管理系統(tǒng)為研究基礎(chǔ),分析并提出有針對性的數(shù)據(jù)挖掘方法構(gòu)架,以達到對課程建設(shè)情況和學(xué)生學(xué)習(xí)情況的跟蹤分析,為教師改進教學(xué)策略、提高網(wǎng)絡(luò)課程教學(xué)質(zhì)量提供有力支持及方法借鑒。

【關(guān)鍵詞】 網(wǎng)絡(luò)課程;數(shù)據(jù)挖掘;挖掘模式

【中圖分類號】 G40-034 【文獻標(biāo)識碼】 A 【文章編號】 1009―458x(2014)09―0068―04

一、引言

隨著互聯(lián)網(wǎng)以及移動設(shè)備的迅速普及,人們使用網(wǎng)絡(luò)的時長在不斷增加,通過網(wǎng)絡(luò)進行學(xué)習(xí)的需求及能力也在迅速提高。據(jù)美國Ambient Insight研究報告指出,2009年美國中學(xué)以后的教育機構(gòu)中,有44%的學(xué)生通過網(wǎng)絡(luò)進行課程學(xué)習(xí),預(yù)計到2018年,美國通過網(wǎng)絡(luò)學(xué)習(xí)的學(xué)生人數(shù)將超過面授學(xué)生的總?cè)藬?shù)。在韓國,78%的高校都提供網(wǎng)絡(luò)教學(xué)(Allen et al. 2008)。在中國,教育部于2011年10月啟動了國家開放課程建設(shè)工作,教育部《教育信息化十年發(fā)展規(guī)劃》(2011-2020年)中也明確提出了“推動信息技術(shù)與高等教育融合,創(chuàng)新人才培養(yǎng)模式”的要求,融合的關(guān)鍵就是要選擇有效的網(wǎng)絡(luò)教學(xué)模式,因此,對網(wǎng)絡(luò)教學(xué)的質(zhì)量和有效性研究正被人們所關(guān)注。

本文以Moodle網(wǎng)絡(luò)課程平臺為基礎(chǔ),分析并提出有針對性的數(shù)據(jù)挖掘方法構(gòu)架,以達到對課程建設(shè)情況和學(xué)生學(xué)習(xí)應(yīng)用情況的跟蹤分析,為教師改進教學(xué)策略、提高網(wǎng)絡(luò)課程教學(xué)質(zhì)量提供有力支持。

二、選擇Moodle網(wǎng)絡(luò)課程平臺的理由

之所以選擇Moodle課程管理系統(tǒng)建設(shè)網(wǎng)絡(luò)課程平臺,是由于Moodle課程管理系統(tǒng)是一個開源免費軟件,更主要的是其模塊化的設(shè)計非常易于課程的創(chuàng)建,能使課程教師擺脫課程網(wǎng)站建設(shè)的技術(shù)屏障,還可以使教師從課程內(nèi)容的設(shè)計者轉(zhuǎn)變?yōu)榻虒W(xué)資源與活動的組織者。[1]

在國外Moodle系統(tǒng)的應(yīng)用得到了迅速推廣。有數(shù)據(jù)顯示,使用Moodle的國家和地區(qū)有200多個,注冊使用機構(gòu)有67,000多所,注冊用戶數(shù)量達5,800萬,運行課程有600多萬門。注冊用戶最多的前五位國家分別是美國、西班牙、巴西、英國和德國。[2]

三、教師所關(guān)注問題調(diào)查

根據(jù)教育部頒布的《CELTS-31教育資源建設(shè)技術(shù)規(guī)范》,將教育資源建設(shè)分為素材、課程、評價和資源管理系統(tǒng)開發(fā)四個層次。其中素材與課程是網(wǎng)絡(luò)教育資源建設(shè)的基礎(chǔ),評價和資源管理系統(tǒng)則分別是確保質(zhì)量與實現(xiàn)資源建設(shè)的工具與手段。[3]對于建設(shè)網(wǎng)絡(luò)課程的教師需要了解它的使用情況,從而分析課程結(jié)構(gòu)是否合理,調(diào)整課程內(nèi)容的分布情況,優(yōu)化網(wǎng)絡(luò)課程的設(shè)計,提高教學(xué)效果。

為了解教師使用網(wǎng)絡(luò)課程的期待值和目的性,我們采取目的抽樣和隨機抽樣相結(jié)合的方式,樣本來自筆者所在的三個教師專用QQ群人員。調(diào)查問卷設(shè)計從了解教師對網(wǎng)絡(luò)課程的需求、認(rèn)識、應(yīng)用三個主要層面展開,具體的問卷內(nèi)容為四個部份:了解參與問卷教師的基本情況;了解教師對網(wǎng)絡(luò)技術(shù)應(yīng)用的需求情況;了解教師對網(wǎng)絡(luò)課程的認(rèn)識及使用困難所在;了解教師希望網(wǎng)絡(luò)課程能幫助解決教學(xué)中的哪些問題。問卷在公共專業(yè)問卷調(diào)查網(wǎng)站(問卷星)上,一周后回收有效問卷159份。數(shù)據(jù)分析基本報告可見鏈接:http:///report/3234099.aspx。

筆者所在院校為云南普通高校,與問卷的地圖分布情況相吻合,應(yīng)該更能代表云南普通高校的普遍情況(見圖1)。

圖1 問卷來源地理分布比率圖

問卷中有96.61%的教師認(rèn)為應(yīng)該在教學(xué)中整合網(wǎng)絡(luò)技術(shù),有38.98%的教師因為技術(shù)應(yīng)用能力的不足,不夠明確如何使用網(wǎng)絡(luò)技術(shù)(見圖2),這說明我們建設(shè)網(wǎng)絡(luò)課程應(yīng)該選擇如同Moodle這樣簡單易用的課程管理系統(tǒng)。

對于建設(shè)網(wǎng)絡(luò)課程,教師關(guān)注度較高的前4個方面是:學(xué)生學(xué)習(xí)過程參與的情況、網(wǎng)絡(luò)資源的使用情況、學(xué)生在線學(xué)習(xí)時間以及學(xué)生參與討論的頻度情況(見圖3)。

圖2 教師對網(wǎng)絡(luò)技術(shù)與教學(xué)融合的意見

圖3 教師關(guān)注信息統(tǒng)計

四、網(wǎng)絡(luò)課程數(shù)據(jù)挖掘模式構(gòu)架

數(shù)據(jù)挖掘技術(shù)是獲取相關(guān)信息的有效技術(shù)手段。對于教師所關(guān)心的幾個方面內(nèi)容,這里提供幾種可借鑒的方法:

1. 學(xué)生學(xué)習(xí)過程分析

美國教育評價專家斯克里文(G F. Scriven)在1967年所著的《評價方法論》中,提出形成性評價是為正在進行的教育活動提供反饋信息,以提高正在進行的教育活動質(zhì)量的評價,是一種對學(xué)習(xí)進程的動態(tài)評價。教師和學(xué)生可以依據(jù)獲取的反饋信息了解學(xué)習(xí)狀態(tài),及時調(diào)整教學(xué)或?qū)W習(xí)。[4]

在Moodle平臺中具備學(xué)生學(xué)習(xí)進展跟蹤功能。

方法一:通過設(shè)置“課程進度跟蹤”,了解學(xué)生各項學(xué)習(xí)活動的完成情況。

如圖4所示,進入課程,在“課程管理”/“課程進度跟蹤”進行跟蹤條件設(shè)置,然后再選擇“課程管理”/“報表”/“課程進度”,就會顯示選修該門課程的所有學(xué)生的各項學(xué)習(xí)活動的完成情況。

圖4 課程進度跟蹤設(shè)置

方法二:分析學(xué)生各項學(xué)習(xí)活動的參與度。

通過選擇“課程管理”/“報表”/“課程成員”,可以詳細地顯示各項課程活動學(xué)生的參與情況,以及參與的次數(shù),更清楚地分析學(xué)生的學(xué)習(xí)努力程度。如圖5所示,列出了數(shù)據(jù)庫原理及應(yīng)用這門課程的“第一部分測驗”活動、每個學(xué)生參與的次數(shù)。

方法三:采用數(shù)據(jù)挖掘手段,了解學(xué)生的學(xué)習(xí)風(fēng)格。

此方法要求具備一定的數(shù)據(jù)挖掘知識及應(yīng)用能力。通過Mysql系統(tǒng)提取Moodle后臺數(shù)據(jù)庫(\server\mysql\data\mysql)進行關(guān)聯(lián)規(guī)則分析。

關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘,可以發(fā)現(xiàn)學(xué)生學(xué)習(xí)行為之間的關(guān)系,通過對學(xué)生的某兩類網(wǎng)絡(luò)學(xué)習(xí)行為之間取值關(guān)系進行分析就可以得出它們之間的關(guān)聯(lián)性,進而預(yù)測學(xué)生將要進行的下一個行為,從而挖掘網(wǎng)絡(luò)學(xué)生學(xué)習(xí)行為之間的關(guān)系,使得學(xué)生學(xué)習(xí)風(fēng)格顯性化。[5]

2. 課程資源利用情況分析

課程資源建設(shè)是影響網(wǎng)絡(luò)教學(xué)應(yīng)用質(zhì)量的重要因素。甘振韜等通過SQL Server的Analysis Services 工具,對網(wǎng)絡(luò)課程的資源配置情況,包括資源配置指數(shù)和訪問量進行分析。[6]

Moodle平臺能很直觀地呈現(xiàn)課程各項資源的訪問情況。

方法:選擇“課程管理”/“報表”/“課程活動”,課程設(shè)計的各項活動被訪問量被詳細統(tǒng)計出,如圖6所示,教師可以清楚了解課程資源的利用率情況,分析學(xué)生的學(xué)習(xí)喜好,適當(dāng)調(diào)整各活動資源的配比。

圖6 課程資源訪問情況

3. 學(xué)生在線學(xué)習(xí)時間分析

對于某門課程,通過分析學(xué)生的日志,可以掌握學(xué)生的在線學(xué)習(xí)時間,以及學(xué)習(xí)時段的分布情況。

方法:點擊“課程管理”/“報表”/“日志”,其中可以設(shè)定查看所有成員或是某一個成員、所有活動或是某一項活動,以及所有日期或是某一天,學(xué)生的在線學(xué)習(xí)情況。如圖7所示。

圖7 學(xué)生日志

4. 學(xué)生參與討論的頻度分析

學(xué)生參與課程討論的頻度,可以反映學(xué)生的學(xué)習(xí)主動性,教師通過觀察可以即時進行有針對性的教學(xué)干預(yù)。

方法:選擇“課程管理”/“報表”/“課程成員”,如圖8所示,學(xué)生參與“課程聊吧”活動的情況。

圖8 學(xué)生參與討論活動的頻度

5. 學(xué)習(xí)成績分析

學(xué)生的最終學(xué)習(xí)情況需要一個成績評定,Moodle平臺的設(shè)計理念中非常強調(diào)過程性評價,它能夠記錄學(xué)生學(xué)習(xí)過程中的各項活動成績,包括師生、生生相互評價的成績,匯總成學(xué)生的最終成績。

方法一:查看教學(xué)活動的單項成績情況。

直接使用Moodle平臺所提供的課程管理功能,點擊“課程管理”/“成績”選項,打開成績管理菜單,再選擇“類別和項”下的“簡略視圖”(如圖9),可以查看教學(xué)活動過程各項匯總成績。并可以設(shè)置學(xué)習(xí)過程中各部分占總成績的比率。

方法二:對測驗試題結(jié)構(gòu)分析。

在Moodle中若選擇測驗,則出現(xiàn)“測驗管理”,再選擇“測驗管理”/“統(tǒng)計”,可以得到本次測驗的統(tǒng)計分析報告。包括此測驗的標(biāo)準(zhǔn)偏差、測驗的分?jǐn)?shù)分布偏度、分?jǐn)?shù)的分布峰度等。還有此測驗試題的結(jié)構(gòu)分析結(jié)果,包括容易度指數(shù)、試題的標(biāo)準(zhǔn)偏差等(如圖10),能讓教師科學(xué)地調(diào)整測驗的結(jié)構(gòu)組成,試題的難易程度和分?jǐn)?shù)的布局等。

圖10 測驗試題結(jié)構(gòu)

方法三:在成績管理菜單下選擇“導(dǎo)出”為Excel、OpenDocument電子表格或其它文檔,再進行統(tǒng)計分析。

6. 群組分析(分組)

學(xué)生分組開展學(xué)習(xí),可以促進學(xué)生的集體意識及合作能力的培養(yǎng),但如何分組?各分組成員真的能很好地協(xié)作嗎?這需要教師特別注意,需要考慮如何分組才能更好地激發(fā)學(xué)生的學(xué)習(xí)積極性。

方法一:選擇“課程管理”/“用戶”/“小組”,可以自主創(chuàng)建小組,也可以用“自動創(chuàng)建小組”方式創(chuàng)建,如圖11所示,就是以自動方式創(chuàng)建的小組,其中還可以指定小組數(shù)量或是每個小組成員數(shù)。這種方式設(shè)置的小組較為隨機,如果希望分組能考慮成員的凝聚性可以選擇方法二進行。

方法二:應(yīng)用社會網(wǎng)絡(luò)分析軟件,如UCINET等,可以開展學(xué)習(xí)社群的關(guān)系距離及中心性分析,以及小團體分析等分析。通過收集學(xué)生在討論區(qū)或是聊天室中的問答的關(guān)系情況獲得分析數(shù)據(jù)。對于社會網(wǎng)絡(luò)結(jié)構(gòu)的特征分析可以輔助判斷師生交互網(wǎng)絡(luò)發(fā)展的成熟程度。

五、小結(jié)

本文基于Moodle網(wǎng)絡(luò)課程管理系統(tǒng),介紹了教師關(guān)心的幾個方面的數(shù)據(jù)分析方法,為想要分析自己網(wǎng)絡(luò)課程使用情況的教師提供方法借鑒,從而教師能夠更好地調(diào)整網(wǎng)絡(luò)課程的內(nèi)容組成、結(jié)構(gòu)布局,以及教學(xué)方法策略的調(diào)整。同時,本研究也適當(dāng)突破Moodle網(wǎng)絡(luò)課程平臺,提供了在其它網(wǎng)絡(luò)課程平臺中進行數(shù)據(jù)挖掘分析的方法和思路。通過幾個方面數(shù)據(jù)分析方法的整合,目的是提供一種進行網(wǎng)絡(luò)課程數(shù)據(jù)挖掘模式架構(gòu)的研究。今后,研究還應(yīng)深入底層數(shù)據(jù)的分析,提供更具通用性的網(wǎng)絡(luò)課程數(shù)據(jù)挖掘模式方法。

[參考文獻]

[1] 黎加厚. 信息化課程設(shè)計――Moodle 信息化學(xué)習(xí)環(huán)境創(chuàng)設(shè)[M]. 上海:華東師范大學(xué)出版社,2007.

[2] 張偉遠,段承貴. 網(wǎng)絡(luò)教學(xué)平臺發(fā)展的全球合作和共建共享[J]. 中國遠程教育,2012,(10):32-36.

[3] 鄧康橋. workflow技術(shù)在網(wǎng)絡(luò)課程開發(fā)管理系統(tǒng)中的應(yīng)用研究[J].中國遠程教育,2013,(4):63-68.

[4] 劉納. 基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)學(xué)習(xí)形成性評價研究[D]. 上海:華東師范大學(xué),2012.

[5] 李素珍. 基于網(wǎng)絡(luò)學(xué)習(xí)行為分析的網(wǎng)絡(luò)學(xué)習(xí)風(fēng)格與學(xué)習(xí)偏好挖掘模型研究[D]. 武漢:華中師范大學(xué),2009.

[6] 甘振韜,梅文,郭玉軍. 數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)課程資源配置中的研究[J]. 中國醫(yī)學(xué)教育技術(shù),2012,26(6):635-638.

第2篇:數(shù)據(jù)挖掘課程范文

關(guān)鍵詞: 數(shù)據(jù)挖掘; 課程內(nèi)容體系; IT專業(yè); 教學(xué)效果

中圖分類號:G642 文獻標(biāo)志碼:A 文章編號:1006-8228(2014)11-65-02

Course construction of data mining course for IT specialty in application-oriented university

Li Zhong, Li Shanshan

(Institute of Disaster Prevention, Sanhe, Hebei 065201, China)

Abstract: Aiming at the content differences of data mining course in the application-oriented university, the training objectives and requirement for different specialty are analyzed. The content system and hours arrangements of data mining courses for IT specialty starting are given from the three major functions of data mining. Based on the last two years' student teaching effectiveness of data mining courses, it is concluded that combining theoretical and experimental training content settings with appropriate teaching methods can improve learning interest, stimulate learning enthusiasm, improve operating ability and achieve training objectives.

Key words: data mining; course content system; IT specialty; teaching effectiveness

0 引言

毋庸置疑,我們正處在信息時代。根據(jù)國際互聯(lián)網(wǎng)管理機構(gòu)2012年的數(shù)據(jù),每天全球互聯(lián)網(wǎng)流量累計達1EB(即10億GB),這意味著每天產(chǎn)生的信息量可以刻滿1.88億張DVD光盤[1]。要想在如此浩瀚的數(shù)字海洋里尋找有用的信息,簡直是大海撈針!因此數(shù)據(jù)挖掘技術(shù)應(yīng)運而生。大概十幾年前,微軟創(chuàng)始人比爾?蓋茨就預(yù)言,數(shù)據(jù)挖掘技術(shù)將是未來計算機發(fā)展的重要方向之一,事實也的確如此。

數(shù)據(jù)挖掘技術(shù)誕生于20世紀(jì)80年代末,是統(tǒng)計學(xué)和計算機科學(xué)的交叉學(xué)科,涉及數(shù)據(jù)庫技術(shù)、統(tǒng)計學(xué)、機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、模式識別、知識發(fā)現(xiàn)、專家系統(tǒng)、信息檢索、高性能計算、可視化以及面向?qū)ο蟪绦蛟O(shè)計等若干學(xué)科知識,在商業(yè)、金融、保險、體育、勘探、生物技術(shù)等領(lǐng)域獲得廣泛應(yīng)用。也正因為該課程涉及的內(nèi)容寬泛,要求知識面寬廣、數(shù)學(xué)基礎(chǔ)扎實等,前幾年主要在研究生階段開設(shè)。但是隨著信息技術(shù)的快速發(fā)展,本科生能力要求提高,知識傳授的重心下移,很多高校已在本科階段開設(shè)數(shù)據(jù)挖掘課程,以提高大學(xué)生解決實際問題的能力,進而為課程設(shè)計和畢業(yè)設(shè)計打下必要的基礎(chǔ)[2]。

1 國內(nèi)高校本科數(shù)據(jù)挖掘課程開設(shè)現(xiàn)狀

通過院校實地交流,結(jié)合網(wǎng)絡(luò)搜索,我們已經(jīng)收集了十幾所高校的數(shù)據(jù)挖掘課程教學(xué)大綱,開設(shè)專業(yè)包含有計算機類專業(yè)、經(jīng)濟統(tǒng)計類專業(yè)、電氣自動化類專業(yè)、生物技術(shù)專業(yè)等,各專業(yè)根據(jù)自己的人才培養(yǎng)目標(biāo)制訂教學(xué)大綱、教學(xué)計劃、考試大綱等,其內(nèi)容存在很大差異。其中985、211高校主要以英語授課,采用國外原版教材,課程內(nèi)容涉及算法、編程較多;而一般院校多采用中文教材,根據(jù)專業(yè)不同,內(nèi)容也有很大差異。

經(jīng)濟統(tǒng)計類專業(yè)開設(shè)數(shù)據(jù)挖掘課程,要求學(xué)生了解什么是數(shù)據(jù)挖掘,以及如何用數(shù)據(jù)挖掘來解決實際問題,了解如何通過幾種數(shù)據(jù)挖掘技術(shù)建立數(shù)學(xué)模型,了解主流數(shù)據(jù)挖掘系統(tǒng)的特點,能夠安裝、使用,要求能夠熟練使用典型的挖掘工具對實際數(shù)據(jù)進行分析,具備從數(shù)據(jù)資源提取信息與知識并進行輔助決策的基本能力。

自動化專業(yè)開設(shè)數(shù)據(jù)挖掘課程,要求學(xué)生了解數(shù)據(jù)挖掘概念、原理、過程,學(xué)會利用數(shù)據(jù)挖掘技術(shù)處理問題,了解有關(guān)數(shù)據(jù)挖掘算法原理,熟練運用數(shù)據(jù)挖掘技術(shù)建立數(shù)學(xué)模型,要求能夠熟練使用數(shù)據(jù)挖掘軟件解決問題。

第3篇:數(shù)據(jù)挖掘課程范文

Abstract: The characteristic of data mining technology course and the problems in the course teaching were analyzed. Based on them, some countermeasures were proposed to improve the effect of course teaching of data mining technology.

關(guān)鍵詞: 數(shù)據(jù)挖掘技術(shù);課程;教學(xué)

Key words: data mining technology;course;teaching

中圖分類號:G642.0 文獻標(biāo)識碼:A 文章編號:1006-4311(2011)25-0155-01

0 引言

數(shù)據(jù)挖掘技術(shù)是電子商務(wù)專業(yè)的一門重要專業(yè)課程,它是信息化時代對信息與數(shù)據(jù)管理的必然要求。一方面,在生產(chǎn)、生活和商業(yè)活動中,我們產(chǎn)生了海量的數(shù)據(jù),這些數(shù)據(jù)有著不同的表現(xiàn)形式,如最常見的超市記錄單、各種各樣的公司或商業(yè)數(shù)據(jù)庫,還包括音頻、視頻等;另一方面,我們需要從這些數(shù)據(jù)中尋求規(guī)律,對數(shù)據(jù)進行“挖掘”,使數(shù)據(jù)發(fā)揮更大的作用[1]。數(shù)據(jù)挖掘正是從大量的數(shù)據(jù)中提取出隱含的、以前不為人所知的、可信而有效的知識[2]。數(shù)據(jù)挖掘技術(shù)教學(xué)的目的就是要使學(xué)生掌握典型的數(shù)據(jù)挖掘技術(shù),并能夠運用數(shù)據(jù)挖掘技術(shù)解決實際問題,為今后運用數(shù)據(jù)挖掘技術(shù)解決實際問題打下扎實的基礎(chǔ)。

1 數(shù)據(jù)挖掘技術(shù)課程特點

數(shù)據(jù)挖掘技術(shù)具有自己獨特的課程特點:

1.1 新穎性 1995年,在加拿大召開了第一屆知識發(fā)現(xiàn)和數(shù)據(jù)挖掘國際學(xué)術(shù)會議(International Conference on Knowledge Discovery and Data Mining),由于把數(shù)據(jù)庫中的數(shù)據(jù)形象地比喻為“礦床”,“數(shù)據(jù)挖掘”一詞很快流傳開來[3]。數(shù)據(jù)挖掘的發(fā)展僅有10余年的時間,數(shù)據(jù)挖掘技術(shù)課程是一門新興學(xué)科。

1.2 內(nèi)容廣 數(shù)據(jù)挖掘包括關(guān)聯(lián)規(guī)則挖掘、分類規(guī)則挖掘、特征規(guī)則挖掘、時序規(guī)則挖掘、偏差規(guī)則挖掘、聚類規(guī)則挖掘和預(yù)測這七大任務(wù),相應(yīng)的,每種任務(wù)都有自己專門的挖掘技術(shù)[4],如關(guān)聯(lián)規(guī)則挖掘的典型技術(shù)為Apriori算法及其衍生技術(shù),分類規(guī)則挖掘的典型技術(shù)為ID3或C4.5決策樹算法及其改進算法等。

1.3 有深度 數(shù)據(jù)挖掘技術(shù)作為一門計算機與數(shù)據(jù)處理相結(jié)合的新興學(xué)科,具有一定的難度。其中的任何一個技術(shù)都可以獨立成篇,如粗糙集分類算法自原理至實例推廣就是一門單獨的課程;作為數(shù)據(jù)處理的重要內(nèi)容,聚類算法同樣可以獨立成籍。

1.4 交叉性 誠如前面所述,數(shù)據(jù)挖掘技術(shù)有著廣泛的支撐背景,既包括信息論方法和集合論方法等歸納學(xué)習(xí)類技術(shù),又包括神經(jīng)網(wǎng)絡(luò)方法、遺傳算法方法、蟻群算法等仿生物技術(shù),還包括成熟的統(tǒng)計分析技術(shù)和模糊數(shù)學(xué)技術(shù),此外還有公式發(fā)現(xiàn)類技術(shù)和可視化技術(shù)等??梢赃@樣說,數(shù)據(jù)挖掘總是在廣泛吸取其他各門學(xué)科的先進技術(shù),并加以轉(zhuǎn)化、發(fā)展的。

2 數(shù)據(jù)挖掘技術(shù)教學(xué)過程存在的問題剖析

數(shù)據(jù)挖掘技術(shù)作為一門新學(xué)科、新課程,發(fā)展迅速,但是其缺點也是不言而喻的,主要包括:

2.1 課程教材不統(tǒng)一 目前,數(shù)據(jù)挖掘技術(shù)的教材層出不窮,這些教材盡管總體涵蓋內(nèi)容相近,均自成體系,但是有的細節(jié)卻并不一致,如多數(shù)教材主張采用E-R圖進行數(shù)據(jù)倉庫(數(shù)據(jù)挖掘通??偸桥c數(shù)據(jù)倉庫連接在一起的)設(shè)計,但也有教材持反駁態(tài)度[3];對數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)說法也不盡一致,不同的教材給出不同的體系結(jié)構(gòu),有的甚至將數(shù)據(jù)結(jié)構(gòu)等同于體系結(jié)構(gòu)[5]。這主要是由于學(xué)科和課程的新穎性導(dǎo)致的,使得教材的編寫多帶有研究探索的性質(zhì),未能達成統(tǒng)一。

2.2 教學(xué)重點不統(tǒng)一 教材的不統(tǒng)一和學(xué)時的不統(tǒng)一(如有的院校是36課時,有的是48課時)導(dǎo)致教學(xué)重點也不統(tǒng)一,有的考慮到學(xué)生掌握知識的淺顯性,將重點放在統(tǒng)計分析技術(shù),而對神經(jīng)網(wǎng)絡(luò)技術(shù)和遺傳算法技術(shù)等相對較難的技術(shù)一筆帶過;有的則考慮到體系的完整性,對所有數(shù)據(jù)挖掘技術(shù)等同對待,均勻筆墨。

2.3 教學(xué)方式不統(tǒng)一 數(shù)據(jù)挖掘技術(shù)是一門實驗技術(shù)較強的課程,但是有的教師在安排授課時,僅設(shè)置理論課時,沒有實驗課時;有的教師則將課程直接放在實驗室來上,偏重于對學(xué)生實驗技巧的掌握。當(dāng)然,更多的是將實驗課時與理論課時交錯進行的。對實驗安排的處理也不盡相同,有的分組進行,有的則由學(xué)生獨立完成。

3 提高數(shù)據(jù)挖掘技術(shù)課程效果的對策建議

3.1 精心編排課程講義 課程教材是授課的首要基礎(chǔ),一本好的教材不僅便于教師的備課、授課,更有利于學(xué)生的理解。當(dāng)然,教材與課時、教學(xué)大綱有著密切關(guān)系,教師在選擇教材時應(yīng)充分考慮學(xué)生的學(xué)科基礎(chǔ)、授課課時數(shù)、教學(xué)大綱規(guī)定的培養(yǎng)目標(biāo)等各種因素,從大量層出不窮的教材中選擇最理想的教材,適當(dāng)?shù)臅r候也可根據(jù)相關(guān)教材,整理一份恰當(dāng)?shù)闹v義教材,組織學(xué)生使用。

3.2 合理安排教學(xué)內(nèi)容 數(shù)據(jù)挖掘技術(shù)的教學(xué)內(nèi)容應(yīng)考到學(xué)科體系的完整性,既要為學(xué)生打牢理論基礎(chǔ),又要突出學(xué)生實踐能力的培養(yǎng)。因此要以“掌握理論、強化應(yīng)用、突出能力”作為數(shù)據(jù)挖掘技術(shù)課程的培養(yǎng)目標(biāo),通過精選具有充分代表性、源于實際問題的典型例題與案例,使它們能基本覆蓋在實際中最常見的數(shù)據(jù)挖掘問題,在講解這些從實踐中抽取并經(jīng)過精心改造和設(shè)計的例題和案例的過程中,逐步地建立起學(xué)生應(yīng)該掌握的數(shù)據(jù)挖掘技術(shù)理論框架。

4 結(jié)束語

數(shù)據(jù)挖掘技術(shù)教學(xué)具有十分重要的現(xiàn)實意義,通過科學(xué)講述數(shù)據(jù)挖掘技術(shù),有助于培養(yǎng)學(xué)生對理論知識的現(xiàn)實應(yīng)用轉(zhuǎn)化能力,培養(yǎng)學(xué)生從現(xiàn)實世界出發(fā)提出問題、分析問題和解決問題的能力。數(shù)據(jù)挖掘技術(shù)的教學(xué)應(yīng)以培養(yǎng)學(xué)生能力為主線,精心組織教學(xué)內(nèi)容,有效采用多種方式,增進學(xué)生對知識的理解與掌握,顯著提高教學(xué)效果與質(zhì)量。

參考文獻:

[1]陳文偉.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程[M].北京:清華大學(xué)出版社,2006.

[2]Jiawei Han,Micheline Kamber著.范明,孟小峰譯.數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:機械工業(yè)出版社,2007.

[3]周根貴.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].杭州:浙江大學(xué)出版社,2004.

第4篇:數(shù)據(jù)挖掘課程范文

【關(guān)鍵詞】客戶關(guān)系管理;數(shù)據(jù)挖掘;流程;模型

隨著市場經(jīng)濟的發(fā)展,企業(yè)將面臨強大的競爭壓力,企業(yè)的產(chǎn)品越來越趨向于同質(zhì)化,僅僅依靠產(chǎn)品本身很難在日趨激烈的競爭中取勝,所以愈來愈多的先進企業(yè)將重點從以產(chǎn)品為中心向以客戶為中心的新型商業(yè)模式轉(zhuǎn)移,客戶關(guān)系管理(CRM)也就應(yīng)運而生。客戶關(guān)系管理(Customer Relationship Management)簡稱CRM,是由美國的Gartner Group me公司于1999年首先提出的。CRM是一種以客戶為中心的經(jīng)營策略,它以信息技術(shù)為手段,并對工作流程進行重組,以賦予企業(yè)更完善的客戶交流能力,最大化客戶的收益率。CRM就是企業(yè)為了保持競爭力,采取的面向客戶、客戶驅(qū)動和以客戶為中心的發(fā)展策略。而企業(yè)在與客戶交互過程中積累下來的各種客戶數(shù)據(jù)恰恰是反映客戶特征和需求的最佳載體。當(dāng)今許多企業(yè)的數(shù)據(jù)庫或數(shù)據(jù)倉庫中都搜集和存儲了大量關(guān)于客戶的寶貴數(shù)據(jù),這些數(shù)據(jù)涵蓋了從客戶基本數(shù)據(jù)、購買記錄及客戶反饋的個個環(huán)節(jié)。充分利用這些數(shù)據(jù),深入分析、挖掘隱含在這些數(shù)據(jù)中的有用信息,將有助于企業(yè)更好地管理客戶關(guān)系,實現(xiàn)CRM的功能和目標(biāo)。然而,由于缺乏在大量數(shù)據(jù)中發(fā)現(xiàn)深層次信息的能力,許多企業(yè)對于這些數(shù)據(jù)的利用還只是停留在基礎(chǔ)層的瀏覽、檢索、查詢和應(yīng)用層的繼承、組合、整理等方面,而無法將這些數(shù)據(jù)轉(zhuǎn)化為更加有用的知識。因此,如何更加有效地管理企業(yè)數(shù)據(jù)庫中快速增長的海量數(shù)據(jù),將數(shù)據(jù)資源的利用提高到知識創(chuàng)新的高級階段,已經(jīng)成為企業(yè)當(dāng)前需要迫切解決的問題,數(shù)據(jù)挖掘(Data Mining簡稱DM)技術(shù)的運用就可以幫助企業(yè)很好地解決這個問題。

一、數(shù)據(jù)挖掘的流程

數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在的和有用的信息和知識的過程,它可以按照企業(yè)既定的業(yè)務(wù)目標(biāo)自動地從數(shù)據(jù)庫中提取出用以輔助企業(yè)決策的相關(guān)模式。數(shù)據(jù)挖掘的流程圖如下:

圖1中各步驟(1)確定業(yè)務(wù)對象。清晰地定義出業(yè)務(wù)問題,認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步。挖掘的最后結(jié)構(gòu)是不可預(yù)測的,但要探索的問題應(yīng)是有預(yù)見的,為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘則帶有一盲目性,是不會成功的。(2)數(shù)據(jù)準(zhǔn)備。一是數(shù)據(jù)的選擇。搜索所有與業(yè)務(wù)對象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù)。二是數(shù)據(jù)的預(yù)處理。研究數(shù)據(jù)的質(zhì)量,為進一步的分析做準(zhǔn)備。并確定將要進行的挖掘操作的類型。三是數(shù)據(jù)的轉(zhuǎn)換。將數(shù)據(jù)轉(zhuǎn)換成一個分析模型,這個分析模型是針對挖掘算法建立的。建立一個真正適合挖掘算法的分析模型是數(shù)據(jù)挖掘成功的關(guān)鍵。(3)數(shù)據(jù)挖掘。對所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進行挖掘。除了完善從選擇合適的挖掘算法外,其余一切工作都能自動地完成。(4)結(jié)果分析。解釋并評估結(jié)果,其使用的分析方法一般應(yīng)作數(shù)據(jù)挖掘操作而定,通常會用到可視化技術(shù)。(5)知識的同化。將分析所得到的知識集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。

二、數(shù)據(jù)挖掘流程的模型

數(shù)據(jù)挖掘業(yè)內(nèi),公認(rèn)的兩大模型是SAS的SEMMA和包括SPSS在內(nèi)的行業(yè)協(xié)會提出的CRISP-DM。SEMMA強調(diào)的是應(yīng)用的方法;CRISP-DM則從方法學(xué)的角度強調(diào)實施數(shù)據(jù)挖掘項目的方法和步驟。CRISP-DM是站在高處,在講一個總體大方向;而SEMMA在說具體應(yīng)該如何著手。

1.SEMMA。(1)Sample──數(shù)據(jù)取樣。當(dāng)進行數(shù)據(jù)挖掘時,首先要從企業(yè)大量數(shù)據(jù)中取出一個與企業(yè)要探索問題相關(guān)的樣板數(shù)據(jù)子集。通過數(shù)據(jù)取樣,要把好數(shù)據(jù)的質(zhì)量關(guān),一定要保證取樣數(shù)據(jù)的代表性、真實性、完整性和有效性,這樣才能通過此后的分析研究得出反映本質(zhì)規(guī)律性的結(jié)果。根據(jù)具體的需求,可以創(chuàng)建訓(xùn)練集、測試集和效驗集。(2)Explore──數(shù)據(jù)特征探索、分析和預(yù)處理。當(dāng)用戶拿到了一個樣本數(shù)據(jù)集后,它是否達到用戶原來設(shè)想的要求,有沒有什么明顯的規(guī)律和趨勢,有沒有出現(xiàn)用戶所從未設(shè)想過的數(shù)據(jù)狀態(tài),各因素之間有什么相關(guān)性,可區(qū)分成怎樣一些類別,這些都是首先要探索的內(nèi)容。(3)Modify──數(shù)據(jù)調(diào)整和技術(shù)選擇。在問題進一步明確化的基礎(chǔ)上,用戶可以按照問題的具體要求來審視數(shù)據(jù)集,看它是否適應(yīng)企業(yè)問題的需要。針對問題的需要,可能要對數(shù)據(jù)進行增刪,也可能按照用戶對整個數(shù)據(jù)挖掘過程的新認(rèn)識,組合或者生成一些新的變量,以體現(xiàn)對狀態(tài)的有效描述。(4)Model──模型的研發(fā)和知識的發(fā)現(xiàn)。數(shù)理統(tǒng)計方法是數(shù)據(jù)挖掘工作中最常用的主流技術(shù)手段。應(yīng)用SAS提供的多種分析工具不僅能揭示企業(yè)已有數(shù)據(jù)間的新關(guān)系、隱藏著的規(guī)律性,而且能預(yù)測事件的發(fā)展趨勢。用戶采用哪一種模型,主要取決于數(shù)據(jù)集的特征和用戶要實現(xiàn)的目標(biāo)。另一方面,數(shù)據(jù)挖掘是一個反復(fù)的不斷深化的實踐過程,用戶可在實踐中選出最適合的模型。(5)Assess──模型和知識的綜合解釋和評價。經(jīng)過以上五個步驟,用戶將會得出一系列的分析結(jié)果、模式或模型,常常是對目標(biāo)問題多側(cè)面的描述。這時,就要能很好地綜合這些規(guī)律性,為企業(yè)提供合理的決策支持信息。

2.CRISP-DM。(1)業(yè)務(wù)理解(Business Understanding)。最初的階段集中在理解項目目標(biāo)和從業(yè)務(wù)的角度理解需求,同時將這個知識轉(zhuǎn)化為數(shù)據(jù)挖掘問題的定義和完成目標(biāo)的初步計劃。(2)數(shù)據(jù)理解(Data Understanding)。數(shù)據(jù)理解階段從初始的數(shù)據(jù)收集開始,通過一些活動的處理,目的是熟悉數(shù)據(jù),識別數(shù)據(jù)的質(zhì)量問題,首次發(fā)現(xiàn)數(shù)據(jù)的內(nèi)部屬性,或是探測引起興趣的子集去形成隱含信息的假設(shè)。(3)數(shù)據(jù)準(zhǔn)備(Data

Preparation)。數(shù)據(jù)準(zhǔn)備階段包括從未處理數(shù)據(jù)中構(gòu)造最終數(shù)據(jù)集的所有活動。這些數(shù)據(jù)將是模型工具的輸入值。這個階段的任務(wù)有個能執(zhí)行多次,沒有任何規(guī)定的順序。任務(wù)包括表、記錄和屬性的選擇,以及為模型工具轉(zhuǎn)換和清洗數(shù)據(jù)。(4)建模(Modeling)。在這個階段,可以選擇和應(yīng)用不同的模型技術(shù),模型參數(shù)被調(diào)整到最佳的數(shù)值。一般,有些技術(shù)可以解決一類相同的數(shù)據(jù)挖掘問題。有些技術(shù)在數(shù)據(jù)形成上有特殊要求,因此需要經(jīng)常跳回到數(shù)據(jù)準(zhǔn)備階段。(5)評估(Evaluation)。在開始最后部署模型之前,重要的事情是徹底地評估模型,檢查構(gòu)造模型的步驟,確保模型可以完成業(yè)務(wù)目標(biāo)。此階段的關(guān)鍵目的是確定是否有重要業(yè)務(wù)問題沒有被充分的考慮。在這個階段結(jié)束后,一個數(shù)據(jù)挖掘結(jié)果使用的決定必須達成。(6)部署(Deployment)。通常,模型的創(chuàng)建不是項目的結(jié)束。模型的作用是從數(shù)據(jù)中找到知識,獲得的知識需要便于用戶使用的方式重新組織和展現(xiàn)。根據(jù)需求,這個階段可以產(chǎn)生簡單的報告,或?qū)崿F(xiàn)一個比較復(fù)雜的、可重復(fù)的數(shù)據(jù)挖掘過程。

參考文獻

[1]Margaret H.Dunham.數(shù)據(jù)挖掘教程[M].清華大學(xué)出版社,2005

[2]魏兵.?dāng)?shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用研究[D].南京理工大學(xué)碩士.2005

[3]章兢,張小剛.?dāng)?shù)據(jù)挖掘算法及其工程應(yīng)用[M].機械工業(yè)出版社,2006(6):56~73

[4]趙閃.?dāng)?shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用研究[D].廣東工業(yè)大學(xué)碩士學(xué)位論文.2007

[5]邵兵家,于同奎.客戶關(guān)系管理一理論與實踐[M].清華大學(xué)出版社,2004

[6]賈月娥.客戶關(guān)系管理趨勢談[J].管理信息化.2003

第5篇:數(shù)據(jù)挖掘課程范文

關(guān)鍵詞:數(shù)據(jù)挖掘;教務(wù)管理;決策支持

中圖分類號:G647 文獻標(biāo)志碼:A 文章編號:1674-9324(2014)13-0010-03

近年來,隨著高等學(xué)校擴招以及計算機在管理中的普及應(yīng)用,學(xué)校教學(xué)管理系統(tǒng)積累了大量的數(shù)據(jù)。目前,這些數(shù)據(jù)只是用于簡單的成績分析,并未能充分用于規(guī)律分析和處理,未在學(xué)校管理和決策起到應(yīng)有的作用。因此,利用數(shù)據(jù)挖掘技術(shù)對學(xué)生成績數(shù)據(jù)進行深層次分析,找出其中各種潛在模式及影響因素,將對學(xué)生選修課個性化管理、課程設(shè)置、教學(xué)計劃制訂和教學(xué)實踐有重要的指導(dǎo)作用[1-3]。本文針對高等院校教學(xué)管理系統(tǒng)普遍存在的問題,提出了將數(shù)據(jù)挖掘技術(shù)應(yīng)用到本科生成績管理、分析和實踐,通過從學(xué)生成績數(shù)據(jù)中挖掘潛在的、有用的信息,目標(biāo)是為教學(xué)管理者提供決策,為學(xué)生選課提供支持。

一、數(shù)據(jù)挖掘的概念

1989年,在第11界國際人工智能的專題研討會上,學(xué)者們提出了基于挖掘的知識發(fā)現(xiàn)(KDD)概念。1995年在美國計算機年會上,一些學(xué)者開始把數(shù)據(jù)挖掘視為數(shù)據(jù)庫知識發(fā)現(xiàn)的一個基本步驟或把兩者視為進義詞討論[4,5]。所謂數(shù)據(jù)挖掘(Data Mining),就是從大量、不完全、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含的、未知的、具有潛在應(yīng)用價值的信息和知識的過程。其主要特征表現(xiàn)為:數(shù)據(jù)源必須是真實的、大量的;挖掘加工出用戶感興趣的知識;形成的知識要可接受、可理解、可運用。通過數(shù)據(jù)挖掘,可以幫助決策者尋找規(guī)律,發(fā)現(xiàn)被忽略的要素,預(yù)測趨勢,并用于決策。數(shù)據(jù)挖掘是對數(shù)據(jù)內(nèi)在和本質(zhì)的高度抽象與概括,是對數(shù)據(jù)從感性認(rèn)識到理性認(rèn)識的升華。數(shù)據(jù)挖掘又被稱為知識發(fā)現(xiàn)(Knowledge Discovery,KD),因此許多知識發(fā)現(xiàn)中的算法,如人工智能,也常常被使用于數(shù)據(jù)挖掘過程中。數(shù)據(jù)挖掘一般以下7個步驟:(1)數(shù)據(jù)清理:消除噪聲和不一致數(shù)據(jù)。(2)數(shù)據(jù)集成:可以把多種數(shù)據(jù)源組合在一起,將數(shù)據(jù)結(jié)果放在數(shù)據(jù)倉庫中。(3)數(shù)據(jù)選擇:從數(shù)據(jù)庫中提取與分析任務(wù)相關(guān)的數(shù)據(jù)。(4)數(shù)據(jù)變換:通過匯總或聚集操作把數(shù)據(jù)變換或統(tǒng)一成適合挖掘的形式。(5)數(shù)據(jù)挖掘:使用智能方法提取數(shù)據(jù)模式。(6)模式評估:根據(jù)用戶某興趣度度量,識別表示知識的真正有趣的模式。(7)知識表示:實用可視化和知識表示及技術(shù)向用戶提供挖掘的有用知識。

二、數(shù)據(jù)挖掘技術(shù)在本科教學(xué)管理中的應(yīng)用

大學(xué)本科教學(xué)管理,一般涉及了學(xué)生成績管理、選課管理、學(xué)生評教等幾部分內(nèi)容,其實質(zhì)上也是一個數(shù)據(jù)分析、加工利用和決策管理的過程。因此,利用上述數(shù)據(jù)挖掘的方法,對大學(xué)本科教學(xué)管理數(shù)據(jù)進行深層次的分析,可以將人們對數(shù)據(jù)的應(yīng)用從低層的數(shù)據(jù)查詢提升到?jīng)Q策支持、信息預(yù)測,在教學(xué)管理的諸多方面發(fā)揮著重要作用。

1.本科生成績的挖掘加工。學(xué)生成績是評價教學(xué)質(zhì)量的重要依據(jù),也是評價學(xué)生對所學(xué)知識掌握程度的重要標(biāo)志,在高等教育質(zhì)量評價中居于重要位置。所以通過對學(xué)生的成績進行分析和挖掘,可以為教學(xué)管理者提供改善教學(xué)條件,加強教學(xué)管理,深化教學(xué)改革,提高教學(xué)質(zhì)量等方面的重要依據(jù)。利用數(shù)據(jù)挖掘技術(shù),通過不同范圍、不同角度分析學(xué)生的成績和分布規(guī)律,挖掘影響學(xué)生成績的因素。主要包括:①統(tǒng)計分析各門課程成績分布,包括最高分、最低分、及格率等;分析各門成績之間的關(guān)系。②按班級分析學(xué)生成績分布,以及影響班級成績的因素。生成各年級成績分布情況排名,年級成績分布曲線。③不同任課教師給予的學(xué)生平均成績;學(xué)生成績與教師學(xué)歷、職稱,教學(xué)經(jīng)驗之間的關(guān)系。④各生源地成績分布,生源地與學(xué)生成績間的關(guān)系。利用關(guān)聯(lián)分析或分類分析,可以發(fā)現(xiàn)一些普遍性的現(xiàn)象。如通過分析學(xué)生的成績,可能發(fā)現(xiàn)“高等數(shù)學(xué)”成績好的學(xué)生,其在計算機語言類課程的成績也好。但這種分析,也可能導(dǎo)致對暫時不具有普遍性課程的忽略。

2.學(xué)生選課信息的挖掘分析。選課就是學(xué)生利用計算機軟件選擇自己所上的課程。選課數(shù)據(jù)中可能隱藏著對教學(xué)管理具有重要的參考價值,數(shù)據(jù)挖掘技術(shù)可以用來找出這些隱藏在數(shù)據(jù)背后的信息和知識。主要可從以下幾個方面進行分析挖掘:分析各門課的課程歸屬和所占學(xué)分,確定學(xué)生選課時對不同課程歸屬課的學(xué)分多少的考慮;分析各門課的選課人數(shù),確定課程的歡迎程度;分析各門課選課率,了解學(xué)生對目前課程安排中的滿意程度;分析某門課程的選課學(xué)生情況,了解選擇當(dāng)前課程的學(xué)生的專業(yè)情況;分析各門課程的任課教師情況,了解任課教師的實際情況和綜合能力。具體的挖掘步驟可按如下進行:①首先要對選課的原始數(shù)據(jù)進行預(yù)處理,把其原始數(shù)據(jù)采樣后轉(zhuǎn)換成適合數(shù)據(jù)挖掘的數(shù)據(jù)。由數(shù)據(jù)收集階段得到的數(shù)據(jù)可能有一定的“污染”,表現(xiàn)在數(shù)據(jù)可能存在自身的不一致性,或者有缺失數(shù)據(jù)的存在等,因此要進行抽樣與清理。在處理的過程中,要明晰數(shù)據(jù)的上下結(jié)構(gòu)和面向?qū)ο?,為?shù)據(jù)挖掘作好準(zhǔn)備。②完成數(shù)據(jù)的預(yù)處理之后,確定參與挖掘的數(shù)據(jù)表,在教務(wù)選課系統(tǒng)中學(xué)生選課表是基本事實表,課程信息表、學(xué)生信息表和教師信息表可作為維表。③最后將預(yù)處理之后的數(shù)據(jù)進行狀態(tài)運行,在此基礎(chǔ)上選擇合適的數(shù)據(jù)挖掘算法進行數(shù)據(jù)挖掘。數(shù)據(jù)挖掘通過匯總或聚集操作將數(shù)據(jù)變換或統(tǒng)一成適合挖掘的形式,可單獨利用也可綜合利用各種數(shù)據(jù)挖掘方法對數(shù)據(jù)進行分析,挖掘用戶所需要的各種規(guī)則、趨勢、類別、模型等。挖掘的最終結(jié)果可以用可視化的圖形方式表現(xiàn)出來。根據(jù)挖掘的結(jié)果,得出選課背后隱藏的各種數(shù)據(jù)信息,如某些專業(yè)的學(xué)生喜歡選某位老師所開設(shè)的相關(guān)課程,部分學(xué)生總是選擇學(xué)分較多的有更多上機機會的課程等等。

3.學(xué)生評教信息挖掘分析。合理評價教學(xué)的技術(shù)水平是衡量一個學(xué)校教育質(zhì)量的重要標(biāo)準(zhǔn)。教學(xué)評價就是根據(jù)教學(xué)目標(biāo)和教學(xué)計劃的要求,系統(tǒng)全面地收集數(shù)據(jù),對教學(xué)過程中的教學(xué)活動以及教學(xué)成果給予判斷的過程。評教內(nèi)容一般包括對學(xué)生“學(xué)”的評價和對教師“教”的評價。下面以學(xué)生綜合測評指標(biāo)和學(xué)生評教指標(biāo)為例,將關(guān)聯(lián)規(guī)則和粗糙集理論應(yīng)用于評價系統(tǒng),通過對各指標(biāo)的排序、約簡等,在一定程度上對評價指標(biāo)優(yōu)化,討論把數(shù)據(jù)挖掘技術(shù)引入學(xué)生評教指標(biāo)優(yōu)化和信息分析。另一方面,評定學(xué)生的學(xué)習(xí)行為,既可對學(xué)生起到信息反饋和激發(fā)學(xué)習(xí)動機的作用,又是檢查課程計劃、教學(xué)程序以至教學(xué)目的的手段。同時,考查學(xué)生個別差異,便于因材施教的途徑。評價要遵循“評價內(nèi)容要全面、評價方式要多元化、多次化、注重自評與互評的有機結(jié)合”的原則。利用數(shù)據(jù)挖掘工具對學(xué)生的學(xué)習(xí)成績數(shù)據(jù)庫、行為記錄數(shù)據(jù)庫、獎勵處罰數(shù)據(jù)庫等進行分析處理,可以及時得到學(xué)生的評價結(jié)果,對學(xué)生出現(xiàn)的不良學(xué)習(xí)行為進行及時指正。同時,還能夠克服教師主觀評價的不公正、不客觀的弱點,減輕教師的工作量。另外,將關(guān)聯(lián)規(guī)則運用于教學(xué)評價數(shù)據(jù)中,可以探討教學(xué)效果的好壞與教師年齡、職稱之間的關(guān)系、學(xué)生各項素質(zhì)指標(biāo)之間的關(guān)系等,用來及時地對教師的教學(xué)和專業(yè)發(fā)展以及學(xué)生的學(xué)習(xí)和個性發(fā)展提供指導(dǎo),這是非常有意義的。

4.教師信息的挖掘分析。教師信息是本科教學(xué)管理中的重要方面,如使教學(xué)評價過程科學(xué)化,增強教學(xué)工作的預(yù)測功能和評價功能,為教學(xué)的客觀決策和客觀評價教師、了解教師的教學(xué)質(zhì)量提供了一種比較合理的管理依據(jù)。主要包括:①教師個人信息:包括教師學(xué)歷情況、職稱情況、科研情況、研究方向、級別、工作經(jīng)歷等各種信息,可運用關(guān)聯(lián)規(guī)則方法對教學(xué)評價結(jié)果和教師個人信息一起進行挖掘,從而得出影響教學(xué)結(jié)果的潛在的教師個人信息的部分情況。②教師素質(zhì):包括教師的思想政治素質(zhì)、道德素質(zhì)、文化素質(zhì)、智能素質(zhì)、心理素質(zhì)、身體素質(zhì)、外在素質(zhì)等七個方面,通過數(shù)據(jù)挖掘技術(shù)在學(xué)生成績或者相應(yīng)的調(diào)查信息的挖掘,看出哪些因素對教學(xué)方面有較大影響,切實加強教師在哪些素質(zhì)方面的培養(yǎng)和提高,從而有利于教學(xué)管理方法的制定和實施。③教師績效:包括教師的工作業(yè)績、工作態(tài)度、工作技能等方面的綜合考核。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以從教學(xué)評價數(shù)據(jù)中進行數(shù)據(jù)挖掘,查詢教學(xué)效果與教師的工作態(tài)度、工作技能等的各種關(guān)聯(lián),找到教師的教學(xué)效果與教師績效的關(guān)系問題,合理調(diào)配一門課程的上課老師,使學(xué)生能夠較好地保持良好的學(xué)習(xí)狀態(tài),從而為教學(xué)部門提供了決策支持信息。

我國高校的教學(xué)管理長期沿用經(jīng)驗管理模式,往往難以避免管理滯后的弊端,尤其是近年來隨著教學(xué)管理中產(chǎn)生的數(shù)據(jù)急劇增加以及對信息量的更高要求,把數(shù)據(jù)挖掘技術(shù)應(yīng)用到教學(xué)管理系統(tǒng)中,必將為各教學(xué)管理部門的決策提供切實可行的依據(jù),可以促進教育管理的進一步改革、完善和發(fā)展。對數(shù)據(jù)挖掘工具的有效利用,能夠客觀地反映教學(xué)系統(tǒng)中存在的問題,為實現(xiàn)高校的教學(xué)改革,將來在激烈的競爭中掌握主動,從而提高管理的科學(xué)性、針對性和高效率。

參考文獻:

[1]梁循.數(shù)據(jù)挖掘算法與應(yīng)用[M].北京:北京大學(xué)出版社,2006.

[2]劉曉霞.數(shù)據(jù)挖掘技術(shù)在高校教學(xué)中的應(yīng)用[J].現(xiàn)代計算機,2008,(285):115-116.

[3]張玉林.數(shù)據(jù)挖掘技術(shù)在教學(xué)過程中的指導(dǎo)作用[J].西安通信學(xué)院學(xué)報,2006,(02):38-40.

[4]陳文偉.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程[M].北京:清華大學(xué)出版社,2006.

第6篇:數(shù)據(jù)挖掘課程范文

關(guān)鍵詞:數(shù)據(jù)挖掘;信息處理;教學(xué)管理

中圖分類號:G434 文獻標(biāo)識碼:A

Application Analysis of Data Mining Technology in Teaching Management

DONG Jun-kai

(Yanshan University, Hebei Qinhuangdao 066004)

Key words:data mining;information processing;teaching management

隨著信息技術(shù)在高校管理中的普及,在教學(xué)管理中積累了海量的各種數(shù)據(jù)。這些與教學(xué)相關(guān)的數(shù)據(jù)已經(jīng)形成一個完整的信息數(shù)據(jù)庫。在當(dāng)今信息化條件下,對這些數(shù)據(jù)進行處理、分析和挖掘,目的是想發(fā)現(xiàn)對學(xué)校教學(xué)管理、學(xué)生管理等各個方面有作用的指導(dǎo)信息。這些知識可以輔助學(xué)校管理者決策,提高學(xué)校的綜合實力,同時也可以為學(xué)校提高教學(xué)質(zhì)量,優(yōu)化教學(xué)資源提供可靠的數(shù)據(jù)依據(jù)[1]。

數(shù)據(jù)挖掘(Data Mining ,DM) 是一個多學(xué)科交叉融合而形成的新興學(xué)科,已經(jīng)被廣泛應(yīng)用于社會階層各個行業(yè)的多個方面。DM已經(jīng)在許多領(lǐng)域取得令人滿意的應(yīng)用效果。在教育方面,隨著數(shù)據(jù)信息的不斷增長,把數(shù)據(jù)挖掘技術(shù)應(yīng)用到高校管理當(dāng)中,可以促進教育體制的完善、發(fā)展以及必要的改革。DM技術(shù)能客觀地反映高校管理中存在的一些問題,為制定學(xué)校的方針政策提供重要依據(jù)。隨著教育信息化進程的推進,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教育中,從大量的教育數(shù)據(jù)中發(fā)現(xiàn)隱藏的、有用的知識來指導(dǎo)教育、發(fā)展教育,成為當(dāng)今勢在必行的重要的研究課題[2]。

1 數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘(DM, Data Mining) 就是從大量的、不完全、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的,人們事先不知道的,但又是潛在有用的信息和知識(模型或規(guī)則)的過程,是一類深層次的數(shù)據(jù)分析方法。它是一門交叉學(xué)科,包括機器學(xué)習(xí)、數(shù)理統(tǒng)計、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)庫、模式識別、粗糙集、模糊數(shù)學(xué)等相關(guān)技術(shù)。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教學(xué)評價無疑是非常有益的,它可以全面地分析教學(xué)評價結(jié)果與各種因素之間隱藏的內(nèi)在聯(lián)系。

隨著數(shù)據(jù)挖掘技術(shù)的成熟及應(yīng)用領(lǐng)域的不斷擴展,許多高校研究人員已開始研究將數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校教學(xué)管理中,這對提高學(xué)校的管理水平起到了很好的作用。利用數(shù)據(jù)挖掘技術(shù)可以從教學(xué)管理的各個層面,精確地展現(xiàn)目前存在的許多潛在的有用的各種信息。通過把數(shù)據(jù)挖掘技術(shù)引入到教學(xué)管理中,可以找出教學(xué)管理中存在的潛在因素,從而制定對應(yīng)的措施,進一步引導(dǎo)學(xué)生學(xué)習(xí)積極性,最終提高教學(xué)質(zhì)量,增強教學(xué)效果。

2 數(shù)據(jù)挖掘技術(shù)在教學(xué)中的應(yīng)用

數(shù)據(jù)挖掘可以看成是一種決策支持過程,是深層次的數(shù)據(jù)信息分析方法,把數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校信息管理

是非常有幫助的,可以全面地分析各種因素之間隱藏的內(nèi)在聯(lián)系。數(shù)據(jù)挖掘技術(shù)在教學(xué)管理的各個方面都有典型的應(yīng)用,如學(xué)生信息、教師信息方面等,其中最常見的是在教學(xué)質(zhì)量評價結(jié)果和成績分析中的應(yīng)用。考慮到數(shù)據(jù)挖掘在教學(xué)質(zhì)量評價結(jié)果和成績分析這方面的論文已經(jīng)非常廣泛,因此這里只給出其他方面的應(yīng)用。

2.1對教師方面信息的挖掘

數(shù)據(jù)挖掘技術(shù)應(yīng)用于教學(xué)管理中,對教學(xué)水平的提高有著積極作用。如使教學(xué)評價過程科學(xué)化,增強教學(xué)工作的預(yù)測功能和評價功能,為教學(xué)的客觀決策和客觀評價教師、了解教師的教學(xué)質(zhì)量提供了一種比較合理的管理依據(jù),為教師教學(xué)質(zhì)量的提高提出了一種新的分析思路和研究方法[3]。

(1)課堂教學(xué)信息:課堂教學(xué)是評價教師教學(xué)水平的重要依據(jù)。通過對教師的教學(xué)風(fēng)格、教學(xué)方法、教學(xué)內(nèi)容、講授思路、教學(xué)態(tài)度、教學(xué)過程、教學(xué)互動、教學(xué)效果等情況進行全面的監(jiān)督調(diào)查,收集各種數(shù)據(jù)信息,從而得出教師在課堂上的各種教學(xué)能力方面的具體情況。在此信息基礎(chǔ)上,進行數(shù)據(jù)挖掘,找出各個方面影響學(xué)生學(xué)習(xí)成績高低的潛在規(guī)則,進行總結(jié)提高,找出其中存在的問題,切實提高教師的教學(xué)能力。在教學(xué)過程中,教師采用多種教學(xué)方法來完成自己的教學(xué)任務(wù):比如傳統(tǒng)法、討論法、實驗法、多媒體輔助法、參觀法、調(diào)查法、實習(xí)法、提問法等。據(jù)此可以用數(shù)據(jù)挖掘的方法來挖掘數(shù)據(jù)庫中的數(shù)據(jù),判定下一步我們應(yīng)采取什么樣的教學(xué)方法,以滿足實際教學(xué)的需要。在網(wǎng)上進行問卷調(diào)查,從每個學(xué)生對教學(xué)方法的評價以及不同的教學(xué)方法得出的教學(xué)成績來進行分析,來判斷這些教學(xué)方法適合哪一類學(xué)生或哪門課程。

(2)教師個人信息:包括教師學(xué)歷情況、職稱情況、科研情況、研究方向、級別、工作經(jīng)歷等各種信息,可運用關(guān)聯(lián)規(guī)則方法對教學(xué)評價結(jié)果和教師個人信息一起進行挖掘,從而得出影響教學(xué)結(jié)果的潛在的教師個人信息的部分情況。

(3)教師的素質(zhì)方面:教師所具備的基本素質(zhì)是實施教育教學(xué)的基礎(chǔ)。包括教師的思想政治素質(zhì)、道德素質(zhì)、文化素質(zhì)、智能素質(zhì)、心理素質(zhì)、身體素質(zhì)、外在素質(zhì)等七個方面,其實這些方面可以通過數(shù)據(jù)挖掘技術(shù)在學(xué)生成績或者相應(yīng)的調(diào)查信息的挖掘,看出哪些因素對教學(xué)方面有較大影響,切實加強教師在哪些素質(zhì)方面的培養(yǎng)和提高,從而有利于教學(xué)管理方法的制定和實施。

(4)教師績效方面:包括教師的工作業(yè)績、工作態(tài)度、工作技能等方面的綜合考核??梢哉f教師的績效直接影響到教學(xué)管理的各個方面,如教師工作量的計算、教師的評價結(jié)果等等。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以從教學(xué)評價數(shù)據(jù)中進行數(shù)據(jù)挖掘,查詢教學(xué)效果與教師的工作態(tài)度、工作技能等的各種關(guān)聯(lián),找到教師的教學(xué)效果與教師績效的關(guān)系問題,合理調(diào)配一門課程的上課老師,使學(xué)生能夠較好地保持良好的學(xué)習(xí)狀態(tài),從而為教學(xué)部門提供了決策支持信息,促使更好地開展教學(xué)工作,提高教學(xué)質(zhì)量[4]。

2.2對學(xué)生方面信息的挖掘

對學(xué)生的素質(zhì)培養(yǎng)一直是高校發(fā)展的重點,學(xué)生學(xué)習(xí)質(zhì)量的好壞、綜合素質(zhì)的高低決定了學(xué)校的辦學(xué)定位和發(fā)展目標(biāo),也為學(xué)生的人生選擇、自我發(fā)展起到了決定性作用。所以高校在擴招的同時要努力提高教學(xué)質(zhì)量和管理水平,為學(xué)生的學(xué)習(xí)質(zhì)量改善、綜合素質(zhì)的提高提供保證[5]。

(1)學(xué)生的課堂行為表現(xiàn):認(rèn)知能力,是否能夠保證理解和掌握教師的所教授的內(nèi)容;人際交往,課堂上教師、學(xué)生之間交流、提問氣氛是否活躍;學(xué)習(xí)態(tài)度,學(xué)生對教學(xué)中的各種問題是否積極參與、是否認(rèn)真完成課題作業(yè);情緒表現(xiàn),學(xué)生能否進行順利地學(xué)習(xí)。通過對學(xué)生課堂行為表現(xiàn)與對應(yīng)的學(xué)生成績之間的數(shù)據(jù)挖掘并結(jié)合實踐證明,學(xué)生在課堂上的表現(xiàn)狀態(tài)對學(xué)習(xí)效果有至關(guān)重要的影響。

(2)學(xué)生的作業(yè)情況:學(xué)生完成作業(yè)情況和成績,從而可以考查平時學(xué)習(xí)情況。通過對平時學(xué)習(xí)信息的數(shù)據(jù)挖掘,通??梢缘贸鲎罱K的學(xué)習(xí)情況。其實,各個學(xué)校的教學(xué)管理應(yīng)該加大對學(xué)生的作業(yè)要求。

(3)學(xué)生的考試情況:考試是對教和學(xué)效果的檢驗,是教學(xué)中必不可少的環(huán)節(jié)之一。試題難度、考試信度、考試狀態(tài)等。如果將數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則應(yīng)用于試卷分析數(shù)據(jù)庫中,然后根據(jù)學(xué)生得分情況分析出每道題的難易度、區(qū)分度、相關(guān)度等指標(biāo),教師就能夠?qū)υ囶}的質(zhì)量作出比較準(zhǔn)確的評價,進而可以用來檢查自己的教學(xué)情況及學(xué)生的掌握情況,并為今后的教學(xué)提供指導(dǎo)。

(4)學(xué)生的行為和獎懲情況:可以觀察學(xué)生在學(xué)習(xí)和生活中的和方面信息。這個側(cè)面也能從一定程度上反映學(xué)生的學(xué)習(xí)情況,但是這個方面往往集中反映學(xué)校的整體教學(xué)效果。如利用學(xué)生信息中的數(shù)據(jù),采用樸素貝葉斯分類的方法,對學(xué)生信息數(shù)據(jù),如不同課程性質(zhì)課程的平均成績、社會實踐能力、獲獎情況、社會工作情況等進行分類與預(yù)測。從結(jié)果看來,樸素貝葉斯在學(xué)生信息分類預(yù)測中取得了很好的效果,這樣也就促進了高校的教學(xué)管理、人才培養(yǎng)等各方面的發(fā)展。

(5)學(xué)生個人信息:利用數(shù)據(jù)挖掘技術(shù),比如可以對學(xué)生訪問情況進行分析,跟蹤、了解學(xué)生出勤情況。還可對學(xué)生年齡、性別等個人情況進行分析,了解學(xué)生的組成、結(jié)構(gòu),為合理地安排課程設(shè)置提供依據(jù)。通過對學(xué)生考試情況的分析,并結(jié)合出勤情況,可作為考查學(xué)生學(xué)習(xí)的情況,為合理地評估學(xué)生綜合素質(zhì)提供依據(jù)。對于挖掘出來的規(guī)則信息可以利用可視化技術(shù),以圖表或曲線等形式提供給教師,以使教師能充分利用學(xué)生的問題資源,從而提高教學(xué)質(zhì)量。

(6)學(xué)生學(xué)習(xí)特征:學(xué)生特征包括兩個方面:一是學(xué)習(xí)準(zhǔn)備,一是學(xué)習(xí)風(fēng)格。學(xué)習(xí)準(zhǔn)備包括初始能力和一般特征兩個方面。學(xué)生的初始能力是指學(xué)生在學(xué)習(xí)某一特定的課程內(nèi)容時,已經(jīng)具備的有關(guān)知識與技能的基礎(chǔ),以及他們對這些學(xué)習(xí)內(nèi)容的認(rèn)識和態(tài)度。學(xué)習(xí)風(fēng)格包括學(xué)習(xí)者的生理特征、心理特征和社會特征三個方面。學(xué)生的學(xué)習(xí)風(fēng)格與學(xué)習(xí)活動有著密切的關(guān)系。對學(xué)生感知不同事物、并對不同事物做出反應(yīng)這兩方面產(chǎn)生影響的所有心理特征構(gòu)成了學(xué)習(xí)風(fēng)格[6]。利用數(shù)據(jù)挖掘功能分析學(xué)生特征,并在此基礎(chǔ)上組織學(xué)習(xí)內(nèi)容、明確學(xué)習(xí)目標(biāo)、確定教學(xué)策略、選擇教學(xué)輔助媒體,為學(xué)生創(chuàng)造出一個適合其內(nèi)部條件的外部學(xué)習(xí)環(huán)境,使有效學(xué)習(xí)發(fā)生在每個學(xué)生的身上。通過數(shù)據(jù)挖掘技術(shù),把不同學(xué)習(xí)者的學(xué)習(xí)特征存入數(shù)據(jù)庫,教師可以通過它及時地了解學(xué)習(xí)者的需求、興趣愛好、個性差異等信息,并以此為依據(jù)為不同學(xué)習(xí)者提供動態(tài)的學(xué)習(xí)內(nèi)容、相應(yīng)的導(dǎo)航機制、推薦個性化的學(xué)習(xí)材料等服務(wù),真正的實現(xiàn)因材施教。

(7)學(xué)生學(xué)習(xí)情況:學(xué)習(xí)評價是教育工作者的重要職責(zé)之一。評定學(xué)生的學(xué)習(xí)行為,既對學(xué)生起到信息反饋和激發(fā)學(xué)習(xí)動機的作用,又是檢查課程計劃、教學(xué)程序以至教學(xué)目的的手段,也是考查學(xué)生個別差異,便于因材施教的途徑。對學(xué)生學(xué)習(xí)行為和綜合素質(zhì)進行評價,一般采用模糊論中的模糊綜合評判及模糊聚類的方法,對評價結(jié)果采用了對定性和定量指標(biāo)加權(quán)平均算出綜合素質(zhì)評價得分并排名的方法,而且由于學(xué)生綜合素質(zhì)的評價指標(biāo)是動態(tài)變化的,可以考慮選用動態(tài)聚類法對評判結(jié)果進行動態(tài)聚類分析。

2.3對選課數(shù)據(jù)的信息挖掘

學(xué)生通過網(wǎng)絡(luò)選擇自己所上的課程,選課數(shù)據(jù)背后可能隱藏著許多尚不被我們所知的重要信息,這些信息對教學(xué)管理具有重要的參考價值,而數(shù)據(jù)挖掘技術(shù)可以用來找出這些隱藏在數(shù)據(jù)背后的信息和知識的技術(shù)[7]。

在選課數(shù)據(jù)分析上,主要考慮以下幾個方面:分析各門課的選課數(shù)目,確定課程的歡迎程度;分析各門課的課程歸屬和選課學(xué)分,確定學(xué)生選課時對不同課程歸屬課的學(xué)分多少的考慮;分析各門課選課率,了解學(xué)生對目前課程安排中的滿意程度;分析選課學(xué)生的情況,了解選擇當(dāng)前課程的學(xué)生的專業(yè)情況;分析任課教師情況,了解任課教師的實際情況和綜合能力。

首先要對選課的原始數(shù)據(jù)進行預(yù)處理,把其原始數(shù)據(jù)采樣后轉(zhuǎn)換成適合數(shù)據(jù)挖掘的數(shù)據(jù)。在處理的過程中,要明晰數(shù)據(jù)的上下結(jié)構(gòu)和面向?qū)ο?為數(shù)據(jù)挖掘作好準(zhǔn)備。完成數(shù)據(jù)的預(yù)處理之后,確定參與挖掘的數(shù)據(jù)表,在選課系統(tǒng)中學(xué)生選課表是基本事實表,學(xué)生信息表、教師信息表和課程信息表可作為周圍的維表。最后將預(yù)處理之后的數(shù)據(jù)進行狀態(tài)運行,在此基礎(chǔ)上選擇數(shù)據(jù)挖掘算法FP-growth進行數(shù)據(jù)挖掘。挖掘的最終結(jié)果可以用可視化的圖形方式表現(xiàn)出來。根據(jù)挖掘的結(jié)果,得出選課背后隱藏的各種數(shù)據(jù)信息,如某些專業(yè)的學(xué)生喜歡選某位老師所開設(shè)的相關(guān)課程,部分學(xué)生總是選擇學(xué)分較多的有更多上機機會的課程等等。

根據(jù)數(shù)據(jù)挖掘的分析結(jié)果,了解實際的情況,在此基礎(chǔ)上就進一步加強教學(xué)管理,合理設(shè)置各種課程和提高教

學(xué)質(zhì)量,最終讓學(xué)生學(xué)習(xí)到更有用的知識和技能。

3 結(jié)束語

隨著信息量的急劇增長和對信息提取的更高要求,現(xiàn)在我們很難再依照傳統(tǒng)方法在海量數(shù)據(jù)中尋找決策的依據(jù),這就必須借助數(shù)據(jù)挖掘法發(fā)掘數(shù)據(jù)中隱藏的規(guī)律或模式,為決策提供更有效的支持。數(shù)據(jù)挖掘能夠為教學(xué)改革提供有效的理論與實踐決策依據(jù),在分析影響高校教學(xué)管理的各個層面中具有較好的作用。

在教學(xué)管理中,把常用的數(shù)據(jù)挖掘技術(shù)應(yīng)用在教師信息、學(xué)生信息、選課信息等各個方面,每一種應(yīng)用都和具體的挖掘情況相結(jié)合,根據(jù)實際情況,采用適當(dāng)?shù)耐诰蚍椒?確實發(fā)掘數(shù)據(jù)中隱藏的內(nèi)在聯(lián)系。結(jié)合學(xué)校的實際情況,采用合理的挖掘步驟,將挖掘后的結(jié)果分析應(yīng)用到實際中,找出影響教學(xué)的關(guān)鍵因素,提高教學(xué)管理水平,使教師和學(xué)校教育決策者洞悉教學(xué)中存在的問題。

參考文獻:

[1]劉曉霞.數(shù)據(jù)挖掘技術(shù)在高校教學(xué)中的應(yīng)用[J].現(xiàn)代計算機,2008,(285):115-116.

[2]楊永斌.數(shù)據(jù)挖掘技術(shù)在教育中的應(yīng)用研究[J].計算機科學(xué),2006,33(12):284-286.

[3]邱燕玲.數(shù)據(jù)挖掘在教學(xué)測評中的應(yīng)用分析[J].科技資訊,2007,(07):131-132.

[4]楊金凡.數(shù)據(jù)挖掘在教學(xué)評價中的應(yīng)用[J].電腦開發(fā)與應(yīng)用,2007,20(4):77-79.

[5]駱毓燕,張霞,白云.基于樸素貝葉斯的學(xué)生信息分類預(yù)測研究[J].高等教育與學(xué)術(shù)研究,2008,(3):65-70.

第7篇:數(shù)據(jù)挖掘課程范文

關(guān)鍵詞:高職教育;個性化學(xué)習(xí);數(shù)據(jù)挖掘;商業(yè)智能

中圖分類號:TP311.13

作為我國高等教育一支重要生力軍――高等職業(yè)教育近幾年來的發(fā)展可謂迅猛,無論是學(xué)校數(shù)還是學(xué)生人數(shù),高職??频囊?guī)模已是我國高等教育的半壁江山。高職教育對人才的培養(yǎng)目標(biāo)是為國家和地方經(jīng)濟的發(fā)展輸送適應(yīng)生產(chǎn)、建設(shè)服務(wù)等一線急需的應(yīng)用型高素質(zhì)人才,《國務(wù)院關(guān)于大力發(fā)展職業(yè)教育的決定》中就提出了“堅持以就業(yè)為導(dǎo)向,深化職業(yè)教育教學(xué)改革”,要求加強職業(yè)院校對學(xué)生實踐能力和職業(yè)技能的培養(yǎng)。

1 現(xiàn)狀

目前,高職學(xué)生在學(xué)校完成系統(tǒng)的課程學(xué)習(xí)依然是高職教育教學(xué)的主要方式,在此過程中,由于學(xué)生個體特性、就業(yè)意向、專業(yè)方向等各種因素的影響,獲取的知識無論從方式方法、內(nèi)容結(jié)構(gòu),還是真正掌握的程度來說都因人而異,而這其中有相當(dāng)大的部分是學(xué)生主動性選擇的結(jié)果;此外,在高職教育教學(xué)改革的嘗試中,大類招生、拓展專業(yè)等多項措施在很多職業(yè)院校中已然試行,這就給予學(xué)生更多的自和選擇的機會。

然而,在自主選擇的過程中,由于沒有一個可參照的、適合自己的挑選標(biāo)準(zhǔn),高職學(xué)生進行各項選擇時在很大程度上有著“扎堆隨大流”、“哪個課能混好過”的心理,這就導(dǎo)致主動選擇的課程,其學(xué)習(xí)過程并不順暢、學(xué)習(xí)效果也不理想,沒有提升自身知識結(jié)構(gòu)的質(zhì)量。這種高職教育中教與學(xué)環(huán)節(jié)的脫節(jié)會對高職學(xué)生的能力培養(yǎng)產(chǎn)生有著不可忽視的影響。

2 研究思路

隨著教育信息化的深入發(fā)展,先進的信息技術(shù)手段在教育教學(xué)的方方面面都得以有效利用,這也為學(xué)生綜合能力培養(yǎng)的探索與嘗試提供了新的途徑,數(shù)據(jù)挖掘技術(shù)就是其中很重要的一種。數(shù)據(jù)挖掘指的是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。在此過程中,數(shù)據(jù)源必須是真實的、大量的、含噪聲的,而從中發(fā)現(xiàn)的是用戶所感興趣的知識內(nèi)容,這些知識應(yīng)該是可以接受和理解、并且能加以進一步運用的。

數(shù)據(jù)挖掘技術(shù)之所以在教育行業(yè)有更為廣泛、實際的應(yīng)用,這是由于各個學(xué)校都會有自己的一整套數(shù)據(jù)庫系統(tǒng),用于記錄學(xué)生的學(xué)籍信息、課程教學(xué)過程等歷史數(shù)據(jù),這樣,就可以嘗試運用先進的數(shù)據(jù)挖掘技術(shù)和智能分析工具,通過對高職教育研究和教學(xué)過程中積累的海量數(shù)據(jù)進行采集分類、挖掘和分析,從多角度、多層次出發(fā),構(gòu)建識別個體特點、知識構(gòu)成和獲取方式等要素之間關(guān)聯(lián)模式的數(shù)據(jù)模型。數(shù)據(jù)挖掘是一門交叉學(xué)科,其理論和方法有很多,包括K-最近鄰分類器、判別分析、人工神經(jīng)網(wǎng)絡(luò)和分類樹等,它把人們對數(shù)據(jù)的應(yīng)用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。在這里就是要將數(shù)據(jù)挖掘方法與高職教育教學(xué)研究相結(jié)合,設(shè)計實際的分析應(yīng)用系統(tǒng),具體來說:

(1)數(shù)據(jù)挖掘技術(shù)面向高職教育這一特定領(lǐng)域中的主體――高職學(xué)生,針對專門的指標(biāo),包括個體特性、專業(yè)要求、就業(yè)意向等,著眼于課程這個知識載體,對它們之間的關(guān)系進行深層次、智能化的挖掘、分析;

(2)數(shù)據(jù)挖掘的應(yīng)用會具體到建模、變量篩選和導(dǎo)入等方面,而不只是一些抽象的挖掘算法的研究;

(3)數(shù)據(jù)分析采用先進的商業(yè)智能工具,同樣,數(shù)據(jù)的展現(xiàn)手段基于平臺,具有開放化、模塊化、網(wǎng)絡(luò)化特點。

3 系統(tǒng)框架

系統(tǒng)定位于個性化學(xué)習(xí)分析,其框架結(jié)構(gòu)參見圖1,主要由數(shù)據(jù)集成、數(shù)據(jù)建模、數(shù)據(jù)分析及展現(xiàn)等部分構(gòu)成。具體來說,數(shù)據(jù)集成模塊完成定義數(shù)據(jù)結(jié)構(gòu)、裝載、清洗、合并數(shù)據(jù)的功能;數(shù)據(jù)建模是指建立數(shù)據(jù)分析OLAP及數(shù)據(jù)挖掘模型;數(shù)據(jù)分析旨在分析和比較各種不同算法得出的結(jié)果,尋找最為匹配的算法,而數(shù)據(jù)展現(xiàn)的作用是根據(jù)分析結(jié)構(gòu)靈活創(chuàng)建數(shù)據(jù)報告。

圖1 系統(tǒng)框架結(jié)構(gòu)

在此架構(gòu)下,各個子系統(tǒng)的功能如下所述:

(1)數(shù)據(jù)集成。分析和歸納課程教學(xué)過程中產(chǎn)生的系列數(shù)據(jù),根據(jù)其特征和行為設(shè)計及定義便于分析和挖掘的數(shù)據(jù)結(jié)構(gòu),然后并進行數(shù)據(jù)集成。數(shù)據(jù)集成的工作包括從異構(gòu)數(shù)據(jù)源獲取數(shù)據(jù),將其進行清洗、轉(zhuǎn)換、合并,然后加載到數(shù)據(jù)倉儲中。數(shù)據(jù)集成執(zhí)行的時間、相互的順序、成敗對將來的分析結(jié)果的有效性則至關(guān)重要。

(2)數(shù)據(jù)建模。典型的數(shù)據(jù)挖掘工具將在構(gòu)建了數(shù)據(jù)倉庫后進行分析并生成結(jié)果,一些工具也可以使用關(guān)系型數(shù)據(jù)進行分析,數(shù)據(jù)分析的結(jié)果獨立于數(shù)據(jù)倉庫中使用的數(shù)據(jù)。數(shù)據(jù)挖掘核心的部分就是選擇挖掘算法并建立數(shù)據(jù)模型,這樣就可以根據(jù)學(xué)生個體信息、學(xué)生成績等數(shù)據(jù)之間的關(guān)系將這些學(xué)生劃分成分析有意義的組群并預(yù)測他們的行為;當(dāng)把這些組發(fā)送回分析過程時,數(shù)據(jù)挖掘引擎允許分析人員和用戶根據(jù)這些簇進行劃分和細化。

(3)數(shù)據(jù)分析與展示。以學(xué)生個體信息和課程數(shù)據(jù)為輸入,利用所篩選出的最佳建模方法,逐步提出一個可實現(xiàn)個性化學(xué)習(xí)分析的數(shù)據(jù)模型,以衡量及提高模型預(yù)測的準(zhǔn)確度。將分析結(jié)果以特定的客戶端或Web方式進行展現(xiàn),以建立的分析結(jié)果展示平臺,具有高度的開放性、通用性和可擴展性。通過建模創(chuàng)建了正確的模型,數(shù)據(jù)挖掘的重點就從分析轉(zhuǎn)到結(jié)果上,數(shù)據(jù)報告的展現(xiàn)方式有多種,可通過專業(yè)的報告工具,也可自行編寫Web網(wǎng)站進行。

4 結(jié)束語

在高職教育教學(xué)研究中運用先進的數(shù)據(jù)挖掘技術(shù)手段,針對各項課程教學(xué)、學(xué)生管理數(shù)據(jù)進行深度挖掘、分析,研究個性化學(xué)習(xí)模式,為學(xué)生的自我學(xué)習(xí)規(guī)劃提供具體化、智能化分析結(jié)果以供參照,在此情況下,先進技術(shù)手段的支持,對教與學(xué)都有著不可忽視的影響。同時,也為人才培養(yǎng)的探索與嘗試提供新途徑。

參考文獻:

[1]趙云鵬,石麗,劉瑩.基于數(shù)據(jù)挖掘的高校規(guī)模分析及應(yīng)用研究.第九屆全國信息獲取與處理學(xué)術(shù)會議論文集[C].2011.

[2].數(shù)據(jù)挖掘在高職院校教學(xué)管理中的應(yīng)用[J].清遠職業(yè)技術(shù)學(xué)院學(xué)報,2010(12).

[3]干娟.基于決策樹算法的學(xué)生綜合測評系統(tǒng)的設(shè)計[J].安徽電子信息職業(yè)技術(shù)學(xué)院學(xué)報,2011(04).

第8篇:數(shù)據(jù)挖掘課程范文

摘要:基于現(xiàn)代計算機技術(shù)的快速發(fā)展,網(wǎng)絡(luò)技術(shù)和高等院校教育教學(xué)系統(tǒng)實現(xiàn)了有機整合,并且促進了教育教學(xué)與組織管理等多種活動的信息化發(fā)展,一定程度上提高了教育教學(xué)質(zhì)量以及效率,構(gòu)建了全新的教育教學(xué)管理模式。在此背景下,教育教學(xué)數(shù)字化發(fā)展速度也不斷加快,信息量增長速度加快,對于信息提取的要求也隨之提高。所以,在大量數(shù)據(jù)當(dāng)中獲取重要的信息也逐漸成為高等院校教育教學(xué)決策的重要依據(jù)?;诖?,文章將高校教育教學(xué)作為研究重點,闡述了數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用,以供參考。

關(guān)鍵詞:高校教育教學(xué);數(shù)據(jù)挖掘技術(shù);運用

一、數(shù)據(jù)挖掘概述

所謂的數(shù)據(jù)挖掘,具體指的就是在海量且模糊隨機數(shù)據(jù)當(dāng)中提取出隱含其中,同時具有潛在價值的信息與知識過程。將數(shù)據(jù)挖掘技術(shù)應(yīng)用在教育教學(xué)當(dāng)中,可以對海量數(shù)據(jù)予以深入挖掘與分析,進而獲得數(shù)據(jù)當(dāng)中所隱含的潛在信息內(nèi)容,更好地為高校教育教學(xué)管理人員決策提供有力支持[1]。

二、高校教育教學(xué)管理中的數(shù)據(jù)挖掘技術(shù)應(yīng)用

2.1在教學(xué)質(zhì)量提升方面的應(yīng)用

高等院校為了更好地提高教學(xué)管理的質(zhì)量,教務(wù)管理部門會在學(xué)期期末測評學(xué)員領(lǐng)導(dǎo)與任課教師的教學(xué)思想、態(tài)度以及教學(xué)方法等,并且根據(jù)最終的評分結(jié)果來明確教師的教學(xué)質(zhì)量。然而,受評價人員對標(biāo)準(zhǔn)理解以及把握程度的影響,學(xué)生評價仍存在隨意性特征。

在這種情況下,導(dǎo)致評分結(jié)果很難對教學(xué)效果進行真實地反映,因而也影響了教學(xué)質(zhì)量的評估。

但是,將數(shù)據(jù)挖掘技術(shù)應(yīng)用在教學(xué)質(zhì)量評估方面,通過對關(guān)聯(lián)規(guī)則算法的合理運用,可以將教學(xué)質(zhì)量評價當(dāng)中的不同指標(biāo)權(quán)重系數(shù)進行設(shè)定,并通過Apriori的算法來掃描數(shù)據(jù)集,在數(shù)據(jù)挖掘的作用下,獲取學(xué)歷、年齡以及職稱三者之間存在的聯(lián)系,同樣也可以獲得教學(xué)質(zhì)量和方法的關(guān)系[2]。

為此,高校教務(wù)管理部門就可以將獲得的規(guī)律應(yīng)用在教學(xué)管理實踐當(dāng)中,合理地設(shè)置督學(xué)小組并制定出聽課制度,將教學(xué)課堂教學(xué)的質(zhì)量真實且客觀地反映出來,實現(xiàn)高校教學(xué)水平的全面提升。

2.2課程體系結(jié)構(gòu)的有效完善

高等院校教育體系當(dāng)中的專業(yè)建設(shè)作用十分重要,所以,必須要具備高質(zhì)量的課程體系結(jié)構(gòu)設(shè)置。在對學(xué)生成績數(shù)據(jù)庫以及畢業(yè)生去向數(shù)據(jù)庫等多種數(shù)據(jù)信息進行數(shù)據(jù)挖掘以后,可以通過對關(guān)聯(lián)分析與序列模式的分析和探究,獲得數(shù)據(jù)與數(shù)據(jù)間存在的相關(guān)性。

其中,課程間的關(guān)系和先后順序亦或是課程和課程體系結(jié)構(gòu)之間的關(guān)系等等。在此基礎(chǔ)上,保證學(xué)習(xí)高級課程前事先學(xué)習(xí)先行課程。以計算機專業(yè)《數(shù)據(jù)結(jié)構(gòu)》為例,在教學(xué)中將《C語言》作為重要的先行課程,以保證學(xué)生在學(xué)習(xí)《數(shù)據(jù)結(jié)構(gòu)》內(nèi)容的時候可以具備良好語言基礎(chǔ),更深入地理解并靈活地應(yīng)用數(shù)據(jù)結(jié)構(gòu)當(dāng)中的算法。

而在完成《數(shù)據(jù)結(jié)構(gòu)》學(xué)習(xí)以后,應(yīng)根據(jù)學(xué)生就業(yè)走向和市場的實際需求來確定是否安排《JAVA語言程序設(shè)計》課程教學(xué)。這樣一來,學(xué)生的學(xué)習(xí)成績實現(xiàn)了有效地提高,更利于學(xué)生未來就業(yè)。除此之外,對內(nèi)容重復(fù)的課程進行有效地壓縮,將落后的課程內(nèi)容適當(dāng)?shù)貏h除,與專業(yè)特點相結(jié)合。

由此可見,將數(shù)據(jù)挖掘技術(shù)應(yīng)用在高校教學(xué)中,對于專業(yè)建設(shè)以及課程改革決策具有積極的作用。

三、網(wǎng)絡(luò)教學(xué)中的數(shù)據(jù)挖掘技術(shù)應(yīng)用

在網(wǎng)絡(luò)教學(xué)中應(yīng)用數(shù)據(jù)挖掘技術(shù),可以從Web文件以及Web活動當(dāng)中選擇出用戶較為感興趣的有價值模式以及信息,這就是所謂的Web挖掘[3]。因為接受教育對象在多個方面都存在差異,具體表現(xiàn)在個人學(xué)習(xí)目標(biāo)、學(xué)習(xí)能力與知識基礎(chǔ)的差異等。為此,網(wǎng)絡(luò)教學(xué)也必須要能夠適應(yīng)個性化的學(xué)習(xí)需求。可以把不同用戶學(xué)習(xí)狀況與軌跡詳細記錄并存放至數(shù)據(jù)庫當(dāng)中,通過對WEB挖掘技術(shù)的合理運用,在序列模式挖掘的作用下合理地分類文檔,以保證學(xué)生信息檢索速度的提高。

另外,也可以根據(jù)學(xué)生訪問瀏覽的數(shù)據(jù)挖掘并分析,針對訪問的數(shù)據(jù)展開聚類分析,以保證更好地了解學(xué)生感興趣的內(nèi)容,并為其推送相關(guān)內(nèi)容。與此同時,可以在相關(guān)聯(lián)的頁面當(dāng)中合理地設(shè)置超鏈接,對網(wǎng)站結(jié)構(gòu)予以有效地改善,確保頁面間的鏈接與用戶訪問的習(xí)慣更吻合。

結(jié)束語:

總而言之,在高校教育教學(xué)中合理地運用數(shù)據(jù)挖掘技術(shù)可以在大量數(shù)據(jù)信息當(dāng)中處理并提取出更具價值的信息內(nèi)容,促進高等院校教育教學(xué)管理工作的正常開展,特別是評估與決策方面,數(shù)據(jù)挖掘技術(shù)的作用更為明顯。

除此之外,該技術(shù)也可以應(yīng)用在網(wǎng)絡(luò)教學(xué)當(dāng)中,使得網(wǎng)絡(luò)教學(xué)資源配置更加合理,在教育教學(xué)中充分發(fā)揮自身的效用。上文針對數(shù)據(jù)挖掘技術(shù)在高校教育教學(xué)中的實際應(yīng)用展開了相關(guān)性地研究和分析,主要的目的就是為了更好地幫助高校進行決策,為學(xué)生提供更為理想的學(xué)習(xí)環(huán)境,在提高學(xué)生學(xué)習(xí)興趣的基礎(chǔ)上,增強高校教育教學(xué)的質(zhì)量與效率。

參考文獻

[1]侯錕.數(shù)據(jù)挖掘技術(shù)在高校教育教學(xué)中的應(yīng)用[J].吉林省教育學(xué)院學(xué)報(下旬),2012,28(7):51-52.

第9篇:數(shù)據(jù)挖掘課程范文

【關(guān)鍵詞】數(shù)據(jù)挖掘教學(xué)質(zhì)量教學(xué)評價

隨著高職教育的快速發(fā)展,高職院校的教學(xué)質(zhì)量的自我評價已經(jīng)成為學(xué)??茖W(xué)管理的重要保障。教育部為了確保高校的教育質(zhì)量,于2003年確立了5年一輪的評估制度。各高職院校在推進教育評估工作的同時,積極地組織自評,建立健全了全院教職工共同參與的教學(xué)質(zhì)量內(nèi)部自我評估機制。而建立健全高職院校教學(xué)質(zhì)量評價系統(tǒng)是提高教師教學(xué)質(zhì)量的重要途徑,也是提高教學(xué)管理水平的迫切需要。數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中提取知識的有效技術(shù),不僅可以實現(xiàn)教學(xué)評教數(shù)據(jù)的知識挖掘。這些知識可以為學(xué)校提高教學(xué)質(zhì)量,同時也可以輔助學(xué)校管理者決策,為進一步優(yōu)化教學(xué)資源提供可靠的數(shù)據(jù)依據(jù)。

一、教學(xué)質(zhì)量評價的作用

高職院校的教學(xué)質(zhì)量是高等職業(yè)教育的生命線,教學(xué)質(zhì)量的評價作為提高教學(xué)質(zhì)量的手段被擺到了越來越重要的位置,而教師在教育工作中擔(dān)負著溝通教與學(xué)的橋梁作用,其工作質(zhì)量的好與壞會直接影響到教育質(zhì)量的好壞。在教學(xué)管理中,對高職教師進行教學(xué)質(zhì)量測評,是教學(xué)活動中提高教學(xué)質(zhì)量的一個重要環(huán)節(jié),也是教學(xué)管理的核心。教學(xué)質(zhì)量測評在教學(xué)過程中發(fā)揮著諸多作用,具體表現(xiàn)在以下幾個方面:

1、通過教學(xué)質(zhì)量測評,進一步加強人才培養(yǎng)工作的宏觀管理與指導(dǎo),推動學(xué)校自覺地按照教育規(guī)律不斷明確辦學(xué)指導(dǎo)思想、堅持教育創(chuàng)新、深化教學(xué)改革、加強教學(xué)基本建設(shè)、強化教學(xué)管理、全面提高教育質(zhì)量。

2、教學(xué)質(zhì)量評價能夠從整體上對教學(xué)活動進行調(diào)控,以確保教學(xué)活動能夠按照預(yù)定目標(biāo)進行,并且能最終達到該目標(biāo)。

二、數(shù)據(jù)挖掘概述

1、數(shù)據(jù)挖掘的定義

簡單的說,數(shù)據(jù)挖掘(Data Mining)就是從大量的、隨機的實際應(yīng)用數(shù)據(jù)中,提取或挖掘隱含在其中的、人們事先不知道的、但又有用的知識的過程。數(shù)據(jù)挖掘涉及多學(xué)科技術(shù)的集成,包括了數(shù)據(jù)庫和數(shù)據(jù)倉庫、機器學(xué)習(xí)、統(tǒng)計學(xué)、人工智能、神經(jīng)網(wǎng)絡(luò)、信息檢索、模式識別等多個領(lǐng)域的理論和方法。與數(shù)據(jù)挖掘相近的同義詞有知識提取、數(shù)據(jù)捕撈、數(shù)據(jù)融合、數(shù)據(jù)分析、決策支持和從數(shù)據(jù)中挖掘知識等。

2、數(shù)據(jù)挖掘的方法

數(shù)據(jù)挖掘源于多個學(xué)科,受多個學(xué)科影響,數(shù)據(jù)挖掘的核心技術(shù)融合了數(shù)據(jù)庫、機器學(xué)習(xí)、統(tǒng)計學(xué)、人工智能等多個學(xué)科領(lǐng)域的理論和方法,數(shù)據(jù)挖掘利用的技術(shù)越多,得出結(jié)果的精確性就會越高。目前數(shù)據(jù)挖掘方法很多,比較典型的有關(guān)聯(lián)分析、序列模式分析、分類分析、聚類分析等。

(1)關(guān)聯(lián)分析

所謂關(guān)聯(lián)分析,也就是利用關(guān)聯(lián)規(guī)則進行數(shù)據(jù)挖掘,通過關(guān)聯(lián)規(guī)則挖掘,可以發(fā)現(xiàn)那些隱藏在海量數(shù)據(jù)間的相互關(guān)系,發(fā)現(xiàn)那些潛在的、隱含在數(shù)據(jù)記錄中的有用信息。利用關(guān)聯(lián)規(guī)則進行數(shù)據(jù)挖掘是由Rakesh Apwal等人首先提出的。

(2)序列模式分析

序列模式分析,側(cè)重分析數(shù)據(jù)間的前后序列關(guān)系,它能發(fā)現(xiàn)數(shù)據(jù)庫中“在一段時間內(nèi),先進行了一活動后,又接著進行了另一項活動”之類的知識。

(4)聚類分析

聚類分析是統(tǒng)計學(xué)中的一種研究方法,主要研究”物以類聚”的問題,它是把物理或抽象的集合分割為多個類的過程,使得同一類中的對象具有高度的相似性,而不同類之間對象的差別較明顯。與分類分析不同,在聚類分析中,預(yù)先不知道記錄數(shù)據(jù)中分類信息,并且目標(biāo)數(shù)據(jù)分成幾類也不知道,需要依據(jù)某種度量標(biāo)準(zhǔn),合理地劃分記錄數(shù)據(jù)到各個簇中。聚類分析的方法很多,具體可以分為系統(tǒng)聚類法、模糊聚類法、基于密度的方法等。

三、教學(xué)質(zhì)量評價存在的問題

現(xiàn)在的教學(xué)質(zhì)量評價中尚存在著一些新的問題。像許多高職院校一樣,我院在多年來的教學(xué)、管理和教學(xué)質(zhì)量評價工作積累了大量的數(shù)據(jù),但目前對這些海量數(shù)據(jù)的研究處理還僅停留在初級的數(shù)據(jù)備份、查詢及簡單基本的統(tǒng)計階段,使得這些數(shù)據(jù)不能發(fā)揮其應(yīng)有的價值。如何更有效地利用大這些大量的數(shù)據(jù)記錄信息理性探析并指導(dǎo)高職院校教師更好的教學(xué)已變得非常重要。

四、數(shù)據(jù)挖掘技術(shù)在教學(xué)評價中的應(yīng)用

1、基于數(shù)據(jù)挖掘的教學(xué)評價流程

(1)確定挖掘?qū)ο?。源?shù)據(jù)庫存儲了來自教務(wù)系統(tǒng)不同模塊的數(shù)據(jù),主要有教師基本信息、課程基本信息、評價基本信息等,這些都是評價數(shù)據(jù)分析的基礎(chǔ)。清晰定義問題,認(rèn)清數(shù)據(jù)挖掘的目的,是數(shù)據(jù)挖掘的關(guān)鍵一步,挖掘的最后結(jié)果是不可預(yù)測的,但是要探索的問題一般是可以預(yù)見的。

(2)數(shù)據(jù)的采集。教師需要在教學(xué)過程中,主要收集教學(xué)數(shù)據(jù)信息,有些信息需要可以直接獲得,有的信息需要進行調(diào)查獲得。此項工作繁瑣,耗時,工作量大。

(3)數(shù)據(jù)的預(yù)處理。數(shù)據(jù)的預(yù)處理主要包括數(shù)據(jù)集成、選擇、轉(zhuǎn)換等過程。此過程的實施是針對算法而準(zhǔn)備的,不同的算法一般需要不同的分析數(shù)據(jù)模型。

(4)數(shù)據(jù)分析。進行數(shù)據(jù)分析,首先要選擇合適的挖掘算法,目的是為了建立一個分析數(shù)據(jù)模型,并使用合適的軟件實現(xiàn)這一算法,繼而對所轉(zhuǎn)換的數(shù)據(jù)進行挖掘。

(5)結(jié)果分析與表示。根據(jù)用戶的不同,對分析結(jié)果庫中的數(shù)據(jù)進行分析,把具有價值信息提取出來,以文字、圖形等形式反饋給最終用戶。例如教師可利用所得的信息改進教學(xué)策略,指導(dǎo)進一步的教學(xué)。

2、數(shù)據(jù)挖掘在高職院校教學(xué)評價中的作用

在高職院校的教學(xué)工作中,有許多教師根據(jù)教學(xué)需要,往往每位教師所教的課程不止一門,在整個教學(xué)質(zhì)量評價活動中,評價某位教師的授課質(zhì)量不能僅限于某個班級、某一學(xué)期、某一門課程成績排名,而是由我們事先設(shè)定好的挖掘模型從其開始授課時起,對其在各個學(xué)期、不同的班級及不同課程的平均成績進行數(shù)據(jù)挖掘,客觀得出該教師的總體教學(xué)效果。

總之,我院擁有信息量龐大的歷屆教學(xué)評價數(shù)據(jù)和人事信息數(shù)據(jù),現(xiàn)在我們很難再依照傳統(tǒng)方法在海量數(shù)據(jù)中尋找決策的依據(jù),數(shù)據(jù)挖掘作為一種工具,其技術(shù)日趨成熟,我們將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教學(xué)評價中,可以借助它去發(fā)掘數(shù)據(jù)中隱藏的規(guī)律或模式,為建立教學(xué)評價模型提供了捷徑,為決策提供科學(xué)的依據(jù)。

注:河北省教育學(xué)會“十二五”規(guī)劃課題(XHX NO,12550038)

參考文獻: