公務(wù)員期刊網(wǎng) 論文中心 正文

談數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)課程體系

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了談數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)課程體系范文,希望能給你帶來靈感和參考,敬請閱讀。

談數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)課程體系

摘要:該文闡述了數(shù)據(jù)科學與大數(shù)據(jù)專業(yè)的設(shè)置必要性、專業(yè)的培養(yǎng)目標和知識能力結(jié)構(gòu),最后探索了數(shù)據(jù)科學與大數(shù)據(jù)專業(yè)的技術(shù)性課程體系設(shè)置方法。希望該文內(nèi)容對數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)的培養(yǎng)方案制訂和課程體系構(gòu)造具有一定的指導意義和參考價值。

關(guān)鍵詞:數(shù)據(jù)科學;大數(shù)據(jù)技術(shù);課程體系

1本專業(yè)的背景

數(shù)據(jù)科學隨著人工智能學科發(fā)展而產(chǎn)生。自1956年提出人工智能研究以來,人工智能經(jīng)歷過推理研究期、知識表達研究期和機器學習期[1]。機器學習中歸納學習主要從數(shù)據(jù)歸納出規(guī)律,在20世紀80年代末期提出知識發(fā)現(xiàn)(Knowl-edgeDiscover,KDD),而20世紀90年代初產(chǎn)生了數(shù)據(jù)挖掘(DataMining)研究方向,數(shù)據(jù)挖掘成為20世紀90年代至21世紀初非常熱門的研究方向,各種數(shù)據(jù)挖掘研究問題和成果,形成了數(shù)據(jù)科學的主要內(nèi)容。21世紀初,網(wǎng)絡(luò)技術(shù)的廣泛運用推動了信息領(lǐng)域的大規(guī)模數(shù)據(jù)產(chǎn)生與積累。從大量數(shù)據(jù)的統(tǒng)計分析中發(fā)現(xiàn)一些規(guī)律,成為業(yè)界亟須解決的一個技術(shù)問題,推動了大規(guī)模并行計算以及分布式計算技術(shù)的發(fā)展,產(chǎn)生了以Hadoop平臺為代表的大數(shù)據(jù)分析計算技術(shù)。國家在“十三五”規(guī)劃綱要中提出:“實施國家大數(shù)據(jù)戰(zhàn)略,推進數(shù)據(jù)資源開放共享”。黨的十八屆五中全會公報提出要實施“國家大數(shù)據(jù)戰(zhàn)略”,標志著大數(shù)據(jù)戰(zhàn)略正式上升為國家戰(zhàn)略。2015年9月,國務(wù)院印發(fā)的《促進大數(shù)據(jù)發(fā)展行動綱要》提出,加強專業(yè)人才培養(yǎng),鼓勵高校設(shè)立數(shù)據(jù)科學和數(shù)據(jù)工程相關(guān)專業(yè),重點培養(yǎng)專業(yè)化數(shù)據(jù)工程師等大數(shù)據(jù)專業(yè)人才。正是在這種背景下,2016年,我國設(shè)立了數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)本科專業(yè),第一批由北京大學、中南大學和中央財經(jīng)大學等三所高校設(shè)立,第二批為2017年由32所高校設(shè)立。

2本專業(yè)的培養(yǎng)目標

在國外,數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)(DataScience)專業(yè)是以數(shù)據(jù)分析學(DataAnalytics)專業(yè)為基礎(chǔ)發(fā)展而來的,在北美大學首先設(shè)立數(shù)據(jù)分析碩士學位,主要是抽象出底層的數(shù)據(jù)問題,連接計算機基礎(chǔ)學科與數(shù)據(jù)科學之間的空白。2013年,紐約大學等幾所美國高校設(shè)立了數(shù)據(jù)科學碩士學位,出現(xiàn)了數(shù)據(jù)科學專業(yè)概念[2]。該專業(yè)以數(shù)據(jù)科學與大數(shù)據(jù)分析開發(fā)為核心內(nèi)容,并強調(diào)學生理解掌握數(shù)據(jù)領(lǐng)域的知識,具備為數(shù)據(jù)分析運用服務(wù)的技術(shù)能力。數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)培養(yǎng)具有多學科交叉能力的大數(shù)據(jù)人才,其中,重點培養(yǎng)三方面的素質(zhì)人才:理論型人才,主要應(yīng)具備對數(shù)據(jù)科學中模型進行理解和運用的能力;實踐型人才,主要應(yīng)具備處理實際數(shù)據(jù)的能力;應(yīng)用型人才,主要應(yīng)具備利用大數(shù)據(jù)的方法解決具體行業(yè)應(yīng)用問題的能力。學生畢業(yè)后主要從事大數(shù)據(jù)產(chǎn)品開發(fā)或大數(shù)據(jù)分析,未來職業(yè)發(fā)展為企事業(yè)單位的數(shù)據(jù)信息高級管理員和分析師,或成為信息技術(shù)領(lǐng)域的涉及數(shù)據(jù)分析方向軟件開發(fā)工程師或算法分析師。具體目標為:掌握面向數(shù)據(jù)應(yīng)用的統(tǒng)計學、數(shù)學、計算機科學以及應(yīng)用領(lǐng)域?qū)W科的基礎(chǔ)理論和方法、熟練運用各種數(shù)據(jù)分析技術(shù)和手段;掌握數(shù)據(jù)尤其是大數(shù)據(jù)的采集、存儲、處理、分析與應(yīng)用等技術(shù),具備數(shù)據(jù)和大數(shù)據(jù)應(yīng)用項目的設(shè)計和開發(fā)能力;能夠利用探索性數(shù)據(jù)分析技術(shù)對數(shù)據(jù)進行初步建模,并能利用統(tǒng)計推斷的基本理論、方法對數(shù)據(jù)進行分析和產(chǎn)品化開發(fā);在系統(tǒng)的專業(yè)技術(shù)訓練基礎(chǔ)上,具備廣泛的數(shù)據(jù)應(yīng)用視野、能夠勝任大數(shù)據(jù)分析挖掘、大數(shù)據(jù)系統(tǒng)開發(fā)等技術(shù)領(lǐng)域以及大數(shù)據(jù)商務(wù)與金融等各類相關(guān)應(yīng)用領(lǐng)域的多層次工作。

3數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)知識能力結(jié)構(gòu)

數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)主要以計算機科學與技術(shù)專業(yè)為基本知識能力支撐、將人工智能的數(shù)據(jù)挖掘為拓展性能力,因此其涉及計算機科學與技術(shù)、人工智能、統(tǒng)計學等專業(yè)知識與能力,即掌握應(yīng)用先進的計算技術(shù)并從大數(shù)據(jù)當中獲取知識與智慧的技術(shù)[3]。數(shù)據(jù)科學與大數(shù)據(jù)專業(yè)要求的知識與能力是計算機傳統(tǒng)知識能力、經(jīng)典數(shù)據(jù)分析與新型數(shù)據(jù)分析手段;計算機的信息管理技術(shù)提供應(yīng)用基礎(chǔ)技術(shù),數(shù)學理論基礎(chǔ)和數(shù)理統(tǒng)計方法支持,新興技術(shù)平臺提供技術(shù)支持,通過多支持并以數(shù)據(jù)為核心所得出的技術(shù)。數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)能力需求可以分為理論性能力和實踐性能力[4]。學生要有較強的數(shù)理統(tǒng)計基礎(chǔ)、數(shù)學建模能力、扎實的數(shù)據(jù)結(jié)構(gòu)和算法基本功,能夠很好地理解和掌握各種機器學習和數(shù)據(jù)挖掘算法,還要掌握處理“大數(shù)據(jù)”的先進技術(shù),即掌握云計算相關(guān)的大數(shù)據(jù)處理平臺及其生態(tài)系統(tǒng)。實踐性能力指處理實際數(shù)據(jù)的實踐能力,能夠掌握基本算法和系統(tǒng)開發(fā)能力,并且具備一定實際應(yīng)用性能力,即利用大數(shù)據(jù)解決具體行業(yè)應(yīng)用問題的能力。專業(yè)技術(shù)性能力要求為:具備數(shù)學能力,在基本數(shù)據(jù)技術(shù)及其在軟件開發(fā)中應(yīng)用數(shù)學的能力。具備大數(shù)據(jù)應(yīng)用程序開發(fā)實踐能力,能夠根據(jù)軟件需要設(shè)計簡單的解決方案,能根據(jù)給出的設(shè)計方案實現(xiàn)軟件開發(fā);具備應(yīng)用大數(shù)據(jù)知識將大數(shù)據(jù)和云計算知識用于分析解決復雜性工程問題的能力;具備能夠基于科學原理并采用科學方法對復雜工程問題進行研究的能力,包括設(shè)計實驗、分析與解釋數(shù)據(jù),并能通過信息綜合得到合理有效的結(jié)論[5-6]。

4數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)課程設(shè)計原則

專業(yè)技術(shù)性能力課程體系分為:數(shù)學基礎(chǔ)課、計算機相關(guān)課程、數(shù)據(jù)科學相關(guān)課程、大數(shù)據(jù)技術(shù)相關(guān)課程、領(lǐng)域相關(guān)課程。各高??筛鶕?jù)各自的專業(yè)定位選擇設(shè)置。數(shù)學基礎(chǔ)課:傳統(tǒng)計算機學科基礎(chǔ)數(shù)學主要有微積分、線性代數(shù)、概論統(tǒng)計學。專業(yè)數(shù)學基礎(chǔ)課可擴展為優(yōu)化與運籌學課程:時間序列導論、隨機過程分析、最優(yōu)化方法、多元統(tǒng)計分析、運籌學。計算機相關(guān)課程:遵照中國工程教育認證的計算機類的通用標準主要有計算機科學導論、高級語言程序設(shè)計、算法與數(shù)據(jù)結(jié)構(gòu)、操作系統(tǒng)、計算機組成原理、操作系統(tǒng)導論、軟件工程、數(shù)據(jù)庫原理與應(yīng)用、計算機網(wǎng)絡(luò)等相關(guān)課程,根據(jù)本專業(yè)特點,建議增設(shè)算法分析與設(shè)計。數(shù)據(jù)科學相關(guān)課程:主要是圍繞數(shù)據(jù)挖掘與分析展開課程。根據(jù)需要掌握數(shù)據(jù)采集、數(shù)據(jù)存儲與管理、數(shù)據(jù)分析方法、數(shù)據(jù)展示等能力,可開設(shè)的課程有數(shù)據(jù)科學導論、數(shù)據(jù)挖掘與分析、機器學習、數(shù)據(jù)可視化、數(shù)據(jù)采集與爬蟲技術(shù)、數(shù)據(jù)的人文與倫理等課程。大數(shù)據(jù)技術(shù)相關(guān)課程:須掌握利用相關(guān)大數(shù)據(jù)技術(shù)平臺和開發(fā)方法,實現(xiàn)數(shù)據(jù)科學理論的分析方法。面向大數(shù)據(jù)實際應(yīng)用能力培養(yǎng),比較典型大數(shù)據(jù)平臺開發(fā)課程主要有Spark開發(fā)技術(shù)、Hadoop編程平臺、HBase大數(shù)據(jù)快速讀寫、大數(shù)據(jù)系統(tǒng)應(yīng)用實驗、云計算。領(lǐng)域相關(guān)課程:這方面課程主要面向?qū)I(yè)方向選修課,其包括兩類,一類是通用領(lǐng)域的相關(guān)課程,例如自然語言處理、圖像分析與處理、語音分析或相關(guān)領(lǐng)域的數(shù)據(jù)分析、大數(shù)據(jù)案例分析與實驗、文本挖掘分析、智能系統(tǒng)推薦等;另一類是與行業(yè)相關(guān)的領(lǐng)域課程,例如農(nóng)業(yè)大數(shù)據(jù)分析、電子商務(wù)大數(shù)據(jù)分析、電力數(shù)據(jù)分析等,可根據(jù)各高校的專業(yè)特色定位而開設(shè)。

參考文獻

[1]顧險峰.人工智能的歷史回顧和發(fā)展現(xiàn)狀[J].自然雜志,2016,38(3):157-166.

[2]孫書韜,朱立谷,李春芳.北美知名大學數(shù)據(jù)科學專業(yè)課程體系分析[J].中國教育信息化,2019(24):48-50.

[3]賀文武,劉國買.數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)核心課程建設(shè)的探索與研究[J].教育評論,2017(11):31-35.

[4]楊洪,李知遙,張志強.數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)實踐能力培養(yǎng)體系的探索與實踐[J].成都大學學報(社會科學版),2018(3):106-112.

[5]劉穎,王愛蓮,宣齊娜,等.新工科背景下數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)建設(shè)探析:以地方財經(jīng)類高校為例[J].吉林工商學院學報,2019,35(6):106-109.

[6]周四軍,熊偉強.如何構(gòu)建數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)本科專業(yè)課程體系[J].才智,2017(25):60.

作者:劉建華 胡文瑜 唐鄭熠 林芳 單位:福建工程學院信息科學與工程學院