公務(wù)員期刊網(wǎng) 精選范文 數(shù)學(xué)建模大數(shù)據(jù)處理方法范文

數(shù)學(xué)建模大數(shù)據(jù)處理方法精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的數(shù)學(xué)建模大數(shù)據(jù)處理方法主題范文,僅供參考,歡迎閱讀并收藏。

數(shù)學(xué)建模大數(shù)據(jù)處理方法

第1篇:數(shù)學(xué)建模大數(shù)據(jù)處理方法范文

有這樣一種人,他們既具備統(tǒng)計(jì)建模的能力,又對(duì)某一業(yè)務(wù)領(lǐng)域的知識(shí)十分熟悉;

有這樣一種人,他們?cè)跀?shù)據(jù)分析型項(xiàng)目中必不可少……

這就是大數(shù)據(jù)時(shí)代稀缺的數(shù)據(jù)科學(xué)家。

被《哈佛商業(yè)評(píng)論》喻為21世紀(jì)最性感職業(yè)的數(shù)據(jù)科學(xué)家背后到底有哪些不為人知的故事呢?

讓我們一起走近數(shù)據(jù)科學(xué)家。

有人給予了大數(shù)據(jù)專家許多美好的稱號(hào),比如“數(shù)據(jù)開(kāi)采者”、“數(shù)據(jù)建筑師”等,但其中最時(shí)髦的當(dāng)屬“數(shù)據(jù)科學(xué)家”。當(dāng)記者在互聯(lián)網(wǎng)上搜索“數(shù)據(jù)科學(xué)家”這個(gè)關(guān)鍵詞時(shí),看到的都是“21世紀(jì)最性感的職業(yè)”、“大數(shù)據(jù)行業(yè)最時(shí)髦的職業(yè)”等溢美之詞。埃森哲大中華區(qū)技術(shù)咨詢董事總經(jīng)理何悠毅(Jouni Hakanen)表示,目前對(duì)數(shù)據(jù)科學(xué)家需求極大。

“性感”的數(shù)據(jù)科學(xué)家

記者采訪人人游戲高級(jí)數(shù)據(jù)科學(xué)家陳弢時(shí),他提到了當(dāng)年在香港科技大學(xué)計(jì)算機(jī)系讀博士的時(shí)候曾聽(tīng)教授這樣調(diào)侃:“只有那些不能嚴(yán)格被算為科學(xué)而又想擠進(jìn)科學(xué)的學(xué)科,才會(huì)在命名的時(shí)候加上‘科學(xué)’二字作為后綴,比如計(jì)算機(jī)科學(xué)?!比绻@樣類比,數(shù)據(jù)科學(xué)家就是一群很難算得上是科學(xué)家的人。那么事實(shí)到底是不是這樣呢?

在《大數(shù)據(jù)研究的科學(xué)價(jià)值》一文中,中國(guó)工程院李國(guó)杰院士相信數(shù)據(jù)界存在普適的共性問(wèn)題,比如電網(wǎng)數(shù)據(jù)分析的算法也可應(yīng)用于供水和交通管理上。李國(guó)杰給出的結(jié)論是肯定的:數(shù)據(jù)科學(xué)就是關(guān)于數(shù)據(jù)的科學(xué)。

“數(shù)據(jù)科學(xué)家”這個(gè)新稱謂近兩年才被叫響。大數(shù)據(jù)與數(shù)據(jù)科學(xué)家有著千絲萬(wàn)縷的聯(lián)系,因此容易讓人產(chǎn)生一種錯(cuò)覺(jué),數(shù)據(jù)科學(xué)家是大數(shù)據(jù)時(shí)代特有的一類專才。但其實(shí)在傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)處理過(guò)程中,數(shù)據(jù)科學(xué)家的身影就已經(jīng)出現(xiàn)。記者最近采訪了一些中國(guó)的大數(shù)據(jù)企業(yè),其中很多企業(yè)并沒(méi)有設(shè)立數(shù)據(jù)科學(xué)家這一職位,但數(shù)據(jù)分析師、數(shù)據(jù)工程師等都在做著數(shù)據(jù)科學(xué)家的工作。

《哈佛商業(yè)評(píng)論》曾指出,數(shù)據(jù)科學(xué)家是21世紀(jì)最性感的職業(yè)。所謂性感,既說(shuō)明數(shù)據(jù)科學(xué)家這一新職業(yè)頗具誘惑力,但同時(shí)也說(shuō)明大家對(duì)此工作的內(nèi)涵還不了解。陳弢認(rèn)為,數(shù)據(jù)科學(xué)目前還處在“白盒研究”的階段,也就是說(shuō)數(shù)據(jù)科學(xué)家至少在未來(lái)5~10年內(nèi)還需要先協(xié)助其他領(lǐng)域的學(xué)者解決大數(shù)據(jù)帶來(lái)的技術(shù)挑戰(zhàn)問(wèn)題,等到知識(shí)的積累達(dá)到一定程度,才可能在數(shù)據(jù)界抽象出通用性較強(qiáng)的“黑盒模型”和普適規(guī)律。不過(guò)在現(xiàn)階段,數(shù)據(jù)科學(xué)家的工作也是很務(wù)實(shí)的。LinkedIn首席數(shù)據(jù)科學(xué)家Manu Sharma曾表示,數(shù)據(jù)科學(xué)家的工作主要包括采集數(shù)據(jù)、整理數(shù)據(jù)和建立正確的數(shù)學(xué)模型、測(cè)試模型,他們還需要具有一定的編程能力。數(shù)據(jù)科學(xué)家加工處理的數(shù)據(jù)不僅有助于數(shù)據(jù)產(chǎn)品的開(kāi)發(fā),而且可以有助于發(fā)現(xiàn)新的商機(jī),推動(dòng)企業(yè)業(yè)務(wù)的發(fā)展。

隨著數(shù)據(jù)量的迅猛增長(zhǎng),今天企業(yè)搜集的數(shù)據(jù)比以往任何時(shí)候都要多,不僅在企業(yè)內(nèi)部,在外部的組織網(wǎng)絡(luò)和更廣泛的消費(fèi)領(lǐng)域亦是如此。企業(yè)文化的轉(zhuǎn)變對(duì)組織運(yùn)營(yíng)產(chǎn)生了巨大影響。

在新數(shù)字化企業(yè)及其周圍的環(huán)境里,數(shù)據(jù)成為了組織的基石。從創(chuàng)新到所有決策,數(shù)據(jù)推動(dòng)著企業(yè)的發(fā)展,并使得各級(jí)組織的運(yùn)營(yíng)更為高效。可以這樣說(shuō),數(shù)據(jù)將成為每個(gè)企業(yè)獲取下一個(gè)核心競(jìng)爭(zhēng)力的要素。

何悠毅認(rèn)為,數(shù)據(jù)科學(xué)家的核心作用在于發(fā)掘數(shù)據(jù)的最佳商業(yè)價(jià)值,而并非簡(jiǎn)單地使大數(shù)據(jù)項(xiàng)目落地。盡管大數(shù)據(jù)項(xiàng)目的實(shí)施在沒(méi)有數(shù)據(jù)科學(xué)家的情況下也能夠成功地完成,但有鑒于數(shù)據(jù)科學(xué)家將成為大數(shù)據(jù)項(xiàng)目的工具、系統(tǒng)和輸出的最終用戶,數(shù)據(jù)科學(xué)家在大數(shù)據(jù)項(xiàng)目的計(jì)劃階段至關(guān)重要。

重“實(shí)”不重“名”

關(guān)于數(shù)據(jù)科學(xué)家的內(nèi)涵,不同的企業(yè)或從業(yè)者也有不同的理解。

陳弢認(rèn)為,數(shù)據(jù)科學(xué)家有廣義和狹義兩種:從廣義的角度說(shuō),以數(shù)據(jù)為處理對(duì)象的從業(yè)者都可稱為數(shù)據(jù)科學(xué)家,比如原來(lái)的數(shù)據(jù)庫(kù)管理人員、數(shù)據(jù)庫(kù)工程師和數(shù)據(jù)統(tǒng)計(jì)分析師都可以被稱為數(shù)據(jù)科學(xué)家;從狹義的角度說(shuō),只有那些能夠利用數(shù)據(jù)作為資源,推動(dòng)公司業(yè)務(wù)增長(zhǎng)、創(chuàng)造附加價(jià)值的才是真正的數(shù)據(jù)科學(xué)家。

百度大數(shù)據(jù)首席架構(gòu)師林仕鼎也認(rèn)為:如果從廣義的角度講,從事數(shù)據(jù)處理、加工、分析等工作的數(shù)據(jù)科學(xué)家、數(shù)據(jù)架構(gòu)師和數(shù)據(jù)工程師都可以籠統(tǒng)地稱為數(shù)據(jù)科學(xué)家;而從狹義的角度講,那些具有數(shù)據(jù)分析能力,精通各類算法,直接處理數(shù)據(jù)的人員才可以稱為數(shù)據(jù)科學(xué)家。

記者采訪到的大多數(shù)人都認(rèn)為,數(shù)據(jù)科學(xué)家的工作比較純粹,就是對(duì)數(shù)據(jù)進(jìn)行加工和分析,因此數(shù)據(jù)科學(xué)家只要具備數(shù)據(jù)建模和分析能力即可,不一定要具有編程能力。而品友互動(dòng)CTO沈?qū)W華則表示:“如果數(shù)據(jù)科學(xué)家沒(méi)有一定的編程能力,很難在我們公司立足。”

記者曾經(jīng)看到過(guò)一幅描述數(shù)據(jù)科學(xué)家基本技能的圖,那里面提及的數(shù)據(jù)科學(xué)家應(yīng)具備的技能達(dá)上百種。數(shù)據(jù)科學(xué)家到底應(yīng)該具備哪些基本素質(zhì)和技能呢?在Cloud Connect大會(huì)上,VMware公司全球高級(jí)副總裁范承工接受記者采訪時(shí)表示,數(shù)據(jù)科學(xué)家通常應(yīng)具備三種能力:數(shù)據(jù)分析的能力(數(shù)學(xué)方面的知識(shí))、計(jì)算機(jī)方面的能力,以及對(duì)某行業(yè)的應(yīng)用深入理解的能力,前兩種能力是必需的,而第三種能力是可選的。

“數(shù)據(jù)科學(xué)家是一個(gè)新興職位。在高等教育上不存在這一專門(mén)學(xué)科。目前,在北美地區(qū)有多種針對(duì)數(shù)據(jù)科學(xué)家的認(rèn)證。”中橋調(diào)研咨詢首席分析師王叢(Kim Wang)告訴記者,“數(shù)據(jù)科學(xué)家不僅要懂IT,能夠深入了解數(shù)據(jù)的構(gòu)成,進(jìn)行分析建模,實(shí)現(xiàn)分析結(jié)果的呈現(xiàn),而且要遵守?cái)?shù)據(jù)隱私權(quán)的規(guī)定,同時(shí)還要懂得如何將數(shù)據(jù)變成商業(yè)價(jià)值?,F(xiàn)有的IT架構(gòu)很可能成為數(shù)據(jù)分析的障礙。未來(lái)IT可能提供更強(qiáng)大的大數(shù)據(jù)分析能力。”

談到數(shù)據(jù)科學(xué)家應(yīng)具備的能力,何悠毅表示,數(shù)據(jù)科學(xué)家所需的基本技能和能力與其他發(fā)揮信息數(shù)據(jù)最大用途的工作相同,即深度分析的能力、扎實(shí)的數(shù)據(jù)挖掘技能以及對(duì)統(tǒng)計(jì)分析方法和工具的了解。同時(shí),數(shù)據(jù)科學(xué)家還需引導(dǎo)有價(jià)值和有意義的見(jiàn)解,這要求其能夠深刻理解行業(yè)動(dòng)態(tài)和發(fā)展趨勢(shì)、客戶的需求與行為以及企業(yè)內(nèi)部的業(yè)務(wù)流程等。數(shù)據(jù)科學(xué)家必須掌握所有形式的數(shù)據(jù),并不斷地利用這些資源推動(dòng)業(yè)務(wù)實(shí)現(xiàn)創(chuàng)新與突破。

何悠毅特別指出:“最優(yōu)秀的數(shù)據(jù)科學(xué)家還需具備企業(yè)家的心態(tài)以及關(guān)乎創(chuàng)造力的好奇心。畢竟,最高價(jià)值的發(fā)現(xiàn)往往源自于對(duì)某些非常重大的和創(chuàng)新性的事物的探索,而這些正是其他人不能做到的。”

“數(shù)據(jù)科學(xué)家可以被看作是傳統(tǒng)意義上的項(xiàng)目管理者與應(yīng)用開(kāi)發(fā)者的結(jié)合體。他們一方面在涉眾管理層面發(fā)揮作用,另一方面,在業(yè)務(wù)應(yīng)用的開(kāi)發(fā)和數(shù)據(jù)服務(wù)交付方面也能提供指導(dǎo)?!盕orrester Research首席分析師及企業(yè)架構(gòu)專家Charlie Dai表示,“其實(shí)具體的職務(wù)并不重要,真正重要的是以前瞻務(wù)實(shí)的眼光看待數(shù)據(jù)管理的架構(gòu)實(shí)踐,幫助企業(yè)業(yè)務(wù)務(wù)實(shí)發(fā)展。”

Kaggle總裁兼首席科學(xué)家Jeremy Howard認(rèn)為,一個(gè)偉大的數(shù)據(jù)科學(xué)家應(yīng)具備創(chuàng)新、堅(jiān)韌、好奇、技術(shù)功底深厚這四項(xiàng)素質(zhì)。如果從字面意思來(lái)理解,一方面數(shù)據(jù)科學(xué)家要具有科學(xué)家的基本素質(zhì),比如客觀、誠(chéng)實(shí)、嚴(yán)謹(jǐn);另一方面,數(shù)據(jù)科學(xué)家主要是用數(shù)據(jù)說(shuō)話,應(yīng)具備數(shù)據(jù)收集、數(shù)據(jù)改寫(xiě)、可視化、機(jī)器學(xué)習(xí)、計(jì)算機(jī)編程等能力,并能使數(shù)據(jù)驅(qū)動(dòng)決策并主導(dǎo)產(chǎn)品的開(kāi)發(fā)。

其實(shí)在企業(yè)中,數(shù)據(jù)科學(xué)家并不是孤立的個(gè)體,而應(yīng)該是一個(gè)團(tuán)隊(duì)。數(shù)據(jù)科學(xué)家之間的交流與協(xié)作是必需的,這樣才更有利于數(shù)據(jù)處理工作的開(kāi)展和數(shù)據(jù)產(chǎn)品的開(kāi)發(fā)。文思海輝金融事業(yè)群商業(yè)智能事業(yè)部解決方案高級(jí)經(jīng)理馬寧認(rèn)為,一個(gè)人難以精通與數(shù)據(jù)業(yè)務(wù)相關(guān)的方方面面的問(wèn)題,因此企業(yè)應(yīng)該成立一個(gè)數(shù)據(jù)科學(xué)團(tuán)隊(duì),團(tuán)隊(duì)中的每個(gè)人都可以專注于自身擅長(zhǎng)的領(lǐng)域。

最需要?jiǎng)幽X筋的人

范承工表示,數(shù)據(jù)科學(xué)家在大數(shù)據(jù)項(xiàng)目中扮演著非常重要的角色。他將大數(shù)據(jù)架構(gòu)分為四層:最下面一層是基礎(chǔ)架構(gòu),其上是大數(shù)據(jù)管理層(包括數(shù)據(jù)庫(kù)、Hadoop等),再上面是數(shù)據(jù)分析層(也就是數(shù)據(jù)科學(xué)家的主要工作范圍),最上層則是應(yīng)用場(chǎng)景的實(shí)現(xiàn)(即大數(shù)據(jù)應(yīng)用的實(shí)現(xiàn))。數(shù)據(jù)科學(xué)家的工作需要業(yè)務(wù)端的配合,也需要底層基礎(chǔ)架構(gòu)為其提供必要的支撐。數(shù)據(jù)科學(xué)家處于基礎(chǔ)架構(gòu)和業(yè)務(wù)層之間,必須精通數(shù)學(xué)模型與算法。范承工認(rèn)為:“數(shù)據(jù)科學(xué)家是最需要?jiǎng)幽X筋的人?!痹诂F(xiàn)有的高等教育體系中,還沒(méi)有數(shù)據(jù)科學(xué)家產(chǎn)生的土壤,因?yàn)樗麄冃枰谡鎸?shí)的大數(shù)據(jù)環(huán)境中實(shí)踐和磨煉。那么,現(xiàn)在企業(yè)中的數(shù)據(jù)科學(xué)家是從哪里來(lái)的?數(shù)據(jù)科學(xué)家與傳統(tǒng)的從事數(shù)據(jù)處理工作的數(shù)據(jù)庫(kù)分析師、數(shù)據(jù)分析師有何區(qū)別呢?

“數(shù)據(jù)庫(kù)工程師有很多種,有些人的工作與數(shù)據(jù)科學(xué)家相關(guān)?!?dāng)?shù)據(jù)科學(xué)家’雖然是一個(gè)新名詞,但是從事數(shù)據(jù)分析工作的人一直存在。過(guò)去,數(shù)據(jù)挖掘主要是在結(jié)構(gòu)化數(shù)據(jù)的基礎(chǔ)上完成的,而現(xiàn)在非結(jié)構(gòu)化數(shù)據(jù)的重要性更高,將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)相結(jié)合進(jìn)行處理是必需的。”范承工表示,“雖然數(shù)據(jù)的結(jié)構(gòu)變了,數(shù)據(jù)模型改變了,數(shù)據(jù)處理的要求提高了,但數(shù)據(jù)科學(xué)家的本質(zhì)和工作的最終目標(biāo)并沒(méi)改變,那就是提取智能信息,使企業(yè)具有更強(qiáng)的競(jìng)爭(zhēng)力。”

企業(yè)級(jí)的數(shù)據(jù)庫(kù)工程師,處理的往往是以表結(jié)構(gòu)為主的數(shù)據(jù)庫(kù)架構(gòu)。但在大數(shù)據(jù)時(shí)代,數(shù)據(jù)科學(xué)家面對(duì)的是像Hadoop、MapReduce這類的數(shù)據(jù)分析架構(gòu)。王叢認(rèn)為,數(shù)據(jù)科學(xué)家需要承擔(dān)起數(shù)據(jù)分析各個(gè)環(huán)節(jié)的不同責(zé)任,而數(shù)據(jù)庫(kù)工程師或數(shù)據(jù)分析師只須承擔(dān)數(shù)據(jù)科學(xué)家部分的責(zé)任,而不是全部。

何悠毅分析說(shuō),數(shù)據(jù)科學(xué)家更側(cè)重于數(shù)據(jù)的戰(zhàn)略方面,即引導(dǎo)、捕捉、發(fā)現(xiàn)創(chuàng)新方式,并利用數(shù)據(jù)提高商業(yè)價(jià)值。數(shù)據(jù)科學(xué)家往往與企業(yè)密切合作,能夠協(xié)助實(shí)現(xiàn)產(chǎn)品的創(chuàng)新與服務(wù)的創(chuàng)新。而數(shù)據(jù)庫(kù)工程師則更專注于維護(hù)數(shù)據(jù)庫(kù)的數(shù)據(jù),包括硬件和軟件的一些技能。數(shù)據(jù)分析師則更專注于運(yùn)營(yíng)方面,他們可以利用現(xiàn)有的系統(tǒng)、工具和方法,每天對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘和統(tǒng)計(jì)分析。

馬寧認(rèn)為,在實(shí)際工作中,數(shù)據(jù)科學(xué)家與數(shù)據(jù)分析師的界限其實(shí)并不清晰。在某些語(yǔ)境里,數(shù)據(jù)分析師指僅從事統(tǒng)計(jì)建模的人員,他們只負(fù)責(zé)構(gòu)建精確的數(shù)學(xué)模型,不需要掌握業(yè)務(wù)領(lǐng)域的知識(shí),而數(shù)據(jù)科學(xué)家則需要對(duì)數(shù)學(xué)模型進(jìn)行業(yè)務(wù)解釋,并利用該模型指導(dǎo)業(yè)務(wù)流程優(yōu)化,輔助企業(yè)決策。但在某些語(yǔ)境中,數(shù)據(jù)分析師與數(shù)據(jù)科學(xué)家是指同一類人。

數(shù)據(jù)科學(xué)家階層正在崛起

McKinsey預(yù)測(cè)在未來(lái)6年,僅美國(guó)本土就可能缺少14萬(wàn)~19萬(wàn)具備深入分析數(shù)據(jù)能力的專業(yè)人才,能夠通過(guò)分析大數(shù)據(jù)支撐企業(yè)做出有效決策的數(shù)據(jù)管理人員和分析師也有150萬(wàn)人的缺口。從這個(gè)角度說(shuō),數(shù)據(jù)科學(xué)家是大數(shù)據(jù)時(shí)代最緊缺的人才并不為過(guò)。

但是目前還沒(méi)有專門(mén)針對(duì)數(shù)據(jù)科學(xué)家的教育。高水平的數(shù)據(jù)科學(xué)家最有可能來(lái)自于數(shù)據(jù)分析領(lǐng)域具有長(zhǎng)期經(jīng)驗(yàn)和過(guò)硬本領(lǐng)的人。何悠毅告訴記者:“想要成為一個(gè)優(yōu)秀的數(shù)據(jù)科學(xué)家,就必須對(duì)業(yè)務(wù)有極大的激情,再加上擁有好奇心、可視化的技能和創(chuàng)新的力量。”

中橋調(diào)研咨詢?cè)?jīng)在2013年7月針對(duì)中國(guó)市場(chǎng)做過(guò)一次調(diào)研,結(jié)果顯示:中國(guó)目前實(shí)現(xiàn)近實(shí)時(shí)和實(shí)時(shí)分析的企業(yè)不到5%,遠(yuǎn)遠(yuǎn)落后于歐美市場(chǎng)53%的比例;在大數(shù)據(jù)處理中,中國(guó)用戶目前還主要局限在結(jié)構(gòu)化數(shù)據(jù)方面,其大數(shù)據(jù)工作的主要目標(biāo)是通過(guò)批量分析控制成本,提高資金回流和原材料的周轉(zhuǎn)效率,而尚未進(jìn)入通過(guò)對(duì)半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,捕捉新的市場(chǎng)空間的階段;中國(guó)的大多數(shù)企業(yè)正在評(píng)估如何部署大數(shù)據(jù)分析系統(tǒng)。

第2篇:數(shù)學(xué)建模大數(shù)據(jù)處理方法范文

 

著名未來(lái)學(xué)家阿爾文托夫勒(1980)^很早就在其經(jīng)典著作《第三次浪潮》中,將大數(shù)據(jù)熱情地贊譽(yù)為“第三次浪潮的華彩樂(lè)章”,但是大數(shù)據(jù)成為高頻詞是最近一兩年的事情。隨著社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)、云計(jì)算的興起,數(shù)據(jù)規(guī)模越來(lái)越大,2011年5月,全球知名咨詢公司麥肯錫(MckinseyandCompany)了《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿領(lǐng)域》2報(bào)告,標(biāo)志著‘‘大數(shù)據(jù)”時(shí)代的到來(lái),指出‘‘?dāng)?shù)據(jù)已經(jīng)滲透到每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)因素;而人們對(duì)于海量數(shù)據(jù)的運(yùn)用將預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)”。2012年世界經(jīng)濟(jì)論壇了《大數(shù)據(jù)、大影響》3的報(bào)告,從金融服務(wù)、健康、教育、農(nóng)業(yè)、醫(yī)療等多個(gè)領(lǐng)域闡述了大數(shù)據(jù)給世界經(jīng)濟(jì)社會(huì)發(fā)展帶來(lái)的機(jī)會(huì)。2012年3月,奧巴馬政府《大數(shù)據(jù)研究和發(fā)展倡議》4,投資2.5億美元,正式啟動(dòng)大數(shù)據(jù)發(fā)展計(jì)劃,計(jì)劃在科學(xué)研究、環(huán)境、生物醫(yī)學(xué)等領(lǐng)域?qū)で笸黄啤?jù)Gartner公司2012年8月的技術(shù)發(fā)展生命周期5趨勢(shì)圖(圖1),大數(shù)據(jù)不到兩年時(shí)間內(nèi)成為新技術(shù)發(fā)展的熱點(diǎn)。一時(shí)間大數(shù)據(jù)蜂擁襲來(lái),那么什么是

 

大數(shù)據(jù)?大數(shù)據(jù)對(duì)傳統(tǒng)經(jīng)濟(jì)學(xué)會(huì)帶來(lái)哪些沖擊?傳統(tǒng)經(jīng)濟(jì)學(xué)應(yīng)該如何面對(duì)大數(shù)據(jù)帶來(lái)的挑戰(zhàn)?

 

對(duì)于什么是大數(shù)據(jù),目前業(yè)界并沒(méi)有公認(rèn)的說(shuō)法。Dumbill(2012)6采用IBM公司的觀點(diǎn),認(rèn)為大數(shù)據(jù)具有“3V”特點(diǎn),即規(guī)模性(Volume)、多樣性(Variety)、實(shí)時(shí)性(Velocity)。以IDC為代表的業(yè)界認(rèn)為大數(shù)據(jù)具備“4V”特點(diǎn),即在3V的基礎(chǔ)上增加價(jià)值性(Value)。NetApp公司7認(rèn)為大數(shù)據(jù)應(yīng)包括A、B、C三大要素,即分析(Analytic)、帶寬(Bandwidth)和內(nèi)容(Content)。所謂大分析(BigAnalytics),指通過(guò)對(duì)大數(shù)據(jù)進(jìn)行實(shí)時(shí)分析后帶來(lái)新的業(yè)務(wù)模式,幫助用戶獲得洞見(jiàn),從而更好地進(jìn)行客戶服務(wù);高帶寬(BigBandwidth)指快速有效地消化和處理大數(shù)據(jù);大內(nèi)容(BigContent)—方面指大數(shù)據(jù)包括結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)與非機(jī)構(gòu)化數(shù)據(jù),另一方面則是指對(duì)數(shù)據(jù)的存儲(chǔ)擴(kuò)展要求極高,能輕松實(shí)現(xiàn)數(shù)據(jù)的恢復(fù)、備份、復(fù)制與安全管理。Gartner認(rèn)為,大數(shù)據(jù)需要新的處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力,滿足海量、高增長(zhǎng)和多樣化信息資產(chǎn)的需要。

 

大數(shù)據(jù)是工業(yè)傳感器、互聯(lián)網(wǎng)、移動(dòng)數(shù)碼等固定和移動(dòng)設(shè)備產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的總和,大數(shù)據(jù)重在實(shí)時(shí)的處理與應(yīng)用,以獲得所需要的信息和知識(shí),從而實(shí)現(xiàn)商業(yè)價(jià)值以及為公共管理服務(wù)。數(shù)據(jù)挖掘和人工智能等應(yīng)用工具在大數(shù)據(jù)處理中發(fā)揮著重要作用,現(xiàn)代信息技術(shù)是大數(shù)據(jù)賴以存在和發(fā)展的重要支撐力量。

 

二、大數(shù)據(jù)給經(jīng)濟(jì)學(xué)帶來(lái)的影響

 

Victor(2012)8在其最新著作《大數(shù)據(jù)時(shí)代—生活、工作與思維的大變革》中指出,大數(shù)據(jù)時(shí)代,思維方式要發(fā)生3個(gè)變革:第_,要分析與事物相關(guān)的所有數(shù)據(jù),而不是依靠分析少量數(shù)據(jù)樣本;要總體,不要樣本。第二,要樂(lè)于接受數(shù)據(jù)的紛繁復(fù)雜,而不再追求精確性。第三,不再探求難以捉摸的因果關(guān)系,應(yīng)該更加注重相關(guān)關(guān)系。楊華磊(2013)9分析了高頻數(shù)據(jù)對(duì)傳統(tǒng)經(jīng)濟(jì)學(xué)研究范式的沖擊,出現(xiàn)了‘‘非主流經(jīng)濟(jì)學(xué)就是致力研究異?,F(xiàn)象的經(jīng)濟(jì)學(xué)”,當(dāng)然高頻數(shù)據(jù)與大數(shù)據(jù)不是一回事,兩者之間存在交集。那么,大數(shù)據(jù)給經(jīng)濟(jì)學(xué)帶來(lái)了哪些影響昵?

 

(一)大數(shù)據(jù)研究對(duì)象變成了總體

 

傳統(tǒng)經(jīng)濟(jì)學(xué)研究中,由于搜集數(shù)據(jù)的條件所限,人們往往對(duì)數(shù)據(jù)進(jìn)行抽樣,用少量樣本來(lái)進(jìn)行研究,這一傳統(tǒng)一直延續(xù)至今,并且成為經(jīng)濟(jì)學(xué)研究的主流做法,但是抽樣的質(zhì)量對(duì)研究結(jié)果影響很大,比如公眾對(duì)政府統(tǒng)計(jì)部門(mén)公布的物價(jià)指數(shù)和基尼系數(shù)引發(fā)的懷疑。在大數(shù)據(jù)時(shí)代,很多場(chǎng)合下已經(jīng)無(wú)需進(jìn)行針對(duì)樣本的研究,直接將總體作為研究對(duì)象,從而很大程度上改變了數(shù)據(jù)來(lái)源方式,對(duì)數(shù)據(jù)的處理也產(chǎn)生了深遠(yuǎn)的影響。

 

(二)大數(shù)據(jù)不需要基于假設(shè)檢驗(yàn)的研究

 

傳統(tǒng)的經(jīng)濟(jì)學(xué)研究,往往根據(jù)研究?jī)?nèi)容提出數(shù)個(gè)假設(shè),然后再采用數(shù)學(xué)模型基于統(tǒng)計(jì)檢驗(yàn)來(lái)驗(yàn)證假設(shè)。但在大數(shù)據(jù)時(shí)代,由于有足夠的變量、足夠的數(shù)據(jù),可以采用人工智能來(lái)進(jìn)行數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn),得到的結(jié)論是成百上千的,和傳統(tǒng)經(jīng)濟(jì)學(xué)研究需要驗(yàn)證假設(shè)的數(shù)量永遠(yuǎn)不是一個(gè)數(shù)量級(jí)。在大數(shù)據(jù)時(shí)代,如果繼續(xù)采用傳統(tǒng)的假設(shè)檢驗(yàn)方法進(jìn)行研究,永遠(yuǎn)是不充分的、不完備的、無(wú)法滿足需要的。大數(shù)據(jù)時(shí)代重在對(duì)數(shù)據(jù)處理的多樣化結(jié)果進(jìn)行分析,可以是基于經(jīng)濟(jì)學(xué)的,也可以是基于應(yīng)用的,從而輔助人們決策。

 

此外,由于變量的完備性要求使得傳統(tǒng)的基于假設(shè)驗(yàn)證的研究有時(shí)變得十分尷尬。比如,研究研發(fā)投入對(duì)企業(yè)績(jī)效的影響,需要考慮的不僅僅是研發(fā)投入,還要考慮企業(yè)資本結(jié)構(gòu)、競(jìng)爭(zhēng)水平、人員素質(zhì)、行業(yè)特點(diǎn)、管理能力等諸多因素,研究者重點(diǎn)關(guān)注的是研發(fā)投入的彈性系數(shù),但卻得到了其它所有數(shù)十個(gè)變量的彈性系數(shù),從而使研究重心不容易掌握。

 

(三)大數(shù)據(jù)使得因果關(guān)系變得不太重要

 

傳統(tǒng)經(jīng)濟(jì)學(xué)是一門(mén)解釋科學(xué),重在對(duì)經(jīng)濟(jì)現(xiàn)象進(jìn)行解釋,了解他們的因果關(guān)系,但在大數(shù)據(jù)時(shí)代,這樣做是遠(yuǎn)遠(yuǎn)不夠的,大數(shù)據(jù)甚至可以發(fā)現(xiàn)事物發(fā)展?jié)撛诘囊?guī)律,以供經(jīng)濟(jì)學(xué)家解釋,具有_定的“智能性”,某種程度上超越了經(jīng)濟(jì)學(xué)研究的因果關(guān)系。

 

大數(shù)據(jù)并沒(méi)有改變因果關(guān)系,但是使傳統(tǒng)經(jīng)濟(jì)學(xué)的因果關(guān)系變得不太重要。比如經(jīng)濟(jì)學(xué)家在預(yù)測(cè)房?jī)r(jià)時(shí),無(wú)非是根據(jù)住房?jī)r(jià)格變化的影響因素來(lái)進(jìn)行分析,比如經(jīng)濟(jì)發(fā)展水平、人均收入、土地價(jià)格、宏觀房產(chǎn)政策、地點(diǎn)等因素。但谷歌預(yù)測(cè)房?jī)r(jià)時(shí),根據(jù)住房搜索查詢量變化進(jìn)行預(yù)測(cè),結(jié)果比不動(dòng)產(chǎn)經(jīng)濟(jì)學(xué)家的預(yù)測(cè)更為準(zhǔn)確及時(shí)。IBM日本公司,通過(guò)檢索關(guān)鍵詞“新訂單”“雇員“生產(chǎn)”等來(lái)預(yù)測(cè)采購(gòu)經(jīng)理人指數(shù),僅用6小時(shí)就得出結(jié)果,并且和專業(yè)的采購(gòu)人指數(shù)分析師們計(jì)算的結(jié)果基本一致。大數(shù)據(jù)并沒(méi)有改變因果關(guān)系,但使因果關(guān)系變得意義不大,很多時(shí)候因果關(guān)系成為‘‘正確的廢話”。

 

(四)傳統(tǒng)的因果關(guān)系有時(shí)無(wú)法驗(yàn)證

 

弄清事物之間的內(nèi)在聯(lián)系和作用機(jī)制,一直是傳統(tǒng)經(jīng)濟(jì)學(xué)研究的核心。但有時(shí)因果關(guān)系是沒(méi)有辦法驗(yàn)證的。比如新產(chǎn)品上市,人們往往傾向于購(gòu)買(mǎi)新產(chǎn)品,這樣對(duì)舊產(chǎn)品的需求會(huì)下降,那么舊產(chǎn)品價(jià)格應(yīng)該立即回落,這是其一。從另外—個(gè)角度,如果大家都認(rèn)識(shí)到這一點(diǎn),就會(huì)貪便宜購(gòu)買(mǎi)舊產(chǎn)品,短期內(nèi)會(huì)造成舊產(chǎn)品供不應(yīng)求,反而導(dǎo)致舊產(chǎn)品漲價(jià)。究竟是漲是跌,要看這兩種因素誰(shuí)弱誰(shuí)強(qiáng),采用傳統(tǒng)經(jīng)濟(jì)學(xué)研究方法是難以驗(yàn)證這兩種效應(yīng)的,只能驗(yàn)證兩種效應(yīng)作用的綜合結(jié)果。

 

實(shí)際情況是,在大數(shù)據(jù)時(shí)代,西雅圖Decide.comg公司分析了近400萬(wàn)商品的超過(guò)250億條價(jià)格信息,發(fā)現(xiàn)新產(chǎn)品上市時(shí),短期內(nèi)舊產(chǎn)品價(jià)格是上漲的,過(guò)一段時(shí)間才逐步回落。采用大數(shù)據(jù),既可以知道多少人購(gòu)買(mǎi)舊產(chǎn)品,也能知道多少人購(gòu)買(mǎi)新產(chǎn)品,以及舊產(chǎn)品價(jià)格變化的規(guī)律。在這種情況下,我們知道所有的因果關(guān)系,卻難以檢驗(yàn),并且沒(méi)有意義,知道結(jié)果更重要。

 

(五)傳統(tǒng)經(jīng)濟(jì)學(xué)研究具有滯后性

 

傳統(tǒng)經(jīng)濟(jì)學(xué)對(duì)于新生事物是不敏感的,必須等事情發(fā)生并且成長(zhǎng)到_定規(guī)模以后才能搜集到足夠數(shù)據(jù)進(jìn)行相關(guān)研究。在大數(shù)據(jù)時(shí)代,可以通過(guò)海量數(shù)據(jù)對(duì)經(jīng)濟(jì)行為進(jìn)行分析,一旦有新情況、新動(dòng)態(tài)立即予以關(guān)注,從而實(shí)現(xiàn)對(duì)新生事物的早期干預(yù)和分析,因此具有前瞻性。大數(shù)據(jù)本身就具有智能,可以輔助經(jīng)濟(jì)學(xué)發(fā)現(xiàn)知識(shí)。

 

(六)大數(shù)據(jù)對(duì)基于統(tǒng)計(jì)檢驗(yàn)的計(jì)量經(jīng)濟(jì)學(xué)沖擊很大

 

建立在回歸和統(tǒng)計(jì)檢驗(yàn)基礎(chǔ)上的計(jì)量經(jīng)濟(jì)學(xué)以其嚴(yán)謹(jǐn)?shù)倪壿嫵蔀榻?jīng)濟(jì)學(xué)研究的重要方法論,迄今為止,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者有近半數(shù)是計(jì)量經(jīng)濟(jì)學(xué)家,但大數(shù)據(jù)動(dòng)搖了這_根基,比如采用普通回歸研究自變量X于因變量Y的關(guān)系,對(duì)于X回歸系數(shù)采用t檢驗(yàn),_般認(rèn)為相伴概率小于0.05(特殊情況可以放大到0.1)就說(shuō)明兩變量相關(guān)。其實(shí)在這種情況下,犯兩變量不相關(guān)錯(cuò)誤的可能性是5%,以CNNIC的《第31次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》M為例,2012年底我國(guó)網(wǎng)民數(shù)量達(dá)5.64億人,假設(shè)我們研究網(wǎng)民平均受教育年限(X)與上網(wǎng)時(shí)長(zhǎng)(Y)的關(guān)系,5%就是2820萬(wàn)人,此時(shí)我們還能漠視這5%的錯(cuò)誤嗎?同樣,如果t檢驗(yàn)的相伴概率為0.95,那么很明顯說(shuō)明平均受教育年限與上網(wǎng)時(shí)長(zhǎng)不相關(guān),但同樣會(huì)犯錯(cuò)誤,即有5%的可能性平均受教育年限(X)與上網(wǎng)時(shí)長(zhǎng)(Y)是相關(guān)的,會(huì)涉及2820萬(wàn)網(wǎng)民,這同樣是不能忽視的。

 

(七)大數(shù)據(jù)對(duì)經(jīng)濟(jì)學(xué)建模提出挑戰(zhàn)

 

傳統(tǒng)的經(jīng)濟(jì)學(xué)研究,往往采用1個(gè)或少數(shù)幾個(gè)數(shù)學(xué)模型來(lái)進(jìn)行研究,但任何模型都各有長(zhǎng)處,也各有其局限,沒(méi)有包治百病萬(wàn)能的數(shù)學(xué)模型。比如動(dòng)態(tài)面板容易使投入變量的彈性系數(shù)估計(jì)變小,空間面板容易出現(xiàn)空間矩陣設(shè)置方法不當(dāng)導(dǎo)致結(jié)果偏誤,面板變系數(shù)模型難以和空間面板結(jié)合使用,面板聯(lián)立方程模型對(duì)方程形式的要求極高,面板向量自回歸模型難以和空間面板融合等等。在研究同一問(wèn)題時(shí),可用模型其實(shí)較多,有沒(méi)有最佳模型昵?這恐怕是個(gè)無(wú)解的問(wèn)題。實(shí)際情況是,迄今為止傳統(tǒng)經(jīng)濟(jì)學(xué)研究得出的結(jié)論,至多只能說(shuō)明采用甲模型的結(jié)論,并不具有普適性,換個(gè)乙模型結(jié)論可能立即就變了,其實(shí)研究結(jié)論是脆弱的。

 

此外,在研究同一個(gè)問(wèn)題時(shí),即使采用同一模型,由于模型的變量選擇、估計(jì)的方法、參數(shù)設(shè)置、滯后期選擇等不同,也會(huì)導(dǎo)致估計(jì)結(jié)果相差很大。

 

在大數(shù)據(jù)時(shí)代,借助云計(jì)算和分布式處理等現(xiàn)代信息技術(shù),往往可以采用成百上千的模型來(lái)進(jìn)行研究。Google公司在預(yù)測(cè)2009年美國(guó)甲型H1N1流感爆發(fā)時(shí)間時(shí),把5000萬(wàn)條美國(guó)人常用的檢索詞條和美國(guó)疾控中心2003-2008年期間季節(jié)性流感傳播數(shù)據(jù)進(jìn)行比較,希望通過(guò)搜索記錄判斷這些人是否得了流感,先后共采用了4.5億個(gè)不同的數(shù)學(xué)模型,預(yù)測(cè)結(jié)果和官方數(shù)據(jù)的一致率高達(dá)97%,但比官方節(jié)省了兩周時(shí)間,從而為政府采取相關(guān)措施贏得了寶貴的時(shí)間。

 

在傳統(tǒng)經(jīng)濟(jì)學(xué)研究中,由于研究對(duì)象錯(cuò)綜復(fù)雜,直接影響與間接影響因素眾多,變量的完備性被認(rèn)為是不可能的事情,往往只能選取少數(shù)變量來(lái)進(jìn)行研究,達(dá)到一個(gè)相對(duì)滿意的結(jié)果。在大數(shù)據(jù)時(shí)代,我們可以獲取越來(lái)越多的變量,從而使遺失變量的可能性降到最低,這樣在研究中由原來(lái)的數(shù)個(gè)變量可能會(huì)變成數(shù)十個(gè)甚至成百上千的變量,在這樣的情況下,對(duì)原有的建模技術(shù)就帶來(lái)了巨大挑戰(zhàn),對(duì)計(jì)量經(jīng)濟(jì)學(xué)的發(fā)展將會(huì)產(chǎn)生深遠(yuǎn)影響。

 

(八)大數(shù)據(jù)給經(jīng)濟(jì)學(xué)研究工具和手段發(fā)生變化

 

傳統(tǒng)經(jīng)濟(jì)學(xué)研究,_個(gè)團(tuán)隊(duì)、數(shù)臺(tái)電腦、幾個(gè)軟件就能進(jìn)行像樣的研究,很少有運(yùn)算需要?jiǎng)佑么笾行头?wù)器的,但在大數(shù)據(jù)時(shí)代,經(jīng)濟(jì)學(xué)研究發(fā)生了巨大的變化,在人員組成上,不光要有經(jīng)濟(jì)學(xué)家和領(lǐng)域?qū)<?,還要有大數(shù)據(jù)維護(hù)專家、大數(shù)據(jù)建模專家;在計(jì)算工具上,需要廣泛借助云計(jì)算,幾臺(tái)電腦根本解決不了問(wèn)題;從合作關(guān)系上,需要廣泛與政府、大數(shù)據(jù)擁有者、云計(jì)算服務(wù)商等合作,不然難以進(jìn)行研究。大數(shù)據(jù)時(shí)代,經(jīng)濟(jì)學(xué)研究必須依靠跨學(xué)科團(tuán)隊(duì),傳統(tǒng)的少數(shù)幾個(gè)學(xué)者就能進(jìn)行研究的模式已經(jīng)難以為繼。

 

(九)大數(shù)據(jù)徹底改變了傳統(tǒng)的統(tǒng)計(jì)調(diào)查方式

 

大數(shù)據(jù)徹底改變了傳統(tǒng)的統(tǒng)計(jì)調(diào)查方式,比如對(duì)于經(jīng)濟(jì)指數(shù)、物價(jià)指數(shù)的計(jì)算,完全可以采用全新的模式,徹底摒棄傳統(tǒng)方式。對(duì)于統(tǒng)計(jì)學(xué)中的異常點(diǎn),以往的處理方式往往是丟棄,或者是平滑,但在大數(shù)據(jù)時(shí)代,由于樣本眾多,異常點(diǎn)成為寶貴的資源和研究對(duì)象廣受重視。傳統(tǒng)的統(tǒng)計(jì)數(shù)據(jù)是經(jīng)過(guò)加工后的結(jié)構(gòu)化的數(shù)據(jù),在大數(shù)據(jù)時(shí)代,人們更加重視原始數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),因?yàn)槿绻y(tǒng)計(jì)數(shù)據(jù)已經(jīng)經(jīng)過(guò)加工,那就變成了二手?jǐn)?shù)據(jù),如果_手?jǐn)?shù)據(jù)加工過(guò)程出現(xiàn)問(wèn)題必然導(dǎo)致后續(xù)處理出現(xiàn)誤差。此外,大數(shù)據(jù)還使間隔時(shí)間較短的高頻數(shù)據(jù)研究成為可能。

 

三、大數(shù)據(jù)經(jīng)濟(jì)學(xué)

 

(一)大數(shù)據(jù)經(jīng)濟(jì)學(xué)的定義與研究?jī)?nèi)容

 

考慮到大數(shù)據(jù)給傳統(tǒng)經(jīng)濟(jì)學(xué)帶來(lái)的巨大沖擊和影響,迫切需要對(duì)此進(jìn)行研究,斯坦福大學(xué)的教授、沃爾瑪全球電子商務(wù)的高級(jí)副總裁的共同創(chuàng)立者發(fā)明了—個(gè)新詞,指將計(jì)算機(jī)科學(xué)和信息技術(shù)應(yīng)用于經(jīng)濟(jì)學(xué)領(lǐng)域,特別指應(yīng)用于大數(shù)據(jù)的經(jīng)濟(jì)分析的意義相近,翻譯成中文后更容易混淆,加上其和(生態(tài))相近,因此并不是一個(gè)好的名詞。本文提出大數(shù)據(jù)經(jīng)濟(jì)學(xué),給出如下定義:

 

大數(shù)據(jù)經(jīng)濟(jì)學(xué)是在經(jīng)濟(jì)學(xué)研究和應(yīng)用中采用大數(shù)據(jù)并且采用大數(shù)據(jù)思想對(duì)傳統(tǒng)經(jīng)濟(jì)學(xué)進(jìn)行深化的新興交叉學(xué)科。大數(shù)據(jù)經(jīng)濟(jì)學(xué)不僅要研究如何建模、管理和應(yīng)用大數(shù)據(jù),而且要深入研究傳統(tǒng)經(jīng)濟(jì)學(xué)如何應(yīng)對(duì)大數(shù)據(jù)帶來(lái)的挑戰(zhàn)并進(jìn)行改良,大數(shù)據(jù)經(jīng)濟(jì)學(xué)需要經(jīng)濟(jì)學(xué)家、領(lǐng)域?qū)<液托畔⒓夹g(shù)專家等密切合作,對(duì)人文社科與自然科學(xué)的跨學(xué)科研究提出了更高的要求,并且對(duì)整個(gè)經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、公共管理等將帶來(lái)革命性變革。大數(shù)據(jù)經(jīng)濟(jì)學(xué)的研究?jī)?nèi)容包括:

 

第一,大數(shù)據(jù)計(jì)量經(jīng)濟(jì)學(xué)。這是和傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)對(duì)應(yīng)的一個(gè)學(xué)科,也是大數(shù)據(jù)經(jīng)濟(jì)學(xué)下面的子學(xué)科。在大數(shù)據(jù)背景下,經(jīng)濟(jì)學(xué)建模與分析方法與傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)完全不同,迫切需要采用全新的思路和方法進(jìn)行研究。對(duì)信息技術(shù)專家們而言,大數(shù)據(jù)經(jīng)濟(jì)學(xué)僅僅是算法和建模問(wèn)題,但是如果沒(méi)有經(jīng)濟(jì)學(xué)理論指導(dǎo),沒(méi)有經(jīng)濟(jì)學(xué)家的思維,必然會(huì)導(dǎo)致研究方向的迷失。一些大數(shù)據(jù)領(lǐng)域的學(xué)者認(rèn)為‘‘要相關(guān),不要因果”,這是非常要不得的,傳統(tǒng)經(jīng)濟(jì)學(xué)理論至今仍然到處閃爍著智慧的光芒,對(duì)經(jīng)濟(jì)現(xiàn)象的深入見(jiàn)解時(shí)刻發(fā)揮著重要的作用,所以大數(shù)據(jù)背景下的經(jīng)濟(jì)學(xué)分析不能主要靠信息技術(shù)的建模專家來(lái)進(jìn)行,必須繼續(xù)依靠大數(shù)據(jù)計(jì)量經(jīng)濟(jì)學(xué)家。

第3篇:數(shù)學(xué)建模大數(shù)據(jù)處理方法范文

關(guān)鍵詞:應(yīng)用統(tǒng)計(jì)學(xué)專業(yè);實(shí)踐教學(xué);學(xué)科建設(shè)

中圖分類號(hào):G642.0 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2017)02-0126-02

一、前沿

早在清末,我國(guó)就在商科開(kāi)設(shè)了統(tǒng)計(jì)課程。到1949年,已有近20所高等院校設(shè)立了統(tǒng)計(jì)學(xué)系。1949年后,受蘇聯(lián)的影響,統(tǒng)計(jì)學(xué)科逐漸被人為地割裂為“數(shù)理統(tǒng)計(jì)”和“經(jīng)濟(jì)統(tǒng)計(jì)”兩種統(tǒng)計(jì)學(xué)。數(shù)理統(tǒng)計(jì)日益趨向于理論化,而經(jīng)濟(jì)統(tǒng)計(jì)則越來(lái)越指標(biāo)化、簡(jiǎn)單化,統(tǒng)計(jì)的理論和應(yīng)用嚴(yán)重分離,極大阻礙了統(tǒng)計(jì)學(xué)科的發(fā)展。

2011年2月,國(guó)務(wù)院學(xué)位委員會(huì)通過(guò)的新的《學(xué)位授予和人才培養(yǎng)學(xué)科目錄》將統(tǒng)計(jì)學(xué)升級(jí)為理學(xué)門(mén)類中的一級(jí)學(xué)科,實(shí)現(xiàn)了統(tǒng)計(jì)學(xué)、數(shù)學(xué)和經(jīng)濟(jì)學(xué)的獨(dú)立。2011年6月,統(tǒng)計(jì)學(xué)科評(píng)議組確定了統(tǒng)計(jì)一級(jí)學(xué)科的5個(gè)二級(jí)學(xué)科:社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)(經(jīng)濟(jì)學(xué));數(shù)理統(tǒng)計(jì)學(xué)(理學(xué)、經(jīng)濟(jì)學(xué));金融統(tǒng)計(jì)、風(fēng)險(xiǎn)管理與精算學(xué)(經(jīng)濟(jì)學(xué));應(yīng)用統(tǒng)計(jì)學(xué)(理學(xué)、經(jīng)濟(jì)學(xué));生物衛(wèi)生統(tǒng)計(jì)學(xué)(理學(xué),這就為統(tǒng)計(jì)學(xué)未來(lái)的發(fā)展提供了廣闊的空間和舞臺(tái)。

如今,統(tǒng)計(jì)方法不僅可應(yīng)用到社會(huì)、經(jīng)濟(jì)和管理領(lǐng)域,生物、醫(yī)學(xué)、制藥、衛(wèi)生、工程、司法等領(lǐng)域也需要大量統(tǒng)計(jì)專業(yè)人才。

安徽理工大學(xué)2012年申報(bào)了應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)并獲批,已于2013年開(kāi)始招生,這不僅為學(xué)校增加了一個(gè)一級(jí)學(xué)科,完善了學(xué)校的學(xué)科體系,也將不斷培養(yǎng)出一批應(yīng)用統(tǒng)計(jì)人才,服務(wù)于社會(huì)經(jīng)濟(jì)。在辦學(xué)過(guò)程中,加強(qiáng)統(tǒng)計(jì)實(shí)踐教學(xué),提高學(xué)生的實(shí)踐操作能力,提高學(xué)生的統(tǒng)計(jì)分析、計(jì)算和數(shù)據(jù)挖掘等能力,是極為必要的。本文以安徽理工大學(xué)應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)為例,探討應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)用于實(shí)踐教學(xué)的配套實(shí)驗(yàn)室與實(shí)踐基地建設(shè)、實(shí)踐教學(xué)課程一體化設(shè)置,應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)和統(tǒng)計(jì)學(xué)學(xué)科建設(shè)一體化的實(shí)踐教學(xué)體系的建設(shè)等問(wèn)題。

二、學(xué)科建設(shè)

合理科學(xué)的課程內(nèi)容體系的研究與設(shè)計(jì)在學(xué)科建設(shè)中極為重要的。課程體系規(guī)劃指導(dǎo)學(xué)生形成知識(shí)框架,側(cè)重于處理基礎(chǔ)、時(shí)代和前沿的教學(xué)內(nèi)容的關(guān)系,以及應(yīng)用、方法、理論三個(gè)方面該關(guān)系問(wèn)題,其核心是如何使課程內(nèi)容體系適應(yīng)應(yīng)用統(tǒng)計(jì)學(xué)的創(chuàng)新人才培養(yǎng)。

1.應(yīng)重視加強(qiáng)數(shù)學(xué)理論知識(shí)?,F(xiàn)代統(tǒng)計(jì)的理論和方法是基于數(shù)學(xué)建立起來(lái)的。在目前信息發(fā)展非常迅猛的時(shí)代,大量的數(shù)據(jù)處理和分析影響著各行各業(yè)的發(fā)展,如果不采用先進(jìn)的數(shù)學(xué)工具,得出正確的結(jié)論是不可靠的。統(tǒng)計(jì)學(xué)作為一級(jí)學(xué)科,課程的設(shè)計(jì)應(yīng)該增加數(shù)理統(tǒng)計(jì)理論和方法的比例。統(tǒng)計(jì)學(xué)是處理數(shù)據(jù),而不是指標(biāo)的解釋的方法。概率統(tǒng)計(jì)描述了最簡(jiǎn)潔和強(qiáng)大的社會(huì)活動(dòng),提高概率統(tǒng)計(jì)教學(xué)的比重,是中國(guó)統(tǒng)計(jì)成熟的主要標(biāo)志和重要舉措。然而,因?yàn)樯鐣?huì)環(huán)境的影響,有很多具有統(tǒng)計(jì)學(xué)專業(yè)的學(xué)校已經(jīng)或削減了大量的數(shù)學(xué)課程或大大降低數(shù)學(xué)的難度,有的甚至又回到了過(guò)去的舊的社會(huì)和經(jīng)濟(jì)統(tǒng)計(jì),其統(tǒng)計(jì)的發(fā)展是極為不利的,會(huì)削弱學(xué)生的職業(yè)發(fā)展?jié)摿Α?/p>

2.注重傳授統(tǒng)計(jì)學(xué)學(xué)科體系的基本框架和基本統(tǒng)計(jì)理論與方法。學(xué)科建設(shè)是一門(mén)學(xué)科培養(yǎng)人才的基礎(chǔ),引導(dǎo)學(xué)生的發(fā)展方向。目標(biāo)應(yīng)該是:為學(xué)生構(gòu)建一個(gè)基礎(chǔ)、厚統(tǒng)計(jì)知識(shí)的平臺(tái),使學(xué)生理解領(lǐng)悟最基本的專業(yè)技能和統(tǒng)計(jì)思想,熟悉現(xiàn)代統(tǒng)計(jì)及決策分析方法,培養(yǎng)學(xué)生具有使用統(tǒng)計(jì)分析能力解決實(shí)際問(wèn)題的水平。課程應(yīng)包括運(yùn)籌學(xué)、經(jīng)濟(jì)學(xué)、多元統(tǒng)計(jì)分析、回歸分析、統(tǒng)計(jì)軟件、非參數(shù)估計(jì)、抽樣調(diào)查、時(shí)間序列分析、測(cè)試設(shè)計(jì)和質(zhì)量控制等。通過(guò)的課程學(xué)習(xí)的學(xué)生將具備基本的數(shù)據(jù)采集、處理和分析能力。此外,以建立統(tǒng)計(jì)模型,分析模型和測(cè)試模型是非常重要的,所以我們應(yīng)該特別注意的數(shù)學(xué)建模能力的培養(yǎng)。

3.加強(qiáng)計(jì)算機(jī)技術(shù)教育。最近,從事研究統(tǒng)計(jì)和統(tǒng)計(jì)應(yīng)用人已經(jīng)感覺(jué)數(shù)據(jù)的巨大數(shù)量的增長(zhǎng)的影響的統(tǒng)計(jì)問(wèn)題的規(guī)模和復(fù)雜性也大大增加。網(wǎng)絡(luò)和計(jì)算機(jī)技術(shù)將數(shù)據(jù)處理從剝離的具體業(yè)務(wù)內(nèi)容,并升級(jí)了。它奠定了高水平的統(tǒng)計(jì)應(yīng)用程序的統(tǒng)一模型和自動(dòng)化的方法了堅(jiān)實(shí)的基礎(chǔ)??梢?jiàn),要成為一名合格的統(tǒng)計(jì)人必須有計(jì)算機(jī)技術(shù)有一定的基本知識(shí)??傊?,數(shù)學(xué),統(tǒng)計(jì)方法和計(jì)算機(jī)技術(shù)的基本原理是學(xué)生的統(tǒng)計(jì)知識(shí)結(jié)構(gòu)的基本組成部分。如果你要在金融工作中從事,需要學(xué)習(xí)經(jīng)濟(jì)學(xué)和金融統(tǒng)計(jì)課程;此外,還必須具備一定的領(lǐng)域知識(shí),如果你想從事衛(wèi)生統(tǒng)計(jì)工作,學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)和管理方面的知識(shí)。

三、實(shí)驗(yàn)教學(xué)體系

1.建設(shè)應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)教學(xué)的配套實(shí)驗(yàn)室與實(shí)踐教學(xué)基地。為了加強(qiáng)統(tǒng)計(jì)專業(yè)在實(shí)踐教學(xué)中的應(yīng)用,安徽理工大學(xué)在學(xué)校建設(shè)了專業(yè)實(shí)驗(yàn)室,與校外企業(yè)合作建成了實(shí)踐教學(xué)基地,為學(xué)生實(shí)習(xí)實(shí)踐提供良好的實(shí)驗(yàn)場(chǎng)所和物質(zhì)保障。學(xué)校申請(qǐng)了教育廳的專項(xiàng)基金用來(lái)建設(shè)數(shù)學(xué)建模實(shí)驗(yàn)室、數(shù)據(jù)挖掘與數(shù)據(jù)處理實(shí)驗(yàn)室,給學(xué)生提供參加各種比賽的機(jī)會(huì)和條件,近幾年學(xué)校在競(jìng)賽方面成果顯著,多次獲得全國(guó)數(shù)學(xué)建模競(jìng)賽和研究生數(shù)學(xué)建模競(jìng)賽獎(jiǎng)項(xiàng)。另外,結(jié)合學(xué)校特點(diǎn),我們與煤礦開(kāi)采相關(guān)專業(yè)開(kāi)展合作,用統(tǒng)計(jì)的相關(guān)知識(shí)來(lái)解決實(shí)際工程的問(wèn)題,得到了很好的效果,學(xué)生也在此過(guò)程中,統(tǒng)計(jì)能力得到了顯著的提高。

2.建設(shè)應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)的實(shí)踐教學(xué)課程的一體化。安徽理工大學(xué)應(yīng)用統(tǒng)計(jì)專業(yè)的辦學(xué)宗旨是培養(yǎng)應(yīng)用型統(tǒng)計(jì)人才,培養(yǎng)的畢業(yè)生必須要掌握基礎(chǔ)的統(tǒng)計(jì)學(xué)、應(yīng)該數(shù)學(xué)、經(jīng)濟(jì)學(xué)理論,熟練掌握主流統(tǒng)計(jì)軟件,善于數(shù)據(jù)挖掘與分析,會(huì)靈活統(tǒng)計(jì)方法和統(tǒng)計(jì)技術(shù)分析和解決經(jīng)濟(jì)和社會(huì)的實(shí)際問(wèn)題。學(xué)生要會(huì)使用SPSS、SAS軟件和R主流的統(tǒng)計(jì)數(shù)據(jù)為指標(biāo),通過(guò)統(tǒng)計(jì)實(shí)踐活動(dòng)課程,培養(yǎng)學(xué)生扎實(shí)的數(shù)據(jù)處理、數(shù)據(jù)分析和統(tǒng)計(jì)推斷和數(shù)據(jù)挖掘能力,這個(gè)過(guò)程中也要強(qiáng)化培訓(xùn)教師必須掌握專業(yè)的統(tǒng)計(jì)分析軟件SPSS、SAS、R等主流統(tǒng)計(jì);最后,學(xué)生們用熟練的軟件技能,解決課程和實(shí)際應(yīng)用中相應(yīng)統(tǒng)計(jì)的例子,實(shí)現(xiàn)理論與實(shí)踐相結(jié)合,既鞏固了理論知識(shí),又培養(yǎng)了學(xué)生在學(xué)習(xí)理論知識(shí)的前提下,熟練解決實(shí)際問(wèn)題的能力。

3.建設(shè)應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)和統(tǒng)計(jì)學(xué)學(xué)科建設(shè)一體化的實(shí)踐教學(xué)體系。安徽理工大學(xué)積極鼓勵(lì)學(xué)科交叉與學(xué)科融合,以實(shí)現(xiàn)學(xué)科的整合。應(yīng)用統(tǒng)計(jì)學(xué)抓住學(xué)校學(xué)科建設(shè)整改的機(jī)會(huì)和學(xué)校的幾個(gè)重點(diǎn)建設(shè)學(xué)科合作研究,實(shí)現(xiàn)與煤礦開(kāi)采、安全工程、地下空間、爆破等專業(yè)的學(xué)科交叉融合,優(yōu)勢(shì)互補(bǔ)的深度,擴(kuò)大統(tǒng)計(jì)在其他領(lǐng)域的研究方向,增強(qiáng)教師的科研能力,同時(shí)對(duì)交叉學(xué)科提供了良好的數(shù)據(jù)分析和數(shù)據(jù)挖掘平臺(tái)。與此同時(shí),安徽理工大學(xué)應(yīng)用統(tǒng)計(jì)專業(yè)的學(xué)生可以使用大量的實(shí)驗(yàn)和統(tǒng)計(jì)數(shù)據(jù)的做法的統(tǒng)計(jì)專業(yè)課程,服務(wù)實(shí)踐的做法,及時(shí)更新,緊跟步伐時(shí)代和豐富的應(yīng)用程序數(shù)據(jù)極大地提高了學(xué)生的統(tǒng)計(jì)實(shí)踐的興趣,特別是一些開(kāi)放的數(shù)據(jù),使學(xué)生能夠更容易地參與有關(guān)教師統(tǒng)計(jì)研究這些領(lǐng)域,培養(yǎng)學(xué)生的科研能力。

參考文獻(xiàn):

[1]袁衛(wèi).機(jī)遇與挑戰(zhàn)――寫(xiě)在統(tǒng)計(jì)學(xué)成為一級(jí)學(xué)科之際[J].統(tǒng)計(jì)研究,2012,(11).

[2]羅亞非,朱遠(yuǎn)程.經(jīng)濟(jì)管理專業(yè)”應(yīng)用統(tǒng)計(jì)學(xué)”教學(xué)的幾點(diǎn)思考[J].統(tǒng)計(jì)教育,2005,(8).

[3]莫生紅.高校統(tǒng)計(jì)學(xué)課程教學(xué)改革探討[J].新西部,2009,(2).

[4]劉宏建,費(fèi)為銀,王傳玉.統(tǒng)計(jì)學(xué)專業(yè)應(yīng)用型人才培養(yǎng)模式的探索與實(shí)踐[J].中國(guó)電力教育:上,2012,(11).

[5]茍巧玲.《統(tǒng)計(jì)學(xué)》課程教學(xué)中存在的問(wèn)題與建議[J].統(tǒng)計(jì)與咨詢,2008,(1).

[6]薛艷.應(yīng)用型統(tǒng)計(jì)學(xué)專業(yè)實(shí)踐教學(xué)系統(tǒng)的構(gòu)建[J].中國(guó)電力教育:上,2012,(5).

[7]閏立梅.統(tǒng)計(jì)學(xué)專業(yè)創(chuàng)新性應(yīng)用型人才培養(yǎng)模式探索[J].職業(yè)時(shí)空,2013,(2).

[8]王麟,苑延華,于海姝,等.應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)人才實(shí)踐能力培養(yǎng)[J].價(jià)值工程,2013,(3).

Research on the Discipline Construction and Practice Teaching of the Specialty of Applied Statistics

GENG Xian-ya,XU Feng

(College of Science,Anhui University of Science and Technology,Huainan,Anhui 232001,China)

第4篇:數(shù)學(xué)建模大數(shù)據(jù)處理方法范文

[關(guān)鍵詞]信息與計(jì)算科學(xué);案例;建模;計(jì)算;開(kāi)發(fā)

[中圖分類號(hào)] G420 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 2095-3437(2016)08-0017-03

一、前言

課程建設(shè)是專業(yè)建設(shè)中的重要組成部分,專業(yè)導(dǎo)論課往往在第一學(xué)年開(kāi)設(shè),是學(xué)生了解專業(yè)、建立專業(yè)概念和專業(yè)認(rèn)同的重要課程,對(duì)學(xué)生的專業(yè)學(xué)習(xí)和發(fā)展有著重要的引領(lǐng)和指導(dǎo)作用。[1] [2] [3]

信息與計(jì)算科學(xué)專業(yè)是信息科學(xué)、計(jì)算科學(xué)、運(yùn)籌與控制、計(jì)算機(jī)及應(yīng)用等學(xué)科交叉而形成的專業(yè),往往設(shè)置為理科專業(yè)。多種學(xué)科知識(shí)的交叉滲透,加上因?qū)I(yè)名稱的望文生義,使學(xué)生容易產(chǎn)生簡(jiǎn)單的認(rèn)識(shí)――“信息與計(jì)算科學(xué)專業(yè)是數(shù)學(xué)與計(jì)算機(jī)結(jié)合的專業(yè)”。這樣籠統(tǒng)的認(rèn)識(shí)可能會(huì)導(dǎo)致學(xué)生認(rèn)為該專業(yè)“要么學(xué)數(shù)學(xué),要么學(xué)計(jì)算機(jī)”,至于“怎么結(jié)合”搞不清,不重視專業(yè)的其他重要方面,甚至連信息與計(jì)算科學(xué)的專業(yè)特點(diǎn)和核心競(jìng)爭(zhēng)力也模糊不清。

關(guān)于信息與計(jì)算科學(xué)專業(yè)課程體系建設(shè)的論述已有很多,然而關(guān)于該專業(yè)大導(dǎo)論課程的研究還不多見(jiàn)。針對(duì)上述存在的種種問(wèn)題,本文認(rèn)為信息與計(jì)算科學(xué)專業(yè)設(shè)置專業(yè)導(dǎo)論課程是極為必要的,而且在課程體系中應(yīng)作為獨(dú)立的重要一環(huán)。因?yàn)樽鳛樾畔⑴c計(jì)算科學(xué)(信計(jì))專業(yè)的導(dǎo)論課程,需要回答的問(wèn)題多且必要:信計(jì)專業(yè)培養(yǎng)什么樣的人才?什么是信計(jì)專業(yè)?信計(jì)的核心競(jìng)爭(zhēng)力是什么?如何實(shí)現(xiàn)?信息處理、應(yīng)用開(kāi)發(fā)中有哪些數(shù)學(xué)知識(shí)?信息挖掘、信息安全與算法設(shè)計(jì)的聯(lián)系如何?建模能力如何鑄就?計(jì)算分析能力怎樣打造?就業(yè)崗位對(duì)信計(jì)的現(xiàn)實(shí)要求有哪些?等等。

信計(jì)專業(yè)導(dǎo)論課的開(kāi)設(shè)需要對(duì)信計(jì)專業(yè)的發(fā)展歷史,專業(yè)的研究應(yīng)用進(jìn)展和前沿有深入、廣泛的了解,通過(guò)精選教學(xué)內(nèi)容,使教學(xué)內(nèi)容形成體系,以達(dá)到解決學(xué)生關(guān)切問(wèn)題、培養(yǎng)學(xué)生專業(yè)思想、建立學(xué)生專業(yè)認(rèn)同、激發(fā)學(xué)生專業(yè)學(xué)習(xí)興趣的教學(xué)目標(biāo)。教學(xué)過(guò)程中典型的教學(xué)案例對(duì)學(xué)習(xí)興趣的提高有明顯的促進(jìn)作用,在專業(yè)學(xué)習(xí)中能夠激發(fā)學(xué)生對(duì)專業(yè)的興趣,促進(jìn)學(xué)生對(duì)專業(yè)的理解,特別是有利于學(xué)生加深對(duì)專業(yè)的宏觀認(rèn)識(shí)以及對(duì)專業(yè)的一些具體方向的感性認(rèn)識(shí)。本文將結(jié)合教學(xué)典型案例深入剖析信息與計(jì)算科學(xué)專業(yè)導(dǎo)論教學(xué)中需要解決的問(wèn)題。

二、信息與計(jì)算科學(xué)的直觀印象

信息與計(jì)算科學(xué)作為交叉學(xué)科,和其他一些專業(yè)的易混淆性,使得我們必須首先回答什么是信息與計(jì)算科學(xué)專業(yè),更為緊要的是在大一階段應(yīng)該如何從直觀的角度來(lái)闡述它。我們知道,隨著現(xiàn)代信息計(jì)算科學(xué)技術(shù)的發(fā)展,上班考勤甚至上課考勤都有系列的產(chǎn)品可供選擇,常見(jiàn)的考勤機(jī)為指紋考勤機(jī)器――這是一個(gè)很典型的利用信息與計(jì)算科學(xué)知識(shí)和方法進(jìn)行應(yīng)用開(kāi)發(fā)的產(chǎn)品。在教學(xué)中,類似的案例可以體現(xiàn)信息與計(jì)算科學(xué)專業(yè)各學(xué)科之間的交叉滲透,為學(xué)生提供直觀的專業(yè)認(rèn)識(shí)印象,具體闡述如下。

1.利用該例闡述科技應(yīng)用開(kāi)發(fā)中,信息與計(jì)算科學(xué)專業(yè)知識(shí)的使用流程和涉及的課程知識(shí)。指紋考勤機(jī)首先要采集被識(shí)別人的指紋信息,并以此作為樣本;預(yù)處理后把樣本信息存儲(chǔ)為向量或數(shù)據(jù),通過(guò)建立樣本的特征提取模型,進(jìn)行特征提??;之后輸入建立的識(shí)別模型,對(duì)待識(shí)別的指紋進(jìn)行計(jì)算識(shí)別;接下來(lái)是針對(duì)硬件的編程實(shí)現(xiàn)和測(cè)試,最后再植入匹配的設(shè)備或者網(wǎng)絡(luò)傳入后臺(tái)系統(tǒng),完成系統(tǒng)測(cè)試,投入使用。由于建立特征提取模型和識(shí)別模型的方法很多,快速計(jì)算的方法選擇有所不同,這涉及信息與計(jì)算科學(xué)中許多數(shù)學(xué)基礎(chǔ)知識(shí)和數(shù)學(xué)建模方法等??偟膩?lái)說(shuō),考勤機(jī)的工作流程可以歸納為5步:(1)信息采集和預(yù)處理;(2)特征提取和識(shí)別模型;(3)識(shí)別、計(jì)算分析;(4)編程實(shí)現(xiàn);(5)植入硬件。分別講述其中各個(gè)環(huán)節(jié)可涉及的專業(yè)課程:信息采集和預(yù)處理可涉及高等代數(shù)、概率統(tǒng)計(jì)等課程;特征提取和識(shí)別模型可涉及高等代數(shù)、數(shù)學(xué)分析、概率統(tǒng)計(jì)、運(yùn)籌優(yōu)化、數(shù)學(xué)建模等課程;識(shí)別、計(jì)算分析涉及高等代數(shù)、數(shù)學(xué)分析、運(yùn)籌優(yōu)化、數(shù)值分析等課程;編程實(shí)現(xiàn)可涉及程序設(shè)計(jì)語(yǔ)言、算法設(shè)計(jì)、軟件開(kāi)發(fā)測(cè)試,等等。這樣結(jié)合專業(yè)課程知識(shí)與應(yīng)用實(shí)例的詳細(xì)講解,易于讓學(xué)生了解信息與計(jì)算科學(xué)專業(yè)知識(shí)的應(yīng)用流程,使學(xué)生對(duì)信息與計(jì)算科學(xué)專業(yè)知識(shí)有直觀的認(rèn)識(shí)。

2.利用該例闡述科技應(yīng)用開(kāi)發(fā)中,信息與計(jì)算科學(xué)中各個(gè)學(xué)科的交叉滲透。如前所述,由于一個(gè)產(chǎn)品的開(kāi)發(fā)可能涉及的知識(shí)點(diǎn)很多,可采取的模型方法也是多種多樣,這些知識(shí)之間的應(yīng)用就會(huì)有交叉。例如,特征提取、識(shí)別模型的建立有可能用到信息處理的數(shù)學(xué)基礎(chǔ),這時(shí)又需要考慮該模型是否能設(shè)計(jì)出快速的計(jì)算方法來(lái)滿足實(shí)際計(jì)算速度的要求;識(shí)別模型的實(shí)現(xiàn)最后需要計(jì)算機(jī)編程來(lái)完成,這又涉及合適的模型、快速的算法和良好的程序設(shè)計(jì)之間的協(xié)調(diào)融合。當(dāng)然,完整的產(chǎn)品設(shè)計(jì)還需要考慮到采集設(shè)備的精度、程序植入等其他學(xué)科的知識(shí)。這樣講解,學(xué)生就會(huì)對(duì)信息與計(jì)算科學(xué)知識(shí)的交叉有較為宏觀的認(rèn)識(shí)。

3.啟發(fā)學(xué)生對(duì)信息與計(jì)算科學(xué)中的相關(guān)問(wèn)題進(jìn)行思考。

(1)指紋樣本信息采集是很微妙的事,如果當(dāng)采集一個(gè)樣本的次數(shù)太多,超出了很多人的承受范圍,比如一個(gè)手指的指紋采集超過(guò)了三次,這樣產(chǎn)品的便利性、應(yīng)用性和競(jìng)爭(zhēng)力就值得懷疑了。因?yàn)橥ǔG闆r下,我們很自然的認(rèn)為事不過(guò)三為好。那么,如何以最少的采集次數(shù)達(dá)到要求的識(shí)別效果?這就是值得考慮的問(wèn)題。

(2)如何提高產(chǎn)品的識(shí)別效果(正確識(shí)別率),提升產(chǎn)品質(zhì)量,這除了與團(tuán)隊(duì)的專業(yè)知識(shí)相關(guān)以外,還與獲取知識(shí)的能力有很大關(guān)系。例如能不能利用已有的專業(yè)知識(shí)積累從現(xiàn)有的國(guó)內(nèi)文獻(xiàn)中獲取最新的技術(shù)信息,能不能利用國(guó)外的技術(shù)文獻(xiàn),等等。這些都是由典型案例所延伸出的值得思考的問(wèn)題。這些問(wèn)題有利于開(kāi)拓思路,使學(xué)生對(duì)將來(lái)的工作和研究研發(fā)空間充滿期待。

三、信息與計(jì)算科學(xué)專業(yè)的核心競(jìng)爭(zhēng)力

信息與計(jì)算科學(xué)是由多個(gè)學(xué)科專業(yè)合并和綜合而來(lái)的,其重視基礎(chǔ)能力,培養(yǎng)能解決實(shí)際中信息與科學(xué)工程計(jì)算應(yīng)用問(wèn)題的寬口徑專業(yè)人才??紤]到專業(yè)的名稱與計(jì)算機(jī)、信息工程等專業(yè)有相似之處,專業(yè)導(dǎo)論課程需要闡明該專業(yè)與其他專業(yè),特別是一些計(jì)算機(jī)科學(xué)專業(yè)、信息工程專業(yè)和數(shù)學(xué)與應(yīng)用數(shù)學(xué)專業(yè)之間的區(qū)別。因此,信息與計(jì)算科學(xué)專業(yè)課程的核心是什么?專業(yè)人才的核心競(jìng)爭(zhēng)力是什么?這兩個(gè)問(wèn)題是無(wú)法回避的。針對(duì)這些問(wèn)題,除了上述案例,圖像(信息)的壓縮處理也是一個(gè)很直觀的例子。利用圖像壓縮,可以給學(xué)生展示壓縮編碼技術(shù)、壓縮的算法、軟件開(kāi)發(fā)等,這涉及信息編碼、密碼學(xué)、算法設(shè)計(jì)能力、應(yīng)用開(kāi)發(fā)能力等。結(jié)合這些案例,我們信息與計(jì)算科學(xué)專業(yè)并不是單純的涉及數(shù)學(xué)基礎(chǔ)課程、建模能力、算法設(shè)計(jì)或者計(jì)算機(jī)科學(xué)其中的某一方面,它的核心競(jìng)爭(zhēng)力在于“數(shù)學(xué)基礎(chǔ)與建模能力、計(jì)算分析與算法設(shè)計(jì)、程序語(yǔ)言與應(yīng)用開(kāi)發(fā)”這三者的有機(jī)融合。單單講某個(gè)方面還不足以稱之為專業(yè)的核心競(jìng)爭(zhēng)力。因?yàn)閷I(yè)人才的定位是解決信息與科學(xué)工程計(jì)算的應(yīng)用問(wèn)題,這些實(shí)際問(wèn)題本身與這三方面多有緊密的聯(lián)系,單強(qiáng)調(diào)某一方面或重視某一模塊容易和上述一些類似名稱的專業(yè)混淆。因而,與這三方面相關(guān)的數(shù)學(xué)基礎(chǔ)課程有數(shù)學(xué)分析、高等代數(shù)、解析幾何、微分方程、概率統(tǒng)計(jì)等;與這三方面相關(guān)的一些專業(yè)課程需要凝聚成為專業(yè)的核心課程,如數(shù)值分析、離散數(shù)學(xué)、程序語(yǔ)言、數(shù)學(xué)建模等。

四、信息處理、應(yīng)用開(kāi)發(fā)中的數(shù)學(xué)知識(shí)

信息與計(jì)算科學(xué)專業(yè)的大一新生對(duì)就讀該專業(yè)充滿了憧憬。他們能發(fā)現(xiàn)數(shù)學(xué)基礎(chǔ)的老三樣(數(shù)分、高代、解幾)但看不到信息和計(jì)算的影子,看不出專業(yè)的特征和特色,這就需要專業(yè)導(dǎo)論課程加以引導(dǎo)。選取信息處理和應(yīng)用開(kāi)發(fā)中的相關(guān)案例來(lái)闡述數(shù)學(xué)基礎(chǔ)知識(shí)在解決這些問(wèn)題中的重要作用,可以使學(xué)生對(duì)數(shù)學(xué)基礎(chǔ)知識(shí)與實(shí)際科學(xué)工程問(wèn)題有直觀的印象,這對(duì)學(xué)生下決心打好基礎(chǔ),投入前期課程學(xué)習(xí)有著重要的作用。如選擇圖像處理中的修補(bǔ)算法、游戲開(kāi)發(fā)中憤怒的小鳥(niǎo)的技術(shù)含量為講述案例,則這些應(yīng)用案例就可結(jié)合數(shù)學(xué)基礎(chǔ)知識(shí)來(lái)闡述。

1.圖像處理中的修補(bǔ)算法。圖形圖像的基本處理分析方法,如傅里葉分析可選擇進(jìn)行更為全面的介紹,介紹其在工程領(lǐng)域、數(shù)字信號(hào)處理、醫(yī)學(xué)領(lǐng)域的廣泛應(yīng)用。這樣來(lái)看,大一開(kāi)始學(xué)習(xí)的分析類課程作為專業(yè)的基礎(chǔ)課程確實(shí)是名符其實(shí)。圖像圖像處理的修補(bǔ)涉及優(yōu)化模型和優(yōu)化算法、算法的復(fù)雜性等,而這些基本的模型形式――在一定約束要求的前提下,求目標(biāo)函數(shù)的極小值,容易使學(xué)生對(duì)開(kāi)始學(xué)的分析課程的導(dǎo)數(shù)與極值、矩陣等基本知識(shí)聯(lián)系起來(lái)。

2.憤怒的小鳥(niǎo)的技術(shù)含量。應(yīng)用開(kāi)發(fā)形式多種多樣,游戲開(kāi)發(fā)是一種有趣生動(dòng)的開(kāi)發(fā)過(guò)程,許多游戲開(kāi)發(fā)又與數(shù)學(xué)基礎(chǔ)知識(shí)有緊密聯(lián)系。因此,選取其中的典型案例進(jìn)行介紹,容易激發(fā)學(xué)生的學(xué)習(xí)興趣,促進(jìn)學(xué)生對(duì)數(shù)學(xué)知識(shí)在應(yīng)用開(kāi)發(fā)中作用的理解。如該例涉及的物體碰撞檢測(cè)和連續(xù)碰撞檢測(cè)與向量及運(yùn)算、旋轉(zhuǎn)矩陣、線性變換等數(shù)學(xué)基礎(chǔ)知識(shí),可以由此進(jìn)一步介紹物體的移動(dòng)、壁障和尋路等游戲開(kāi)發(fā)中常見(jiàn)的智能化算法,這些都將和許多基礎(chǔ)知識(shí)緊密結(jié)合。

五、信息挖掘與算法設(shè)計(jì)

信息與計(jì)算科學(xué)專業(yè)人才應(yīng)具有處理實(shí)際中信息與科學(xué)工程計(jì)算問(wèn)題的能力。當(dāng)前大數(shù)據(jù)處理涉及的信息挖掘的相關(guān)內(nèi)容,與信計(jì)專業(yè)有天然的聯(lián)系,特別是挖掘目標(biāo)的設(shè)置、隱含信息的挖掘模型的建立和使用、模型的求解、算法性能分析等,與信息與計(jì)算科學(xué)中的計(jì)算能力、建模能力、程序設(shè)計(jì)等核心能力模塊要求相連。這方面的熱點(diǎn)案例很多,如可選阿里巴巴大數(shù)據(jù)競(jìng)賽、2012年和2015年深圳杯全國(guó)大學(xué)生數(shù)學(xué)建模夏令營(yíng)B題進(jìn)行展示,其中阿里巴巴大數(shù)據(jù)競(jìng)賽可聯(lián)系到機(jī)器學(xué)習(xí)算法等。講述這些典型的熱點(diǎn)應(yīng)用案例,對(duì)學(xué)生了解專業(yè)課程和專業(yè)的內(nèi)涵有重要的指導(dǎo)作用。

綜上,通過(guò)梳理信息與計(jì)算科學(xué)專業(yè)導(dǎo)論教學(xué)中一些需要澄清的問(wèn)題,根據(jù)教學(xué)實(shí)踐,從典型案例的視角對(duì)這些問(wèn)題設(shè)置的必要性和解決方式進(jìn)行了分析和探討,剖析了這對(duì)于促進(jìn)學(xué)生對(duì)專業(yè)內(nèi)涵的總體把握、了解專業(yè)應(yīng)用領(lǐng)域、品味專業(yè)學(xué)習(xí)價(jià)值的有益作用。

[ 參 考 文 獻(xiàn) ]

[1] 楊曉東,崔亞新,劉貴富.試論高等學(xué)校專業(yè)導(dǎo)論課的開(kāi)設(shè)[J].黑龍江高教研究,2010(7):147-149.

[2] 王曉暉.大學(xué)專業(yè)導(dǎo)論課開(kāi)設(shè)的目標(biāo)探析[J].高教論壇,2013(12):69-71.

[3] 王利眾,朱麗平.工科專業(yè)導(dǎo)論課教學(xué)研究――以“通信技術(shù)導(dǎo)論與導(dǎo)學(xué)”為例[J].黑龍江教育:高教研究與評(píng)估,2015(9):29-30.

[4] 許峰,方賢文,許志才.信息與計(jì)算科學(xué)專業(yè)教學(xué)體系的實(shí)踐與探索[J].高等理科教育,2007(4):70-73.

[5] 龔日朝.“以特色取勝”建設(shè)信息與計(jì)算科學(xué)專業(yè)的新型思路與實(shí)踐[J].大學(xué)數(shù)學(xué),2004(3):12-15.

[6] 蘇麗卿,黃民海.對(duì)信息與計(jì)算科學(xué)專業(yè)的認(rèn)識(shí)與思考[J].河北師范大學(xué)學(xué)報(bào)(教育科學(xué)版),2008(6):107-109.

[7] 李學(xué)勇,王鑫,譚義紅.應(yīng)用型本科院校信息與計(jì)算科學(xué)專業(yè)人才培養(yǎng)模式[J].長(zhǎng)沙大學(xué)學(xué)報(bào),2009(5):109-111.

[8] 汪富泉.信息與計(jì)算科學(xué)專業(yè)應(yīng)用型人才培養(yǎng)模式研究與實(shí)踐[J].大學(xué)教育,2013(18):62-63.

[9] 鄭金洲.案例教學(xué):教師專業(yè)發(fā)展的新途徑[J].教育理論與實(shí)踐,2002(7):36-41.

第5篇:數(shù)學(xué)建模大數(shù)據(jù)處理方法范文

大數(shù)據(jù)環(huán)境對(duì)財(cái)務(wù)分析的對(duì)象、方法與工具以及功能等產(chǎn)生了巨大的影響,從而對(duì)財(cái)務(wù)分析人員的知識(shí)與能力結(jié)構(gòu)提出了新的挑戰(zhàn)和需求。作為培養(yǎng)財(cái)務(wù)分析人才的主要載體——財(cái)務(wù)分析教材,必須加以重新構(gòu)建和創(chuàng)新。大數(shù)據(jù)環(huán)境下的財(cái)務(wù)分析教材體系首先要強(qiáng)調(diào)海量數(shù)據(jù)收集、整理、處理等工具的運(yùn)用能力培養(yǎng),同時(shí),應(yīng)突破財(cái)務(wù)會(huì)計(jì)數(shù)據(jù)分析的局限性,從財(cái)務(wù)信息、行業(yè)信息和宏觀信息方面進(jìn)行更大、更復(fù)雜、更全面分析,構(gòu)建一個(gè)全新視角的財(cái)務(wù)分析方法體系和內(nèi)容體系,從而為決策者提供更多寶貴信息,創(chuàng)造更多價(jià)值與財(cái)富。

關(guān)鍵詞:

財(cái)務(wù)分析;教材體系;大數(shù)據(jù)環(huán)境;方法;內(nèi)容

根據(jù)Gartner(2012)的定義,大數(shù)據(jù)具有數(shù)量大、變化快和多樣化的基本特征,是典型的信息資產(chǎn),其背后隱藏著巨大價(jià)值與財(cái)富。財(cái)務(wù)數(shù)據(jù)是企業(yè)最基本、最有決策價(jià)值的數(shù)據(jù),是大數(shù)據(jù)的重要構(gòu)成內(nèi)容。但大數(shù)據(jù)時(shí)代,財(cái)務(wù)所面對(duì)的數(shù)據(jù)規(guī)模越來(lái)越龐大、數(shù)據(jù)類型越來(lái)越復(fù)雜,也蘊(yùn)藏著越來(lái)越多的寶貴信息,因此,大數(shù)據(jù)對(duì)傳統(tǒng)財(cái)務(wù)會(huì)計(jì)理論與實(shí)務(wù)提出了新的要求,對(duì)會(huì)計(jì)信息質(zhì)量產(chǎn)生更廣泛而深刻的影響,這必然需要培養(yǎng)掌握先進(jìn)的分析技術(shù)和大數(shù)據(jù)分析工具,能從海量數(shù)據(jù)中發(fā)現(xiàn)機(jī)遇,具備高效的溝通和協(xié)作能力的數(shù)據(jù)處理與分析的團(tuán)隊(duì)。財(cái)務(wù)分析教材作為財(cái)務(wù)數(shù)據(jù)處理與分析人才培養(yǎng)的主要載體、平臺(tái)和手段,必然以大數(shù)據(jù)環(huán)境下財(cái)務(wù)數(shù)據(jù)分析人才知識(shí)和能力需求為導(dǎo)向,對(duì)其教學(xué)工具、教學(xué)內(nèi)容和教學(xué)方式進(jìn)行變革與調(diào)整。關(guān)于財(cái)務(wù)分析教材方面的研究,從文獻(xiàn)的數(shù)量上來(lái)看并不多,而進(jìn)行大數(shù)據(jù)環(huán)境下財(cái)務(wù)分析教材的研究文獻(xiàn)基本是空白。不過(guò),隨著大數(shù)據(jù)時(shí)代的到來(lái),目前,關(guān)于大數(shù)據(jù)下財(cái)務(wù)分析的討論越來(lái)越多。部分學(xué)者對(duì)從理論上分析了大數(shù)據(jù)對(duì)財(cái)務(wù)會(huì)計(jì)理論的影響,進(jìn)而指出大數(shù)據(jù)對(duì)財(cái)務(wù)分析內(nèi)涵、對(duì)象和功能等內(nèi)容的影響[1];也有部分學(xué)者結(jié)合實(shí)際指出:大數(shù)據(jù)的到來(lái)給財(cái)務(wù)分析領(lǐng)域帶來(lái)了巨大機(jī)遇和挑戰(zhàn)[2],財(cái)務(wù)分析將不再是一個(gè)靜態(tài)的,個(gè)態(tài)的和封閉的內(nèi)部“小分析”[3],而是動(dòng)態(tài)的、系統(tǒng)的、開(kāi)放的、注重過(guò)程分析和非結(jié)構(gòu)數(shù)據(jù)分析的綜合分析[4];當(dāng)然,也有個(gè)別學(xué)者從課程建設(shè)的角度進(jìn)行分析,指出數(shù)據(jù)時(shí)代的到來(lái),高校財(cái)務(wù)分析課程急需改革,以培養(yǎng)創(chuàng)新型財(cái)務(wù)分析人才來(lái)適應(yīng)市場(chǎng)需求[5],等等。本文希望在借鑒前述學(xué)者的研究成果基礎(chǔ)上,構(gòu)建適應(yīng)大數(shù)據(jù)環(huán)境下財(cái)務(wù)分析人才培養(yǎng)的全新的財(cái)務(wù)分析教材體系。

一、大數(shù)據(jù)環(huán)境對(duì)財(cái)務(wù)分析的影響

大數(shù)據(jù)時(shí)代的到來(lái),財(cái)務(wù)分析將發(fā)生一個(gè)翻天的變革,其將突破靜態(tài)的,個(gè)態(tài)的“小分析”范疇,而變成一個(gè)動(dòng)態(tài)的、系統(tǒng)的“綜合分析”。

(一)對(duì)財(cái)務(wù)分析對(duì)象的影響

大數(shù)據(jù)環(huán)境下,財(cái)務(wù)分析將更注重信息的全面性和針對(duì)性,更注重利益相關(guān)者的信息需求和信息的決策相關(guān)性。針對(duì)不同利益相關(guān)者信息需求的各種“個(gè)性化財(cái)務(wù)報(bào)告”在大數(shù)據(jù)時(shí)代強(qiáng)大的存儲(chǔ)功和分析能力下將以較低成本得以產(chǎn)生。[1]同時(shí),強(qiáng)大的分析功能使財(cái)務(wù)分析對(duì)象將打破本公司財(cái)務(wù)數(shù)據(jù)的界限,大量涉足非本公司以外的財(cái)務(wù)數(shù)據(jù)和其他非財(cái)務(wù)信息。

(二)對(duì)財(cái)務(wù)分析人員知識(shí)和能力的影響

大數(shù)據(jù)環(huán)境下的財(cái)務(wù)分析人才需要新知識(shí)、新能力、新度量和新的思維方式,實(shí)現(xiàn)由傳統(tǒng)的財(cái)務(wù)數(shù)據(jù)分析,向一個(gè)大數(shù)據(jù)環(huán)境下的綜合思維轉(zhuǎn)變。在知識(shí)結(jié)構(gòu)方面,財(cái)務(wù)分析人士除了需要厚實(shí)的財(cái)務(wù)與會(huì)計(jì)專業(yè)知識(shí)外,更需要扎實(shí)的數(shù)學(xué)、統(tǒng)計(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)等進(jìn)行數(shù)據(jù)分析的基礎(chǔ)知識(shí)作支撐。在能力結(jié)構(gòu)方面,財(cái)務(wù)分析人士需要具有挖掘大數(shù)據(jù)價(jià)值與消除噪音數(shù)據(jù)的洞查能力、分析大數(shù)據(jù)的新技術(shù)與新工具的使用能力以及為利益相關(guān)者創(chuàng)造數(shù)據(jù)或提供報(bào)告的語(yǔ)言表達(dá)能力等??傊?,大數(shù)據(jù)環(huán)境下的企業(yè)首席財(cái)務(wù)分析師既是企業(yè)首席財(cái)務(wù)技術(shù)師、企業(yè)首席財(cái)務(wù)信息師更是企業(yè)首席戰(zhàn)略決策的咨詢師。

(三)對(duì)財(cái)務(wù)分析方法與工具的影響

大數(shù)據(jù)時(shí)代的到來(lái),財(cái)務(wù)分析突破了傳統(tǒng)的數(shù)據(jù)基礎(chǔ)和計(jì)算條件的限制,其分析越來(lái)越精益,與之相應(yīng)的財(cái)務(wù)分析方法與技術(shù)也與時(shí)俱進(jìn)。信息技術(shù)、數(shù)據(jù)庫(kù)和云計(jì)算技術(shù)與統(tǒng)計(jì)學(xué)方法和數(shù)學(xué)方法相結(jié)合在數(shù)據(jù)存儲(chǔ)、處理、挖掘和分析中發(fā)揮有效的作用,使得財(cái)務(wù)分析方法將由傳統(tǒng)小樣本抽樣分析轉(zhuǎn)向全面分析成為可能,為不同利益相關(guān)都提供全部和高質(zhì)量的信息。

(四)對(duì)財(cái)務(wù)分析功能的影響

大數(shù)據(jù)環(huán)境下,分析方法和分析內(nèi)容的豐富,財(cái)務(wù)分析更注意尋找事物的相關(guān)關(guān)系,而不僅僅是事物的因果關(guān)系;更注重高質(zhì)量數(shù)據(jù)的挖掘和企業(yè)價(jià)值的提高。因此,大數(shù)據(jù)時(shí)代的財(cái)務(wù)分析功能不僅僅是傳統(tǒng)的預(yù)測(cè)和控制等,而是更注重利用數(shù)據(jù)為企業(yè)利益相關(guān)者提供全方位、高相關(guān)性和高準(zhǔn)確性的決策信息,發(fā)展企業(yè)商業(yè)價(jià)值和戰(zhàn)略先機(jī)。

二、大數(shù)據(jù)環(huán)境下財(cái)務(wù)分析教材體系的構(gòu)建

大數(shù)據(jù)對(duì)財(cái)務(wù)分析對(duì)象、功能和方法等產(chǎn)生了巨大的影響,從而對(duì)財(cái)務(wù)分析人才的能力和知識(shí)結(jié)構(gòu)給出了新的要求。財(cái)務(wù)分析課程是財(cái)務(wù)分析人才培養(yǎng)的平臺(tái),大數(shù)據(jù)環(huán)境下其必須建立在統(tǒng)計(jì)學(xué)、計(jì)量經(jīng)濟(jì)學(xué)和高等數(shù)學(xué)等基本工具的先修課程的基礎(chǔ)上;而財(cái)務(wù)分析教材則是財(cái)務(wù)分析人才培養(yǎng)的直接載體和手段,其教學(xué)體系直接決定著財(cái)務(wù)分析人才的知識(shí)和能力結(jié)構(gòu)。(如圖1所示)傳統(tǒng)的以財(cái)務(wù)比率分析為工具,以財(cái)務(wù)報(bào)告為對(duì)象,以滿足股東、債權(quán)人和經(jīng)營(yíng)者等相關(guān)利益者對(duì)財(cái)務(wù)數(shù)據(jù)需求為目的的教材體系必將進(jìn)行重新構(gòu)建和創(chuàng)新,以適應(yīng)大數(shù)據(jù)環(huán)境下財(cái)務(wù)分析人才的成長(zhǎng)。

(一)第一部分:財(cái)務(wù)分析緒論

本部分內(nèi)容應(yīng)該由以下幾部分組成:大數(shù)據(jù)環(huán)境下利益相關(guān)者對(duì)財(cái)務(wù)分析的需求、大數(shù)據(jù)環(huán)境下財(cái)務(wù)分析的目標(biāo)與定位、大數(shù)據(jù)環(huán)境下財(cái)務(wù)分析所需要的知識(shí)與能力支持體系、方法體系以及大數(shù)據(jù)環(huán)境下財(cái)務(wù)分析教材的內(nèi)容體系與框架。

(二)第二部分:財(cái)務(wù)分析方法體系

大數(shù)據(jù)環(huán)境下,財(cái)務(wù)分析的方法尤為重要,除了傳統(tǒng)的財(cái)務(wù)比率和比較分析等方法外,更注重利用數(shù)學(xué)、統(tǒng)計(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)等知識(shí)與計(jì)算機(jī)軟件和硬件平臺(tái)的結(jié)合使用來(lái)收集、整理、甄別和處理數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)潛在的巨大商業(yè)價(jià)值。就財(cái)務(wù)分析教材而言,必須強(qiáng)調(diào)學(xué)生充分利用先修改課程所學(xué)的知識(shí),具備從各種渠道獲取大數(shù)據(jù)的能力,處理數(shù)據(jù)與建模能力,因此,大數(shù)據(jù)環(huán)境下財(cái)務(wù)分析方法應(yīng)包括海量數(shù)據(jù)收集方法、海量數(shù)據(jù)整理與甄別方法以及海量數(shù)據(jù)的處理方法。

(三)第三部分:財(cái)務(wù)分析內(nèi)容體系

1.財(cái)務(wù)信息分析。財(cái)務(wù)會(huì)計(jì)數(shù)據(jù)是企業(yè)最基本、也是最大和豐富的一種數(shù)據(jù),是傳統(tǒng)財(cái)務(wù)分析的主體,也是大數(shù)據(jù)的重要組成部分,因此,財(cái)務(wù)分析首先必定是對(duì)企業(yè)大量的財(cái)務(wù)數(shù)據(jù)進(jìn)行分析,包括財(cái)務(wù)報(bào)表比較分析、各種財(cái)務(wù)能力(盈利、償債、營(yíng)運(yùn)、發(fā)展、創(chuàng)新和綜合財(cái)務(wù))分析、各種會(huì)計(jì)活動(dòng)分析等,讓財(cái)務(wù)數(shù)據(jù)開(kāi)口說(shuō)話,挖掘其價(jià)值,為企業(yè)經(jīng)營(yíng)管理者提供決策相關(guān)的信息,同時(shí),也為后面的相關(guān)分析奠定基礎(chǔ)。[4]

2.企業(yè)信息分析。企業(yè)信息在一定程度是企業(yè)的工具更是企業(yè)的商業(yè)機(jī)遇,企業(yè)除了財(cái)務(wù)數(shù)據(jù)外,還有大量的非財(cái)務(wù)數(shù)據(jù)如客戶關(guān)系信息、產(chǎn)品與銷售信息和部門(mén)合作信息,等等,這些數(shù)據(jù)相當(dāng)重要,也是企業(yè)決策的基礎(chǔ),但零散、單個(gè)的數(shù)據(jù)沒(méi)有任何價(jià)值,只有財(cái)務(wù)人員利用科學(xué)的分析方法,建立適當(dāng)?shù)姆治瞿P?,?duì)數(shù)據(jù)進(jìn)行加工,才能挖掘出其隱含的商業(yè)價(jià)值。

3.行業(yè)和宏觀信息分析。大數(shù)據(jù)環(huán)境下,數(shù)據(jù)分析人才的基本能力之一是要通過(guò)不同渠道獲得相關(guān)行業(yè)和宏觀經(jīng)濟(jì)數(shù)據(jù),進(jìn)行中觀和宏觀分析。行業(yè)和宏觀數(shù)據(jù)來(lái)源于金融數(shù)據(jù)庫(kù),板塊數(shù)據(jù)庫(kù),網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、國(guó)研網(wǎng)和各種信息中心等平臺(tái)的數(shù)據(jù),分析人員不僅要利用計(jì)量經(jīng)濟(jì)學(xué)的方法進(jìn)行定量分析,同時(shí),也要利用一些SWOT、專家經(jīng)驗(yàn)判斷法等非定量方法進(jìn)行分析,為企業(yè)發(fā)展所處的行業(yè)和宏觀環(huán)境做出科學(xué)合理的判斷。

(四)第四部分:大數(shù)據(jù)環(huán)境下財(cái)務(wù)分析的應(yīng)用

1.利用大數(shù)據(jù)進(jìn)行風(fēng)險(xiǎn)管理。以某企業(yè)所處的宏觀和行業(yè)環(huán)境為例,設(shè)置相應(yīng)的指標(biāo)反映其中觀和宏觀環(huán)境,建議中宏風(fēng)險(xiǎn)預(yù)警模型,然后再選擇或設(shè)置反映企業(yè)經(jīng)營(yíng)和財(cái)務(wù)風(fēng)險(xiǎn)的相關(guān)指標(biāo),建立微觀風(fēng)險(xiǎn)預(yù)警模型。

2.利用大數(shù)據(jù)創(chuàng)造價(jià)值。以某企業(yè)為例,分析其不同經(jīng)營(yíng)環(huán)節(jié)(生產(chǎn)過(guò)程、供應(yīng)鏈和銷售環(huán)節(jié)等)的相關(guān)數(shù)據(jù),運(yùn)用財(cái)務(wù)分析方法對(duì)大數(shù)據(jù)的戰(zhàn)略分析,為企業(yè)提供機(jī)遇,創(chuàng)造價(jià)值。

3.利用大數(shù)據(jù)進(jìn)行專業(yè)化、實(shí)時(shí)化的決策。以某家銀行數(shù)據(jù)收集處理和方案決策為例,分析其在大數(shù)據(jù)環(huán)境下的工作效率和決策程度,比較傳統(tǒng)的決策方式,闡述大數(shù)據(jù)環(huán)境下利用大數(shù)據(jù)的專業(yè)化和實(shí)時(shí)化決策。

參考文獻(xiàn):

[1]齊萱,楊靜.大數(shù)據(jù)時(shí)代會(huì)計(jì)信息相關(guān)性研究述評(píng)[J].財(cái)會(huì)通訊,2015(28):62-65.

[2]張紅英,王翠森.大數(shù)據(jù)時(shí)代財(cái)務(wù)分析領(lǐng)域機(jī)遇與挑戰(zhàn)[J].財(cái)會(huì)通訊,2016(2):84-85.

[3]白金榮.大數(shù)據(jù)時(shí)代公司財(cái)務(wù)分析的發(fā)展淺析[J].經(jīng)營(yíng)管理者,2015(9):280.

[4]趙紅梅,王衛(wèi)星.財(cái)務(wù)分析的理論基礎(chǔ)與教材體系創(chuàng)新研究[J].財(cái)會(huì)通訊,2014(10):48-51.

第6篇:數(shù)學(xué)建模大數(shù)據(jù)處理方法范文

關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué);教學(xué)改革

伴隨著網(wǎng)絡(luò)信息計(jì)算的急速發(fā)展,各領(lǐng)域數(shù)據(jù)以迅雷不及掩耳之勢(shì)的速度不斷更新,同時(shí)人們對(duì)數(shù)據(jù)的看法也在不斷變化,采取的決策也在不斷深化,人們?cè)诟鱾€(gè)領(lǐng)域做出的決策都在由“以業(yè)務(wù)為中心”向“以數(shù)據(jù)為中心”轉(zhuǎn)變。有人說(shuō),獲取數(shù)據(jù)的人將獲得世界的青睞,因此,對(duì)數(shù)據(jù)的統(tǒng)計(jì)與分析能力是當(dāng)今一項(xiàng)非常重要的技能[1]。

統(tǒng)計(jì)學(xué)作課程作為各大高校開(kāi)設(shè)的一門(mén)必修課,在學(xué)生接受的課程教育體系中起著重要的基礎(chǔ)作用。同時(shí)隨著各行各業(yè)數(shù)據(jù)分析的深入,高校統(tǒng)計(jì)學(xué)課程也必須順應(yīng)時(shí)展,進(jìn)行教學(xué)改革,力爭(zhēng)培養(yǎng)能畢業(yè)后與各行業(yè)順利對(duì)接、有較強(qiáng)數(shù)據(jù)分析能力的人才。

一、當(dāng)前統(tǒng)計(jì)學(xué)課程教學(xué)中存在一系列問(wèn)題

當(dāng)前,統(tǒng)計(jì)學(xué)課程教學(xué)中有一些不盡如人意的地方,無(wú)論是教學(xué)大綱的編制、教學(xué)進(jìn)度的安排還是教學(xué)中采用的軟件應(yīng)用性上,都有一些小問(wèn)題,給教學(xué)工作者帶來(lái)很多困惑。

(一)教學(xué)大綱內(nèi)容多,教學(xué)時(shí)長(zhǎng)卻較以往更短

高校一般每學(xué)期都會(huì)就下一年上統(tǒng)計(jì)學(xué)課程的該年級(jí)學(xué)生編制教學(xué)大綱,大綱內(nèi)容全面、綜合,涵蓋了幾乎統(tǒng)計(jì)學(xué)教材中的全部知識(shí)。統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)包括導(dǎo)論、數(shù)據(jù)的收集、整理、分析、抽驗(yàn)分布、參數(shù)估計(jì)等。內(nèi)容多,且覆蓋范圍廣,且要求學(xué)生有較好的數(shù)學(xué)基本功,能快速理解、掌握每個(gè)公式和理論背后的含義。同時(shí),為提高學(xué)生處理數(shù)據(jù)的能力,大綱中還要求給與一定數(shù)量的實(shí)訓(xùn)學(xué)時(shí),要學(xué)生掌握SPSS,SAS等統(tǒng)計(jì)軟件。目標(biāo)很好,希望學(xué)生能真正掌握統(tǒng)計(jì)學(xué)課程的精髓。只是時(shí)間太有限,學(xué)校分給學(xué)生學(xué)習(xí)統(tǒng)計(jì)學(xué)課程的時(shí)長(zhǎng)只有48學(xué)時(shí),有一學(xué)期甚至壓縮到了32學(xué)時(shí),課堂教學(xué)時(shí)明顯感覺(jué)時(shí)間緊,無(wú)法詳細(xì)講述書(shū)中的重要知識(shí)點(diǎn),課堂上老師只能走馬觀花的講講重點(diǎn),學(xué)生聽(tīng)的也是懵懵懂懂,知其然不知其所以然,不能理解定理、公式背后的含義,學(xué)習(xí)效果沒(méi)有想象中好[2]。

(二)學(xué)生基本功不扎實(shí)

統(tǒng)計(jì)學(xué)課程本質(zhì)上是采用的數(shù)學(xué)方法,其理論基礎(chǔ)是微積分和概率論基礎(chǔ)等數(shù)學(xué)系課程。對(duì)于非統(tǒng)計(jì)專業(yè)的學(xué)生而言,數(shù)學(xué)課是從小就伴隨著他們的噩夢(mèng),從小就缺乏學(xué)習(xí)數(shù)學(xué)、利用公式解決問(wèn)題的興趣。進(jìn)了大學(xué)后,更為枯燥、深?yuàn)W的符號(hào)在他們看來(lái)更是一場(chǎng)莫名其妙的游戲,內(nèi)心不愿參與到這場(chǎng)游戲中,只能形式上聽(tīng)一聽(tīng),至于老師上課時(shí)傳授的內(nèi)容和精髓,則根本不曾記住過(guò)。薄弱的數(shù)學(xué)功底導(dǎo)致了他們?cè)趯W(xué)完微積分、概率論后接觸統(tǒng)計(jì)學(xué)課程時(shí)無(wú)法理解統(tǒng)計(jì)學(xué)里的基本知識(shí),甚至大數(shù)定律、中心極限定理這些最基本的統(tǒng)計(jì)知識(shí)他們都無(wú)法理解其深意。

(三)學(xué)生以考試及格為目標(biāo),重理論輕實(shí)踐

統(tǒng)計(jì)學(xué)考試方式為理論考試,無(wú)上機(jī)操作考試。雖然教學(xué)大綱中明確要求有一定比例的實(shí)訓(xùn)學(xué)時(shí),只是由于統(tǒng)計(jì)學(xué)課程知識(shí)點(diǎn)繁多,有些老師為講完理論知識(shí),不得已壓縮學(xué)生上機(jī)操作的時(shí)間。而大部分學(xué)生上統(tǒng)計(jì)學(xué)課的目的是為了及格,也不重視統(tǒng)計(jì)軟件的操作,導(dǎo)致通常一學(xué)期的課結(jié)束了,學(xué)生還不會(huì)使用SPSS軟件進(jìn)行聚類分析。造成了學(xué)生處理數(shù)據(jù)的能力非常差,進(jìn)入企業(yè)工作后一定要接受額外培訓(xùn)才能分析數(shù)據(jù),這與企業(yè)所需人才嚴(yán)重脫節(jié)。

(四)教學(xué)方法陳舊,不能采用新型教學(xué)手段

現(xiàn)在的統(tǒng)計(jì)學(xué)課程幾乎還是采用滿堂灌的填鴨式方法教學(xué),老師在課堂上講,學(xué)生在課堂聽(tīng),整堂課下來(lái),老師筋疲力盡,學(xué)生聽(tīng)得味同嚼蠟,有些地方?jīng)]跟上老師節(jié)奏的,后面便再也不去聽(tīng)了,課堂效率低。如今互聯(lián)網(wǎng)時(shí)代,很多新的教學(xué)方法應(yīng)運(yùn)而生,如微課+翻轉(zhuǎn)課堂、對(duì)分課堂等,且這些方法是行之有效的,可以調(diào)動(dòng)學(xué)生學(xué)習(xí)能動(dòng)性。而統(tǒng)計(jì)學(xué)課堂卻沒(méi)有采用這些教學(xué)方法。

(五)統(tǒng)計(jì)學(xué)教材與當(dāng)今大數(shù)據(jù)時(shí)代脫軌

很多高校給學(xué)生上課前選教材時(shí)都會(huì)選國(guó)家級(jí)規(guī)劃教材,希望這些教材能保留統(tǒng)計(jì)學(xué)的精髓知識(shí)的同時(shí),也順應(yīng)當(dāng)今大數(shù)據(jù)時(shí)代的要求,傾向于講述提高學(xué)生數(shù)據(jù)處理能力。只是老師們?cè)谶x教材時(shí)還是會(huì)發(fā)現(xiàn)兩難全。

統(tǒng)計(jì)學(xué)教學(xué)中有很多亟待提高的地方,基于此,統(tǒng)計(jì)學(xué)教學(xué)改革勢(shì)在必行。

二、統(tǒng)計(jì)學(xué)教學(xué)改革措施

大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)學(xué)課程可充分利用時(shí)代給予的“數(shù)據(jù)”紅利,充分發(fā)揮工具的作用,將統(tǒng)計(jì)學(xué)中的方法充分與數(shù)據(jù)結(jié)合,使學(xué)生能自如運(yùn)用統(tǒng)計(jì)學(xué)知識(shí)處理數(shù)據(jù),并挖掘數(shù)據(jù)背后的含義。統(tǒng)計(jì)學(xué)教學(xué)改革可側(cè)重以下幾個(gè)方面:

(一)編制合適的教學(xué)大綱,制定相應(yīng)的教學(xué)時(shí)長(zhǎng)

教學(xué)過(guò)程中一定要分清重點(diǎn),主次分明,不能什么都視為很重要的知識(shí)點(diǎn)。適當(dāng)調(diào)整授課節(jié)奏,重點(diǎn)知識(shí)重點(diǎn)講解,非重點(diǎn)知識(shí)可一語(yǔ)帶過(guò)甚至不講,編制合理的教學(xué)大綱。同時(shí)教學(xué)中注意盡量減少一味的講公式、定理,要針對(duì)性教學(xué),針對(duì)非統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生,可盡量減少講解定理的證明,多講些現(xiàn)實(shí)中定理的應(yīng)用,可穿插案例教學(xué)。講授過(guò)程中慢慢引入統(tǒng)計(jì)工具與技術(shù),力爭(zhēng)理論與實(shí)踐相結(jié)合,以適應(yīng)大數(shù)據(jù)時(shí)代分析數(shù)據(jù)的需要。另外,可制定合適的教學(xué)時(shí)長(zhǎng),32學(xué)時(shí)只是入門(mén)級(jí)教學(xué),可根據(jù)學(xué)生的專業(yè)適當(dāng)延長(zhǎng)學(xué)時(shí)。

(二)重視上機(jī)操作,提高實(shí)踐操作的重要性

大部分非統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生上統(tǒng)計(jì)學(xué)課是因?yàn)楸匦蓿瑸榱诵迣W(xué)分而上這門(mén)課。本著及格即萬(wàn)歲的小算盤(pán),課堂上玩手機(jī)睡覺(jué),平時(shí)得過(guò)且過(guò),考前學(xué)習(xí)一下老師畫(huà)的重點(diǎn)題,一學(xué)期輕松飄過(guò)。為讓學(xué)生真正掌握統(tǒng)計(jì)方法,成為新時(shí)代需要的人才,可提高上機(jī)操作占學(xué)生成績(jī)的比重,增加實(shí)訓(xùn)課時(shí),并給學(xué)生分配任務(wù),學(xué)會(huì)用主成分分析處理哪些問(wèn)題,學(xué)會(huì)SPSS中的哪些統(tǒng)計(jì)方法。每次實(shí)訓(xùn)課結(jié)束前,要求學(xué)生上機(jī)演練一遍得出結(jié)果方能下課。且上機(jī)操作的表現(xiàn)可折合成平時(shí)成績(jī),作為學(xué)生總成績(jī)的一部分;或者期末考試前會(huì)有一次上機(jī)操作考試,分?jǐn)?shù)作為總評(píng)成績(jī)的一部分。大數(shù)據(jù)時(shí)代,學(xué)生們一定要有使用簡(jiǎn)單的基礎(chǔ)軟件對(duì)數(shù)據(jù)處理的能力。而能力的培養(yǎng),除了學(xué)生本身的興趣外,還要從制定相應(yīng)的制度強(qiáng)制學(xué)生樹(shù)立自我培養(yǎng)的意識(shí)開(kāi)始。

(三)注重案例分析,注重實(shí)用性,鼓勵(lì)學(xué)生參與課題或比賽

統(tǒng)計(jì)方法的學(xué)習(xí)是為了以后更好地應(yīng)用。為了增加學(xué)生學(xué)習(xí)的能動(dòng)性,教學(xué)中可以通過(guò)案例分析的方法,將現(xiàn)實(shí)中實(shí)際問(wèn)題和數(shù)據(jù)作為分析對(duì)象,并考慮現(xiàn)實(shí)背景,教授學(xué)生采用何種統(tǒng)計(jì)方法能更好解決問(wèn)題。這種方法不僅能幫助學(xué)生長(zhǎng)見(jiàn)識(shí),拓寬視野,更能讓學(xué)生切實(shí)感受到什么叫學(xué)以致用,感受到為未來(lái)進(jìn)入職場(chǎng)積淀知識(shí),力爭(zhēng)成為大數(shù)據(jù)時(shí)代的綜合性人才的重要性。

同時(shí)也可鼓勵(lì)學(xué)生申請(qǐng)或參加課題,培養(yǎng)發(fā)現(xiàn)現(xiàn)實(shí)問(wèn)題、采用統(tǒng)計(jì)方法分析問(wèn)題和解決問(wèn)題的綜合能力,一個(gè)課題從開(kāi)始申請(qǐng)到順利結(jié)項(xiàng),絕不單單只靠幾個(gè)分析方法就能解決的,它是對(duì)一個(gè)人或團(tuán)隊(duì)綜合能力的考驗(yàn),涉及到撰寫(xiě)文案的功底、將現(xiàn)實(shí)問(wèn)題去粗取精后凝練成模型的能力,以及解決問(wèn)題所采用方法的準(zhǔn)確把握的能力等,整個(gè)過(guò)程需要有計(jì)劃的進(jìn)行,方能有條不紊的將課題完成。

目前,很多高校提供了培養(yǎng)學(xué)生創(chuàng)新創(chuàng)業(yè)能力的比賽,還有全國(guó)數(shù)學(xué)建模比賽等,這些平臺(tái)和機(jī)會(huì)都可以幫助學(xué)生,他們用自身所學(xué)的理論和上機(jī)操作知識(shí),緊隨新時(shí)展,采用先進(jìn)的數(shù)據(jù)分析方法,鍛煉解決問(wèn)題的能力。同時(shí)這些實(shí)踐經(jīng)驗(yàn)反過(guò)來(lái)正作用于課堂教學(xué),提高學(xué)生學(xué)習(xí)興趣,使學(xué)生更加有側(cè)重點(diǎn)地學(xué)習(xí)。

(四)采用翻轉(zhuǎn)課堂、對(duì)分課堂等新型教學(xué)方法

經(jīng)驗(yàn)告訴我們,滿堂灌的授課方式效果真的不是多好,激發(fā)學(xué)生興趣,提高學(xué)生學(xué)習(xí)的能動(dòng)性是關(guān)鍵。大數(shù)據(jù)時(shí)代,可以借助互聯(lián)網(wǎng)信息技術(shù)新方法,利用翻轉(zhuǎn)課堂、對(duì)分課堂等新的教學(xué)方法,提供平臺(tái)和教學(xué)資源,讓學(xué)生自主學(xué)習(xí),之后可分組討論所學(xué)知識(shí),對(duì)于不清楚的可自行搜索或者上課討論,課后總結(jié),這樣線上線下教學(xué)的方式,使學(xué)生主動(dòng)掌握學(xué)習(xí)節(jié)奏,增強(qiáng)師生之間的互動(dòng)性。

(五)選擇適合學(xué)生的統(tǒng)計(jì)學(xué)教材

如今市面上的教材數(shù)不勝數(shù),如何選擇合適的教材讓教學(xué)工作者頗為頭疼。對(duì)非統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生,可選擇應(yīng)用性強(qiáng)的近三年教材,側(cè)重案例解析和上機(jī)操作的,盡量少一些定理、公式的證明,更多的側(cè)重于應(yīng)用,這樣有利于讓學(xué)生感受到理論知識(shí)的實(shí)際應(yīng)用,培養(yǎng)創(chuàng)造性思維。

三、結(jié)語(yǔ)

統(tǒng)計(jì)學(xué)教學(xué)改革不是一蹴而就的,需要老師和學(xué)生的共同努力。本文基于當(dāng)前統(tǒng)計(jì)學(xué)課程教學(xué)中普遍存在的問(wèn)題,探討了統(tǒng)計(jì)學(xué)課程教學(xué)改革的措施,如授課內(nèi)容、考核方式等,從而提高教學(xué)效果,提高學(xué)生處理數(shù)據(jù)的能力。

參考文獻(xiàn): 

[1]胡云霞.大數(shù)據(jù)背景下統(tǒng)計(jì)學(xué)教學(xué)改革與創(chuàng)新研究[J].現(xiàn)代商貿(mào)工業(yè),2018,29(35).

[2]章政.大數(shù)據(jù)背景下經(jīng)管類專業(yè)統(tǒng)計(jì)學(xué)課程教學(xué)改革研究[J].創(chuàng)新創(chuàng)業(yè)理論研究與實(shí)踐,2019(24). 

第7篇:數(shù)學(xué)建模大數(shù)據(jù)處理方法范文

〔關(guān)鍵詞〕大數(shù)據(jù);情報(bào)學(xué);研究方法;非結(jié)構(gòu)化數(shù)據(jù)

〔中圖分類號(hào)〕g250.2〔文獻(xiàn)標(biāo)識(shí)碼〕a〔文章編號(hào)〕1008-0821(2013)08-0058-03

大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法透過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理,并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。

隨著云時(shí)代的來(lái)臨,大數(shù)據(jù)(big data)也吸引了越來(lái)越多的關(guān)注?!吨婆_(tái)》的分析師團(tuán)隊(duì)認(rèn)為,大數(shù)據(jù)(big data)通常用來(lái)形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫(kù)用于分析時(shí)會(huì)花費(fèi)過(guò)多時(shí)間和金錢(qián)。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要像mapreduce一樣的框架來(lái)向數(shù)十、數(shù)百甚至數(shù)千的電腦分配工作[1]。所以大數(shù)據(jù)時(shí)代對(duì)于各個(gè)學(xué)科的要求都提高了很多,對(duì)于情報(bào)學(xué)專業(yè)而言,大數(shù)據(jù)時(shí)代同樣帶來(lái)了很多挑戰(zhàn)和機(jī)遇。

1大數(shù)據(jù)時(shí)代情報(bào)學(xué)面臨的挑戰(zhàn)

進(jìn)入2012年之后,“大數(shù)據(jù)”一詞被越來(lái)越多的人所提及,它用來(lái)描述信息大爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),時(shí)至今日“大數(shù)據(jù)”的研究?jī)r(jià)值已經(jīng)可以和黃金相媲美。所謂“大數(shù)據(jù)”顧名思義,首先是數(shù)據(jù)量要大,但是并不是數(shù)據(jù)量大的數(shù)據(jù)都可以稱之為大數(shù)據(jù),ibm公司大數(shù)據(jù)的特點(diǎn)是4個(gè)v:volume(大量)、velocity(高速)、variety(多樣)及veracity(真實(shí)),它提供了在新的和正在出現(xiàn)的數(shù)據(jù)和內(nèi)容中洞悉事物的機(jī)會(huì),使業(yè)務(wù)更加靈活,并回答以往沒(méi)有考慮到的問(wèn)題[2]。gartner公司的報(bào)告也提出,大數(shù)據(jù)是大容量、高速和多樣化的信息資產(chǎn),它們需要新的處理方式,以提高決策能力、洞察力和流程優(yōu)化[3]。

在筆者看來(lái),“大數(shù)據(jù)”還應(yīng)該加入一個(gè)特點(diǎn)就是海量資料之間的關(guān)聯(lián)程度。如果有一批更新速度極快的多樣真實(shí)的大量數(shù)據(jù),將這批數(shù)據(jù)看作一個(gè)整體,每個(gè)單獨(dú)的數(shù)據(jù)看作是整體的一個(gè)組成部分,這些組成部分之間毫不相關(guān),數(shù)據(jù)彼此很孤立,數(shù)據(jù)間的關(guān)系不清晰很難捉摸,看上去并不像一個(gè)整體,相反地更像是一盤(pán)散沙。這種零散的海量數(shù)據(jù)之間的關(guān)系斷裂,其關(guān)聯(lián)程度很低,也就導(dǎo)致其含金量減少,不能形成所謂的“大數(shù)據(jù)”。

由此可見(jiàn),大數(shù)據(jù)時(shí)代的背后其實(shí)有更加深刻的理念,同時(shí)這些理念也為情報(bào)工作者帶來(lái)了新的挑戰(zhàn)。

(1)大數(shù)據(jù)時(shí)代從字面上理解只是進(jìn)入了一個(gè)海量數(shù)據(jù)時(shí)代,而實(shí)際上大數(shù)據(jù)時(shí)代更深刻的理念在于它帶領(lǐng)我們進(jìn)入了數(shù)據(jù)分析時(shí)代,數(shù)據(jù)的分析隨著大數(shù)據(jù)時(shí)代進(jìn)入了一個(gè)前所未有的黃金時(shí)期,如何從海量數(shù)據(jù)中獲取有用的信息成為情報(bào)工作者面臨的新挑戰(zhàn)。

(2)大數(shù)據(jù)時(shí)代的另一個(gè)特點(diǎn)就是其多樣性。進(jìn)入大數(shù)據(jù)時(shí)代之后,數(shù)據(jù)的種類除了包括一部分結(jié)構(gòu)化的數(shù)據(jù)以外,還包括很多非結(jié)構(gòu)化的數(shù)據(jù),例如文本、音頻、視頻等很多形式的數(shù)據(jù)。情報(bào)工作者要挖掘的某些規(guī)律可能隱含在各種形式的數(shù)據(jù)中,而同一種形式的數(shù)據(jù)又有可能含有很多規(guī)律,如此一來(lái),大數(shù)據(jù)時(shí)代就要求情報(bào)工作人員的統(tǒng)籌兼顧,不能漏過(guò)任何一種類型的數(shù)據(jù)。

(3)大數(shù)據(jù)時(shí)代不僅僅是數(shù)據(jù)量的巨大,其最主要的特點(diǎn)還有velocity(高速),這一特點(diǎn)就迫使情報(bào)工作人員必須打破以往的人工分析的工作模式,計(jì)算機(jī)智能分析將成為未來(lái)大數(shù)據(jù)時(shí)代數(shù)據(jù)分析的主流技術(shù)。

在大數(shù)據(jù)時(shí)代中,要求將情報(bào)學(xué)和其他各個(gè)學(xué)科相結(jié)合,在其他學(xué)科的各個(gè)領(lǐng)域內(nèi)應(yīng)用情報(bào)學(xué)的知識(shí)對(duì)海量的數(shù)據(jù)進(jìn)行分析研究,并將各個(gè)學(xué)科領(lǐng)域內(nèi)的研究都?xì)w為情報(bào)學(xué)的一個(gè)組成部分加以建設(shè),情報(bào)學(xué)自身的優(yōu)勢(shì)何在,劣勢(shì)何在,如何把握大數(shù)據(jù)時(shí)代這一機(jī)會(huì)進(jìn)一步進(jìn)行學(xué)科的完善,是我們應(yīng)該思考的問(wèn)題。

2情報(bào)學(xué)在大數(shù)據(jù)時(shí)代的發(fā)展趨勢(shì)

大數(shù)據(jù)時(shí)代的變革將會(huì)引領(lǐng)情報(bào)學(xué)進(jìn)入一個(gè)嶄新的發(fā)展階段,英國(guó)萊斯特大學(xué)的markphythian教授在2008年發(fā)表了題為“intelligence analysis today and tomorrow”的報(bào)告中指出[4]:①獲知情境是非常重要的。忽略戰(zhàn)略環(huán)境、領(lǐng)導(dǎo)作風(fēng)和心

因素等更廣泛的問(wèn)題,都會(huì)引起情報(bào)研究的失誤;②加強(qiáng)信息之間的關(guān)聯(lián)。美國(guó)政府內(nèi)部信息共享的障礙,分析人員無(wú)法獲得足夠的信息,以支持分析活動(dòng),導(dǎo)致情報(bào)研究預(yù)測(cè)失敗;③要學(xué)習(xí)更多外部的專業(yè)知識(shí)。這一舉措雖然不能保證分析的成功性,但將是競(jìng)爭(zhēng)分析的重要信息來(lái)源。

在大數(shù)據(jù)時(shí)代背景下,通過(guò)對(duì)國(guó)內(nèi)外學(xué)者和專家的研究成果的研究,筆者認(rèn)為情報(bào)學(xué)未來(lái)發(fā)展的三方面趨勢(shì):①情報(bào)學(xué)將會(huì)從原來(lái)的單一學(xué)科的研究轉(zhuǎn)變?yōu)槎鄬W(xué)科交叉結(jié)合研究;②情報(bào)學(xué)研究中數(shù)據(jù)的采集和獲取范圍將會(huì)從單一的結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變?yōu)榧尤敫嗟姆墙Y(jié)構(gòu)化數(shù)據(jù);③情報(bào)學(xué)的分析方法將會(huì)從原來(lái)的人工分析為主體轉(zhuǎn)變?yōu)橛?jì)算機(jī)智能化為主體的智能分析。

2.1單一學(xué)科的研究轉(zhuǎn)變?yōu)槎鄬W(xué)科交叉結(jié)合研究

情報(bào)學(xué)是信息大爆炸時(shí)代的新興學(xué)科,而面對(duì)大數(shù)據(jù)時(shí)代,信息量不但巨大而且更新速度極快,傳統(tǒng)的情報(bào)學(xué)研究方法已經(jīng)不能滿足大數(shù)據(jù)時(shí)代人們對(duì)于信息處理的需求,傳統(tǒng)的情報(bào)學(xué)更多的是處理結(jié)構(gòu)化的數(shù)據(jù),而大數(shù)據(jù)時(shí)代給我們帶來(lái)更多非結(jié)構(gòu)化的數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)的處理不是基于數(shù)學(xué)和邏輯運(yùn)算,而主要是基于對(duì)內(nèi)容含義的理解和語(yǔ)義分析,包括各種形式的分類、檢索、信息抽取和內(nèi)容匹配等方法。傳統(tǒng)數(shù)據(jù)庫(kù)技術(shù),例如sql語(yǔ)言在設(shè)計(jì)之初僅考慮了結(jié)構(gòu)化數(shù)據(jù),在海量非結(jié)構(gòu)化數(shù)據(jù)中已然無(wú)用武之地。

未來(lái)情報(bào)學(xué)在發(fā)展中應(yīng)該汲取各個(gè)領(lǐng)域的不同學(xué)科的方法和優(yōu)勢(shì),開(kāi)創(chuàng)更多新型的研究方法來(lái)應(yīng)對(duì)“大數(shù)據(jù)”的處理問(wèn)題,而在非結(jié)構(gòu)化數(shù)據(jù)的包裝下其數(shù)據(jù)的本源是什么,數(shù)據(jù)的含義何在,這些問(wèn)題在以后的情報(bào)學(xué)研究中就需要涉及到本體論的相關(guān)應(yīng)用來(lái)解決。為了順應(yīng)大數(shù)據(jù)時(shí)代的需要,面對(duì)高速產(chǎn)生的繁雜的海量數(shù)據(jù),本體思想無(wú)疑是解決內(nèi)容含義和語(yǔ)義分析最有力的武器。  此外,對(duì)于很多企業(yè)的數(shù)據(jù)資源,情報(bào)學(xué)這一學(xué)科需要研究的除了用戶的行為挖掘之外,還要運(yùn)用很多其他學(xué)科的知識(shí)進(jìn)行輔助分析,例如心理學(xué)的相關(guān)理論已經(jīng)逐步被引用到情報(bào)學(xué)領(lǐng)域,并起到輔助數(shù)據(jù)分析的作用,而情報(bào)學(xué)反過(guò)來(lái)在應(yīng)用其他專業(yè)知識(shí)的同時(shí)也可以為其他專業(yè)提供新的思維和引導(dǎo)。如此一來(lái),多學(xué)科交叉將會(huì)增多,多學(xué)科交叉研究將會(huì)成為未來(lái)情報(bào)學(xué)以及其他學(xué)科為順應(yīng)大數(shù)據(jù)時(shí)代的一個(gè)發(fā)展方向。

2.2情報(bào)學(xué)研究中數(shù)據(jù)的采集和獲取范圍將會(huì)從單一的結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變?yōu)榧尤敫嗟姆墙Y(jié)構(gòu)化數(shù)據(jù)不同信息源可以從不同角度揭示問(wèn)題,如專利、研究出版物、技術(shù)報(bào)告等,可以較為直觀地反映研究者對(duì)某科技問(wèn)題的理解與描述,而評(píng)論文章、科技新聞、市場(chǎng)調(diào)查等,可以反映出社會(huì)對(duì)該科技的觀點(diǎn)、認(rèn)知情況[5]。

在大數(shù)據(jù)時(shí)代,情報(bào)學(xué)這一學(xué)科需要研究的數(shù)據(jù)量更大,數(shù)據(jù)類型更多,很多在別人看來(lái)是無(wú)用的數(shù)據(jù),在情報(bào)學(xué)看來(lái)它們可能是最有價(jià)值的資源,情報(bào)學(xué)在大數(shù)據(jù)時(shí)代更多的要學(xué)會(huì)“撿垃圾”,在海量資源中獲取數(shù)據(jù)的同時(shí)不能忽略任何一個(gè)可以找到信息情報(bào)的數(shù)據(jù),可能某一數(shù)據(jù)表面看來(lái)毫無(wú)用處,但是當(dāng)這個(gè)數(shù)據(jù)和其他數(shù)據(jù)整合在一起后就有可能是打開(kāi)整個(gè)數(shù)據(jù)挖掘大門(mén)的金鑰匙。

雖然情報(bào)學(xué)的很多研究方法在處理非結(jié)構(gòu)化數(shù)據(jù)方面不是強(qiáng)項(xiàng),比如情報(bào)學(xué)的一些分析方法,在處理圖像信息和影音信息方面顯得后勁不足,但是在研究中同樣不能忽略這些資源,這也對(duì)情報(bào)工作者技術(shù)方面提出了更高的要求,開(kāi)發(fā)新技術(shù),更好的對(duì)數(shù)據(jù)進(jìn)行分析將是情報(bào)學(xué)未來(lái)面對(duì)的難題。而為了得到更優(yōu)質(zhì)的研究結(jié)果,從單一結(jié)構(gòu)化數(shù)據(jù)的采集和獲取轉(zhuǎn)變?yōu)榧尤敫嗟姆墙Y(jié)構(gòu)化數(shù)據(jù)將會(huì)是情報(bào)學(xué)研究的必然趨勢(shì)。

2.3情報(bào)學(xué)的分析方法將會(huì)從原來(lái)的人工分析為主體轉(zhuǎn)變?yōu)橛?jì)算機(jī)智能化為主體的智能分析正如美國(guó)國(guó)家科學(xué)基金會(huì)(nsf)的報(bào)告[6]所說(shuō),美國(guó)在科學(xué)和工程領(lǐng)域的領(lǐng)先地位將越來(lái)越取決于利用數(shù)字化科學(xué)數(shù)據(jù)以及借助復(fù)雜的數(shù)據(jù)挖掘、集成、分析與可視化工具將其轉(zhuǎn)換為信息和知識(shí)的能力。

由于非結(jié)構(gòu)化的數(shù)據(jù)的大量引入,情報(bào)學(xué)不可避免的將面對(duì)一場(chǎng)技術(shù)上的革命,而傳統(tǒng)的人工分析不僅浪費(fèi)人力資源,而且根本無(wú)法適應(yīng)高速產(chǎn)生的數(shù)據(jù)群。開(kāi)發(fā)計(jì)算機(jī)智能分析技術(shù)勢(shì)在必行,在技術(shù)上,計(jì)算機(jī)智能化分析將會(huì)以更快的速度解決不斷增長(zhǎng)的海量數(shù)據(jù),達(dá)到節(jié)約時(shí)間提高效率的作用。從數(shù)據(jù)類型方面,很多數(shù)據(jù)并不是傳統(tǒng)人工方法可以完成的,例如分析視頻和音頻,這就需要新技術(shù)的支持,未來(lái)如果不開(kāi)發(fā)計(jì)算

機(jī)智能化新技術(shù),將會(huì)導(dǎo)致很多視頻和音頻數(shù)據(jù)不得不被放棄掉。

計(jì)算機(jī)智能化新技術(shù)可以解放更多的人力去做更有價(jià)值的研究,同時(shí)也是大數(shù)據(jù)時(shí)代進(jìn)行高速數(shù)據(jù)處理,高速數(shù)據(jù)挖掘的需要。未來(lái)情報(bào)學(xué)中計(jì)算機(jī)智能分析模型的建立將會(huì)對(duì)情報(bào)工作者提出更多的要求,情報(bào)工作者除了有數(shù)據(jù)分析和挖掘的能力之外,還應(yīng)該具有數(shù)學(xué)邏輯思維來(lái)輔助計(jì)算機(jī)智能化模型的建立,傳統(tǒng)的人工分析為主體的分析方法,必然會(huì)被計(jì)算機(jī)智能化分析方法所取代,這不僅是大數(shù)據(jù)時(shí)代的要求,也是當(dāng)今社會(huì)發(fā)展的必然趨勢(shì)。

3大數(shù)據(jù)時(shí)代情報(bào)學(xué)的機(jī)遇

狄更斯曾經(jīng)說(shuō)過(guò)“機(jī)會(huì)不會(huì)上門(mén)來(lái)找,只有人去找機(jī)會(huì)?!倍髷?shù)據(jù)時(shí)代的來(lái)臨,無(wú)疑是為情報(bào)學(xué)的學(xué)科發(fā)展創(chuàng)造了契機(jī)。情報(bào)學(xué)還是一個(gè)比較年輕的學(xué)科,大數(shù)據(jù)時(shí)代的到來(lái)也顯示出情報(bào)學(xué)的“年輕”之處,如何將情報(bào)學(xué)進(jìn)行完善,如何讓情報(bào)學(xué)走向成熟,這都將會(huì)在大數(shù)據(jù)時(shí)代中找到解決的機(jī)遇。

3.1完善學(xué)科技術(shù)和方法

美國(guó)mckinsey global institute在2011年5月了研究報(bào)告“大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿領(lǐng)域”[7]。報(bào)告分6個(gè)部分,其中第二部分討論了大數(shù)據(jù)技術(shù),并圍繞大數(shù)據(jù)分析技術(shù)、大數(shù)據(jù)技術(shù)和可視化三方面進(jìn)行了闡述。在大數(shù)據(jù)分析技術(shù)中,列舉了26項(xiàng)適用于眾多行業(yè)的分析技術(shù),包括a/b測(cè)試、關(guān)聯(lián)規(guī)則學(xué)習(xí)、分類、聚類分析、眾包、數(shù)據(jù)融合和數(shù)據(jù)集成、數(shù)據(jù)挖掘、集成學(xué)習(xí)、遺傳算法、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、神經(jīng)網(wǎng)絡(luò)、網(wǎng)絡(luò)分析、優(yōu)化、模式識(shí)別、預(yù)測(cè)建模、回歸、情感分析、信號(hào)處理、空間分析、統(tǒng)計(jì)、監(jiān)督學(xué)習(xí)、模擬、時(shí)間序列分析、無(wú)監(jiān)督學(xué)習(xí)和可視化[8]。

大數(shù)據(jù)時(shí)代,無(wú)論是數(shù)據(jù)量還是數(shù)據(jù)類型,都要求情報(bào)學(xué)這一學(xué)科對(duì)于自身的技術(shù)和研究方法進(jìn)行一次變革和完善,以往的技術(shù)不能解決的問(wèn)題,在大數(shù)據(jù)時(shí)代的今天將會(huì)得到解決;以往的方法不能研究的問(wèn)題,在大數(shù)據(jù)時(shí)代也將得到研究,這也是技術(shù)和方法的升華。大數(shù)據(jù)時(shí)代的到來(lái),可以為情報(bào)學(xué)這一學(xué)科提供更強(qiáng)有力的數(shù)據(jù)處理分析工具和方法。

數(shù)據(jù)分析雖然是情報(bào)學(xué)的研究?jī)?nèi)容,但是大數(shù)據(jù)時(shí)代的契機(jī)下更多的人才進(jìn)入這個(gè)領(lǐng)域,這樣就使數(shù)據(jù)分析方法汲取百家之長(zhǎng),從各個(gè)方面得到了完善和發(fā)展。同時(shí)情報(bào)學(xué)在完善技術(shù)和方法的同時(shí)也將會(huì)開(kāi)創(chuàng)更多的新技術(shù),為將來(lái)更多的研究做鋪墊,情報(bào)學(xué)專業(yè)將會(huì)在大數(shù)據(jù)時(shí)代逐步走向成熟。

3.2情報(bào)學(xué)將會(huì)更加受到重視

很多人曾經(jīng)認(rèn)為沒(méi)有必要設(shè)置情報(bào)學(xué)專業(yè),甚至網(wǎng)絡(luò)中有人將情報(bào)學(xué)列入20個(gè)無(wú)用的專業(yè)之一。但是在大數(shù)據(jù)時(shí)代,任何一個(gè)行業(yè)想在海量數(shù)據(jù)中進(jìn)行“淘金”,都需要情報(bào)工作人員的介入,事實(shí)驗(yàn)證情報(bào)學(xué)的一些比較成熟的研究方法是其他專業(yè)不能比擬的,在情報(bào)學(xué)對(duì)數(shù)據(jù)挖掘的能力面前,曾經(jīng)看著無(wú)用的垃圾信息將會(huì)是揭示某種規(guī)律的關(guān)鍵性信息。

情報(bào)學(xué)專業(yè)在大數(shù)據(jù)時(shí)代應(yīng)該抓住機(jī)遇展現(xiàn)自身的優(yōu)勢(shì),順應(yīng)潮流發(fā)展,讓更多的人看到情報(bào)學(xué)專業(yè)的閃光點(diǎn),進(jìn)一步對(duì)學(xué)科建設(shè)進(jìn)行完善,使情報(bào)學(xué)充分的與數(shù)學(xué)、經(jīng)濟(jì)學(xué)、心理學(xué)等其他學(xué)科結(jié)合起來(lái),從而使情報(bào)學(xué)更為成熟,成為數(shù)據(jù)挖掘和數(shù)據(jù)分析中的領(lǐng)頭羊。

3.3情報(bào)學(xué)人才的培養(yǎng)

情報(bào)學(xué)未來(lái)開(kāi)發(fā)新技術(shù),研究新方法無(wú)疑是需要更多的人才培養(yǎng),這就需要更多跨專業(yè)人才進(jìn)入情報(bào)學(xué),在招收情報(bào)學(xué)方面人才時(shí)應(yīng)該更加注重人才在學(xué)科中的交叉,不同學(xué)科人才的思維方式不同,不同學(xué)科人才的專長(zhǎng)不同,不同學(xué)科人才所了解的研究方法也是多種多樣。未來(lái)情報(bào)學(xué)要抓住大數(shù)據(jù)時(shí)代的契機(jī),對(duì)各類人才進(jìn)行吸收,從而使情報(bào)技術(shù)更為完善,使研究方法更為廣泛。同時(shí)現(xiàn)有的情報(bào)工作者也要注重自身的培養(yǎng),與時(shí)俱進(jìn),多涉及一些其他領(lǐng)域的知識(shí),使自身的研究領(lǐng)域得到更好的完善。  4結(jié)論

綜上所述,大數(shù)據(jù)時(shí)代為情報(bào)學(xué)帶來(lái)了很多難題,也帶來(lái)了很多技術(shù)和方法上的困難,但與此同時(shí),大數(shù)據(jù)時(shí)代也為情報(bào)學(xué)帶來(lái)了更多的發(fā)展,機(jī)遇。本文從大數(shù)據(jù)時(shí)代背景下情報(bào)學(xué)發(fā)展趨勢(shì)和面對(duì)機(jī)遇方面出發(fā),為情報(bào)學(xué)未來(lái)發(fā)展提出了建議,希望可以為以后的研究者提供些幫助。

參考文獻(xiàn)

[1]http:∥baike.baidu.com/view/6954399.htm[eb].2013,(1).

[2]what is big data[eb/ol].http:∥www-01.ibm.com/software/data/bigdata/,2013-01-16.

[3]big data in little new zealand[

eb/ol].http:∥techday.co.nz/itbrief/news/big-data-in-little-new-zealand/24518/,2013-01-16.

[4]intelligence analysis today and tomorrow[j].securitychallenges,2009,5(1):67-83.

[5]alan l.porter,scottw.cunninghan.tech mining exploiting new technologies for competitive advantage[m].john wiley & sons,2005.

[6]nsfs cyberinfrastructure vision for 21st century discovery[eb/ol].http:∥nsf.gov/od/oci/civ5.pdf,2013-01-16.

第8篇:數(shù)學(xué)建模大數(shù)據(jù)處理方法范文

關(guān)鍵詞: 應(yīng)用型本科院校 概率統(tǒng)計(jì) 數(shù)學(xué)研究

概率統(tǒng)計(jì)的理論和方法廣泛地應(yīng)用于工業(yè)、國(guó)防、國(guó)民經(jīng)濟(jì)、科學(xué)技術(shù),以及人文科學(xué)等領(lǐng)域而使其成為最重要和最活躍的應(yīng)用數(shù)學(xué)學(xué)科之一,是高等院校和高職院校很多專業(yè)的一門(mén)重要的基礎(chǔ)數(shù)學(xué)課程。它不僅是各專業(yè)處理各種信息的一種有力工具,也是許多后續(xù)專業(yè)課程的基礎(chǔ),而且是全國(guó)碩士研究生入學(xué)數(shù)學(xué)考試的一個(gè)重要組成部分。它是大學(xué)生首次遇到的一門(mén)研究不確定現(xiàn)象的科學(xué),處理問(wèn)題的思想方法與學(xué)生已學(xué)過(guò)的其他數(shù)學(xué)課程有很大的差異。因此學(xué)生在學(xué)習(xí)過(guò)程中需要改變以往數(shù)學(xué)的思考方式,這也是概率統(tǒng)計(jì)一直是學(xué)生認(rèn)為比較困難的課程的主要原因。如何讓學(xué)生接受這種差異,學(xué)會(huì)有效地應(yīng)用概率統(tǒng)計(jì)這個(gè)有力的數(shù)據(jù)(信息)處理工具,已是迫切要解決的問(wèn)題。實(shí)質(zhì)上概率論與數(shù)理統(tǒng)計(jì)是數(shù)學(xué)學(xué)科中與現(xiàn)實(shí)生活聯(lián)系得最為緊密的一門(mén)課程,只要教學(xué)方法適當(dāng),是很容易把它講得生動(dòng)有趣。在此,我根據(jù)自己的學(xué)習(xí)和教學(xué)經(jīng)驗(yàn),從以下幾個(gè)方面提出一些建議。

1.將數(shù)學(xué)史及實(shí)際案例融入概率統(tǒng)計(jì)課程

任何一門(mén)課程,了解它的發(fā)展史對(duì)于學(xué)習(xí)和掌握該課程的思想方法都有著深刻的意義。所以,我們?cè)凇案怕收撆c數(shù)理統(tǒng)計(jì)”課程的教學(xué)過(guò)程中很注意向?qū)W生介紹這方面的內(nèi)容。作為一門(mén)年輕的數(shù)學(xué)分支課程,概率論與數(shù)理統(tǒng)計(jì)的歷史不算久遠(yuǎn),但也經(jīng)歷了很多曲折的階段,才形成了今天相對(duì)完整和獨(dú)立的學(xué)科。概率論起源于博弈問(wèn)題。在教學(xué)過(guò)程中,我們特別注意這些知識(shí)背景的補(bǔ)充介紹,一方面讓學(xué)生了解前后知識(shí)的聯(lián)系,同時(shí)也在無(wú)形之中向他們灌輸了研究問(wèn)題的思想方法。對(duì)概率統(tǒng)計(jì)發(fā)展史的了解,不僅豐富了學(xué)生的數(shù)學(xué)史知識(shí),更重要的是了解這些知識(shí)使他們能更好地理解課程內(nèi)容之間的內(nèi)在聯(lián)系,學(xué)習(xí)的時(shí)候不再孤立地看待這些知識(shí)點(diǎn),從而對(duì)概率統(tǒng)計(jì)知識(shí)有一個(gè)整體的認(rèn)識(shí)。

教師在講解概率的計(jì)算時(shí)可引進(jìn)概率理論起源的一些經(jīng)典案例,如在講解數(shù)學(xué)期望時(shí)引用“合理分配賭本問(wèn)題”案例;同時(shí)引用與經(jīng)濟(jì)生活貼近的案例,如:庫(kù)存與收益問(wèn)題、有關(guān)彩票中獎(jiǎng)率問(wèn)題。將實(shí)際案例恰當(dāng)?shù)匾虢虒W(xué)不僅可以將理論與實(shí)際聯(lián)系起來(lái),使學(xué)生在課堂上就能接觸到大量的實(shí)際問(wèn)題,而且對(duì)提高學(xué)生綜合分析和解決實(shí)際問(wèn)題的能力大有幫助。通過(guò)案例教學(xué)可以促進(jìn)學(xué)生全面看問(wèn)題,從數(shù)量的角度分析事物的變化規(guī)律,使概率論與數(shù)理統(tǒng)計(jì)的思想和方法在現(xiàn)實(shí)經(jīng)濟(jì)生活中得到更好的應(yīng)用,發(fā)揮其應(yīng)有的作用。

2.突出抓主線化繁為簡(jiǎn)的原則

對(duì)工科專業(yè)的學(xué)生,并不需要詳細(xì)掌握定理的證明和計(jì)算過(guò)程,在概率統(tǒng)計(jì)的教學(xué)中只需要求學(xué)生掌握概率統(tǒng)計(jì)的主要概念、基本定理,以及常用的數(shù)理統(tǒng)計(jì)的思想和方法即可。應(yīng)將主要精力放在培養(yǎng)學(xué)生運(yùn)用概率論思想和數(shù)理統(tǒng)計(jì)方法解決實(shí)際問(wèn)題的能力上。因此課程的教學(xué)原則是,抓住主線,即抓主要概念、理論思想和方法,講清楚最簡(jiǎn)單、最基本的知識(shí)和原理,說(shuō)明知識(shí)拓展延伸的思路和方法,對(duì)復(fù)雜的定理證明和繁瑣的計(jì)算過(guò)程可不講或只做簡(jiǎn)單介紹。如概率統(tǒng)計(jì)的精華是分布函數(shù)、數(shù)字特征、統(tǒng)計(jì)特征、統(tǒng)計(jì)量,這些一定要講透。

3.重視數(shù)理統(tǒng)計(jì)教學(xué)

概率統(tǒng)計(jì)課程的中心任務(wù)是揭示隨即現(xiàn)象的統(tǒng)計(jì)規(guī)律性及內(nèi)在聯(lián)系。數(shù)理統(tǒng)計(jì)是概率統(tǒng)計(jì)課程中的重要部分,學(xué)生對(duì)這部分內(nèi)容的掌握直接影響解決實(shí)際問(wèn)題的能力。因此如何增強(qiáng)工科學(xué)生對(duì)數(shù)理統(tǒng)計(jì)思想方法的理解與應(yīng)用已成為教學(xué)的一個(gè)重要的課題。傳統(tǒng)的教學(xué)中只重視公式的推導(dǎo)、計(jì)算能力的訓(xùn)練,忽略了對(duì)統(tǒng)計(jì)思想的講授,很多學(xué)生學(xué)完概率統(tǒng)計(jì)課程后只知道照書(shū)上公式計(jì)算而不知道所以然,更談不上統(tǒng)計(jì)方法的應(yīng)用了。統(tǒng)計(jì)學(xué)是討論不確切推理的科學(xué)和藝術(shù),邏輯思維的形式是演繹和歸納,歸納方法作為科學(xué)方法的基礎(chǔ),如效能與毀傷的問(wèn)題,必須抽樣;對(duì)于教科書(shū)中出現(xiàn)的大量的統(tǒng)計(jì)計(jì)算均可由軟件實(shí)現(xiàn),實(shí)際工作中需要統(tǒng)計(jì)處理的數(shù)據(jù)也大多由軟件完成。因此,如何培養(yǎng)學(xué)生用數(shù)理統(tǒng)計(jì)思想建模,相應(yīng)地成了現(xiàn)代數(shù)理統(tǒng)計(jì)教學(xué)工作的重點(diǎn)。在授課過(guò)程中,若條件允許,則可以適當(dāng)安排一些統(tǒng)計(jì)軟件的上機(jī)實(shí)驗(yàn)幫助學(xué)生理解和使用統(tǒng)計(jì)軟件。

4.適度引入多媒體教學(xué)及數(shù)據(jù)處理軟件,促進(jìn)課堂教學(xué)手段多樣化

在概率統(tǒng)計(jì)教學(xué)中,實(shí)際題目信息及文字很多,“一支粉筆、一塊黑板,以講授為主”的傳統(tǒng)教學(xué)方法顯然已經(jīng)跟不上現(xiàn)代化的教學(xué)要求,不利于培養(yǎng)學(xué)生的綜合素質(zhì)和創(chuàng)新能力。因此,有必要借助于現(xiàn)代化媒體技術(shù)和統(tǒng)計(jì)軟件,制作內(nèi)容、圖形、聲音、圖像等結(jié)合起來(lái)的多媒體課件。一方面,采用多媒體教學(xué)手段進(jìn)行輔助教學(xué),能夠?qū)⒔處煆暮芏嘀貜?fù)性的勞動(dòng)中解脫出來(lái),教師可以將更多的精力和時(shí)間投入到如何分析和解決問(wèn)題,以提高課堂效率,與學(xué)生有效地進(jìn)行課堂交流。另一方面,用圖形動(dòng)畫(huà)和模擬實(shí)驗(yàn)等多媒體作為輔助教學(xué)手段,便于學(xué)生對(duì)概念、圖形等的理解。如投幣試驗(yàn)、高爾頓板釘實(shí)驗(yàn)等小動(dòng)畫(huà)在不占用太多課堂時(shí)間的同時(shí),又增添了課堂的趣味性。又如在利用Mathematica軟件演示大數(shù)定律和中心極限定理時(shí),就能將抽象的定理轉(zhuǎn)化為形象的直觀認(rèn)識(shí),達(dá)到一定的教學(xué)效果。在處理概率統(tǒng)計(jì)問(wèn)題中,教師也會(huì)面對(duì)大量的數(shù)據(jù)。另外,集數(shù)學(xué)計(jì)算、處理與分析為一身的數(shù)據(jù)處理軟件如:Excel,Matlab,Mathematic,SAS,SPSS等,在計(jì)算一些冗長(zhǎng)數(shù)據(jù)時(shí)可以簡(jiǎn)化計(jì)算,降低理論難度。而且,在教師的演示過(guò)程中,能讓學(xué)生初步了解如何應(yīng)用計(jì)算機(jī)及軟件,將所學(xué)的知識(shí)用于解決生產(chǎn)生活中的實(shí)際問(wèn)題,從而激發(fā)他們學(xué)習(xí)概率知識(shí)的熱情,提高他們應(yīng)用計(jì)算機(jī)解決問(wèn)題的能力。

以上幾點(diǎn),有些在我的教學(xué)過(guò)程中已采用,有些還只是我的想法,還有很多不全面的地方有待在今后的教學(xué)中不斷完善。

參考文獻(xiàn):

[1]徐群芳.(概率論與數(shù)理統(tǒng)計(jì))課程教學(xué)的探索與實(shí)踐[J].大學(xué)數(shù)學(xué),2010,26(1):10-13.

[2]沈恒范.概率論與數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2003.

第9篇:數(shù)學(xué)建模大數(shù)據(jù)處理方法范文

大數(shù)據(jù)、人工智能是近幾年炙手可熱的詞匯,但是,你是否想過(guò),如果將兩者結(jié)合起來(lái)會(huì)產(chǎn)生哪些意想不到的魔力呢?在國(guó)內(nèi)互聯(lián)網(wǎng)市場(chǎng)獨(dú)占搜索鰲頭的百度公司,正在嘗試將兩者結(jié)合成新的源動(dòng)力,來(lái)推動(dòng)更多行業(yè)的快速發(fā)展。

在各種020服務(wù)層出不窮、360行裂變?yōu)?600行的今天,用戶對(duì)服務(wù)的需求也迅速增長(zhǎng)。誰(shuí)能夠更好地滿足他們,顯然就可以獲得市場(chǎng)先機(jī)。

百度現(xiàn)在正努力地索引著真實(shí)世界。通過(guò)對(duì)真實(shí)世界的索引,把海量數(shù)據(jù)沉淀下來(lái),成為百度大數(shù)據(jù)的基礎(chǔ)和重要組成部分。百度通過(guò)大數(shù)據(jù)連接3600行,打通線上和線下,把線上和線下的數(shù)據(jù)融合起來(lái),產(chǎn)生核聚變,進(jìn)而迸發(fā)出新的能量,讓大數(shù)據(jù)成為3600行的商業(yè)新能源。

大數(shù)據(jù)重新定義資產(chǎn)

谷歌執(zhí)行董事長(zhǎng)艾瑞克·施密特曾經(jīng)說(shuō)過(guò),現(xiàn)在全球每?jī)商焖鶆?chuàng)造的數(shù)據(jù)量等于從人類文明至2003年間產(chǎn)生的數(shù)據(jù)量的總和。互聯(lián)網(wǎng)用戶產(chǎn)生的數(shù)據(jù)包括語(yǔ)音、圖像和視頻,同時(shí)應(yīng)用于物聯(lián)網(wǎng)、智能監(jiān)控等領(lǐng)域的各種智能設(shè)備產(chǎn)生的數(shù)據(jù)更是漫無(wú)邊際、浩如煙海。而海量數(shù)據(jù)的危機(jī)并不單純是數(shù)據(jù)量的爆炸性增長(zhǎng),它還牽涉到數(shù)據(jù)類型的改變。原來(lái)的數(shù)據(jù)都可以用二維表結(jié)構(gòu)存儲(chǔ)在數(shù)據(jù)庫(kù)中,如常用的Excel軟件所處理的數(shù)據(jù),稱之為結(jié)構(gòu)化數(shù)據(jù)。但現(xiàn)在由于互聯(lián)網(wǎng)多媒體應(yīng)用的出現(xiàn),使諸如圖片、聲音和視頻等非結(jié)構(gòu)化數(shù)據(jù)占到了很大比重。而產(chǎn)生智慧的大數(shù)據(jù),往往是這些非結(jié)構(gòu)化數(shù)據(jù),能否在短時(shí)間內(nèi)把數(shù)據(jù)處理好決定了數(shù)據(jù)的價(jià)值,這就需要新的技術(shù)突破,使數(shù)據(jù)成為最有價(jià)值的資產(chǎn)。

數(shù)據(jù)的采集、處理和應(yīng)用的過(guò)程可以影響新的數(shù)據(jù)的產(chǎn)生,從而形成反饋。百度的反饋過(guò)程是一個(gè)正向反饋,使系統(tǒng)更有效率。百度大數(shù)據(jù)將與行業(yè)數(shù)據(jù)深度融合,最終幫助行業(yè)內(nèi)企業(yè)能夠?qū)崿F(xiàn)數(shù)據(jù)的閉環(huán)。

以020為例,通過(guò)目前相關(guān)的軟件和技術(shù),百度可以對(duì)每一家門(mén)店的顧客信息進(jìn)行深度挖掘,幫助門(mén)店了解用戶群體,實(shí)施精準(zhǔn)營(yíng)銷,實(shí)現(xiàn)精細(xì)化運(yùn)營(yíng)。而通過(guò)精細(xì)化運(yùn)營(yíng)可以讓商家獲得更多的客流和流水。同時(shí)更多的客流和流水形成新的數(shù)據(jù),又被百度采集,使正向循環(huán)越變?cè)胶?,越?lái)越高效,這是大數(shù)據(jù)發(fā)揮價(jià)值最為關(guān)鍵的地方。

“百度大數(shù)據(jù)十”是百度面向各行業(yè)開(kāi)發(fā)大數(shù)據(jù)的平臺(tái),包括數(shù)據(jù)融合、洞察用戶、智能模型和匹配能力,同時(shí)基于數(shù)據(jù)融合對(duì)群體用戶進(jìn)行立體畫(huà)像描繪,對(duì)線上線下用戶行為分析,對(duì)從“多屏”到“跨屏”的用戶進(jìn)行識(shí)別。百度有決策模型、推薦模型和綠色模型,此外,百度還開(kāi)發(fā)了七個(gè)服務(wù)模塊,包括了行業(yè)洞察、營(yíng)銷決策、客群分析、輿情監(jiān)控、店鋪分析、推薦引擎以及數(shù)據(jù)加油站。百度數(shù)據(jù)已在零售、020、旅游、金融、保險(xiǎn)、房地產(chǎn)等方面與商家深入合作,并取得了可喜的成果。

大數(shù)據(jù)助力零售業(yè)

線下零售業(yè)面臨電商競(jìng)爭(zhēng)挑戰(zhàn)壓力非常大。線下零售業(yè)如何利用互聯(lián)網(wǎng)和新的技術(shù)贏得新的競(jìng)爭(zhēng)優(yōu)勢(shì),已成為業(yè)界關(guān)心的話題。線下零售業(yè)競(jìng)爭(zhēng)最關(guān)鍵的核心是看誰(shuí)能提供最好的用戶綜合體驗(yàn)。誰(shuí)的體驗(yàn)好,誰(shuí)就能贏得先機(jī)。

過(guò)去傳統(tǒng)零售業(yè)與百度合作,是希望通過(guò)百度的搜索和“鳳巢”推廣,把線上的用戶導(dǎo)流到線下,使之也變成他們的客戶,這是單向?qū)Я?。而百度大?shù)據(jù)可以對(duì)用戶有更全面、更深入地了解,百度能夠更好地了解這些用戶的特性,更好地識(shí)別用戶的需求,從而幫助線下企業(yè)為用戶提供個(gè)性化營(yíng)銷方案或個(gè)性化服務(wù)。

不久前,百度和北京朝陽(yáng)大悅城在大數(shù)據(jù)方面展開(kāi)了合作。在充分保障用戶隱私和安全的前提下,把百度海量的線上數(shù)據(jù)和朝陽(yáng)大悅城線下多年積累的數(shù)據(jù)結(jié)合在一起,從而更好地洞悉用戶的需求?;诖祟惔髷?shù)據(jù),百度和朝陽(yáng)大悅城制訂了一些更有針對(duì)性、更精準(zhǔn)的推廣計(jì)劃。這種個(gè)性化的推廣計(jì)劃在很大程度上提升了朝陽(yáng)大悅城的銷售量,其會(huì)員銷售額提高了12%,未購(gòu)買(mǎi)品牌推薦轉(zhuǎn)化率提升了五倍,非活躍會(huì)員到場(chǎng)消費(fèi)率提高了53%。這只是雙方合作的第一期,僅是在推廣服務(wù)方面進(jìn)行的合作。下一階段,雙方還將通過(guò)百度糯米和朝陽(yáng)大悅城的合作,實(shí)現(xiàn)線上和線下服務(wù)的打通,將大數(shù)據(jù)的威力再提高一個(gè)層次。

大數(shù)據(jù)助力互聯(lián)網(wǎng)金融

互聯(lián)網(wǎng)金融是現(xiàn)在熱門(mén)的話題。金融行業(yè)希望能夠得到互聯(lián)網(wǎng)公司的大數(shù)據(jù),也希望能夠得到互聯(lián)網(wǎng)公司的技術(shù)支持。他們希望通過(guò)此類結(jié)合實(shí)現(xiàn)“彎道超車”,能把中國(guó)的金融業(yè)提高到一個(gè)新層次。把線上的海量數(shù)據(jù)和線下的金融數(shù)據(jù)結(jié)合在一起,這將對(duì)基金選股、風(fēng)險(xiǎn)控制、信用評(píng)估有很大的幫助。

過(guò)去金融行業(yè)的分析師在做決策的時(shí)候,一般從幾十甚至幾百個(gè)維度來(lái)作判斷。當(dāng)有了互聯(lián)網(wǎng)大數(shù)據(jù)之后,分析師已能夠非常準(zhǔn)確地監(jiān)控上萬(wàn)個(gè)緯度的數(shù)據(jù)。而且不僅根據(jù)這上萬(wàn)個(gè)緯度的數(shù)據(jù)來(lái)做決策,還能夠?qū)崟r(shí)監(jiān)控?cái)?shù)據(jù)的變化,對(duì)這些變化知其然,且還可知其所以然。

百度和國(guó)金證券已在大數(shù)據(jù)合作方面做了非常有意義的嘗試。百度將線上和線下的數(shù)據(jù)結(jié)合在一起,通過(guò)對(duì)這些海量數(shù)據(jù)進(jìn)行復(fù)雜計(jì)算,挑選出20多個(gè)有效的互聯(lián)網(wǎng)因子,并用這些因子建立數(shù)學(xué)模型,助力選股和買(mǎi)賣(mài)決策。基于上述大數(shù)據(jù)的合作,國(guó)金證券金融產(chǎn)品的年化收益提升了5%一8%,信息比率IR提升了0.6-0.9,最大回撤降低了3%-5%。有了大數(shù)據(jù)的強(qiáng)大技術(shù)支持,分析師在股票與基金的選擇上,實(shí)現(xiàn)了更大的收益,更好地控制了風(fēng)險(xiǎn)。未來(lái)百度將和國(guó)金證券進(jìn)行新的嘗試,共同建立一個(gè)新的量化基金。希望通過(guò)這種創(chuàng)新和嘗試,幫助互聯(lián)網(wǎng)金融企業(yè)找到更加可行的發(fā)展道路。

除了基金,互聯(lián)網(wǎng)金融另一個(gè)重要領(lǐng)域是保險(xiǎn)業(yè)。保險(xiǎn)公司每降低一個(gè)百分點(diǎn)的風(fēng)險(xiǎn),就意味著比競(jìng)爭(zhēng)對(duì)手有更大的優(yōu)勢(shì)。百度已經(jīng)與新華保險(xiǎn)、安盛天平在大數(shù)據(jù)方面開(kāi)展了合作。百度利用保險(xiǎn)公司多年積累的線下數(shù)據(jù),圈定了一大批低賠付人群樣本,將這些人群的線上線下數(shù)據(jù)融合并進(jìn)行建模,通過(guò)人工智能算法,挖掘出這些人的特征。百度在6億網(wǎng)民中通過(guò)海量計(jì)算,將具有相同特征的人篩選出來(lái),從而發(fā)現(xiàn)更多的低賠付人群,其準(zhǔn)確率超過(guò)85%。百度希望在這些嘗試之后,能夠?qū)⑦@些技術(shù)進(jìn)行廣泛地推廣。

人工智能重新定義效率

最近幾年,計(jì)算機(jī)在語(yǔ)音、圖象和自然語(yǔ)音的理解上取得了很大突破。由通過(guò)鼠標(biāo)、鍵盤(pán)與計(jì)算機(jī)交互的方式,正在向通過(guò)與計(jì)算機(jī)對(duì)話、圖像識(shí)別等方式改變。這些方式都在增加用戶與互聯(lián)網(wǎng)交互的頻率,這將大幅度提升人機(jī)交流的效率。

人工智能目前的學(xué)習(xí)能力較弱,推理能力還無(wú)法與人腦相提并論。但在此領(lǐng)域,只要給予研發(fā)人員足夠的時(shí)間和數(shù)據(jù),即可使人工智能的學(xué)習(xí)和推理能力超越人類。幾年前,計(jì)算機(jī)戰(zhàn)勝國(guó)際象棋大師的例子充分說(shuō)明了這一點(diǎn)。

目前,正是人工智能發(fā)展的良好時(shí)機(jī)。一方面,有海量數(shù)據(jù)提供模型學(xué)習(xí),數(shù)據(jù)越多特征就越多,模型就能判斷更精準(zhǔn);另一方面,深度學(xué)習(xí)技術(shù)也在快速地發(fā)展,類似人腦神經(jīng)一樣去分析解釋數(shù)據(jù)的技術(shù)已日漸成熟,未來(lái)將出現(xiàn)類似人腦的智能。人工智能的應(yīng)用基礎(chǔ)是大數(shù)據(jù),用戶量越大所產(chǎn)生的數(shù)據(jù)就越多,模型就愈加優(yōu)化,人工智能的智能性就越強(qiáng),將更符合人類的思維習(xí)慣。例如用戶在使用搜索引擎若無(wú)法獲得所希望的信息時(shí),就需自己想辦法換一種搜索方法。但是通過(guò)人工智能技術(shù),機(jī)器人已經(jīng)能夠記住用戶上一次與機(jī)器人對(duì)話的內(nèi)容,并且能夠理解用戶的意圖,隨后根據(jù)用戶的提問(wèn)進(jìn)行交互。百度的“度秘”就是通過(guò)大數(shù)據(jù)和人工智能理解人的語(yǔ)言,實(shí)現(xiàn)多輪交互。

深度學(xué)習(xí)與大數(shù)據(jù)結(jié)合

深度學(xué)習(xí)有多層次的結(jié)構(gòu),能夠從眾多數(shù)據(jù)中將所需要的信息充分挖掘出來(lái),正是深度學(xué)習(xí)與大數(shù)據(jù)的結(jié)合形成了此次人工智能潮浪的巨大推動(dòng)力。

百度投入巨大的資源用于百度大腦的PADDLE深度學(xué)習(xí)平臺(tái)的開(kāi)發(fā),其可以支持百度各類海量數(shù)據(jù)并能夠靈活地推出各種不同的深度學(xué)習(xí)模型的結(jié)構(gòu),在網(wǎng)頁(yè)搜索、廣告排序、數(shù)據(jù)中心管理、百度殺毒等方面已得到了廣泛應(yīng)用。

在百度看來(lái),機(jī)器的感知能力正在超越人類水平。在語(yǔ)音方面,人的識(shí)別錯(cuò)誤率是8%,而百度能將機(jī)器的識(shí)別錯(cuò)誤率控制在6%以內(nèi);在人臉識(shí)別方面,百度的錯(cuò)誤率只有0.23%,低于人類識(shí)別的錯(cuò)誤率。

無(wú)論是人臉識(shí)別還是圖像文字識(shí)別技術(shù),百度都通過(guò)APIStore開(kāi)放出來(lái)。百度端到端的機(jī)器翻譯能力使得百度對(duì)機(jī)器翻譯質(zhì)量有了極大地提升。端到端的學(xué)習(xí)模式拋棄了人為的硬性分解和人為的特征構(gòu)造,通過(guò)一個(gè)完整的模型直接進(jìn)行學(xué)習(xí)。這樣的模式已應(yīng)用于語(yǔ)音識(shí)別、圖像識(shí)別、機(jī)器翻譯中并已取得成功。百度提出將傳統(tǒng)人工智能中不同的分支,例如圖像識(shí)別、語(yǔ)言理解和語(yǔ)言生成等緊密結(jié)合在一起,形成統(tǒng)一的神經(jīng)元網(wǎng)絡(luò),讓機(jī)器人像兒童學(xué)習(xí)知識(shí)一樣,方便用戶在未來(lái)可像教兒童學(xué)習(xí)一樣地教機(jī)器人。

人工智能正在形成良性循環(huán),更多的數(shù)據(jù)、更好的產(chǎn)品、更強(qiáng)的智能正在構(gòu)建組合成一個(gè)閉環(huán),伴隨人工智能使用者不斷地增多,機(jī)器將變得越來(lái)越聰明。

目前人工智還存在很多問(wèn)題,主要包括:缺少小數(shù)據(jù)的學(xué)習(xí)能力,即通過(guò)少量關(guān)鍵數(shù)據(jù)來(lái)實(shí)現(xiàn)深度學(xué)習(xí);不能通過(guò)自主探索環(huán)境來(lái)學(xué)習(xí);缺少通過(guò)與人交流進(jìn)行學(xué)習(xí)的能力。

深度學(xué)習(xí)在語(yǔ)音合成中的技術(shù)創(chuàng)新

百度在智能語(yǔ)音技術(shù)上的成果是LSTM聲學(xué)模型,LSTM即長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)模型也就是模擬人腦。該算法優(yōu)勢(shì)明顯,其一是長(zhǎng)時(shí)間的軌跡記憶和瞬態(tài)記憶的統(tǒng)一;其二是模擬人腦選擇性遺忘;其三是更精準(zhǔn)的軌跡建模。百度的技術(shù)創(chuàng)新就是混合多層結(jié)構(gòu)來(lái)解決海量數(shù)據(jù)訓(xùn)練的效率和穩(wěn)定性問(wèn)題。

每個(gè)人的說(shuō)話方式各有不同,所帶來(lái)的問(wèn)題就是某些語(yǔ)句識(shí)別率不高,傳統(tǒng)技術(shù)很難解決這個(gè)問(wèn)題。百度為此推出了聲學(xué)模型自適模式,為每個(gè)人推出個(gè)性化模型,將識(shí)別錯(cuò)誤率下降到10%-15%。

百度語(yǔ)音開(kāi)放平臺(tái)可為智能手機(jī)提供語(yǔ)音拍照,駕駛助手,語(yǔ)音助手等功能;為電視廠商提供語(yǔ)音搜索和語(yǔ)音指令功能;提供領(lǐng)先的車載解決方案,優(yōu)化車機(jī)設(shè)備的抗噪性能;為智能設(shè)備廠商提供語(yǔ)音技術(shù)支持;為智能手表提供語(yǔ)音輸入和語(yǔ)音搜索功能。