公務(wù)員期刊網(wǎng) 論文中心 正文

地域文化數(shù)字化保護(hù)和大數(shù)據(jù)應(yīng)用方案

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了地域文化數(shù)字化保護(hù)和大數(shù)據(jù)應(yīng)用方案范文,希望能給你帶來靈感和參考,敬請(qǐng)閱讀。

地域文化數(shù)字化保護(hù)和大數(shù)據(jù)應(yīng)用方案

摘要:地域文化的保護(hù)、傳承、發(fā)展與利用,對(duì)于一個(gè)地區(qū)彰顯地方魅力,提高知名度與美譽(yù)度,發(fā)展地方經(jīng)濟(jì)和旅游文化產(chǎn)業(yè),乃至凝聚人心力量,增加地方軟實(shí)力,都有著十分重要的意義。本文以淮安地域文化的實(shí)踐為例,對(duì)地域文化數(shù)字化保護(hù)和大數(shù)據(jù)應(yīng)用方案進(jìn)行了研究和設(shè)計(jì),闡述了地域文化資源的數(shù)字化手段,分析了地域文化數(shù)據(jù)庫的特點(diǎn),說明了地域文化數(shù)據(jù)庫的大數(shù)據(jù)處理技術(shù),提出了地域文化數(shù)據(jù)庫共建共享和利用的方法機(jī)制。

關(guān)鍵詞:地域文化;地域文化數(shù)字化;地域文化數(shù)據(jù)庫;大數(shù)據(jù)

0引言

中華文化源遠(yuǎn)流長(zhǎng),指出:中華優(yōu)秀傳統(tǒng)文化中很多思想理念和道德規(guī)范,不論過去還是現(xiàn)在,都有其永不褪色的價(jià)值。在新的時(shí)代條件下傳承和弘揚(yáng)中華優(yōu)秀傳統(tǒng)文化,一定要以高度的文化自覺和文化自信推動(dòng)中華優(yōu)秀傳統(tǒng)文化的創(chuàng)造性轉(zhuǎn)化和創(chuàng)新性發(fā)展。地域文化作為中華民族文化不可缺少的一部分,是指一定空間范圍內(nèi)的人們?cè)陂L(zhǎng)期的生產(chǎn)和生活實(shí)踐中逐漸形成的歷史遺存、文化形態(tài)、社會(huì)習(xí)俗、生產(chǎn)生活方式等獨(dú)具特色、積極向上的文化傳統(tǒng),其反映不同地域人群的品格特點(diǎn)及文化內(nèi)涵、審美情趣以及價(jià)值取向等。地域文化的傳承、保護(hù)與發(fā)展,對(duì)于形成良好的地域精神與道德風(fēng)尚具有重要的導(dǎo)向作用,是一個(gè)地區(qū)綜合竟?fàn)幜Φ闹匾w現(xiàn)。然而長(zhǎng)期以來,許多地方對(duì)地域文化的保護(hù)發(fā)展工作重要性的認(rèn)識(shí)還不夠,缺乏應(yīng)時(shí)而上保護(hù)發(fā)展利用地域文化的有效舉措,除公共圖書館之外,其他機(jī)構(gòu)的地域文化數(shù)據(jù)庫建設(shè)基本上沒有開展。因此,設(shè)計(jì)建設(shè)一種地域文化數(shù)字化保護(hù)和有效利用的方案機(jī)制有著極為重要的社會(huì)意義。

1總體方案

地域文化數(shù)字化保護(hù)應(yīng)用平臺(tái)的建設(shè),應(yīng)以數(shù)字化手段實(shí)現(xiàn)地域文化資源永久保存為前提,以充分利用、創(chuàng)造性轉(zhuǎn)化和創(chuàng)新性發(fā)展為目標(biāo),堅(jiān)持開放分享,以多方合作模式構(gòu)建地域文化資源數(shù)據(jù)庫和共享平臺(tái),利用大數(shù)據(jù)技術(shù)保證資源數(shù)量和類型的豐富和無限擴(kuò)容。不同文化機(jī)構(gòu)和用戶,運(yùn)用各種數(shù)字化手段將文化資源加工成數(shù)字化的資源,并利用平臺(tái)搭建的接口處理入庫,實(shí)現(xiàn)對(duì)分散無序、相對(duì)獨(dú)立的資源的類聚、重組和融合。為應(yīng)對(duì)數(shù)據(jù)的海量增長(zhǎng)和因資源使用產(chǎn)生的非結(jié)構(gòu)數(shù)據(jù)對(duì)計(jì)算機(jī)存儲(chǔ)和計(jì)算能力的挑戰(zhàn),必須采用大數(shù)據(jù)技術(shù),通過分布式文件系統(tǒng)和分布式數(shù)據(jù)集市保證存儲(chǔ)的可擴(kuò)展性和數(shù)據(jù)的高可用性,并實(shí)現(xiàn)對(duì)非結(jié)構(gòu)數(shù)據(jù)的有效轉(zhuǎn)換和利用,最終提供統(tǒng)一的數(shù)據(jù)服務(wù)。資源的整合是為了讓廣大用戶發(fā)現(xiàn)資源、利用資源,因此必須以地域文化大數(shù)據(jù)庫為中心構(gòu)建各種軟件,為不同類型的用戶提供信息服務(wù),如資源存儲(chǔ)檢索、旅游公司廣告、文化產(chǎn)品銷售、決策的統(tǒng)計(jì)分析等。

2地域文化資源的數(shù)字化采集

2.1地域文化資源選取原則

淮安作為國家歷史文化名城,坐落于古淮河與京杭大運(yùn)河的交點(diǎn),境內(nèi)有中國第四大淡水湖——洪澤湖,是曾經(jīng)的南船北馬交會(huì)之地,大運(yùn)河沿線四大名都之一,南北文化交融,經(jīng)濟(jì)發(fā)達(dá)、人文昌盛,又是淮揚(yáng)名菜的發(fā)源地,的故鄉(xiāng)……,可謂地域文化內(nèi)涵豐富,獨(dú)具特色。在淮安浩如煙海的地域文化資源中,我們堅(jiān)持以下三條選取原則:(1)它必須是積極向上的文化資源,正所謂去其糟粕,取其精華;(2)它必須具有淮安的歷史淵源和地域特色,有較為深厚的歷史積淀和底蘊(yùn);(3)它要有較為寬泛的覆蓋面和認(rèn)同基礎(chǔ),能得到大多數(shù)淮安人的認(rèn)同。

2.2地域文化資源數(shù)字化手段和分類選擇

綜合運(yùn)用多種手段實(shí)現(xiàn)地域文化資源的數(shù)字化再現(xiàn),包括:圖書文獻(xiàn)掃描加工、全景攝像、虛擬現(xiàn)實(shí)、航拍、3D建模、網(wǎng)絡(luò)爬蟲抓取等先進(jìn)的信息技術(shù)集成,實(shí)現(xiàn)快速、便捷、科學(xué)地加工、分類、整理地域文化資源,極大地?cái)U(kuò)大地域文化的來源渠道,豐富地域文化資源的形態(tài)?;窗驳赜蛭幕姆诸愔饕ǎ海?)水文化(運(yùn)河文化、淮河文化、洪澤湖文化、水利工程、水上交通等);(2)名人名家(政治名人、經(jīng)濟(jì)名人、文化名人等);(3)淮揚(yáng)美食(歷史文化、淮揚(yáng)名菜、烹飪名師、餐飲名店等);(4)民俗風(fēng)情(服飾、住居、節(jié)日、婚姻、喪葬、宗教等);(5)方言文化(清淮方言、淮劇、淮書等);(6)生態(tài)文化(淮安生態(tài)、示范基地、政策文件等)。

3地域文化資源的大數(shù)據(jù)處理

3.1地域文化資源數(shù)據(jù)的特點(diǎn)分析

淮安地域文化極其豐富,要充分保護(hù)和高效利用,其數(shù)字化資源必須作為一種社會(huì)基礎(chǔ)性資源長(zhǎng)期建設(shè)。根據(jù)數(shù)據(jù)的不同來源,地域文化資源庫的數(shù)據(jù)主要分為三大類:一是政府部門或社會(huì)公益組織為了實(shí)現(xiàn)地域文化的數(shù)字化保存和利用,利用各種技術(shù)手段形成數(shù)字化資源之后,按照一定的入庫標(biāo)準(zhǔn),有意識(shí)地將各類文化資源分類匯集而產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù)或有序的數(shù)據(jù),如媒體資源庫、數(shù)字出版庫等,這類數(shù)據(jù)有約定俗成的格式規(guī)范,可以利用關(guān)系數(shù)據(jù)庫將其存儲(chǔ)在預(yù)定義的表格中,也能方便地進(jìn)行查詢和分析。二是從其他數(shù)據(jù)庫接入或從相關(guān)網(wǎng)站搜集下載的數(shù)據(jù)。包括專業(yè)的期刊數(shù)據(jù)庫如知網(wǎng),電子圖書館如超星,其他相關(guān)網(wǎng)站如旅游公司、文化產(chǎn)品公司等,都會(huì)有關(guān)于淮安地域文化的資源,甚至景點(diǎn)的售票、文化產(chǎn)品的銷售數(shù)據(jù)也應(yīng)成為我們關(guān)注的數(shù)據(jù)信息。為了給用戶提供統(tǒng)一的訪問通道,要以“海納百川,有容乃大”的理念,兼收并蓄,利用信息技術(shù)手段實(shí)現(xiàn)資源匯聚。三是基于用戶對(duì)文化資源數(shù)據(jù)庫的訪問行為產(chǎn)生的大量數(shù)據(jù)。搜索、下載、點(diǎn)擊、上傳等用戶行為會(huì)隨機(jī)悄然產(chǎn)生大量的多形態(tài)數(shù)據(jù):視頻、照片、社交媒體評(píng)論、網(wǎng)站評(píng)述、訪問量等,可稱為非結(jié)構(gòu)化數(shù)據(jù)或隨機(jī)數(shù)據(jù)。這些數(shù)據(jù)無法利用傳統(tǒng)的關(guān)系數(shù)據(jù)庫進(jìn)行存儲(chǔ),而某些數(shù)據(jù)又生成速度極快,甚至來不及分析后存儲(chǔ),但這些數(shù)據(jù)對(duì)于分析地域文化的接受度、喜好度,以及文化消費(fèi)特點(diǎn)具有重要價(jià)值。

3.2地域文化數(shù)據(jù)庫大數(shù)據(jù)處理的必要性

上段所述表明,地域文化資源庫的數(shù)據(jù)已經(jīng)具備了大數(shù)據(jù)的特點(diǎn),一是模態(tài)繁多,包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);二是數(shù)據(jù)量大,生成快速,具有很強(qiáng)的時(shí)效性。同時(shí),在互聯(lián)網(wǎng)+時(shí)代,我們要最大限度地發(fā)揮地域文化的價(jià)值,必然需要對(duì)地域文化資源的數(shù)據(jù)庫進(jìn)行深度挖掘分析。對(duì)這些數(shù)據(jù)進(jìn)行挖掘分析的目的在于更全面地了解各種文化資源,發(fā)掘數(shù)據(jù)間的內(nèi)在聯(lián)系,通過分析用戶的線上行為,掌握文化旅游、文化產(chǎn)品、文化活動(dòng)的市場(chǎng)需求,更有針對(duì)性地開發(fā)和創(chuàng)作相關(guān)內(nèi)容、形式的旅游文化產(chǎn)品,以滿足各類消費(fèi)者的需要。這對(duì)于提高文化產(chǎn)業(yè)的生產(chǎn)效率是具有重要意義的。因此為應(yīng)對(duì)地域文化資源對(duì)數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)管理和數(shù)據(jù)分析的挑戰(zhàn),我們必須采用大數(shù)據(jù)技術(shù)。

3.2地域文化資源數(shù)據(jù)庫大數(shù)據(jù)處理技術(shù)的使用

地域文化數(shù)據(jù)庫作為一個(gè)公益的社會(huì)基礎(chǔ)資源平臺(tái),采用開源的技術(shù)工具建設(shè)是最為合適的選擇。Hadoop作為一種成熟的大數(shù)據(jù)開源框架,其可靠性、擴(kuò)展性、高效性和容錯(cuò)能力已得到眾多案例證明。利用Hadoop生態(tài)系統(tǒng)中Sqoop工具,能夠?qū)⒌谌綌?shù)據(jù)高效地導(dǎo)入,實(shí)現(xiàn)結(jié)構(gòu)數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)的快速轉(zhuǎn)換。HDFS和YARN是Hadoop實(shí)現(xiàn)分布式數(shù)據(jù)存儲(chǔ)的組件,使得我們能夠充分利用集群的威力,實(shí)現(xiàn)淮安地域文化數(shù)據(jù)庫的無限擴(kuò)容,并帶來集群在利用率、資源統(tǒng)一管理和數(shù)據(jù)共享方面的巨大優(yōu)勢(shì)。MapReduce編程模型是處理地域文化數(shù)據(jù)庫中大量半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的利器,任何形式的數(shù)據(jù)都可以轉(zhuǎn)換成最終的鍵值對(duì)形式。而Hive和Pig提供了數(shù)據(jù)分析的手段,Hive適合用于對(duì)地域文化數(shù)據(jù)的使用日志的分析,Pig做高級(jí)的數(shù)據(jù)分析處理,比如可以用來發(fā)現(xiàn)地域文化資源數(shù)據(jù)庫中多條數(shù)據(jù)資源之間的深層次聯(lián)系。

4地域文化資源的大數(shù)據(jù)利用

作為一種基礎(chǔ)性資源的淮安地域文化數(shù)據(jù)庫,要發(fā)揮其最大價(jià)值,必須貫徹共建共享的理念。共建是數(shù)據(jù)庫保持持久吸引力的保證,首先要匯聚多方資源,接入或?qū)敫鞣綌?shù)據(jù),讓平臺(tái)成為訪問淮安地域文化的統(tǒng)一入口,然后要集合多方力量參與資源貢獻(xiàn),進(jìn)行資源的持續(xù)更新。共享是數(shù)據(jù)庫建設(shè)的目標(biāo)和動(dòng)力,只有共享才能讓淮安地域文化發(fā)揮其最大價(jià)值,真正發(fā)揚(yáng)光大。共享面向的用戶有三種:一是普通民眾,讓更多的淮安市民了解淮安文化,接受淮安文化,有利于提高城市的凝聚力和文明程度;二是研究淮安地域文化的專家學(xué)者,為其對(duì)資源間聯(lián)系和某個(gè)研究方向的研究現(xiàn)狀進(jìn)行分析提供最全面的資源;三是旅游公司和文化產(chǎn)品企業(yè),他們可以獲得廣告銷售服務(wù),也能根據(jù)平臺(tái)的大數(shù)據(jù)分析并制定更好的銷售策略,設(shè)計(jì)更符合消費(fèi)者需求的產(chǎn)品;四是相關(guān)的政府部門,如旅游局、文化局等,平臺(tái)能為其提供定制的資源存儲(chǔ)空間和訪問接口,更為重要是平臺(tái)的大數(shù)據(jù)分析功能可以為他們提供決策服務(wù)。

參考文獻(xiàn):

[1]姜念云,張松海,謝夏.大數(shù)據(jù)分析技術(shù)在文化資源管理中的應(yīng)用[J].中國基礎(chǔ)科學(xué),2014,16(1):17-20+27.

[2]盧艷艷.基于Hadoop的大數(shù)據(jù)存儲(chǔ)關(guān)鍵技術(shù)研究[D].保定:華北電力大學(xué),2016.

[3]付文靜.基于HBase的大數(shù)據(jù)存儲(chǔ)查詢技術(shù)研究[D].成都:電子科技大學(xué),2015.

作者:安宇 郭艾華 單位:淮安信息職業(yè)技術(shù)學(xué)院

相關(guān)熱門標(biāo)簽