公務員期刊網(wǎng) 論文中心 正文

中文科技期刊語義出版態(tài)勢淺析

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了中文科技期刊語義出版態(tài)勢淺析范文,希望能給你帶來靈感和參考,敬請閱讀。

中文科技期刊語義出版態(tài)勢淺析

[摘要]為促進中文科技期刊語義出版的發(fā)展,探討其可行性發(fā)展路徑,以文獻分析、綜合調(diào)查、態(tài)勢分析等方法研究語義技術應用于中國科技期刊的發(fā)展機遇、優(yōu)勢、外部威脅和劣勢。在國家政策層面、技術層面、社會需求層面,語義出版應用于中文科技期刊均具有良好的發(fā)展機遇。語義技術的應用可實現(xiàn)中文科技期刊信息平臺的智能化,提升其受眾黏性,保障中文科技期刊質(zhì)量控制,但也存在語義出版意識欠缺,語義出版技術人才匱乏等內(nèi)部劣勢,并且政府引導與資助有限,專業(yè)化期刊集群平臺建設緩慢,存在一定的市場推廣阻力??梢酝ㄟ^拓展投融資渠道,建立刊企合作研發(fā)與發(fā)展模式,支持科技期刊專業(yè)化集群,建立優(yōu)勝劣汰的退出機制,加快相關技術人才培養(yǎng),制訂戰(zhàn)略性人才管理機制等措施來應對語義技術應用于科技期刊的劣勢與風險。

[關鍵詞]語義出版;中文科技期刊;態(tài)勢

1語義技術應用于中文科技期刊的發(fā)展機遇

1.1國家政策層面

近年來,國家先后出臺了一些政策,積極支持數(shù)字出版產(chǎn)業(yè)的發(fā)展,推進出版融合。語義出版作為數(shù)字出版的高級形態(tài),也越來越受到關注。2011年,《新聞出版業(yè)“十二五”時期發(fā)展規(guī)劃》,在推動“十二五”時期新聞出版業(yè)發(fā)展的主要措施中將語義分析技術作為重點支持研發(fā)的內(nèi)容之一。2012年,新聞出版總署了《關于加快我國數(shù)字出版產(chǎn)業(yè)發(fā)展的若干意見》,積極鼓勵研發(fā)數(shù)字出版核心技術,鼓勵出版方式的多樣化,推動出版?zhèn)鞑ゼ夹g升級換代。2018年11月,中央審議通過《關于深化改革培育世界一流科技期刊的意見》,并于2019年8月印發(fā),其中將抓住數(shù)字化、智能化促進期刊變革的機遇,“建設科技期刊論文大數(shù)據(jù)中心”作為一項重要任務。國家也設立了專項資金資助新聞出版業(yè)的數(shù)字化轉(zhuǎn)型升級,如在《關于開展2014年度文化產(chǎn)業(yè)發(fā)展專項資金新聞出版業(yè)數(shù)字化轉(zhuǎn)型升級項目申報工作的說明》中指出“支持部分專業(yè)出版企業(yè)按服務領域劃分、聯(lián)合開展專業(yè)數(shù)字內(nèi)容資源知識服務模式探索。包括:開展知識挖掘、語義分析等知識服務領域關鍵技術的應用?!?017年9月,國家新聞出版廣電總局的《新聞出版廣播影視“十三五”發(fā)展規(guī)劃》中提出,“推動設立國家出版融合發(fā)展投資引導資金,帶動社會資本積極參加傳統(tǒng)出版與新興出版融合發(fā)展?!辈⒃O立出版融合發(fā)展課題研究專項資金和出版融合發(fā)展項目引導資金。這些政策為我國科技期刊的語義出版提供了強有力的支持,為語義出版指明了發(fā)展方向和實施路徑。“十二五”期間,各地推動文化產(chǎn)業(yè)轉(zhuǎn)型升級,建立了很多數(shù)字出版基地或園區(qū),其中國家級數(shù)字出版基地14個,極大地提高了數(shù)字出版產(chǎn)業(yè)的發(fā)展速度[6]。2016年,國家新聞出版廣電總局出臺《關于加快新聞出版業(yè)實驗室建設的指導意見》,確定了20家出版融合發(fā)展重點實驗室[7]。數(shù)字出版基地與出版融合發(fā)展實驗室的建立為科技與出版的深度融合中瓶頸問題的解決提供了有力支撐,為語義出版提供了良好的發(fā)展空間。

1.2技術層面

隨著相關技術的迅速發(fā)展,語義出版的內(nèi)容越來越豐富,為“無縫交流”創(chuàng)造了可能。一些基于語義出版數(shù)據(jù)集的應用系統(tǒng)被逐步開發(fā)出來,如SemanticLancet(2014年愛思唯爾出版集團)、SciGraph(2017年由Springer-Nature集團)、SciKG(2017年清華大學)等。數(shù)據(jù)加工處理方法和工具的普及使得出版物的語義越來越簡單化,技術門檻的降低為中文科技期刊的語義出版普及帶來了可能[8]。在數(shù)據(jù)的結(jié)構化標準方面,中華醫(yī)學會雜志社參考國外期刊的經(jīng)驗,制定出適合中文科技期刊的中華醫(yī)學會期刊論文標簽集(CMAJATS)[4]。目前,國際上有的期刊已經(jīng)做到了多種類型的數(shù)據(jù)融合,如提供文章唯一標志符DOI和超鏈接;文本術語的語義標記,與相關第三方信息資源的鏈接;交互式數(shù)字;可重新排序的參考列表;包含研究摘要、標簽云和引文分析的文件摘要;包含了表和圖中數(shù)據(jù)的可下載的電子表格[1]。從Aries系統(tǒng)公司的集成元文獻智能的可支持論文出版決策的系統(tǒng),到Elsevier在期刊信息采集與搜索領域的全部期刊及圖書資源支持文本與數(shù)據(jù)挖掘,再到Taylor&Francis與UNSILO合作致力于期刊內(nèi)容的語義,語義技術在整個出版流程中的融入,對于我國中文科技期刊的語義出版均極具參考價值[9]。國內(nèi)的一些科技公司也在語義技術的應用方面進行積極探索,如科大訊飛、百度等。目前,訊飛的核心語音業(yè)務正在向語音識別、語義識別、自然語言處理方向演進。2014年起,科大訊飛基于深度學習算法,啟動了針對人工智能的重大攻關項目“訊飛超腦計劃”[10]。語義技術在其他領域的成功應用對于中文科技期刊的語義出版具有一定的借鑒意義。

1.3社會需求層面

1.3.1響應凈化學術環(huán)境的吁求

近年來,隨著網(wǎng)絡數(shù)據(jù)庫資源的日益豐富,科技信息的獲取越來越便利,而科技期刊版權保護力度普遍較弱[9],科技論文學術不端現(xiàn)象日益嚴重。數(shù)字出版的迅速發(fā)展使得科技期刊的影響面越來越廣,學術不端事件的曝光率增大,導致近來國際上頻現(xiàn)學術不端事件,學術道德也受到了前所未有的重視。中文科技期刊作為我國科技信息交流的重要平臺,在學術環(huán)境的維護中有著舉足輕重的地位。語義技術則為科技期刊對于學術不端的防范提供了一道新屏障。利用語義技術強大的信息挖掘功能,開發(fā)出一套高精度的論文分析系統(tǒng),對論文進行全文檢索和整體分析,防止抄襲及低水平重復,對于科技期刊的發(fā)展和學術環(huán)境的凈化顯得尤為重要。

1.3.2擺脫海量數(shù)字信息的困擾

隨著科技的發(fā)展,我國科技期刊每年發(fā)文量不斷攀升,其中所蘊含的信息量也呈幾何量級地增長,完全靠人力來完成這些信息的分析處理越來越不現(xiàn)實,與此同時科技期刊的審稿工作量也大幅增加。科研人員需要在浩渺的文獻中尋找對自己有用的信息,面臨查詢不全面不準確、成本高、耗時等問題。在傳統(tǒng)的學術信息服務平臺上,其搜索引擎無論是基于網(wǎng)站分類技術還是基于全文檢索技術,用戶在查找在庫文獻的相關信息時,由于所提供的表達模糊、信息孤立、機械化的關鍵字匹配、無法進行知識整合等原因,均需對獲得的一級信息進行二次過濾,難以避免誤查漏查情況的出現(xiàn)。而科技期刊編輯人員所面臨的問題是:在出版前對低水平重復的論文進行有效剔除,降低審稿工作壓力,并確保不遺漏具有創(chuàng)新性的科研成果;在出版后對科技論文所含信息進行有效管理,實現(xiàn)信息的高效利用?;谡Z義技術的科技期刊學術信息平臺可提供一個智能化的檢索方式,實現(xiàn)面向編審人員和科研人員的從稿件編審到到應用的輕松分析處理和充分利用,實現(xiàn)戰(zhàn)略性閱讀,并精準獲取“宏知識”??萍计诳D(zhuǎn)型為信息解決方案的提供方,旨在為用戶提供更好的信息和決策方案[9]。

1.3.3解除經(jīng)濟效益低下的困境

中文科技期刊作為一種特殊的商品,在任何情況下都必須把社會效益放在首位。以社會效益為主的傳統(tǒng)經(jīng)營方式隨著辦刊環(huán)境的變化以及辦刊經(jīng)費的增加,使得一些期刊入不敷出,甚至停刊。實現(xiàn)社會效益和經(jīng)濟效益的雙贏,是維持中文科技期刊的生命力、促進其可持續(xù)發(fā)展的最優(yōu)路徑。語義出版是具有彈性擴展、動態(tài)分配和資源共享等特點的數(shù)字內(nèi)容出版,它催生大量新型出版業(yè)信息服務,帶動出版格局的整體變革。語義技術在科技期刊出版流程中的介入與升級,使得科技信息傳播的專項服務、深度服務、私人訂制成為可能。語義化的中文科技期刊信息服務平臺可以為用戶提供智能化、個性化的科技信息服務,拓寬了其在信息消費市場的服務方式,通過增值服務創(chuàng)造新的商業(yè)機會,增加了盈利空間。如,全球最大的科學與醫(yī)藥信息出版商愛思唯爾,通過整合科技期刊資源和對內(nèi)容產(chǎn)品價值的重新挖掘,其數(shù)字內(nèi)容資源的收入可達每年30億美元[11]。

2語義技術應用于中文科技期刊的內(nèi)部優(yōu)勢

就多數(shù)中文科技期刊來說,目前已基本實現(xiàn)了XML等結(jié)構化處理,這有利于進行文本的語義標注和互動訪問,便于機器理解和獲取其中的數(shù)據(jù)單元,這是應用語義技術的根本和前提,為語義技術的應用創(chuàng)造了條件。同時,語義出版也為中文科技期刊帶來更為優(yōu)良的發(fā)展格局。

2.1實現(xiàn)中文科技期刊信息平臺的智能化

在中文科技期刊信息平臺建設中,運用語義技術將出版內(nèi)容進行智能化加工整合,能夠讓信息的動態(tài)整合和動態(tài)選擇成為可能,科技信息平臺為用戶輸出的產(chǎn)品更加智能化和個性化。利用語義技術,可以將出版對象從論文延伸到原始數(shù)據(jù),將知識組織單位由“文獻”細化到“知識單元”。由于出版內(nèi)容更加結(jié)構化,信息粒度更小,從而更易被計算機理解和自動集成,有利于信息的再利用和按需重組,利于出版內(nèi)容的二次深度開發(fā),實現(xiàn)大規(guī)模個性化信息服務。語義技術的應用可以創(chuàng)新科技期刊的出版形式,實現(xiàn)一次投入多次產(chǎn)出,一種產(chǎn)品多樣化服務,使得科技信息平臺更具友好性,實現(xiàn)信息的結(jié)構化、關聯(lián)化、混合化、可操作化、可視化,先于用戶完成內(nèi)容的理解、分析、綜述、聚合等活動,使得用戶能夠以盡可能少的搜索與整理工作,獲得盡可能多的可用信息。更重要的是,通過信息的智能化加工整合,不僅豐富了傳統(tǒng)中文科技期刊的表現(xiàn)形式,提高了其內(nèi)容的可操作性和交互性,深入挖掘了其內(nèi)容的價值,還增強了不同期刊間、不同文獻間的關聯(lián)度,實現(xiàn)出版內(nèi)容與行業(yè)數(shù)據(jù)跨平臺的互通共享。2.2提升中文科技期刊的受眾黏性將語義技術融入中文科技期刊的數(shù)字出版中,將為用戶帶來全新的知識服務體驗??梢岳谜Z義技術識別和跟蹤用戶的興趣,分析用戶的行為,自動建立用戶偏好庫。通過自動跟蹤偏好庫,用戶即可在浩淼的文獻中方便快捷地得到自己所需的數(shù)據(jù)和信息。通過鏈接至語義相關的文獻,并提供獲取文章內(nèi)數(shù)據(jù)的可行性途徑,實現(xiàn)動態(tài)地獲取和組織內(nèi)容,并主動推送精準的個性化服務。另外,語義技術為中文科技期刊的富媒體出版提供了新路徑,用戶面對的不再僅僅是文字和圖片,還有更豐富和多感官的互動性內(nèi)容展現(xiàn)。這種專業(yè)化、定制化、交互性、高增值性知識服務在為用戶提供較大便利的同時,增加了期刊的受眾黏性,提升了其在信息消費市場的競爭力。

2.3保障中文科技期刊質(zhì)量控制

運用語義技術構建知識版權保護壁壘,確保中文科技期刊的綠色發(fā)展。目前,在論文的審稿階段,中文科技期刊多通過論文重合率的檢測,實現(xiàn)對高重復性文章的初步篩選,防范學術不端行為的出現(xiàn),保證期刊的質(zhì)量。但是一些作者通過各種途徑進行后,對文章的語言敘述稍加調(diào)整,即可通過審核,如:變換同義詞,長短句互換,改變描述方式,打亂句子順序等。隨著語義技術在軟件中應用及逐步成熟,檢測的精確度被提高,真正實現(xiàn)從技術手段方面防范學術不端、減少低水平重復,建立中文科技期刊知識版權的保護壁壘。其原理是基于詞頻統(tǒng)計的方法,此方法引自向量空間的檢索模型,和信息檢索技術相關,是根據(jù)指定規(guī)則,將單詞頻度轉(zhuǎn)化為空間特征向量,最后采取度量向量之間的距離來計算相似度達到的目的[12]。2008年10月的“CNKI期刊學術不端文獻檢測系統(tǒng)”目前已實現(xiàn)了多庫及互聯(lián)網(wǎng)資源的聯(lián)合比對,其檢測原理包含了“語義技術”。

3語義技術應用于中文科技期刊的內(nèi)部劣勢

3.1中文科技期刊語義出版意識欠缺

網(wǎng)絡化和市場化的浪潮為中文科技期刊的發(fā)展帶來了機遇與挑戰(zhàn),大多中文科技期刊都在積極地進行新媒體融合的探索和應用,數(shù)字化出版開始滲透期刊出版的方方面面。但是,由于受發(fā)展思路、體制機制、技術手段、人才資源、經(jīng)營管理模式等因素制約,很多期刊在數(shù)字化進程中處于相對被動的地位,對于語義出版的研究與應用方面更是表現(xiàn)為動力不足。首先是發(fā)展思路方面。目前,中文科技期刊在新媒體融合方面的應用多囿于在線投審稿、開放獲取、DOI標注、搭建集群數(shù)字出版平臺、開通微信公眾號等[13],也有部分中文科技期刊嘗試采用視頻動畫等探索論文可視化發(fā)表[14],語義出版還是一個相對較新的領域,未能進入大多數(shù)中文科技期刊的發(fā)展視野。其次,由于盈利模式尚不成熟,多數(shù)中文科技期刊并未從數(shù)字出版中獲得更多的經(jīng)濟利益,而語義技術的應用尚在逐步發(fā)展中,由于出版理念的落后,未遠瞻到語義出版的優(yōu)勢,鮮有進行語義出版的嘗試。

3.2中文科技期刊語義出版技術人才匱乏

由于中文科技期刊出版與發(fā)行相關機構人員的復雜性及相應的研究發(fā)展起步較晚,編輯隊伍建議滯后,編輯部管理水平落后等原因,該行業(yè)缺乏一支穩(wěn)定的、高質(zhì)量的、專業(yè)的計算機軟件方面研究的隊伍,特別是熟悉編輯業(yè)務、了解語義技術、富有相關系統(tǒng)運作經(jīng)驗的專業(yè)人才十分匱乏。但要進行后期軟件使用的不斷調(diào)適,實現(xiàn)相關軟件系統(tǒng)與出版流程的真正契合,少不了科技期刊管理與編校人員的智力支持。如,在中文科技期刊的語義過程中,需要有專業(yè)的人員進行內(nèi)容碎片化處理,語義標注,語義關聯(lián)等,這些工作需要人員不僅懂專業(yè),還要熟悉語義技術處理方法,對碎片化的資源進行再處理。

4語義技術應用于中文科技期刊的外部威脅

4.1政府引導與資助有限

一方面,現(xiàn)有政策多為針對數(shù)字出版的宏觀指導,針對語義出版的,能夠解決具體的問題的政策相對較少[6];另一方面,語義技術與科技期刊出版的嵌合需要投入較高的成本,然而相關研究資助來源較少。目前,我國科技期刊的發(fā)展多依賴政府的投入,支持資金渠道單一,雖然有專項扶持等政策,也是僧多粥少。在國家和地方的基金項目申報中,新聞學和傳播學基本不在優(yōu)先資助行列,給研究項目申請資助增加了一定難度。

4.2專業(yè)化期刊集群平臺建設緩慢

本體及知識結(jié)構關聯(lián)是以學科為基礎,因此一定規(guī)模的中文科技期刊專業(yè)化集群平臺是語義出版實施的基礎條件。另外,研發(fā)軟件系統(tǒng)的先期投入、后期維護和嵌合會增加辦刊的成本。而專業(yè)化期刊集群既能滿足本體庫構建及語義檢索的要求,又可降低單刊語義出版的成本。由于較多中文科技期刊的主管部門分屬各個高校、科研院所、政府部門或?qū)W會,由于體制原因,改革動力不足,思維鈍化,慣于單兵作戰(zhàn),較難建立起集群。目前,中文科技期刊專業(yè)化集群仍處于初始階段,僅出現(xiàn)少量期刊集群,這些集群中期刊數(shù)量分布不一,而期刊數(shù)量最少的腫瘤科學網(wǎng)僅3種期刊,普遍無法涵蓋學科領域內(nèi)的所有優(yōu)勢刊物。

4.3存在市場推廣阻力

語義技術與出版的融合,可以促進中文科技期刊的發(fā)展,所能帶來的社會效益和經(jīng)濟效益是毋庸置疑的,同時也是一把雙刃劍。鑒于語義技術對于論文相似性檢測的嚴苛性,其對于中文科技期刊稿源的沖擊是必然的,甚至會對一些刊物帶來毀滅性的影響;另外由于資金等方面的限制,其應用很可能僅限于各大中文科技期刊數(shù)據(jù)庫或少數(shù)中文科技期刊出版機構,因此其市場推廣具有一定的難度。

5語義技術應用于中文科技期刊的發(fā)展路徑

5.1拓展投融資渠道,建立刊企合作研發(fā)與發(fā)展模式

語義技術相關軟件系統(tǒng)的開發(fā)和應用,離不開政府的支持和引導??紤]采取“政府參與、刊企合作、產(chǎn)業(yè)推動”的發(fā)展模式,邊研發(fā)邊試點,由易到難逐步有序推進中文科技期刊語義出版的發(fā)展。為了促進中文科技期刊語義出版的發(fā)展,要以政府為主導,做好可持續(xù)的頂層設計和系統(tǒng)規(guī)劃。通過設立專項資金及政策和社會資源適當傾斜,加大對技術研發(fā)平臺的建設,為該項技術的研發(fā)提供信息和技術支持,鼓勵和支持其推廣應用。根據(jù)我國中文科技期刊的網(wǎng)絡發(fā)行現(xiàn)狀,考慮建立以中文科技期刊出版與發(fā)行相關機構為主體的技術研發(fā)體系,充分發(fā)揮政府和產(chǎn)學研機構的協(xié)同作用,通過利益關聯(lián),鼓勵各大網(wǎng)絡科技文獻信息服務商等科技企業(yè)積極參與,切實從社會需要出發(fā),共同進行技術分析和項目研究。積極爭取國家及地方各級財政支持有條件的刊社先行發(fā)展,對已開展語義出版嘗試的刊社進行目標評估與前期扶持,推動設立扶持科技期刊語義出版的專項資金,制定稅收等各項優(yōu)惠政策,吸引社會資金參與中文科技期刊語義出版的發(fā)展。

5.2支持中文科技期刊專業(yè)化集群,建立優(yōu)勝劣汰的退出機制

一方面,充分發(fā)揮已建期刊集群的示范引領作用,從政府層面采取強有力的措施有效整合社會資源,打破傳統(tǒng)出版單位的界限,加強出版單位間的溝通與合作,依托行業(yè)協(xié)會、高校和科研機構建立專業(yè)化期刊集群,實現(xiàn)信息與技術共享,互利共贏,這是實現(xiàn)語義出版的有效路徑。另一方面,應建立一套中文科技期刊的準入退出機制,實行科技期刊動態(tài)監(jiān)管,通過優(yōu)勝劣汰,實現(xiàn)資源的優(yōu)化配置,為普及語義出版創(chuàng)造條件。優(yōu)勝劣汰是市場競爭的必然結(jié)果,中文科技期刊應當順應出版業(yè)的發(fā)展趨勢,適時轉(zhuǎn)變思路,掌握并應用新技術,調(diào)整出版服務模式,積極應對科技的發(fā)展。不進則“退”的競爭壓力會帶動中文科技期刊的主動變革,加快中文科技期刊的規(guī)范化和數(shù)字化發(fā)展。

5.3加快相關技術人才培養(yǎng),制訂戰(zhàn)略性人才管理機制

要實現(xiàn)語義技術融入科技期刊出版流程的方方面面,不僅要具備友好的軟件系統(tǒng),還需要借助多方的人才優(yōu)勢。傳統(tǒng)出版單位要重視涉及語義出版的內(nèi)容生產(chǎn)、研發(fā)、資本運作和經(jīng)營管理等方面各類新型人才的培養(yǎng),在開展專業(yè)技術人才繼續(xù)教育培訓時,考慮適當加入語義出版方面內(nèi)容的介紹,加快專業(yè)技術人才知識更新。隨著相關技術的逐步成熟和完善,有條件的單位可考慮引進相關專業(yè)技術人才,已形成集群的科技期刊則可采取遠程的專業(yè)智力資源共享。另外,應建立有效的評價和激勵機制,鼓勵專業(yè)技術人員樹立專業(yè)自信,積極開展語義出版方面的研究。

6結(jié)語

中文科技期刊作為我國科技信息傳播和交流的重要平臺,承載著促進科技發(fā)展等功能,固步自封既不利于科技信息的快速傳播,也不利于期刊自身的健康發(fā)展。語義出版為中文科技期刊走向可持續(xù)發(fā)展提供了契機。抓住機遇,積極探索,創(chuàng)新中國特色發(fā)展模式,是提升中文科技期刊的國際影響力的可行之路。

作者:聞麗 張揚 謝榮秀 吳彬 單位:中南林業(yè)科技大學期刊社 國家新聞出版署出版融合發(fā)展(武漢)重點實驗室