公務員期刊網(wǎng) 論文中心 正文

科技期刊中學術畫像的應用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了科技期刊中學術畫像的應用范文,希望能給你帶來靈感和參考,敬請閱讀。

科技期刊中學術畫像的應用

[摘要]為了加速邁向互聯(lián)智能時代,科技期刊學術畫像這一概念引入出版流程。文章闡述了學術畫像的定義和分類,介紹了學術畫像的構(gòu)建及技術、平臺支持情況,分析了學術畫像如何優(yōu)化傳統(tǒng)出版流程,剖析了目前將學術畫像在科技期刊中應用存在的問題。盡管學術畫像在出版領域的應用仍處于初步應用期,但新技術中蘊含的強大生機勢必為科技期刊的發(fā)展帶來新的可能性。

[關鍵詞]學術畫像;人工智能;大數(shù)據(jù);圖譜技術;科技期刊

學術畫像源于用戶畫像。用戶畫像是將用戶的屬性、行為與期望聯(lián)結(jié)起來的實際用戶的虛擬代表,屬于計算社會科學的范疇,最早應用于電商領域,它使產(chǎn)品的服務對象更加聚焦、更加專注。關于用戶畫像的研究最早可追溯到1999年,在PeopleGarden:CreatingDataPortraitsforUsers[1]一文中出現(xiàn)了“用戶畫像”一詞,作者指出在線交互環(huán)境中存在大量用戶,為了更加有效地進行在線交互、了解其他參與者、了解它如何隨時間變化,引入根據(jù)用戶交互行為形成的“數(shù)據(jù)畫像”概念。近幾年,以大數(shù)據(jù)技術、人工智能、機器人技術等為突破口的第四次科技革命蓬勃興起,使得數(shù)據(jù)分析更為深入與智能化,機器學習和深入學習成為構(gòu)建用戶畫像的主流技術[2]。伴隨著科學研究的迅猛發(fā)展,科技投入不斷加大,科研成果呈爆發(fā)式增長,學術數(shù)據(jù)呈現(xiàn)指數(shù)增長趨勢。這些海量的學術數(shù)據(jù)蘊藏著巨大的科研價值,值得整個學術界關注。學術大數(shù)據(jù)(ScholarlyBigData,SBD)包括學者數(shù)據(jù)、論文數(shù)據(jù)、期刊會議數(shù)據(jù)以及其間的關聯(lián)信息等,它可定義為通過科研活動產(chǎn)生的海量文獻和學者數(shù)據(jù)[3],以這些大數(shù)據(jù)為基礎,可繪制更為清晰準確的學術畫像。目前,關于學術畫像的研究仍主要為畫像技術層面,應用層面的研究主要集中在圖書館領域,出版業(yè)中的實踐仍然較少。學術畫像在期刊出版領域的研究仍處于萌芽期,但這種技術變革帶來的巨大發(fā)展正在醞釀中,必將為學術交流注入新的活力。

一、學術畫像的定義及分類

學術畫像是指用數(shù)字化的方式對學術對象進行形象化的描述所形成的具體化的表達,利用這一表達為特定用戶提供有針對性的服務。學術畫像通常利用網(wǎng)絡爬蟲獲取互聯(lián)網(wǎng)中的大量學術數(shù)據(jù),包括文獻信息、讀者信息、學者信息、期刊信息等,采用基于深度語義學習的實體識別技術、關系抽取技術和屬性抽取技術等對多源用戶信息進行抽取,再利用基于跨模態(tài)共享子空間學習理論的知識融合技術,實現(xiàn)跨模態(tài)、跨領域的學術信息融合,構(gòu)建學科畫像、學者畫像、期刊畫像、基金畫像、科研機構(gòu)畫像、學術團體畫像、學術會議畫像、個人用戶畫像等(見圖1)。學術畫像的概念與用戶畫像不同之處在于,它是一個統(tǒng)稱,包含的信息更為豐富,因此在科技期刊中的應用也更為廣泛。如學科畫像包括學科結(jié)構(gòu)、研究動態(tài)、學科關聯(lián)與輻射、代表人物、代表成果等;學者畫像包括基本信息、研究領域、學術影響力、學術成果、合作關系網(wǎng)等;期刊畫像又可以細分為面向作者的期刊畫像和面向讀者的期刊畫像,因需求不同,所展示的信息側(cè)重點也不同。除圖1中所列學術畫像的分類,中國知網(wǎng)針對學術期刊還有作者畫像、審稿專家畫像等。

二、學術畫像的構(gòu)建

學術畫像的構(gòu)建主要包括信息采集與抽取、信息融合形成便簽、構(gòu)建畫像幾個部分。學者畫像是學術畫像中研究最早也是研究最為深入的領域,故本文以學者畫像的構(gòu)建為主進行闡述。

(一)學者畫像構(gòu)建流程創(chuàng)建學者畫像需要三步:第一步,基本信息的采集、清洗。學者畫像的信息一般采集于互聯(lián)網(wǎng)或各大數(shù)據(jù)庫,可利用Python采集相關信息,并對海量數(shù)據(jù)進行結(jié)構(gòu)化處理。構(gòu)建學者畫像抽取的重點信息包括工作單位、職務職稱、研究領域、學術成果、合作關系、文獻引用等。第二步,建立數(shù)據(jù)字段標簽,將結(jié)構(gòu)化的數(shù)據(jù)歸類、聚合,統(tǒng)計分析、厘清邏輯關系,分配權重與構(gòu)建畫像體系。第三步,建立模型框架,完善學者畫像。學術畫像構(gòu)建的關鍵技術包括建立標簽體系、提取模型以及關鍵算法。由于學者畫像具有多個維度,因此將其合理的標簽化是關鍵問題之一,再結(jié)合權重可以將標簽進行優(yōu)先級排序。

(二)平臺與技術支持技術是出版行業(yè)變革的觸媒和關鍵力量。雖然科技期刊本身可能欠缺這些新技術的積淀,但這已經(jīng)不再是制約科技期刊邁向人工智能時代的因素了。其原因在于,如騰訊、百度、阿里巴巴等IT業(yè)巨頭已投入大量人財物力將底層AI算法封裝,科技期刊只需要學會如何調(diào)用現(xiàn)成技術即可應用到出版行業(yè)中;另外,還出現(xiàn)了為數(shù)眾多的學術期刊出版平臺技術服務商,它們?yōu)榭萍计诳q{護航。這些技術服務商既包括非出版領域服務商,又包括出版領域?qū)iT的服務商;它們的服務兼具免費服務和收費服務。目前,谷歌學術、微軟學術搜索、百度學術、搜狗學術等搜索引擎均提供學者畫像服務,出版領域的技術服務商如Atpon、中國知網(wǎng)、AMiner等則為學術界量身定制了內(nèi)容更為豐富的學術畫像服務,國際出版業(yè)巨頭如施普林格在其數(shù)字科學(DigitalScience)網(wǎng)站中也推出了學者畫像。在百度學術、中國知網(wǎng)、AMiner的學者畫像中可以看出,不同畫像均包含學者基本信息、學術影響力評估、興趣標簽、合作關系和主要代表作等信息。相比之下,中國知網(wǎng)還提供了全部學術成果展示、所在領域研究現(xiàn)狀分析等,但查看其中部分內(nèi)容需要付費,其優(yōu)勢在于中國知網(wǎng)掌握了國內(nèi)海量的論文資源,而學術數(shù)據(jù)是繪制學術畫像的“燃料”,數(shù)據(jù)也是驅(qū)動人工智能取得更好的識別率和精準度的核心因素。AMiner的畫像信息更為全面準確,學者學術影響力評估采用雷達圖方式更為直觀,繪制了研究方向隨時間的變遷圖,學者畫像經(jīng)過人工校驗,將學者個人主頁、維基百科、社交平臺等眾多異構(gòu)化信息進行篩選合并,它的優(yōu)勢在于算法更為先進,采用在國際語義集成評測OAEI中連續(xù)七年獲獎的知識集成算法(RiMOM),信息抓取的精度更高。AMiner還為科技部的8萬名在庫專家構(gòu)建了專家畫像庫,為2016年以來的科技部重點項目推薦評審專家。除此之外,中國知網(wǎng)、AMiner等技術服務商還進行了學科畫像、期刊畫像、基金畫像、科研機構(gòu)畫像等方面的研究,為科技期刊應用學術畫像優(yōu)化出版流程、完善知識服務等提供技術保障。

三、學術畫像在科技期刊中的應用

在科技期刊的傳統(tǒng)出版流程中,無論是欄目的策劃、組稿,還是審稿專家的遴選、論文的傳播推送,都嚴重依賴編輯的個人經(jīng)驗和主觀判斷,這與科技迅猛發(fā)展的今天不相適應。將學術畫像引入科技期刊出版流程中,從“經(jīng)驗判斷”轉(zhuǎn)向“數(shù)據(jù)分析”,能夠使科技期刊的發(fā)展更加高質(zhì)高效。

(一)利用學術畫像策劃欄目、籌劃新刊“對科研工作來講,科技期刊工作既是龍尾,又是龍頭。”盧嘉錫院士曾這樣高度概括科技期刊在整個科研工作中的重要作用??萍计诳莆罩鴦?chuàng)新科技成果的首發(fā)權,但是面對層出不窮的科研新課題,科技期刊編輯往往無法準確把握科研熱點和發(fā)展脈絡,再依靠自己的經(jīng)驗進行選題策劃易有失偏頗。利用學術畫像可以找到優(yōu)勢學科和新興學科中的空白區(qū)域,進行新刊的策劃或調(diào)整現(xiàn)刊選題。通過學科畫像可以很好地定位學科發(fā)展動態(tài)、掌握學科結(jié)構(gòu)變化,通過期刊畫像可以了解同行競爭態(tài)勢和期刊市場需求,通過學者畫像可以掌握作者分布以及讀者分布,從而為科技期刊策劃欄目或策劃新刊提供數(shù)據(jù)支持。

(二)利用學術畫像組稿科技期刊的長足發(fā)展極大地依賴于優(yōu)秀作者的支持,反之將成為“無源之水、無本之木”。進行了充分的選題策劃后,編輯面臨的又一項任務便是尋找合適的作者完成論文的撰寫?!暗让紫洛仭钡慕M稿方式在科技期刊發(fā)展過程中所占比例逐漸下降,“找米下鍋”的組稿形式越來越受到重視,但也為科技期刊編輯設置了一道新難題:“米”從何處找?找到的“米”質(zhì)量是否符合要求?傳統(tǒng)工作流程中,組稿工作多是根據(jù)編輯所掌握的信息和個人經(jīng)驗篩選合適的撰稿人,這樣作出的選擇往往不夠全面和精確,工作效率也無法保障。而學術畫像可以提供全球數(shù)以億計的科研工作者的信息,讓編輯的“找米”之路不再迷茫。學者畫像在科技期刊組稿過程中能夠起到舉足輕重的作用,根據(jù)學者的興趣標簽、科研成果等可以充分了解其科研進展,判斷是否為理想撰稿人。但在實際約稿過程中存在一種現(xiàn)象:某領域的著名學者有很強的學術影響力,往往一稿難求,這種情況下可以充分利用畫像中的合作關系網(wǎng),發(fā)掘其團隊中的中堅力量,使其成為自己的作者。另外,學科畫像、基金畫像、學術團體畫像都可以為精準選擇撰稿人提供參考。

(三)利用學術畫像審稿同行評審環(huán)節(jié)是把控稿件質(zhì)量的重要一環(huán),但近年來各種因?qū)徃鍖е碌膶W術論文被撤稿事件多有發(fā)生,究其根源在于作者推薦制度下的同行評審專家的選擇存在著漏洞和弊端,引起了學術界的廣泛關注。另外,越來越多的跨學科領域成為科研的熱點,這又為編輯在審稿專家的選擇上帶來了新的難題。既要有效規(guī)避作者推薦審稿專家的弊端,又要找到準確的審稿專家,僅僅依靠編輯的經(jīng)驗判斷是很難實現(xiàn)的,而學術畫像可以輔助期刊編輯選擇合適的審稿專家。通過學者畫像可以發(fā)掘某領域?qū)W術影響力較大的專家學者,又可以檢驗作者推薦的審稿人是否真正是該領域的專家學者。利用學者畫像還可以輔助期刊審稿專家?guī)斓慕?,通過原有的學者畫像,再輔以一貫的審稿行為,形成期刊自己的審稿專家畫像[4]。

(四)利用學術畫像做傳播學術論文的傳播在傳統(tǒng)的出版流程中容易被忽視,但全媒體時代已不再是“酒香不怕巷子深”的時代了,科技期刊應該充分利用各種傳播形式的優(yōu)勢,增強自身的曝光度,從而收獲更多的傳播份額。通過對比科技期刊目前使用的幾種主流傳播方式的優(yōu)缺點(見表1),我們可以清晰地認識到利用學術畫像進行精準推送的優(yōu)勢。目前,AMiner、騰云系統(tǒng)、Atpon技術服務公司等都推出了相應的服務,利用大數(shù)據(jù)和畫像技術助力科技期刊實現(xiàn)論文的精準推送和跨學科擴散,找到潛在讀者群。

(五)利用畫像技術提供優(yōu)質(zhì)知識服務延長出版鏈條是科技期刊適應全媒體時代的必要舉措,科技期刊除了擔負傳播科技信息的責任外,為讀者提供相應的知識服務也是其重要使命。知識服務一詞最早源于圖書館研究,也是近些年圖書館學和情報學領域的研究熱點之一[5],關于科技期刊知識服務的研究剛開展不久。知識服務有別于信息服務,它更注重用戶解決問題的需求,是將學術信息與服務緊密結(jié)合的一種服務模式[6]。目前,以各大數(shù)據(jù)庫面向個人及機構(gòu)用戶的知識服務為主,包括將文獻碎片化、概念圖譜化后,構(gòu)建相應學科的“知識庫”,為讀者提供“學術趨勢搜索”“知識脈絡檢索”;利用學者畫像、期刊畫像等形成的“學術關注度檢索”;通過提取讀者相關信息,進行知識的智能推薦,等等??萍计诳环矫嬉龊门c知識服務技術提供商的完美對接,另一方面要探索如何利用自身的資源優(yōu)勢進行知識服務,提升科技期刊知識服務水平。

四、未來發(fā)展需解決的問題

目前,學術畫像在期刊出版領域的應用仍十分有限,制約其廣泛應用的因素主要包括以下幾個方面。一是技術匱乏。畫像對于計算機技術要求甚高,優(yōu)秀的人工智能算法是保證畫像精確度的重要因素之一,以深度學習為代表的人工智能算法為學術畫像的實現(xiàn)帶來了希望,只有先進的算法才能夠?qū)⒍嘣悩?gòu)的學術大數(shù)據(jù)進行整合,呈現(xiàn)精準全面的學術畫像。但目前部分學術畫像的關鍵技術仍然掌握在少數(shù)人手里,且目前的算法仍然無法滿足需求。二是數(shù)據(jù)稀缺。數(shù)據(jù)可謂畫像技術的“燃料”,沒有數(shù)據(jù)便是“巧婦難為無米之炊”,數(shù)據(jù)是驅(qū)動人工智能取得更好識別率和精確度的核心因素。目前的學術大數(shù)據(jù)并非完全公開,國內(nèi)乃至全球的開放獲取期刊數(shù)量仍有待提高,一些大的出版集團和數(shù)據(jù)庫把持著大量未公開的學術數(shù)據(jù),制約了其他技術公司進行學術畫像的構(gòu)建。與此同時,學術數(shù)據(jù)變化頻繁,又為畫像的繪制增加了難度。三是規(guī)范性欠缺。以學者畫像為例,目前已出現(xiàn)多種版本的學者畫像,無論是信息的全面性還是涉及的信息類型都存在很大的差別。若相關的規(guī)范能夠及時出臺,將分布異構(gòu)的畫像信息進行整合,以規(guī)范化的形式呈現(xiàn)出來,將更有利于科研人員以及科技期刊使用。四是互聯(lián)網(wǎng)思維欠缺??萍计诳庉嫷墓ぷ髦匦耐€在欄目策劃、編輯校對方面,傳統(tǒng)出版思維固化嚴重,對于新技術的敏感度低,對于學術畫像的認識模糊,沒有充分意識到“互聯(lián)網(wǎng)+”思維的重要性,導致科技期刊的參與感不足,直接制約學術畫像在科技期刊中的應用。

五、結(jié)語

學術畫像在期刊出版領域還有更大的發(fā)展空間,目前仍處于初步應用期,尚未出現(xiàn)改變整個期刊出版模式的作用,但是變革的力量已經(jīng)開始醞釀,加上技術升級和催化的新平臺的不斷涌現(xiàn),必將為學術交流注入新的活力,也為科技期刊出版帶來新的可能性和方向。

作者:王雅嬌 路佳 柯曉靜 單位:河北農(nóng)業(yè)大學期刊社