公務(wù)員期刊網(wǎng) 論文中心 正文

電子文件長(zhǎng)期保存中格式管理探究

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了電子文件長(zhǎng)期保存中格式管理探究范文,希望能給你帶來靈感和參考,敬請(qǐng)閱讀。

電子文件長(zhǎng)期保存中格式管理探究

引言

在現(xiàn)代信息技術(shù)迅猛發(fā)展的背景下,傳統(tǒng)紙質(zhì)檔案逐漸被電子檔案所取代,隨著電子檔案的日益增多,其長(zhǎng)期保存問題也就被提上了研究日程。但在實(shí)際的檔案管理工作中,電子檔案的存儲(chǔ)格式經(jīng)常出現(xiàn)混亂的現(xiàn)象,導(dǎo)致使用者無(wú)法有效讀取這些檔案。毫無(wú)疑問,電子檔案的存儲(chǔ)格式將直接決定其是否能夠得到長(zhǎng)期的保存,是否能夠?qū)ζ溥M(jìn)行長(zhǎng)期有效的管理。

一、電子文件長(zhǎng)期保存過程中的格式管理概述

1.電子文件長(zhǎng)期保存及格式管理概念辨析

電子文件是國(guó)家機(jī)構(gòu)、社會(huì)組織或個(gè)人在履行其法定職責(zé)或處理事務(wù)過程中,通過計(jì)算機(jī)等電子設(shè)備形成、辦理、傳輸和存儲(chǔ)的數(shù)字格式的各種信息記錄。文件格式是指電子文件在計(jì)算機(jī)等電子設(shè)備中組織和存儲(chǔ)的編碼方式。電子文件讀取和編輯操作需要依靠計(jì)算機(jī)軟硬件環(huán)境來完成,其存儲(chǔ)結(jié)果表現(xiàn)為特定類型的格式文件,一般是以“.后綴名”的形式來體現(xiàn)的。目前針對(duì)不同類型的電子文件,按其格式劃分,有文本文件、圖像文件、音頻文件、視頻文件、電子郵件文件等。常見格式有XML、TXT、PDF、OFD、JPEG、MPEG等。電子文件長(zhǎng)期保存是指檔案館或其他文件保管單位、組織機(jī)構(gòu)通過采取可靠的、科學(xué)合理的方式長(zhǎng)期維護(hù)電子文件真實(shí)、完整、有效的行為。其中關(guān)于“長(zhǎng)期”的具體時(shí)限性,根據(jù)ISO14721:2003的規(guī)定,慮及技術(shù)變化(包括支持新載體、新數(shù)據(jù)格式)和用戶群體變化對(duì)典藏信息影響的足夠長(zhǎng)的時(shí)間段,這個(gè)時(shí)間段延伸到無(wú)限未來。格式管理是指以電子文件的各種存儲(chǔ)格式為對(duì)象,對(duì)其進(jìn)行類別登記、監(jiān)測(cè)、識(shí)別、轉(zhuǎn)換和日常穩(wěn)健性監(jiān)測(cè)。[1]以保障相應(yīng)格式電子文件的長(zhǎng)期可讀、可解析、可理解。

2.格式管理對(duì)于電子文件長(zhǎng)期保存的重要性

隨著計(jì)算機(jī)的普及和辦公信息化的推廣,日常生活與工作中產(chǎn)生的電子文件體量越來越龐大,而且其中許多是原生性的電子文件,并無(wú)紙質(zhì)版本作為備份保存。因此不管是作為業(yè)務(wù)留痕的需要還是信息保存的必要,都使得電子文件的長(zhǎng)期保存成為數(shù)字時(shí)代檔案工作面臨的一項(xiàng)重要挑戰(zhàn),而電子文件的存儲(chǔ)格式是影響電子文件長(zhǎng)期保存的重要因素之一。在上文中已經(jīng)了解到,電子文件大多是以某種編碼形式存在的,其讀取要依靠計(jì)算機(jī)軟硬件環(huán)境。而在目前已知的技術(shù)更新頻率下,技術(shù)淘汰給電子文件帶來的威脅遠(yuǎn)遠(yuǎn)大于存儲(chǔ)載體的腐壞給其帶來的挑戰(zhàn)。也就是說,一般情況下電子文件存儲(chǔ)載體的壽命是大于讀取它的軟硬件生命周期的,與延長(zhǎng)存儲(chǔ)載體的壽命相比,延長(zhǎng)讀取電子文件的軟硬件技術(shù)壽命顯得更為重要。這就使得格式管理在電子文件長(zhǎng)期保存過程中尤為重要,只有首先保障文件格式的穩(wěn)健,才能考慮電子文件的長(zhǎng)久利用和內(nèi)容管理等進(jìn)一步提升的問題。

3.基于文件生命周期思想的電子文件長(zhǎng)期保存格式管理

將傳統(tǒng)的文件生命周期理論思想應(yīng)用到電子文件的長(zhǎng)期保存格式管理工作中,就表現(xiàn)為針對(duì)電子文件隨著在不同階段中所屬系統(tǒng)形態(tài)、功能定位、使用情景等方面的差異,檔案館應(yīng)當(dāng)相應(yīng)地將文件格式轉(zhuǎn)換為最適合的格式類型。在文件的生成和業(yè)務(wù)流通階段,電子文件的主要功能是支持單位或組織機(jī)構(gòu)的業(yè)務(wù)活動(dòng),格式方面的需求是易于傳遞和讀取,因此應(yīng)當(dāng)選擇適用性強(qiáng)、普及度高的文件格式進(jìn)行存儲(chǔ),以文本文件為例,最適合選擇DOC或PDF格式。在文件的歸檔、存儲(chǔ)階段,電子文件的主要功能是保存信息、業(yè)務(wù)留痕,其管理目的是為了保障文件的長(zhǎng)期保存和長(zhǎng)久可用,因此應(yīng)當(dāng)選擇高質(zhì)量的存儲(chǔ)格式以盡可能多地保全文件內(nèi)容和背景數(shù)據(jù)。而到了文件的提供利用階段,則需要輸出相對(duì)低質(zhì)量的文件格式,僅需要滿足文件可讀可用即可。如音頻文件在存儲(chǔ)時(shí)使用WAV等格式存儲(chǔ),目的是在輸出時(shí)避免用戶下載使用RM等流媒體格式進(jìn)行網(wǎng)絡(luò)播放。這些都是不同階段電子檔案功能要求導(dǎo)致的變化。反之,為適應(yīng)不同階段對(duì)格式的質(zhì)量或管理要求,在某些可控的情形下,就可以在電子檔案的生成環(huán)節(jié)提前進(jìn)行格式準(zhǔn)備。比較典型的包括在數(shù)字化電子檔案生成階段進(jìn)行多版本、多格式輸出。

二、電子文件長(zhǎng)期保存過程中格式管理流程分析

就我國(guó)目前的工作實(shí)際來看,檔案館對(duì)于電子文件的管理實(shí)際上更多的是后端控制。雖然我們提倡在電子文件的管理中注重前端控制,以提高歸檔電子文件的質(zhì)量,方便后續(xù)管理工作的開展,但在實(shí)際工作中,由于形成單位數(shù)量眾多,且業(yè)務(wù)規(guī)范也未達(dá)到完全標(biāo)準(zhǔn)化,工作人員業(yè)務(wù)水平參差不齊、檔案意識(shí)薄弱,因此很難保證生成電子文件的質(zhì)量和規(guī)范。具體到電子文件的格式管理上,雖然已有相關(guān)國(guó)際、國(guó)家標(biāo)準(zhǔn)對(duì)歸檔文件格式進(jìn)行了規(guī)定,但就目前的狀況來看,我國(guó)檔案館對(duì)于入館文件的格式把控還是比較寬松的。格式管理工作一般都是在電子文件提交進(jìn)館后開展。結(jié)合文件生命周期思想,從電子文件的使用情景和所處階段出發(fā),相應(yīng)的格式管理工作具體包括以下流程。

1.接收進(jìn)館階段的格式規(guī)范與驗(yàn)證

電子文件“收”的階段,檔案館主要的格式管理工作是對(duì)各單位提交到檔案館的文件進(jìn)行格式識(shí)別、驗(yàn)證與登記。目前各國(guó)檔案館都已頒布了歸檔電子文件格式的要求及標(biāo)準(zhǔn),我國(guó)也頒布了相應(yīng)推薦標(biāo)準(zhǔn),以規(guī)范文件格式,保障進(jìn)館電子文件的質(zhì)量,為電子文件的可長(zhǎng)期保存打下堅(jiān)實(shí)基礎(chǔ)。從標(biāo)準(zhǔn)內(nèi)容分析來看,在電子文件長(zhǎng)期保存工作中,各國(guó)都一致地傾向于選擇格式開放、軟件依賴程度低、結(jié)構(gòu)化程度高的文件格式。但由于電子文件類型繁多,因此格式也復(fù)雜多變,在提交進(jìn)館后,檔案館還需借助于數(shù)字格式登記系統(tǒng)對(duì)電子文件的格式進(jìn)行一一把控和管理。格式登記系統(tǒng)可以分別從應(yīng)用環(huán)境和生命周期兩個(gè)視角對(duì)電子文件的具體參數(shù)和各階段變化關(guān)系進(jìn)行分析與提取,方便其長(zhǎng)久理解與持久維護(hù)。在檔案館的歸檔電子文件長(zhǎng)期保存過程中,建立格式登記系統(tǒng)為檔案館監(jiān)測(cè)文件格式、選擇適用于長(zhǎng)期保存的文件格式,以及電子文件日常維護(hù)和監(jiān)測(cè),輸出合適的格式進(jìn)行提供利用都提供了極大的便利和安全保障。

2.存儲(chǔ)與管理階段的格式轉(zhuǎn)化

在電子文件“管”和“存”的階段,其格式管理工作主要是選擇合適的格式,以保障長(zhǎng)期甚至永久保存過程中,電子文件的可讀、可用。但當(dāng)確定滿足長(zhǎng)期保存需求的格式后,檔案館還需要使用格式轉(zhuǎn)換技術(shù)來將電子文件轉(zhuǎn)換為適合長(zhǎng)期保存的文件格式。由于歸檔電子文件格式不符合標(biāo)準(zhǔn)、不適宜長(zhǎng)期保存等情況較為普遍,因此格式轉(zhuǎn)換在實(shí)際檔案館電子文件長(zhǎng)期保存的格式管理工作中較為常用。目前電子文件的轉(zhuǎn)換方式主要有以下兩種:一種是直接轉(zhuǎn)換方式,即由源文件格式直接轉(zhuǎn)換到目標(biāo)文件格式。另一種是間接轉(zhuǎn)換方式,即先由源文件格式轉(zhuǎn)換到某種中間文件格式,再由中間文件格式轉(zhuǎn)換到目標(biāo)文件格式。[2]

3.提供利用階段的輸出格式選擇

在電子文件“用”的階段,其格式管理工作主要是選擇合適的格式以最小的體積和最優(yōu)的內(nèi)容表達(dá)提供給用戶進(jìn)行閱覽和利用。以文本文件的輸出格式選擇為例:XML格式是理想的用于長(zhǎng)期保存文本文件格式,其結(jié)構(gòu)化程度非常高,且可擴(kuò)展,讀取不依賴特定軟件,但對(duì)于一般用戶來說,其高度結(jié)構(gòu)化的標(biāo)記語(yǔ)言識(shí)讀起來存在一定困難,更適合用于機(jī)讀或文件間的互操作。而DOC雖然是微軟辦公軟件的特有格式,屬于私有格式,但用戶友好度高,識(shí)讀較為簡(jiǎn)單,基本屬于“所見即所得”的狀態(tài),且支持編輯操作,相比XML更適合提供給用戶進(jìn)行閱覽和利用。因此,在格式管理時(shí),需要從電子文件的使用情景和所處階段出發(fā),選取相應(yīng)的最適宜格式進(jìn)行選擇輸出。

三、電子文件長(zhǎng)期保存過程中格式管理的策略選擇

1.建立配套標(biāo)準(zhǔn)體系做好前端控制

前端控制是確保各機(jī)關(guān)電子文件真實(shí)可靠、完整歸檔、安全利用和長(zhǎng)期可讀的有效策略。由于電子文件具有易流失、易更改等特點(diǎn),在實(shí)際管理過程中較紙質(zhì)檔案難度更大。因此更應(yīng)注重文件形成過程中的管理和干預(yù),來保障電子文件的真實(shí)性、可靠性、完整性和可讀性。最有效的方式就是建立與現(xiàn)有電子文件管理標(biāo)準(zhǔn)配套的電子文件歸檔格式標(biāo)準(zhǔn),組成科學(xué)、有效的標(biāo)準(zhǔn)體系,來做好電子文件長(zhǎng)期保存的前端控制工作。電子文件長(zhǎng)期保存的格式直接關(guān)系著電子文件的長(zhǎng)期可讀性和可用性,我國(guó)可借鑒歐美電子文件的格式標(biāo)準(zhǔn),進(jìn)一步在標(biāo)準(zhǔn)的系統(tǒng)性、完整性和適用性等方面加以完善,促進(jìn)標(biāo)準(zhǔn)制定主體的多元化,并適當(dāng)引進(jìn)和采用相關(guān)的國(guó)際標(biāo)準(zhǔn),參考和借鑒發(fā)達(dá)國(guó)家的國(guó)家標(biāo)準(zhǔn)。逐步建立起電子文件長(zhǎng)期保存標(biāo)準(zhǔn)體系,保障電子文件長(zhǎng)期保存這一工作的科學(xué)開展和順利實(shí)施。

2.建設(shè)格式登記系統(tǒng)做好格式管理工作

一個(gè)好的格式登記系統(tǒng)可以幫助我們理解電子文件的數(shù)字對(duì)象結(jié)構(gòu)和內(nèi)容,可以指導(dǎo)確定特定電子文件的遷移路徑。對(duì)于電子文件的長(zhǎng)期保存格式管理具有重要的意義。因此要想科學(xué)、高效地開展電子文件長(zhǎng)期保存的格式管理工作必須先做好建設(shè)格式登記系統(tǒng)。將文件的格式信息、數(shù)據(jù)信息納入日常監(jiān)測(cè)和維護(hù)中,以保障電子文件的安全性、可靠性,是電子文件長(zhǎng)期保存的有效和必要手段。

參考文獻(xiàn):

[1]梁娜,張曉林.數(shù)字文件格式登記系統(tǒng)[J].圖書情報(bào)工作,2005(11):82-86.

[2]劉越男,祁天嬌.我國(guó)省級(jí)、副省級(jí)檔案館電子文件接收及管理情況的追蹤調(diào)查[J].檔案學(xué)訊,2014(06):10-15.

作者:王玉敏 單位:社會(huì)科學(xué)文獻(xiàn)出版社