檔案數(shù)據(jù)的“異質(zhì)備份”是目前檔案行業(yè)經(jīng)常使用的業(yè)務(wù)術(shù)語,雖然最開始提出時主要是指紙質(zhì)檔案的膠片化,但隨著技術(shù)的發(fā)展,現(xiàn)在主要指對檔案數(shù)據(jù)資源的使用“不同離線介質(zhì)“進(jìn)行”離線存儲”,實(shí)現(xiàn)長期保存。

這個項(xiàng)目自啟動以來,我們團(tuán)隊(duì)便傾注了極大的熱情和精力。在市場調(diào)研、需求分析、方案制定等各個環(huán)節(jié),我們都力求做到最好。期間,我們不斷與合作伙伴溝通協(xié)作,共同攻克了一個又一個難題。終于,在激烈的競爭中脫穎而出,成功中標(biāo)!

這次中標(biāo)不僅是對我們團(tuán)隊(duì)實(shí)力的認(rèn)可,更是對我們辛勤付出的回報。這個項(xiàng)目的成功中標(biāo),將為我們帶來更多的業(yè)務(wù)機(jī)會和發(fā)展空間,也將在行業(yè)內(nèi)樹立我們的良好口碑。


早期觀點(diǎn):“異質(zhì)備份”指電子文件打印為紙質(zhì)或膠片

2008年汶川大地震發(fā)生后,國家檔案局審時度勢,要求各級國家檔案館通過建立異地備份庫等形式,時任國家檔案局局長楊冬權(quán)在兩年后的“全國檔案安全體系建設(shè)工作會議”上提出: “為了確保檔案實(shí)體安全和信息安全,國家檔案局2008年進(jìn)一步要求各級國家檔案館通過建立異地備份庫等形式,對本級重要檔案及電子文件實(shí)行異地備份,對重要的電子文件實(shí)行異質(zhì)備份,確保電子文件的長期可讀,確保檔案信息的絕對安全。各地檔案部門高度重視,精心組織,積極謀劃,相繼建立了電子文件中心或電子文件備份中心,開展電子文件管理工作,認(rèn)真做好電子文件異質(zhì)備份和重要檔案異地備份工作?!? “要嚴(yán)格對電子文件進(jìn)行安全備份。凡未向電子文件中心移交電子文件的單位,要將本單位所有電子文件在異地備份一套,其中劃入永久保存的,還要轉(zhuǎn)換成紙質(zhì)或縮微膠卷,實(shí)行異質(zhì)備份,以確保電子文件安全?!? 可見,早期文檔中所提到的“異質(zhì)備份”主要指電子文件轉(zhuǎn)換成“紙質(zhì)”或“微縮膠片”,也就是大家通常說的“模擬軌”存儲方式。 當(dāng)前技術(shù)下,電子文件主要使用兩種形態(tài)進(jìn)行保存,一種是“模擬軌”、一種是“數(shù)字軌”。模擬軌上主要記錄模擬信號,模擬信號(Analog Signal)是一種連續(xù)變化的信號,可以在一定范圍內(nèi)取無限多個值。它通常用于傳輸物理世界中的信息,如聲音、光強(qiáng)、溫度等。例如,在音頻傳輸中,模擬信號可以直接表示聲音的波形。這種信號的特點(diǎn)是具有連續(xù)性和無窮多的可能值,任何微小的變化都會反映在信號上。由于模擬信號的連續(xù)性,傳輸過程中容易受到噪聲的影響,從而導(dǎo)致信號的失真或衰減。除傳統(tǒng)紙質(zhì)外,早期的磁帶和縮微膠片存儲的就是這類信號。 但是,傳統(tǒng)的模擬信號存儲介質(zhì)存在諸多問題:

問題一:信號不穩(wěn)定,受環(huán)境影響大

這種模擬信號的存儲介質(zhì)由于存儲信號是連續(xù)變化的波形,所以每個采樣點(diǎn)的采樣值在播放或者數(shù)字化過程中很容易受到外界影響而無法輸出唯一數(shù)據(jù)。 例如: 使用不同品牌、不同精度的掃描儀對同一文件進(jìn)行掃描將生成不同大小數(shù)字化文件。 使用不同品質(zhì)的磁頭或者鏡頭將顯著影響磁帶或者膠片的播放質(zhì)量。

問題二:無法記錄復(fù)雜電子文件

除可以展開為二維結(jié)構(gòu)的檔案數(shù)據(jù)(如文本類、圖紙類和簡單圖像)外,傳統(tǒng)紙質(zhì)和膠片介質(zhì)難以記錄復(fù)雜結(jié)構(gòu)電子文件,如壓縮包、鏡像文件、數(shù)據(jù)庫備份文件、二進(jìn)制程序文件、CAD圖紙文件等,這些復(fù)雜類型數(shù)據(jù)難以展開為二維結(jié)構(gòu)或線性波形,因此難以在傳統(tǒng)介質(zhì)上進(jìn)行記錄。

問題三:無法恢復(fù)為唯一的電子文件

備份的唯一作用,就是用來做“數(shù)據(jù)恢復(fù)”,如果異質(zhì)備份主要使用“模擬信號”方式進(jìn)行備份,則將無法準(zhǔn)確恢復(fù)為原文件(文件大小、內(nèi)容完全一致),外界光線、磁場將導(dǎo)致每次的文件還原結(jié)果都不一致。 可見,無論是“紙質(zhì)”還是“縮微膠片”都仍然使用模擬信號存儲數(shù)據(jù),這種存儲模式本質(zhì)上是一種不穩(wěn)定的存儲形態(tài),非常容易受到播放設(shè)備、環(huán)境和技術(shù)種類而導(dǎo)致檔案電子文件發(fā)生變化,從而導(dǎo)致無法從這類介質(zhì)中還原唯一的電子文件,難以使用信息化手段對檔案數(shù)字化文件進(jìn)行唯一性認(rèn)證,最終難以起到現(xiàn)代意義上的數(shù)字備份效果。 導(dǎo)致唯有原紙質(zhì)件才具有法律效力,所有的電子還原件難以證明其真實(shí)性,帶來額外的工作成本。

問題四:誤碼率高,沒有數(shù)據(jù)糾錯機(jī)制,極易損壞

最重要的是,這類存儲介質(zhì)缺乏現(xiàn)代意義上的數(shù)據(jù)修復(fù)機(jī)制(如數(shù)據(jù)校驗(yàn)值、數(shù)據(jù)糾刪算法),當(dāng)一個位置的磁性或者像素丟失后,無法通過數(shù)學(xué)手段恢復(fù)損壞的數(shù)據(jù),最終導(dǎo)致數(shù)據(jù)損壞。 可見,使用“模擬軌”方式存儲的檔案數(shù)據(jù)仍然以實(shí)物方式管理、難以進(jìn)行唯一性跟蹤、除原件外,也難以在現(xiàn)代單套制體系下進(jìn)行憑證和真實(shí)性認(rèn)證。

問題五:容量密度小,相關(guān)設(shè)備造價高、不普及

模擬軌因?yàn)榇鎯υ韱栴}難以實(shí)現(xiàn)高密度擴(kuò)展,單張介質(zhì)存儲量有限,需要搭配專業(yè)級設(shè)備才能實(shí)現(xiàn)數(shù)據(jù)讀取和寫入(如讀取膠片需要專業(yè)級鏡頭設(shè)備,初次采購成本較高)。 隨著技術(shù)發(fā)展,目前也有數(shù)字膠片技術(shù),即采用模擬信號存儲數(shù)字型號的方式,先將數(shù)字信號轉(zhuǎn)為圖形碼(如二維碼),然后將圖形碼刻蝕在傳統(tǒng)膠片上,從而實(shí)現(xiàn)使用傳統(tǒng)膠片記錄數(shù)字信號,但目前仍受限于市場和技術(shù)推廣。

現(xiàn)代觀點(diǎn):“異質(zhì)備份”指在“不同存儲介質(zhì)”上進(jìn)行“離線備份”

隨著信息化系統(tǒng)和“單套制”理念的不斷推進(jìn),數(shù)字化后的電子檔案和原生電子檔案存量逐年增長,為滿足檔案存儲的安全性,官方文檔中不再提及“異質(zhì)備份”,而是將重點(diǎn)落到了在“不同存儲介質(zhì)”上進(jìn)行“離線備份”。 維基百科中提到: “備份(英語:backup),在信息技術(shù)與數(shù)據(jù)管理領(lǐng)域,指將文件系統(tǒng)或數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)加以復(fù)制;一旦發(fā)生災(zāi)難或錯誤操作時,得以方便且及時地恢復(fù)系統(tǒng)的有效數(shù)據(jù)和正常運(yùn)作。重要資料應(yīng)當(dāng)異地備援,降低風(fēng)險” “離線備份(Off-line Backup):離線備份使用可離線媒體來備份,磁帶、光盤或是硬盤盒備份完成后離開備份媒體” 2024年《中華人民共和國檔案法實(shí)施條例》中第四十一條明確提到: “檔案館對重要電子檔案進(jìn)行異地備份保管,應(yīng)當(dāng)采用磁介質(zhì)、光介質(zhì)、縮微膠片等符合安全管理要求的存儲介質(zhì),定期檢測載體的完好程度和數(shù)據(jù)的可讀性。異地備份選址應(yīng)當(dāng)滿足安全保密等要求。” “檔案館可以根據(jù)需要建設(shè)災(zāi)難備份系統(tǒng),實(shí)現(xiàn)重要電子檔案及其管理系統(tǒng)的備份與災(zāi)難恢復(fù)?!? 此外,第四十條也明確提到: “檔案館應(yīng)當(dāng)在接收電子檔案時進(jìn)行真實(shí)性、完整性、可用性和安全性等方面的檢測,并采取管理措施和技術(shù)手段保證電子檔案在長期保存過程中的真實(shí)性、完整性、可用性和安全性。” 2020年國際檔案局《檔案檢查工作辦法》中明確提到: “制定電子檔案備份、轉(zhuǎn)換和遷移方案及策略,并按照備份策略對電子檔案實(shí)行在線、離線、近線備份” “電子檔案單套管理,完成電子檔案長期保存所需的配套制度、設(shè)施設(shè)備的配置工作、指定長期保存策略,實(shí)現(xiàn)電子檔案單套管理”。 2022年,國際檔案局發(fā)布的《電子會計檔案管理規(guī)范》中明確提到: “電子會計檔案應(yīng)實(shí)施在線和離線存儲。在線存儲按電子會計檔案管理系統(tǒng)運(yùn)行要求實(shí)施。離線存儲載體應(yīng)具有較好的耐久性,按優(yōu)先順序依次為一次性寫光盤、磁帶、硬磁盤等?!? “重要電子會計檔案應(yīng)進(jìn)行一式三套離線存儲,三套離線存儲載體宜分開保管,有條件的單位應(yīng)進(jìn)行異地備份。離線存儲載體管理按照 DA/T15和 DA/T38給出的要求進(jìn)行。不能用運(yùn)維備份的信息組織方式進(jìn)行離線存儲,更不能用系統(tǒng)備份文件代替離線存儲文件。 對離線存儲電子會計檔案的磁性載體每滿2年、光盤每滿4年進(jìn)行一次抽樣機(jī)讀檢驗(yàn),抽樣率不低于10%,發(fā)現(xiàn)問題應(yīng)及時采取措施。對磁性載體上的電子檔案,應(yīng)每4年轉(zhuǎn)存一次。原載體同時保留時間不少于4年。” 從上述相關(guān)表述中可以明顯看出,“異質(zhì)備份”表述被“離線存儲”所替代,明確提及了多種離線存儲介質(zhì),如“磁介質(zhì)”和“光介質(zhì)”,并且需要進(jìn)行多套備份和長期保存,并格外重視存儲過程中的“四性檢測”,例如電子檔案數(shù)據(jù)的真實(shí)性就必須依賴現(xiàn)代存儲技術(shù)進(jìn)行針對性維護(hù)。
圍繞“磁介質(zhì)”和“光介質(zhì)”離線存儲,相關(guān)的標(biāo)準(zhǔn)如下: article article 相比于傳統(tǒng)的膠片等技術(shù),光介質(zhì)和磁介質(zhì)主要具備以下優(yōu)勢:

優(yōu)勢一:天然符合支持檔案行業(yè)“離線存儲”

藍(lán)光光盤是天然的離線存儲介質(zhì),當(dāng)不讀取數(shù)據(jù)時,光盤與驅(qū)動器分離,進(jìn)而與系統(tǒng)斷開實(shí)現(xiàn)離線存儲。 硬磁盤的離線存儲通常需要借助人工管理或硬盤庫管理,實(shí)現(xiàn)對指定硬盤進(jìn)行斷電離線管理。

優(yōu)勢二:低誤碼率,數(shù)據(jù)糾錯算法與介質(zhì)質(zhì)檢

現(xiàn)代化的存儲介質(zhì)均具備數(shù)據(jù)糾錯算法,即輕微的環(huán)境干擾或介質(zhì)損壞不會導(dǎo)致數(shù)據(jù)損壞,驅(qū)動器一般可以進(jìn)行數(shù)據(jù)解碼恢復(fù)。 磁介質(zhì)具備S.M.A.R.T.自動化檢測功能,光介質(zhì)需要使用特制檢測光驅(qū)實(shí)現(xiàn)介質(zhì)檢測,完善的介質(zhì)檢測可以避免存儲數(shù)據(jù)潛在的丟失風(fēng)險。

優(yōu)勢三:容量密度大,保存時間長

目前藍(lán)光光盤可以最大做到200GB/張的容量密度。 硬盤可以做到20TB/塊,遠(yuǎn)超傳統(tǒng)的模擬存儲介質(zhì)。

隨著時代和技術(shù)的發(fā)展,各種術(shù)語的含義也在發(fā)生變化,無論是長期保存、離線存儲還是異質(zhì)存儲,雖然技術(shù)在不斷迭代,但目的始終沒有變化,即保證珍貴的檔案數(shù)據(jù)的安全性。 只有結(jié)合最新檔案相關(guān)要求和技術(shù)發(fā)展潮流,提升相關(guān)技術(shù)能力,才能逐步建立起電子檔案數(shù)據(jù)的安全備份體系,實(shí)現(xiàn)長期保存。

查看原文