档案数据的“异质备份”是目前档案行业经常使用的业务术语,虽然最开始提出时主要是指纸质档案的胶片化,但随着技术的发展,现在主要指对档案数据资源的使用“不同离线介质“进行”离线存储”,实现长期保存。

这个项目自启动以来,我们团队便倾注了极大的热情和精力。在市场调研、需求分析、方案制定等各个环节,我们都力求做到最好。期间,我们不断与合作伙伴沟通协作,共同攻克了一个又一个难题。终于,在激烈的竞争中脱颖而出,成功中标!

这次中标不仅是对我们团队实力的认可,更是对我们辛勤付出的回报。这个项目的成功中标,将为我们带来更多的业务机会和发展空间,也将在行业内树立我们的良好口碑。


早期观点:“异质备份”指电子文件打印为纸质或胶片

2008年汶川大地震发生后,国家档案局审时度势,要求各级国家档案馆通过建立异地备份库等形式,时任国家档案局局长杨冬权在两年后的“全国档案安全体系建设工作会议”上提出: “为了确保档案实体安全和信息安全,国家档案局2008年进一步要求各级国家档案馆通过建立异地备份库等形式,对本级重要档案及电子文件实行异地备份,对重要的电子文件实行异质备份,确保电子文件的长期可读,确保档案信息的绝对安全。各地档案部门高度重视,精心组织,积极谋划,相继建立了电子文件中心或电子文件备份中心,开展电子文件管理工作,认真做好电子文件异质备份和重要档案异地备份工作。” “要严格对电子文件进行安全备份。凡未向电子文件中心移交电子文件的单位,要将本单位所有电子文件在异地备份一套,其中划入永久保存的,还要转换成纸质或缩微胶卷,实行异质备份,以确保电子文件安全。” 可见,早期文档中所提到的“异质备份”主要指电子文件转换成“纸质”或“微缩胶片”,也就是大家通常说的“模拟轨”存储方式。 当前技术下,电子文件主要使用两种形态进行保存,一种是“模拟轨”、一种是“数字轨”。模拟轨上主要记录模拟信号,模拟信号(Analog Signal)是一种连续变化的信号,可以在一定范围内取无限多个值。它通常用于传输物理世界中的信息,如声音、光强、温度等。例如,在音频传输中,模拟信号可以直接表示声音的波形。这种信号的特点是具有连续性和无穷多的可能值,任何微小的变化都会反映在信号上。由于模拟信号的连续性,传输过程中容易受到噪声的影响,从而导致信号的失真或衰减。除传统纸质外,早期的磁带和缩微胶片存储的就是这类信号。 但是,传统的模拟信号存储介质存在诸多问题:

问题一:信号不稳定,受环境影响大

这种模拟信号的存储介质由于存储信号是连续变化的波形,所以每个采样点的采样值在播放或者数字化过程中很容易受到外界影响而无法输出唯一数据。 例如: 使用不同品牌、不同精度的扫描仪对同一文件进行扫描将生成不同大小数字化文件。 使用不同品质的磁头或者镜头将显著影响磁带或者胶片的播放质量。

问题二:无法记录复杂电子文件

除可以展开为二维结构的档案数据(如文本类、图纸类和简单图像)外,传统纸质和胶片介质难以记录复杂结构电子文件,如压缩包、镜像文件、数据库备份文件、二进制程序文件、CAD图纸文件等,这些复杂类型数据难以展开为二维结构或线性波形,因此难以在传统介质上进行记录。

问题三:无法恢复为唯一的电子文件

备份的唯一作用,就是用来做“数据恢复”,如果异质备份主要使用“模拟信号”方式进行备份,则将无法准确恢复为原文件(文件大小、内容完全一致),外界光线、磁场将导致每次的文件还原结果都不一致。 可见,无论是“纸质”还是“缩微胶片”都仍然使用模拟信号存储数据,这种存储模式本质上是一种不稳定的存储形态,非常容易受到播放设备、环境和技术种类而导致档案电子文件发生变化,从而导致无法从这类介质中还原唯一的电子文件,难以使用信息化手段对档案数字化文件进行唯一性认证,最终难以起到现代意义上的数字备份效果。 导致唯有原纸质件才具有法律效力,所有的电子还原件难以证明其真实性,带来额外的工作成本。

问题四:误码率高,没有数据纠错机制,极易损坏

最重要的是,这类存储介质缺乏现代意义上的数据修复机制(如数据校验值、数据纠删算法),当一个位置的磁性或者像素丢失后,无法通过数学手段恢复损坏的数据,最终导致数据损坏。 可见,使用“模拟轨”方式存储的档案数据仍然以实物方式管理、难以进行唯一性跟踪、除原件外,也难以在现代单套制体系下进行凭证和真实性认证。

问题五:容量密度小,相关设备造价高、不普及

模拟轨因为存储原理问题难以实现高密度扩展,单张介质存储量有限,需要搭配专业级设备才能实现数据读取和写入(如读取胶片需要专业级镜头设备,初次采购成本较高)。 随着技术发展,目前也有数字胶片技术,即采用模拟信号存储数字型号的方式,先将数字信号转为图形码(如二维码),然后将图形码刻蚀在传统胶片上,从而实现使用传统胶片记录数字信号,但目前仍受限于市场和技术推广。

现代观点:“异质备份”指在“不同存储介质”上进行“离线备份”

随着信息化系统和“单套制”理念的不断推进,数字化后的电子档案和原生电子档案存量逐年增长,为满足档案存储的安全性,官方文档中不再提及“异质备份”,而是将重点落到了在“不同存储介质”上进行“离线备份”。 维基百科中提到: “备份(英语:backup),在信息技术与数据管理领域,指将文件系统或数据库系统中的数据加以复制;一旦发生灾难或错误操作时,得以方便且及时地恢复系统的有效数据和正常运作。重要资料应当异地备援,降低风险” “离线备份(Off-line Backup):离线备份使用可离线媒体来备份,磁带、光盘或是硬盘盒备份完成后离开备份媒体” 2024年《中华人民共和国档案法实施条例》中第四十一条明确提到: “档案馆对重要电子档案进行异地备份保管,应当采用磁介质、光介质、缩微胶片等符合安全管理要求的存储介质,定期检测载体的完好程度和数据的可读性。异地备份选址应当满足安全保密等要求。” “档案馆可以根据需要建设灾难备份系统,实现重要电子档案及其管理系统的备份与灾难恢复。” 此外,第四十条也明确提到: “档案馆应当在接收电子档案时进行真实性、完整性、可用性和安全性等方面的检测,并采取管理措施和技术手段保证电子档案在长期保存过程中的真实性、完整性、可用性和安全性。” 2020年国际档案局《档案检查工作办法》中明确提到: “制定电子档案备份、转换和迁移方案及策略,并按照备份策略对电子档案实行在线、离线、近线备份” “电子档案单套管理,完成电子档案长期保存所需的配套制度、设施设备的配置工作、指定长期保存策略,实现电子档案单套管理”。 2022年,国际档案局发布的《电子会计档案管理规范》中明确提到: “电子会计档案应实施在线和离线存储。在线存储按电子会计档案管理系统运行要求实施。离线存储载体应具有较好的耐久性,按优先顺序依次为一次性写光盘、磁带、硬磁盘等。” “重要电子会计档案应进行一式三套离线存储,三套离线存储载体宜分开保管,有条件的单位应进行异地备份。离线存储载体管理按照 DA/T15和 DA/T38给出的要求进行。不能用运维备份的信息组织方式进行离线存储,更不能用系统备份文件代替离线存储文件。 对离线存储电子会计档案的磁性载体每满2年、光盘每满4年进行一次抽样机读检验,抽样率不低于10%,发现问题应及时采取措施。对磁性载体上的电子档案,应每4年转存一次。原载体同时保留时间不少于4年。” 从上述相关表述中可以明显看出,“异质备份”表述被“离线存储”所替代,明确提及了多种离线存储介质,如“磁介质”和“光介质”,并且需要进行多套备份和长期保存,并格外重视存储过程中的“四性检测”,例如电子档案数据的真实性就必须依赖现代存储技术进行针对性维护。
围绕“磁介质”和“光介质”离线存储,相关的标准如下: article article 相比于传统的胶片等技术,光介质和磁介质主要具备以下优势:

优势一:天然符合支持档案行业“离线存储”

蓝光光盘是天然的离线存储介质,当不读取数据时,光盘与驱动器分离,进而与系统断开实现离线存储。 硬磁盘的离线存储通常需要借助人工管理或硬盘库管理,实现对指定硬盘进行断电离线管理。

优势二:低误码率,数据纠错算法与介质质检

现代化的存储介质均具备数据纠错算法,即轻微的环境干扰或介质损坏不会导致数据损坏,驱动器一般可以进行数据解码恢复。 磁介质具备S.M.A.R.T.自动化检测功能,光介质需要使用特制检测光驱实现介质检测,完善的介质检测可以避免存储数据潜在的丢失风险。

优势三:容量密度大,保存时间长

目前蓝光光盘可以最大做到200GB/张的容量密度。 硬盘可以做到20TB/块,远超传统的模拟存储介质。

随着时代和技术的发展,各种术语的含义也在发生变化,无论是长期保存、离线存储还是异质存储,虽然技术在不断迭代,但目的始终没有变化,即保证珍贵的档案数据的安全性。 只有结合最新档案相关要求和技术发展潮流,提升相关技术能力,才能逐步建立起电子档案数据的安全备份体系,实现长期保存。

查看原文