对档案数字资源“异质备份”的理解
档案数据的“异质备份”是目前档案行业经常使用的业务术语,虽然最开始提出时主要是指纸质档案的胶片化,但随着技术的发展,现在主要指对档案数据资源的使用“不同离线介质“进行”离线存储”,实现长期保存。
这个项目自启动以来,我们团队便倾注了极大的热情和精力。在市场调研、需求分析、方案制定等各个环节,我们都力求做到最好。期间,我们不断与合作伙伴沟通协作,共同攻克了一个又一个难题。终于,在激烈的竞争中脱颖而出,成功中标!
这次中标不仅是对我们团队实力的认可,更是对我们辛勤付出的回报。这个项目的成功中标,将为我们带来更多的业务机会和发展空间,也将在行业内树立我们的良好口碑。
早期观点:“异质备份”指电子文件打印为纸质或胶片
问题一:信号不稳定,受环境影响大
这种模拟信号的存储介质由于存储信号是连续变化的波形,所以每个采样点的采样值在播放或者数字化过程中很容易受到外界影响而无法输出唯一数据。 例如: 使用不同品牌、不同精度的扫描仪对同一文件进行扫描将生成不同大小数字化文件。 使用不同品质的磁头或者镜头将显著影响磁带或者胶片的播放质量。
问题二:无法记录复杂电子文件
除可以展开为二维结构的档案数据(如文本类、图纸类和简单图像)外,传统纸质和胶片介质难以记录复杂结构电子文件,如压缩包、镜像文件、数据库备份文件、二进制程序文件、CAD图纸文件等,这些复杂类型数据难以展开为二维结构或线性波形,因此难以在传统介质上进行记录。
问题三:无法恢复为唯一的电子文件
备份的唯一作用,就是用来做“数据恢复”,如果异质备份主要使用“模拟信号”方式进行备份,则将无法准确恢复为原文件(文件大小、内容完全一致),外界光线、磁场将导致每次的文件还原结果都不一致。 可见,无论是“纸质”还是“缩微胶片”都仍然使用模拟信号存储数据,这种存储模式本质上是一种不稳定的存储形态,非常容易受到播放设备、环境和技术种类而导致档案电子文件发生变化,从而导致无法从这类介质中还原唯一的电子文件,难以使用信息化手段对档案数字化文件进行唯一性认证,最终难以起到现代意义上的数字备份效果。 导致唯有原纸质件才具有法律效力,所有的电子还原件难以证明其真实性,带来额外的工作成本。
问题四:误码率高,没有数据纠错机制,极易损坏
最重要的是,这类存储介质缺乏现代意义上的数据修复机制(如数据校验值、数据纠删算法),当一个位置的磁性或者像素丢失后,无法通过数学手段恢复损坏的数据,最终导致数据损坏。 可见,使用“模拟轨”方式存储的档案数据仍然以实物方式管理、难以进行唯一性跟踪、除原件外,也难以在现代单套制体系下进行凭证和真实性认证。
问题五:容量密度小,相关设备造价高、不普及
模拟轨因为存储原理问题难以实现高密度扩展,单张介质存储量有限,需要搭配专业级设备才能实现数据读取和写入(如读取胶片需要专业级镜头设备,初次采购成本较高)。 随着技术发展,目前也有数字胶片技术,即采用模拟信号存储数字型号的方式,先将数字信号转为图形码(如二维码),然后将图形码刻蚀在传统胶片上,从而实现使用传统胶片记录数字信号,但目前仍受限于市场和技术推广。
现代观点:“异质备份”指在“不同存储介质”上进行“离线备份”
围绕“磁介质”和“光介质”离线存储,相关的标准如下: 相比于传统的胶片等技术,光介质和磁介质主要具备以下优势:
优势一:天然符合支持档案行业“离线存储”
蓝光光盘是天然的离线存储介质,当不读取数据时,光盘与驱动器分离,进而与系统断开实现离线存储。 硬磁盘的离线存储通常需要借助人工管理或硬盘库管理,实现对指定硬盘进行断电离线管理。
优势二:低误码率,数据纠错算法与介质质检
现代化的存储介质均具备数据纠错算法,即轻微的环境干扰或介质损坏不会导致数据损坏,驱动器一般可以进行数据解码恢复。 磁介质具备S.M.A.R.T.自动化检测功能,光介质需要使用特制检测光驱实现介质检测,完善的介质检测可以避免存储数据潜在的丢失风险。
优势三:容量密度大,保存时间长
目前蓝光光盘可以最大做到200GB/张的容量密度。 硬盘可以做到20TB/块,远超传统的模拟存储介质。
随着时代和技术的发展,各种术语的含义也在发生变化,无论是长期保存、离线存储还是异质存储,虽然技术在不断迭代,但目的始终没有变化,即保证珍贵的档案数据的安全性。 只有结合最新档案相关要求和技术发展潮流,提升相关技术能力,才能逐步建立起电子档案数据的安全备份体系,实现长期保存。
查看原文