admin 管理员组文章数量: 1086019
2024年4月20日发(作者:unique用法搭配)
档苑论坛
文书类电子档案长期保存封装格式规范标准的改进
文/丘美嫦陈开清陈道
摘要:随着近年来办公系统设施设备的不断升级换
代,如何更好地管理文书电子档案已迫在眉睫
。文章从对
现行的国家文书电子档案长期保存格式标准存在的问题出
发,从实际业务需求方面进行多方面考虑
,提出改进建
议,并分析其改进的可行性,以供相关研究参考
。
关键词:电子档案;长期保存;文件格式
当前,我国在电子文书档案的保存上并未实现全面统
一标准格式,各个电子档案系统厂家的归档保存格式不尽
相同,不同系统间的电子档案并不能很好地关联及识别。
长此以往,在未来国内统一进行全面电子档案单套制管理
的推广工作时,必然需要耗费大量的资金及人力物力对现
有的电子档案格式进行统一转换
,严重的还会造成重要历
史档案数据的丢失,给国家、企业造成巨大损失
。因此,
进一步优化更新现有的电子文件封装规范,
以推进电子档
案统一归档保存,已经变得紧急而迫切
。
1定义
文书电子档案长期保存格式,是指统一生成的电子文
件封装包格式,与
计算机软硬件无关,适用于电子文件交
换、长期保存和利用的有效文件格式。文书电子档案单套
制管理,是指文书档案仅以电子形式长期保存
,不再要求
同时打印为纸质文件进行保存。
2概要介绍
规范是在《文书类电子文件元数据方案》(DA/T46–
2009)的基础上进行改造而来,
其基于
XML文件格式进行
电子文件封装,目的是利用标准的、与软硬件无关的XML
描述语言将电子文件与其元数据按照规范结构封装在一个
文件中,以维护电子文件与其元数据的完整性
,并保障
两者之间的可靠联系
,实现电子文件自包含、自描述和
自证明
。
元数据是描述电子文件的背景、内容、结构及其管理
过程的数据。元数据管理有助于保证电子文件的真实性
、
完整性、可靠性、可用性(简称“四性”),
保障电子文件
的证据特性,便于对电子文件的理解、管理、交换和利
用,是电子文件管理中必不可少的一部分
。
电子文件主要指各级各类档案馆、机关、团体、企事
业单位和其他社会组织对计算机系统中直接生成的文书类
08
电子文件(含纸质文件/档案数字化图像、文本),
以及与
此类电子文件相关的电子文件
(如草稿文件、审批文件、
及其他相关附件等
)。
DA/T48–2009以Base64编码的方式
,将所有电子文件
的二进制0和1数字转为以字母和数字存取的一长串文字,
然后嵌入到存储电子文件元数据的XML文件中,将文件保
存为.eep后缀格式,以表示此文件为eep标准文件
。
另外,规范还引入了保存修订版本管理,以及数字签
名的功能,在电子档案单套制管理场景中,
电子文件产生
的各个关键环节的修改都会保存具体的电子文件及元数
据,以及对这些电子文件及元数据生成的数字签名
,当再
次对电子档案进行修改时,
将会产生新的修订版本内容,
同时会将过去修订版本的内容一起嵌入保存在其中
,并再
次进行电子签名
,这一系列的操作流程,为电子档案的
四性”检测提供关键的数据结构保障
。
本规范对文书电子档案长期保存业务需求的演进有着
重要的里程碑意义,相比于过往传统的电子档案归档存储
管理方法
,其好处有:
(1)明确定义了电子档案元数据的具体内容
,规定了
电子文件每一个元数据字段的含义及格式要求,这对各个
档案部门如何整理元数据提供了指导标准
;
(2)将元数据和电子文件整体成一个文件,避免了元
数据和电子文件分开保存成多个文件而带来的网络传输
、
文件存储的麻烦,也为电子档案管理带来了便利;
(3)可以对元数据和电子文件集合进行统一数字签
名,可以更好地进行元数据及电子文件的统一
“四性”检
测
;
(4)保存了每次修订版本的历史痕迹
,可以详细追踪
文书电子档案产生的全过程
、发生时间、相关责任人等。
3存在的问题
(1)规范严格限定了文书电子档案的来源、
档号、内
容描述的详细信息,但是结合部分行业具体的收发文的信
息需求,在现行的规范上不能进行扩充,
电子档案在流
转、移交、备份还原过程中,会导致部分信息内容缺失。
(2)规范要求电子文件先以Base64编码后,插入到元
数据XML文件中,目的是将电子文件和元数据封装在一起,
以便长期存储管理。
但是
Base64转码、电子文件的大小对
2019.11下兰台内外
“
整体的性能有较大的影响
,文书类电子档案一般是几十字
节至几兆大小,但是如果有一些较大的电子文件
(如大项
目的标书类),一个
文件可能有几十上百兆,这种大文件
在转为Base64的过程中会消耗服务器的大量性能,甚至有
可能直接让服务器死机
。并且同样的文件在转成
Base64后
存储,也会比原文件占用多一倍甚至几倍的存储空间
,同
时规范未要求压缩存储
,会浪费很多的存储空间。
(3)规范中约定了对电子档案进行数字签名的方式是
对XML文件中的整个
“被签名对象”进行签名,并将签名
结果及相应的数字证书信息一同保存在XML文件中。但是
规范并没有详细约定数字签名的过程算法及具体规则
,只
通过一个“签名规则”文本元素,让电子档案管理系统用
文字语言描述具体签名的算法
,这样产生了隐含的无法统
一的问题点,各个电子档案管理系统的软件厂商的算法都
可以自由发挥,在
电子档案移交时,就有可能会遇到无法
有效地对电子档案的签名信息进行“四性”
检测认证。
4改进建议
(1)在现有的标准基础上,增加可以根据行业特殊要
求,允许根据行业需求扩充一些新的元数据信息
,这些元
数据信息是对标准元数据信息的补充,不影响通用标准的
使用,也可以让各行业进行扩充
,以保存更完整的信息,
可以在电子档案备份、还原、移交等业务操作过程中保持
电子档案信息的完整
。
(2)修改现有的电子文件保存格式,电子文件不直接
以Base64的形式保存到XML文件中,
取而代之的是获取电
子文件的哈希码(证明文件没有被修改过的一串短码
)
后,
再将其插入到
XML文件中,
无须对电子文件进行
Base64编码,对系统性能影响比原先小很多,
可以作为电
子文件完整性验证,对电子档案进行数字签名时,
只对
元数据及各电子文件哈希码生成的二次哈希码进行签名
即可。
另外,将当前以XML进行封装,改为以ZIP压缩包的形
式存储
,元数据
XML文件及所有电子文件
,以单独的文件
形式分目录在压缩包里,元数据的版本管理与数字签名内
容的生成方式继续沿用现有规范的要求进行生成管理
,所
有修订版本产生的新的电子文件不可覆盖原有版本的电子
文件,而是在文件名或文件夹名称基础上增加修订版本号
的方式进行区分
。
(3)在规范中统一文书电子档案数字签名的算法及过
程,不应存在描述不清楚的内容,也不应存在歧义
,所有
的文书电子档案均采用统一的签名算法
,跨系统、跨组织
移交接收电子档案也能够正常进行“四性”
检测,以保证
电子档案的延续性
。
2019.11下兰台内外
档苑论坛
进行以上改进后
,文书电子档案将可以实现元数据信
息的扩充,在整个业务操作过程中始终使用统一的格式
,
包括备份还原、
移交、网络传输等,而且所有国家机关、
部门、事业单位、国企及社会企业、团体均可以统一使
用,同时再进行改进
,实现除文书类电子档案外,成为所
有类型电子档案的统一保存格式
。
5改进的可行性
采用ZIP压缩包封装元数据及相关电子文件是现代许
多优秀文档处理管理类软件的统一做法
,如微软的
OFFICE
文件格式,
从
2007版开始就采用此类文件格式保存
,可使
用常见的压缩/解压缩软件打开WORD、EXCEL、PPT等文件
,
可以看到文件的所有相关XML文件及其他资源文件
,以
XML
作数据描述,连同图片
、音频、视频等统一压缩打包,此
举推动了文档处理软件行业的进一步统一。
国产的金山
WPS软件能实现比过往旧OFFICE版本更好的兼容性
,也在
文档的扩展性、存储空间等方面有不小的优化
。又如
JAVA
语言编译打包的jar、war、ear包文档格式
,以及安卓系
统应用程序打包的apk包,也是采用压缩格式保存,压缩
文件里面的内容也是开放的XML及其他资源文件
。至今,
微软OFFICE是世界上最大的办公软件之一,JAVA是世界上
最高占有率的开发语言
,安卓是世界上最多移动终端安装
使用的操作系统,本文就是在参考这些软件的文件存储格
式的基础上,结合文书电子档案现有的国家标准提出的改
进建议,具有很强的可行性
。
6结束语
目前,国家正在积极推进电子档案长期保存格式的标
准化、规范化,
但是仍有很长的一段路要走,档案“信息
孤岛”的局面仍在未来一段时间内存在,规范和标准并非
总是一成不变的,
通过规范和标准的自身的演变及进化,
能够对电子档案保存提供更加明确、可行的工作指导规
范,促进电子档案长期保存格式的进一步统一。
参考文献
:
[1]DAT48–2009.基于XML的电子文件封装规范
S].
[2]DAT46–2009.文书类电子文件元数据方案
[
S].
作者简介:丘美嫦(1977.12—),女,广东梅州人,
副研究馆员
,本科,从事高速公路档案管理。
项目:本文系2017年广东省档案局科研项目“
高速公
路营运项目电子档案单轨制试点研究”(批准编号:
YDK-170-2017
第一作者:
)
丘美嫦
阶段性
,
成
广
果之
东省南
一
。
粤交通投资建设有限公
司;第二作者:陈开清,广东省南粤交通投资建设有限公
司;第三作者:
陈道,广州市星晨互联科技股份有限公司
09
[
版权声明:本文标题:文书类电子档案长期保存封装格式规范标准的改进 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://roclinux.cn/b/1713597769a642615.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论