纸质档案数字化工作中的问题与对策_档案数字化工作方案

2020-02-28 其他范文 下载本文

纸质档案数字化工作中的问题与对策由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“档案数字化工作方案”。

纸质档案数字化工作中的问题与对策

一、问题的提出

数字化工作中最常遇见的问题可以归结为以下几个方面: 1.如何保证数字化档案的能够忠实地还原原件? 2.如何保证数字化档案的长期保存?

3.如何减少数字档案加工、存储和利用的成本? 4.如何对数字化档案进行管理? 5.如何有效地利用数字化档案?

问题的解答和对策 1.对于问题1的解答和对策

开展纸质档案数字化工作有两重目的。其目的之一是长期保管,这里存在两种不同情形:第一,“替代性保管”——使用数字化复本替代原件长期保存和使用;第二,“复本保管”——为重要档案原件制作异地保管的数字化复本。其目的之二则是利用。以利用为目的的档案数字化同样区分为两种情况:网络利用和非网络利用。非网络利用范围相对有限,主要集中在文献资料的出版和发行;而网络利用是数字化档案利用的主要形式。

从目前来看,数字化工作的主要目的是以利用为主,保管为辅。无论是利用还是保管,我们认为所选的图像格式必须具有良好的还原性、安全性,即识读、显示出来的数字文件在内容上应与原件完全一致,能够通过数字签名等技术固化数字文件的内容,防止保管、利用过程中的信息篡改。此外,所选格式必须预期较低的迁移频率和迁移损耗,否则,数字档案会随信息迁移而失去原真性,甚至成为无法利用的“数字垃圾”。目前很多地方的数字化图像以黑白和灰度图像为主,彩色图像多用于照片档案,且分辨率很低。各档案馆进行数字化加工时,基本上遵照“纸质档案扫描方式主要采用黑白(二值)方式扫描。当黑白方式扫描清晰度较差时,采用灰度方式扫描,灰度方式一般采用256灰阶。„„照片档案扫描方式可选择彩色或者灰度两种方式扫描”的原则进行,采用的图像格式以TIFF/G4、TIFF/LZW、JPG和PDF为主。对于普通纸质档案,其扫描分辨率一般定为150dpi左右,部分档案馆标准更低,只有50~100dpi。照片档案扫描分辨率一般定为300dpi左右。

针对上述情况,我们采取的做法是在国家档案局《数字化加工规范》之上,制定了杭州市《加工规范》,要求制止档案扫描采用24bit真彩,300dpi以上的分辨率,照片档案要求采用600dpi以上的分辨率,归档格式采用JPG格式,全部采用光盘保存,利用格式采用Djvu格式,全部存放在存储设备上。由于Djvu自身采用了分层显示、高压缩比、格式及算法开放等诸多优点,很快得到了推广和采。

对于问题2的解答和对策

对于数字化文件的长期保存,主要从两个方面加以解决:一是管理系统的层面,二是文件格式的层面。

首先,我们要建立起一个能够承担长期数字档案长期维护的一个可信数字仓储TDR系统,传统的档案管理系统显然已经无法满足这样的需求,而OAIS参考模型是数字仓储和数字保存领域重要的国际标准,为数字资源保存提供了全面一致的框架。TDR遵循这一模型,有利于在一个统一的概念、术语和模型框架下,进行TDR的规划建设,易于开展分布式TDR之间数字资源的共享,以及规范化的管理和发展。在TDR中,一个非常重要的功能就是对AIP的维护、更新、技术仿真以及迁移。要做到这点,必须从标准规范和技术手段同时入手。技术标准的是一个不管地自我进化的一个实体,我们在建设TDR时需要考虑到对原有标准的继承和过度,我们应当关注虚拟化技术。虚拟化技术不仅仅能够为我们节省运维成本,在TDR系统中,更为重要的功用是能够对原有的系统环境进行模拟和测试,使得我们面对突然的技术升级时有充分的适应期和缓冲期。目前,我们已经全面对服务器进行了虚拟化,未来将对存储系统进行虚拟化,通过计算资源和存储资源的统一虚拟化,通过内容管理平台进行系统管理,为构建TDR系统打下一个良好的基础。

文件格式层面,我们必须坚定地采用开放的格式标准,这是必须遵守的底线和原则。标准规范方面我们认为国家档案局颁布的《电子文件长期保存版式文件技术规范》是一个非常好的起点,它从标准的角度明确了电子文件的长期保存格式,为未来我们统一归档格式打下了一个良好的基础。不足之处在于仅规范了原生型电子文件的格式规范,而未对其他类型的电子文件的格式规范做出要求,所以尽快针对数字化加工的格式标准和规范进行重新修订和增补非常重要。同时在标准的制定上,应积极地参与国际标准的制定,否则技术再先进市场也不认可,TD-SCDMA移动通信标准和UOF文档格式就是最好的例子。

对于问题3的解答和对策

在我们档案局、档案馆合二为一,且属于党委或者政府序列的机关单位的特殊情况下,自行对馆藏档案进行加工显然是不合适的。我们的做法是通过服务外包的形式大力培育中介机构来完成此项工作,目前杭州市已有档案服务中介机构30多家,从经济学的角度上说,这以及是一个完全竞争性的市场。在一个完全竞争性的市场状态下,商品的价格会自发地限定在一个价格范围之内,而且价格是比较低廉的。目前杭州市纸质档案数字化加工的成本约每页0.25元(包括了前处理、加工、质检等环节)。通过市场的完全竞争使得我们在数字化加工上的成本降到了一个相对合理的位置。但随之而来的问题在于,众多的中介服务机构出于对市场的争夺以及自身业务素质等因素,会出现恶性压价以及加工质量较低等问题,而行政许可法的设立使得档案局无法限制这类服务机构的市场准入。我们目前的做法是对中介服务机构采取登记备案制度,但收效甚微。同时也在考虑今后将定期发布对中介机构服务水平和质量的分析评定报告,以期各家服务机构提升自己的业务素质和服务水平。

由于我们全面采用了Djvu各式,极大地节省了存储资源,目前已完成约XX个全宗约800万页档案的扫描,而仅占据了大约600GB的磁盘空间,所以我们的存储系统容量从全国范围来说都不算大,同时由于采用了虚拟服务器,能够非常灵活地分配存储资源,所以我们的存储系统资源利用率非常高。由于Djvu文件小,便于在网络快捷利用,完全能够满足在1Mbps带宽的ADSL线路上的浏览和传输(当然Djvu这个优势会随着宽带的带宽逐渐提高而减小)。4.问题4的解答和对策

如何有效地管理数字化档案是一个非常重要但是很少被关注的问题,原因在于大家都认为自己的数字化档案已经很好地被管理了。从电子文件的定义去分析,纸质档案数字化文件也可被视之为一种电子文件。既然是属于电子文件,那么纸质档案数字化文件也应当要遵循电子文件的管理模式,也同样要遵循电子文件管理的原则,也同样要前端控制、全程控制、全过程元数据记录和行为跟踪记录。所以从这个角度来说,目前绝大部分的数字化文件的管理是不到位的,其安全性的保障也是令人担忧的。

在ICA发布的《电子文件管理系统建设规范及功能需求》中,明确地提出了ERMS系统要能够进行混合式档案管理。所谓混合式档案管理,就是指能够对原生型电子文件、间接型电子文件以及实体档案进行统一的管理。而目前由于档案数字化加工采用外包形式,第三方中介机构的加工系统过于简单,无法对数字化过程产生的元数据进行完整地、全过程的记录,导致了数字化文件的元数据大量缺失。而且在各个机关,文书人员在收发纸质文件时,很少会及时就将纸质文件数字化而是统一交到档案室由档案室工作人员来完成或者由第三方中介服务机构来完成,同样造成了数字化文件的元数据大量缺失。所以我们认为现阶段数字化文件不具有凭证作用,不能仅仅因为它是纸质档案的数字化图像,容易遭到篡改,更重要的因素在于,我们没有制定一个规范性的数字化加工的流程规范。所以我们在建设电子文件中心时,要求各单位文书人员在做发文或者收文登记时,就完成纸质文件的数字化工作,同时后台对元数据进行记录。同时在建设ERMS系统时,我们要考虑各类安全措施的应用,如访问控制、数字签名、防扩散的使用。通过构建一个安全的系统环境来保证其产生和管理的电子文件,无论是原生型的,还是间接型的,在未来都能够保证其凭证作用。

在硬件系统建设特别是存储系统建设中,我们注意到档案馆的存储建设不应当要求磁盘高响应时间和短磁盘寻道时间,也就是说高性能不应当成为我们主要考虑的因素。我们更加应当关注存储系统的法规遵循能力(尽管目前我们国家还未出台类似于塞班斯法案SOX或者美国联邦健康保险携带和责任法案HIPAA),不但要构建一个安全的软件系统环境,如何构建一个安全的、遵循法规的硬件系统环境同样值得关注。

问题5的解答和对策

不得不承认,相对于数字图书馆的图书数字化后所产生的经济效益和社会效益,档案数字化所产生的社会效益依旧处于非常低的水平,经济效益更是无从谈起,投入与产出及不成比例,这是我们目前面临的一个非常尴尬的境遇。我们注意到,常春档案局采用了按需扫描的模式用以控制和节省数字化加工过程产生的成本,着对于经费相对不足的地区具有很大的示范效应,也能够一定程度上解决档案数字化投入产生比严重失衡的局面。同时也引出一个需要考虑的问题,暨档案数字化的目的究竟是以利用为主还是以保管为主,还是为了电子文件管理的需要?我们认为对于这个问题,各地区有各地区不同的答案,不能一概而论。

我们遇到的第二个尴尬境遇是,数字化档案的开放利用与保密法之间的矛盾。由于很多地区的档案局(馆)普遍存在人手不足的情况,对档案的开放鉴定工作非常缓慢,(以我们杭州为例,自行添加,此处省略)使得大量本因解密开放的档案仍处于不开放状态,但其内容的公开以不会对社会或者个人造成任何影响,而保密法的定密过于宽泛又导致这些数字化成果无法在互联网得到有效利用,仅限于政务网或者馆内局域网的利用进一步限制了利用人群的数量。

在强调政府信息公开的今天,如何丰富馆藏,提升档案数字化成果的利用率,解决与保密法之间的矛盾非常紧迫,否则档案馆在信息化的浪潮下有被图书馆和互联网边缘化的可能,档案的数字化工作有可能会变得毫无意义。

《纸质档案数字化工作中的问题与对策.docx》
将本文的Word文档下载,方便收藏和打印
推荐度:
纸质档案数字化工作中的问题与对策
点击下载文档
相关专题 档案数字化工作方案 档案 纸质 对策 档案数字化工作方案 档案 纸质 对策
[其他范文]相关推荐
    [其他范文]热门文章
      下载全文