关于印发《甘肃省纸质档案数字化操作
关于印发《甘肃省纸质档案数字化操作
规范(试行)》的通知
甘档发〔2010〕133号
各市州档案局,省直各部门、大专院校:
为进一步加快全省档案信息数据库建设步伐,规范纸质档案数字化扫描工作,根据国家和我省有关档案工作业务规范,结合我省当前纸质档案数字化的实际需求,特制定《甘肃省纸质档案数字化操作规范(试行)》。现印发给你们,请认真执行,在执行中如有问题请及时反馈到甘肃省档案局电子文件管理处。
2010年12月31日
主题词:档案 数字化 规范 通知
甘肃省档案局办公室 |
(共印:170份)
甘肃省纸质档案数字化操作规范(试行)
1、总 则
1.1范围
本规范规定了纸质文书档案数字化工作的基本环节和技术要求。
本规范适用于甘肃省各级档案部门对纸质档案的数字化加工处理及数字化成果的管理。
1.2规范引用文件
本规范依据以下国家标准制定:
DA / T 31 一2005 纸质档案数字化技术规范。
GB/T 18894-2002电子文件归档与管理规范
DA/T 18—1999 档案著录规则
2、基本要求
2.1基本原则
纸质档案数字化的基本原则是使档案信息资源准确、方便、快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。
2.2数字化对象的确定原则
应当对所要进行数字化的对象按照一定的原则和方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化。
2.3符合国家法律法规的原则
纸质档案的数字化,必须符合国家档案开放规定以及有关规定。
2.4 价值性原则
属于归档范围且应永久或长期保存的档案可列入数字化加工的范围。
3、基本环节及过程管理
3.1纸质档案数字化的基本环节主要包括:档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。(具体流程见附录图1)。
3.2应加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数
字化档案信息的安全。
3.3纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。
4、前处理工作规范
4.1 档案调卷及质检
对调得的档案进行前期质量检查工作,对有以下情况的案卷视为质量不合格案卷,需要填写调用扫描案卷检查登记表,并交整理人员重新整理。
4.1.2案卷无档号、档号错误或者档号重复。
4.1.3案卷无卷内目录或者卷内目录不正确。
4.1.4卷内文件页码不正确,例如重编或者漏编页码。
4.1.5未进行解密划控鉴定的案卷。
(参考表格见附录表一)
4.2 档案整理
在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要做出标识,确保档案数字化质量。
应在扫描之前对没有编页或编页不规范的档案重新进行编页。
应在档案页面的底端用铅笔(建议用2B铅笔)编写页号,编页不应压盖档案内容,页面底端已有页号时,应将原页号用铅笔划去以示区分。
使用阿拉伯数字从“1”开始依次编写页号,属于同一案卷或文件下的档案,应保证页号编写的连续性。
在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。
4.2.5页面修整
破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等)后再进行扫描。
4.2.6档案整理登记
制作并填写纸质档案扫描检查核对登记表(参考表格见附录表二),详细记录档案整理后每份文件的起始页号和页数。
4.2.7区分扫描件和非扫描件
按要求把同一案卷中的扫描件和非扫描件区分开。普发性文件区分的原则是:无关和重份的文件要剔除,有正式件的文件可以不扫描底稿。
扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持卷内文件的顺序不变,做到安全、准确、无遗漏。对加工好并装订的档案实体进行质量检查,登记,出现以下情况的应退回加工单位重新整理。
5、目录建库
5.1目录数据准备
按照《 档案著录规则》 (DA / T18 一1999 )的要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件题名、责任者、起止页号和页数等,应进行修改。
5.2数据格式选择
目录建库应选择通用的数据格式。所选定的数据格式应能直接或间接通过XML或者TXT 文档进行数据交换。
5.3目录数据质量检查
采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。
6、档案扫描
6.1扫描方式
6.1.2纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率;不适合拆卷的档案可采用零边距扫描仪或照相机拍摄方式。
6.2扫描色彩模式
6.2.3页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,采用灰度模式扫描,档案中的蓝图等特殊档案也采用灰度模式扫描。
6.2.4页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,宜采用彩色模式进行扫描。
6.3扫描分辨率
6.3.2采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率应选择 ≥150dpi 。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率;需要进行OCR汉字识别的档案,扫描分辨率建议选择≥300dpi 。
6.4扫描登记
认真填写纸质档案扫描检查核对登记表单,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法(参考表格见附录表二)。
7、图像处理
7.1纠偏
对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。
7.2去污
对图像中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。
7.3图像拼接
对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
7.4裁边处理
采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。
7.5图像数据质量检验
求时,应重新进行图像的处理。
新扫描。
8、图像存储
8.1存储格式
扫描的图像应保存为TIFF 、JPEG或PDF 格式,一般黑白二值图像保存为TIFF ( G4 ) 格式,灰度或彩色图像保存为JPEG 格式,以单份文件为单位存储为PDF 格式;数码相机拍摄的图像应保存为JPEG 格式。
8.2图像文件的命名
全宗号 目录号 案卷号 份文件夹号 文件号
3位 3位 4位 4位(或8位) 4位(或8位)
001 001 0001 0001(00000001) 0001(00000001)
全宗号 归档年度 机构(问题) 件文件夹号 文件号
3位 4位 4位(或8位) 4位(或8位) 4位 (或8位)
001 2010 0001(00000001) 0001(00000001) 0001(00000001)
9、数据汇总挂接
9.1 汇总挂接
档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认“合格”后,通过相应的软件与档案文件目录数据库进行批量挂接,通过网络及时加载到数据服务器端汇总。
9.2 检查挂接
数据挂接后,以文件级目录数据库为依据,对挂接的图像文件进行检查,核对图像文件的命名格式是否符合要求,发现错误及时修正。
9.3 挂接登记
对汇总挂接及检查挂接的情况进行登记,对挂接错误的注明错误原因、处理
办法及修正结果(参考表格见附录表三)。
10、数据验收
10.1数据抽检
以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。一个全宗的档案数据验收时抽检的比率不得低于5 %。
10.2验收指标
合格率=抽检合格的文件数/抽检文件总数X 100 %
10.3验收登记
认真填写纸质档案挂接验收登记表单(参考表格见附录表三)。
11、数据备份
11.1数据备份
经验收合格的完整数据应及时进行备份,同时为保证数据安全,备份载体的选择应采用在线、离线相结合的方式实现多套备份,并异地保存。备份介质若为一次性写入光盘,则至少备份3套。
11.2数据检验
备份的数据应进行检验,检查备份数据是否能被计算机正确读取、数据信息是否完整、文件数量是否准确等。
11.3备份标签
数据备份后应在相应的备份介质上做好标签,并简略说明备份内容和备份时间,以便查找和管理。
11.4备份登记
对每次备份的内容、数据大小、备份时间、备份套数及数据存放位置等进行记录(参考表格见附录表四)。
12、数据管理
12.1 管理要求
加强对纸质档案数字化成果的管理,制定相应的管理制度,对备份数据定期检查,确保数据的安全、完整和长期可用。
12.2 保管环境
12.3 检测与维护