电 话:18937133779
网 址:https://www.zboao.com
邮 箱:zboao@qq.com
随着社会信息化的迅速发展
纸质档案数字化
定义
档案数字化是随着计算机技术、扫描技术、OCR技术、数字摄影技术(录音、录像)、数据库技术、多媒体技术、存储技术的发展而产生的一种新型档案信息形态将其转化为存储在磁盘、光盘等载体上,并能被计算机识别的数字图像或数字文本的处理过程。
档案数字化是一种新型的档案信息管理模式,它把各种载体的档案资源转化为数字化的档案信息,以数字化的形式储存,网络化的形式互相连接,利用计算机系统进行管理,形成有序结构的档案信息库,及时提供利用,实现资源共享。
数字化步骤
TWO
前期档案整理
●档案借出
从档案室接件,填写档案移交清册,一式两份。拿到档案后,开始核对档案数量,数量核对无误后签字确认,将档案拿回加工现场。
●目录数据准备
按照各类档案整理规定的要求,在档案管理系统著录目录数据。如有错误或不规范的案卷题名、文件名、责任者、日期、起止页号等,应进行修改。
●拆除装订
在不去除装订物情况下,会影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。
●页面修整
破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。
档案扫描
●扫描方式
(1)根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描。
(2)纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案,可采用高速扫描方式以提高工作效率。
●扫描色彩模式
(1)扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用彩色。
(2)页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。
(3)页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。
(4)页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可采用彩色模式进行扫描。
●扫描分辨率
(1)扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。
(2)采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般应设为200-300dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。
图像处理
●图像数据质量检查
(1)对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,应重新进行图像的处理。
(2)由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。
(3)发现文件漏扫时,应及时补扫并正确插入图像。
(4)发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。
●纠偏、去污、图像拼接、裁边处理
(1)对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。
(2)对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。
(3)对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
(4)采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。
图像存储
●存储格式
(1)采用黑白二值模式扫描的图像文件,一般采用PDF格式存储。
(2)采用灰度模式和彩色模式扫描的文件,一般采用PDF格式存储。
●图像文件命名
(1)纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。如图像文件较大,不便于网络浏览,可拆分为多个图像文件,文件名后增加A、B、C等区别。
(2)分别建立文件夹,以文件档号命名,并存储对应图像文件。
数据挂接
将每一份纸质档案扫描所得的图像存储到相应档号的文件夹后,认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中文件的总页数是否相同等。通过每一份图像文件所在文件夹的名称与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。