档案数字化加工流程.docx
《档案数字化加工流程.docx》由会员分享,可在线阅读,更多相关《档案数字化加工流程.docx(8页珍藏版)》请在冰豆网上搜索。
档案数字化加工流程
1.档案数字化加工流程
档案数字化是由多个流程构成,每个流程环环相扣,前一流程完成的好坏直接影响下一流程工作的开展。
根据《纸质档案数字化规范》等国家关于档案数字化的相关规定和紫光数字化团队多年的项目经验,将档案数字化总体流程用拓扑结构表示如下:
1.1.纸介质档案数字化流程
1.1.1.档案出库
为保证档案数字化工作顺利进行,档案数字化工作需要用户另外提供场所,因此,从档案室提卷是数字化工作的第一个步骤。
档案是客户宝贵的信息资源,具有唯一性和不可复制性,在数字化过程中必须要保证档案没有遗失、没有损坏、要做到不重不漏。
要保证出库的档案能保质保量地归还做好档案出库登记是非常重要的。
为保证档案不遗失,档案出库采取一日一提,当天工作开始前半小个小时紫光数字化团队在用户档案负责人的陪伴下去档案室提取档案,当天工作结束前半个小时归还所提档案。
在档案从密集架上下架时,要按照档案原来的排放顺序,作好记录,在档案归还时能保证档案能按原位置排列,不打乱其原排放顺序。
Ø档案出库要登记以下内容:
提卷人、提卷时间、存放位置、提卷的案卷号(盒号)、提卷数量等,作为归还时的核对依据,便于用户清点档案。
档案提卷需用户在场,在用户和紫光数字化工作人员签字确认数量后进行档案移交。
Ø在工作结束后归还出库档案时需用户清点,紫光档案数字化工作人员按照档案原来的排放顺序在密集加上依次排好,用户确认无误后签字。
1.1.2.档案整理
为确保档案数字化质量,扫描完图像清晰可辨,并符合国家关于档案数字化的要求,需要对档案进行适当整理,并视需要做出标识。
包括:
目录数据准备、拆除装订、区分扫描件与非扫描件、页面平整、整理登记和装订等工作。
1.1.2.1.目录数据的准备
根据《档案著录规则》(DA/T18-1999)要求,规范档案目录内容,包括确定档案目录的著录项、字段长度和内容要求。
如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,在征得客户同意后应进行修改。
紫光数字化工作人员需将修改的内容详细记录在紫光自主研发的档案数字化流程软件中,并作为扫描时参考。
1.1.2.2.区分扫描件和非扫描件
按要求把同一案卷中或同一件中的扫描件和非扫描件区分开,无关和重份的文件不扫描,在征得客户同意的情况下抽出无关和重分的文件,并将抽出的文件详细记录在档案数字化流程软件中,备以查考。
同时对非扫描件做标记,便于扫描时区分。
1.1.2.3.对案卷查重、补漏
根据卷内目录逐页检查该案卷内档案是否有重份、缺页的情况,在正文中规定有附件的文件要检查附件是否齐全、完整。
对文书档案按件整理的情况,根据归档文件目录逐件检查页数、题名是否与原文件相符。
根据《归档文件整理规则》(DA/T22-2000),对于批复文件检查该文件后是否有对应的请示文件,转发文后面是否有被转发文,复函是否有对应的来函。
如有缺失,需将缺失内容记录在档案数字化流程软件中,并及时通知客户档案工作负责人,协助查找缺少的文件,并在扫描工作开始之前补全缺少的文件,若因各种原因客户找不到缺失文件,数字化工作人员需在紫光档案数字化流程软件中对相应的文件做记录,并在紫光档案管理系统中录入该条档案信息时在备注中做记录,同时对应的纸质文件目录也需在备注写明缺少内容。
1.1.2.4.检查案卷排列顺序
根据《归档文件整理规则》(DA/T22-2000)中规定,装订时,正本在前,定稿在后;正文在前,附件在后;原件在前,复制件在后;转发文在前,被转发文在后;来文与复文作为一件时,复文在前,来文在后。
在整理档案时,检查文件顺序排放是否符合整理规则,如果顺序不符合在取得客户同意时,重新排放文件顺序,使其符合国家的相关规定。
1.1.2.5.编制页码
为便于数字化流程交接,整理过程中需对每份文件编写页码,在紫光档案数字化流程软件中作记录,备以查考。
编写页码需用铅笔逐页填写,禁止漏编、重编,件码均从1开始。
对于双面打印的文件每面都要编写页码,单面打印的文件只在有字面标记页码。
为确保页码位置统一、整齐,页码写于每页文件的正面的右下角,反面的左下角,所写页码要不影响原文的阅读。
若客户有别的编码规则,按照客户的要求编码。
每编完一份文件,数字化工作人员需在档案数字化流程软件中标明这份文件的页码。
1.1.2.6.页面修整
破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。
在修整的过程中要小心、细心,避免损坏档案原件。
1.1.2.7.拆除装订
与客户档案负责人共同协商档案的拆分原则,并确定哪些档案可以拆除装订,哪些不能拆除装订,需保持原状。
在拆除装订过程中,对档案实体要轻拿轻放,小心拆除装订,不能损坏档案。
拆除订书钉时,要用钳子从反面将订书钉的两个脚夹断,再从正面用钳子将订书钉主体摘除,禁止用夹子或钳子直接从正面将订书钉拽出,造成档案原件的破损。
1.1.3.目录建库及数据录入
根据用户目录数据库及著录要求,在客户要求的档案软件管理系统或其他通用的数据格式中建立案卷目录库和文件目录库等。
与用户协商共同制定各类档案的目录库,著录时严格遵守《档案著录规则》(DA/T18-1999)。
对于建立完毕的目录数据库采取人工校对或软件校对(一稿双录、人机校对)两种方式。
一稿双录、人机校对是指两名录入人员同时录入同一份档案的目录数据,软件自动对两名不同的录入员的数据进行机器校验,当两者一致时跳过,默认此条信息输入正确,若二者输入不一致时,软件就会报警,并将这些项目标识出来(显红),且不让通过。
软件提示“数据不一致请确认”。
随后进行人工校验,由校验员将软件标识出的不一致数据项目与档案原稿进行比对比将数据修改正确。
1.1.4.打印报表
在数据库建立完毕后,对照档案实体的排列顺序,在档案管理系统中打印案卷目录和卷内目录。
若是以件为单位整理的文书档案,则打印归档文件目录。
将打印目录依次放入对应卷内或者盒内。
同时形成档案案卷目录或者归档文件目录汇编一套,在数字化工作结束时交给客户,作为纸质载体的检索工具,为档案利用者提供多种检索方式。
1.1.5.扫描
扫描是档案数字化的最关键、最重要的部分,扫描的好坏直接影响数字化工程的质量。
根据不同档案纸张的大小、厚薄及页面色彩,选择不同的扫描仪。
较为规整的选择高速扫描仪,较薄、较厚和不规整的用平板扫描仪,幅面较大的图纸用工程扫描仪。
这样既能达到保护档案的目的,也能提高档案数字化加工的速度。
1.1.5.1.扫描原则
Ø不重、不漏:
档案的每一张纸都要扫描,无论单面、双面有信息的都要扫描,并且要保证不能出现重复扫描;
Ø不重、不轻:
不重不轻主要时保证扫描后的档案线条清晰、无断线、无断字、线条不过黑、字迹不成黑团、清晰可辩。
同时也保证了扫描后图像大小控制在一个合理的范围内;
Ø数字化人员严格按照扫描流程,保证不扫错、扫乱。
根据纸张情况采用不同扫描仪扫描之后,档案要恢复原来的排放顺序;
Ø尽量保持扫描文档的数量和存储顺序与原档案资料的数量和顺序一致。
1.1.5.2.扫描仪的选择
Ø根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。
Ø大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。
Ø纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。
ØA4幅面档案的扫描一般使用高速扫描仪,因此,扫描人员应该非常小心,不合适的纸张,采用平板扫描仪来扫,在卡纸的时候,不能硬拽,以免损毁档案,应该把扫描仪的盖子打开,解锁扫描装置,然后轻轻拽出。
如有褶皱,应该使用厚重的平整物体(如:
书等)压放,使其恢复原来的平整。
ØA4以上幅面的图纸因为幅面较大,因此扫描一般采用横向的方式进行扫描。
这样扫描有几个好处:
一是扫描仪的速度和扫描的分辨率以及扫描的长度有关,因此,横向扫描能提高扫描速度,减少扫描时间;二是工程扫描仪是滚筒式的,图纸在扫描器中的进纸的距离越短,图纸被损毁的几率越小。
Ø图纸的扫描需要两个人同时进行,第一个人负责整理图纸,记录图纸大小和数量、并扫描;第二个人在扫描的时候要从工程扫描仪的另外一头,轻拽、托图纸,保证图纸受力均匀,并在扫描完后,按照原样折叠好图纸,放入盒中。
Ø图纸扫描前,要注意图纸中有无折痕较深或者图纸已经发生撕裂,如果有这样的图纸,在扫描的时候要使断痕垂直于工程扫描仪的方式扫描,这样能保证不使折痕在扫描过程中撕裂档案。
Ø在最开始的图纸扫描过程中,要反复试验扫描的对比度、明暗度,试扫并处理后,由客户检查是否合格。
如果合格,则记录下来,并应用于以后的扫描中。
紫光数字化加工小组携带的扫描仪具有扫描后调节明暗度和对比度的能力,能够极大的方便扫描,并减少扫描的次数,因此能够非常有效地保护档案。
1.1.5.3.扫描色彩模式的选择
Ø扫描色彩模式一般有黑白二值、灰度、彩色等;
Ø页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描;
Ø页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描;
Ø页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,需要采用彩色模式进行扫描。
1.1.5.4.扫描分辨率的选择
分辨率是指单位长度内图像包含的点数或像素数,一般用每英吋点数(dpi)表示。
在扫描前,根据纸张情况,选择合适的分辨率,保证扫描完的图像清晰、完整,不影响图像的利用效果。
Ø一般的屏幕阅读,采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般选择200dpi即可;
Ø需要进行OCR汉字识别的档案,选择分辨率一般为300dpi;
Ø特殊情况下,如文字偏小、过于密集、清晰度较差等,可适当提高分辨率。
但同时应保证在电子图像清晰可读,且存储容量尽可能较小。
1.1.5.5.扫描图像存储格式
Ø采用黑白二值模式扫描的图像文件,一般采用TIFF(G4)格式存储。
采用灰度模式和彩色模式扫描的文件,一般采用JPEG格式存储。
存储时的压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。
Ø提供网络查询的扫描图像,存储为PDF(双层PDF)或客户要求的其他格式。
1.1.5.6.扫描图像命名规则
Ø纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名;
Ø多页文件可采用该文件档号并建立相应文件夹,按页码顺序对图像文件命名。
1.1.5.7.图像校对
为保证扫描的质量避免扫描过程中发生重复扫描和漏扫的现象,在扫描工作完成后将对扫描图像进行人工的校对,发现问题并及时纠正。
对于重扫的文件图像经确认无误后删除多余扫描图像,漏扫的要补扫。
对于扫描后图像质量不过关的图像,要重新扫描,直到扫描图像达到质量要求。
1.1.6.图像处理
图像的处理,是保证数字化质量的重要步骤。
由于档案原件及扫描仪的问题,扫描后的图像可能存在如下问题:
倾斜、有黑边、有污迹、有索引孔、图纸还会有折痕产生的黑线、整个图像某些部分过浅,某些部分过黑等。
1.1.6.1.一般图像处理
Ø纠偏
对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。
对方向不正确的图像应进行旋转还原,以符合阅读习惯。
Ø去污
对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等应进行去污处理。
处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。
Ø图像拼接
对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
Ø裁边处理
采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。
1.1.6.2.图纸档案图像