佛山档案馆纸质数字化第九期项目需求.docx
《佛山档案馆纸质数字化第九期项目需求.docx》由会员分享,可在线阅读,更多相关《佛山档案馆纸质数字化第九期项目需求.docx(33页珍藏版)》请在冰豆网上搜索。
佛山档案馆纸质数字化第九期项目需求
佛山市档案馆纸质数字化(第九期)项目需求
一、项目技术要求
1.1.项目基本条件
1.1.1.本项目服务内容概述
本次档案数字化加工项目是对佛山市档案馆馆藏档案进行数字化处理,按照《佛山市档案馆纸质档案数字化验收标准》的要求对案卷级和文件级原始的机检目录进行对应性、正确性、完整性的核对,将档案实体用扫描的方式形成图片档案数据,将最终完成的数字化成果进行备份保存。
本项目预算金额为400000元,处理纸质档案规模约89万页。
本项目待处理的纸质档案来源于佛山市档案馆馆藏档案,档案形成于1950年至2020年间,大部分档案形成于1950年至1990年间,实体档案老旧、整理质量较差;本项目待处理的档案涉及的全宗单位较多,档案的整理质量差异较大;档案类型为文书档案、专业档案、及小部分纸质照片档案;在归档方式方面,以案卷形式及单份文件形式归档的档案皆有;在档案幅面方面,以16开、A4为主,兼有A3、8开等其他幅面;档案纸张颜色、厚薄不一,正本与原稿间杂,部分档案出现字迹褪色;档案卷盒新旧参差。
1.1.2.本项目档案的整理状况
(1)本项目档案均进行过编目加工,但编目的质量参差不一,编目错误现象普遍存在。
(2)本项目大部分档案的全宗号、目录号、案卷号编制基本符合规范要求。
(3)本项目大部分以案卷方式归档的档案在归档整理时进行了页码编制,但漏码、重码、错码、空码等错误现象较多;极少部分以案卷方式归档的档案没有编制页码;本项目大部分以单份文件方式归档的档案没有编制连续的页码。
对上述在页码方面存在问题的档案需要进行页码修正或者重新编制页码。
(4)本项目大部分档案均编制有纸质目录,包括:
与档案装订在一起的卷内文件目录1份,独立装订成册的档案目录1—2份。
绝大部分纸质目录是打印的,极少量纸质目录为手写。
(5)本项目大部分档案的目录条目已经输入计算机,形成电子目录,但其中存在有页码、保管期限、题名等字段信息录入错误的现象,需要对目录进行修订;本项目极少部分档案的目录条目没有输入计算机,对这部分目录需要进行补录。
1.1.3.工作场地
本项目工作场地由采购人免费提供,位于佛山市档案馆内,工作场地设有采购人安装、控制的视频监控系统,场所内的电力由采购人免费提供。
1.2.设备、耗材说明及要求
(1)本项目由采购人配备的办公设备包括:
办公桌椅、计算机、扫描仪、打印机、网络设备、档案柜、档案手推车、刻录机;其中可提供的主要数字化处理设备具体为:
计算机约25台,普通A3平板扫描仪5台,零边距A3平板扫描仪3台,ADF高速文档扫描仪1台。
如不能满足实际工作需要的,中标人须配齐所需设施设备和用品,并负责承担其购置、维修、维护等所有费用,采购人不再另行支付其它费用。
(2)本项目将处理档案含有大幅面图纸,中标人需配备工程图纸扫描仪。
(3)本项目实施所需的数字化软件、耗材、用品(刻录光盘片、光盘盒、档案整理工具、打印耗材、目录夹、工作服等)由中标人自行配备。
(4)中标人可在采购人提供的计算机上自行安装必要的数字化处理软件。
(5)未经采购人允许,中标人禁止改动计算机的设置及网络设置,未经允许禁止挪动采购人调配设备的位置。
(6)中标人用于本项目目录打印、目录夹标签打印的纸张必须使用白度较高、酸碱度符合档案管理要求、克重不少于80Gsm的静电复印纸;上述复印纸的品牌、规格须经采购人审核同意,并且一经确定,中标人不能随意改变。
(7)中标人用于制作目录册所用的红色硬皮夹须为档案目录专用目录夹,必须具备硬度适中,无明显异味的要求;装订目录册用的红皮夹的样式、规格须经采购人审核同意,并且一经确定,中标人不能随意改变。
(8)中标人用于储存数字化数据的刻录盘片须为根据ISO/IEC10995标准测试证明光盘数据能在常温下长期保存、每张盘片具有独立包装的档案级光盘。
刻录盘片的品牌、规格及光盘盒的质地、式样须经采购人审核同意,并且一经确定,中标人不能随意改变。
(9)中标人用于本项目档案装订的订书钉必须为质量较好的不锈钢订书钉。
订书钉的品牌、规格须经采购人审核同意,并且一经确定,中标人不能随意改变。
(10)中标人自带设备进场前需经由采购人检查登记,带存储数据功能的设备在离场前必须拆卸其中的存储部件(硬盘、磁带等)给予采购人。
(11)项目完成后中标人自带的设备及用品须经过采购人检查无误后才能搬离工作场地。
1.3.数字化加工管理软件要求
中标人应免费提供在数字化加工过程中使用的数字化加工软件。
软件具有扫描、图像处理、著录、质检、查询检索、数据统计、打印输出等功能。
提供的软件应满足以下要求:
(1)集成图像扫描、图像处理、条目录入、数据质检等工作流程模块,工作流程可追踪。
(2)具有图像元数据捕获、写入功能,能为每个数字化图像按要求写入或人工录入元数据信息至图像的EXIF信息中。
(3)具有查询检索、打印输出、数据统计功能,能对档案目录进行快速检索,按规定格式打印目录,统计画幅及目录数量等。
(4)具有数字化成果输出功能,能批量输出JPEG格式图像及合成相应的PDF格式图像,图像文件按要求进行命名。
1.4.档案数字化各步骤技术要求
包括以下11个主要环节:
调出档案,实体核对及编码,目录修订,档案拆解,档案扫描(含元数据写入),图像处理,目录册打印装订,档案装订还原,综合质检,归还档案,光盘刻录。
在整个工作环节中确保档案实体及其信息的安全保密。
中标人须建立规范的数字化处理各环节的登记表,登记表必须能反映出数字化处理各环节(实体核对及编码、目录修订、档案拆解、档案扫描、图像处理、档案装订还原、综合质检)的处理的责任人、处理时间以及异常情况处理说明等情况,必须保障每卷档案(以件归档的以盒为单位)都有相应的登记表,在档案装订时独立放置于档案最后面。
1.4.1.调出档案具体要求
(1)合同生效后,中标人须指定2名工作人员作为调卷人,负责整个项目馆藏档案的档案调卷、保管、归还工作。
调卷人在项目实施期间要保持相对固定,不得随意更换。
(2)调取档案时根据采购人提供的拟数字化处理的档案清单,以目录号(年度)为单位调卷。
通常情况下,一个目录号(年度)的需扫描处理的档案一次性调出,一次可以调取1个或多个目录号的档案;少数目录号(年度)的档案数量特别多的,该目录号(年度)的档案也可分批调出。
中标人须采取档案调一批、扫一批、还一批、数据交一批的工作调度方式,环环相扣,责任到人,不得出现档案缺失现象。
(3)调卷人须与采购人的有关人员一起对所提取的档案逐卷逐件清点,共同进行档案内容、目录、数量的核对,不能有任何差错。
清点结束,双方在相应交接清单上签字。
(4)中标人须对调出的档案妥善保存、保护,确保档案的安全。
在休息日或每个工作日(含加班的休息日)全天工作结束后,须将档案装入档案柜内保存。
所有已拆解未装订的档案须逐卷或逐份用棉线捆绑好,严防档案散乱。
(5)调卷人应至少提前一个工作日向采购人的相关部门进行调卷预约,以便采购人提前作好相关准备。
1.4.2.实体核对及编码具体要求
1.4.2.1.以份为单位查核文件。
中标人将档案实体与原有的卷内文件目录或归档文件目录进行核对(无卷内文件目录或归档文件目录的档案除外),必须确保档案实体内容与档案目录信息一致。
实体核对的要求为:
(1)不同文件排序应与档案目录的顺序相一致。
(2)同一份文件内需按照档案内容的先后顺序排列正确,不能出现前后转置的情况。
(3)确保一条目录对应一份文件,毫无关联的不同内容文件不允许放置于同一条目录中,需要将其分离出来增加相应的档案条目。
(4)确保条目中字段信息与档案的实际内容相一致,重点核对的目录字段是:
文件题名、文件编号、文件日期、责任者、页号/页数。
(5)以原档案目录为基准,发现档案实体有缺漏现象(档案实体的份数或页数比档案目录少)的,需及时予以登记并与采购人相关管理人员员联系确认。
1.4.2.2.中标人应对照有关要求,认真检查、核对卷/件内文件的页号,对不合要求的页号进行订正或者重新编制页号,对没有页号的档案补编页号。
页号编制的方法和要求为:
(1)卷/件内文件含有有效信息的页面,按次序从1开始连续编号,不得有重号、跳号、错号。
不含有效信息的页面不编页号,含有有效信息的页面必须编页号。
(2)图、文混排的档案,每张图视同一页文件编制页号。
(3)卷/件内文件全部页码需要重新编制时,页号的位置为:
以案卷形式归档的,正面在右上角,背面在左上角;以单份文件方式归档的,正面在右下角,背面在左下角。
卷/件内文件只有部分页码需要修订时,需修订部分的新页码的位置应与不需修订部分的页码的位置协调一致。
页号应尽量在页面的空白处编制,不能将页号编制在有档案内容的位置上。
不能在纸质照片上编制页号。
(4)页号用阿拉伯数字编制,页号须用号码机打印,打印的页号要清晰,方向要端正。
(5)页号不可采用加副页(例如:
3、3-1、4、5……)的方式进行“理顺”。
(6)档案实体原有页号已是从1开始连续编号,无重号、跳号、漏号、错号现象的,不论页号编制在页面何处位置,均不需重新编制页号。
1.4.2.3.以份为单位区分并登记文件的正本及定稿。
中标人应按有关要求对文件进行认真检查、区分、确定每页文件所属稿本(正本或定稿),并逐份登记文件正本所在页号,并在送检的数字化数据相应的文件级条目的正本页号栏中予以注明。
1.4.3.档案拆解具体要求
将需要拆解的以卷、件为单位装订的档案拆解成以张为单位的档案。
(1)档案原件采用装订线装订的,将装订线拆除;采用订书钉装订的,拆除订书钉,拆钉时要小心使用拆钉工具,防止损坏档案;拆解档案有可能损坏原件的,不可强拆档案,采用浆糊、胶水粘贴的,尽量不要拆解,非拆解不可的,要小心处理,不能人为造成档案原件的损坏。
(2)将已拆解的档案排好顺序,不得出现漏缺页及顺序差错,如发现档案页面有残缺现象的,需及时予以登记并与采购人相关部门或立档单位管理员联系确认。
(3)档案中的精装书籍及成精装书籍状装订的档案的(如独立包装成书本、杂志、会议记录本等)禁止拆解档案,利用无边距扫描仪挂边扫描。
(4)发现档案页面明显破损的纸张,应做好登记并按要求进行修裱。
1.4.4.目录修订具体要求
中标人对照档案原件逐条检查纸质档案目录和电子档案目录,在相关的案卷级及文件级目录上找出存在问题并进行修订。
1.4.4.1.案卷级目录修订
(1)案卷题名:
指本卷档案的概括性内容,一般在档案实体的封面上有文字叙述。
修订时需核对案卷题名是否与本卷内容相一致,并检查是否存在错别字。
(2)文件份数:
指一个案卷内的文件份数,著录时用阿拉伯数字据实录入。
(3)页数:
指一个案卷内的总页数,著录时用阿拉伯数字据实录入。
(4)保管期限:
指本卷档案的保管期限,一般情况下档案的封面有标注,据实录入。
(5)一般情况下,除上述案卷题名、文件份数、页数、保管期限4个字段外,其他字段保持原有内容不作修改。
(6)极少部分档案的案卷级目录没有输入计算机,需要进行补录。
1.4.4.2.文件级目录修订
文件级目录指的是“卷内文件目录”及“归档文件目录”。
(1)顺序号(件号):
指文件排列先后顺序的序号,在顺序号(件号)不超过1000时,著录时用3位阿拉伯数字表示,不足3位数的在前面补“0”,例如:
001、002……100等;若出现极少数顺序号(件号)超过1000的,其所在的整个年度的文件级条目的顺序号著录用4位阿拉伯数字表示,不足4位数的在前面补“0”。
例如:
0001、0002……1000、1001;顺序号(件号)出现漏号、跳号、重号时,均要进行理顺、改正。
(2)页号:
即一份文件的首页所在页码,例如:
12。
页号前面不能含有前导“0”,如页号“56”不能表示为“056”或“0056”等。
每一卷的最后一份文件的页号应以起止页号的形式著录,例如:
“99-101”。
如果最后一份文件只有1页,也须以起止页号的形式著录,例如:
“99-99”。
(3)页数:
即一份文件的页数,用阿拉伯数字据实录入。
(4)正本页码:
文件正本所在页号要予以标注。
如某份文件共有10页,该文件在案卷中的起始页为第15页,文件的前5页为正本,则“正本页号”标注为“15-19”;如果该份文件的第1页及第3—6页为正本,则“正本页号”标注为“15、17-20”。
正本号页不连续的(如上述“15、17-20”),不连续的页号之间用顿号“、”分隔,不得使用逗号或其他方式分隔。
(5)题名:
即文件的标题,一般应照实抄录。
①单份文件没有题名的,要依据其内容加拟题名,并加“[]”号。
②单份文件虽有题名但无实质性内容,无法揭示出文件的实际内容和成份的,应当照录原题名,并根据文件内容另拟题名附后,另拟的题名加“[]”号,以示区别。
如:
“通知[关于召开市直单位档案工作座谈会的通知]”、“出访报批表[XXXX公司]”。
③任免通知、表彰决定、专业技术任职资格评定等文件的题名通常只标注一个或部分人名,著录时需在题名之后,加上该文涉及的其他有关人员的名字,并加“[]”号,如:
“关于张XX等同志任职的通知[徐XX、李XX]”。
(6)责任者:
即文件的署名者或发文机关。
要参照以下要求进行著录、修订:
①文件有明确的责任者但目录中没有标注的,应补上责任者,文件无明确的责任者且目录中也没有标注的,责任者可保留空白;
②责任者只有一个时,照原文著录;
③责任者有多个时,应著录居首位的责任者,立档单位本身是责任者的必须著录,被省略的责任者用“等”表示;
④录入多个不同责任者时必须用“/”分隔开,不能使用空格或“\”,例如:
“市X局/市Y局”;
⑤责任者的标注可使用通用规范的简称。
(7)文件编号:
文件制发机关的发文字号或图号,如“佛档[2002]28号”。
其中表示年度的数字不足4位的要按公元纪年的要求补足4位,年份外侧的括号一般情况下用内六角号“〔〕”,实际著录时为方便著录和查找,可以用中括号“[]”代替,同一立档单位同一年度/目录号的档案要统一著录方式,即不能既有“〔〕”,也有“[]”。
录入多个不同的文件编号时,文件编号之间必须用“/”分隔开,如:
佛府〔2001〕1号/佛档〔2001〕1号。
(8)文件日期:
指文件形成的时间,一般指文件末尾的落款时间。
标准格式为:
“YYYY.MM.DD”,也可为“YYYYMMDD”,其中YYYY代表年,用4位数字表示;MM代表月,用2位数表示;DD代表日,用2位数表示;其中月和日不足2位数的,在左边加“0”补足。
例如:
“1999.09.07”或“19990907”,同一立档单位同一年度/目录号的档案要统一著录方式,即不能既有“YYYY.MM.DD”,也有“YYYYMMDD”。
(9)保管期限:
指此份文件的保管期限。
以立卷形式归档的,保管期限应与案卷目录保持一致;以立件形式归档的,保管期限即为档号章上所刻印的保管期限。
(10)一般情况下,除上述9个字段外,其他字段保持原有内容不作修改;部分档案条目需按照采购人要求著录相关的人名或其他要素。
(11)极少部分档案的文件级目录没有输入计算机,需要进行补录,补录时需据实将文件级目录的关键字段全宗号、目录号(年度)、案卷号、顺序号(件号)、页数、页号、责任者、保管期限、文件日期、题名、文件编号、正本页码录入。
(12)其他著录要求:
①原目录用概括的方式反映文件内容,并难以对档案实际内容进行检索的,如“XX单位7月份XX的资料”、“XX会议材料”等,需要对具体的档案内容进行分拆,如“XX单位7月份资料——X1”、“XX单位7月份资料——X2”……、“XX会议材料——X1”、“XX会议材料——X2”……。
②原目录用1条目目录反映多份文件内容的,如“XX的通知以及YY的通告”等,需要对具体的档案内容进行分拆,使得一条条目只能对应一份文件内容。
③原目录中1条条目内有两份或以上不同的档案文件,且原目录只反映了其中1份档案内容,需要相应地拆分为多条条目。
④原目录以偏概全,只用本份档案部分内容作为目录,如“A、B、C等职务任命表”,需要进行详细的补充著录,如“A、B、C、D、E、F……职务任命表”或“A、B、C等职务任命表(D、E、F……)”。
⑤补充著录的条目需要录入大量人名信息时,如表彰类档案、任命类档案等,若可根据档案内容判断只有部分人名信息与立档单位相关的,只需录入与立档单位相关的人名;若不能根据档案内容判断人名是否与立档单位相关,需要录入本份文件所涉及的全部人名。
⑥补充著录的条目需要录入大量人名信息时,若著录题名的字节数超过250的(约120个汉字),只需录入10个人名,可在“备注”字段录入所有的人名。
1.4.5.档案扫描具体要求
1.4.5.1.确定扫描件
中标人须按要求把扫描件和非扫描件区分开,确定需要扫描的文件。
(1)未经解密的涉密文件、档案禁止扫描。
(2)其他经采购人鉴定不宜扫描的文件。
1.4.5.2.扫描件页面修整
中标人须对确定扫描的档案进行页面情况检查。
页面破损严重,无法直接进行扫描的,应先进行页面修复再进行扫描;页面折皱不平,影响扫描质量的,应先压平或熨平后再进行扫描。
1.4.5.3.扫描方式和图像格式
全部文件采用连续色调图像(彩色)扫描。
图像文件采用JPEG格式存储。
采用JPEG格式存储图像时,图像存储时压缩品质应选择“100%”的参数。
1.4.5.4.分辨率选择
不论是一次扫描还是分区多次扫描,扫描分辨率不能低于300dpi。
具体扫描时可根据原件的清晰度适当调整扫描分辨率。
如原件质量较差或字体很小、字迹密集,可适当提高分辨率。
1.4.5.5.扫描图像的质量要求
(1)档案内容完整,即每页实体档案的所有内容全部扫描出来,不存在档案内容缺漏情况。
(2)图像无明显色差,即实体档案的文字和图像文字颜色基本一致,实体档案页面底色和图像底色基本一致。
(3)图像内容清晰可见。
(4)文字无扭曲,图形、图表的线条无变形。
(5)页面超过A3幅面的档案,由中标人自备大幅面扫描仪进行扫描,原则上不允许采用分幅拼接方式。
1.4.5.6.文件夹创建与命名
扫描时中标人应根据实际需要逐级建立文件夹,扫描形成的图像文件按其归属存入相应的文件夹内。
详细要求见《佛山市档案馆纸质档案数字化验收标准》(佛档〔2013〕24号)中有关“文件夹的创建与命名方法”。
1.4.5.7.图像文件命名
图像文件须依照采购人制定的命名规则命名。
详细要求见《佛山市档案馆纸质档案数字化验收标准》(佛档〔2013〕24号)中有关“图像文件命名规则”。
1.4.5.8.元数据捕获与著录
数字化系统应以页(画幅)为单位为每个数字化图像文件自动捕获数字化元数据,无法捕获的元数据项则采取手工著录方式,将元数据合并形成元数据库,并把元数据嵌入(写入)相应的数字化图像文件(EXIF信息)中。
数字化系统不具备自动捕获功能的,应采取手工著录与系统批量赋值相结合的方式为数字化元数据赋值。
数字化成果提交采购人验收前,须先完成所有元数据的捕获和写入工作;提交验收时,同时提交元数据表;验收期间如有数据改动,须同时更新元数据表,并重新提交。
元数据项及著录要求见下表:
序号
元数据项
著录细则
数据格式
元数据写入
数字副本要求
备注
1
电子文件名称
电子文件的名称
字符串(50字符)
写入EXIF:
ImageDescription(图像描述)
2
数字化项目描述
著录当前纸质档案数字化项目名称
字符串(50字符)
写入EXIF:
ImageDescription(图像描述)
同一著录项需著录多个元数据值时用“;”分隔,下同
3
数字化授权描述
著录获得授权实施数字化的责任方名称信息
字符串(50字符)
写入EXIF:
ImageDescription(图像描述)
4
格式名称
著录相应版本数字副本格式名称,默认值为“JPG”
字符串(20字符)
写入EXIF:
ImageDescription(图像描述)
5
版权
著录制作源版数字副本的版权归属单位,默认值为“佛山市档案馆”。
字符串(50字符)
写入EXIF:
Copyright(版权)
6
数字化时间
著录源版数字副本的数字化时间。
格式:
YYYY-MM-DDHH:
MM:
SS
字符串(19字符)
写入EXIF:
DateTimeDigitized(数字化日期/时间)
7
水平分辨率
著录源版数字副本的水平分辨率。
正整数(4位)
写入EXIF:
XResolution(水平方向分辨率)
8
垂直分辨率
著录源版数字副本的垂直分辨率。
正整数(4位)
写入EXIF:
YResolution(垂直方向分辨率)
9
设备制造商
著录制作源版数字副本设备的制造商名称
字符串(40字符)
写入EXIF:
Make(生产商)
10
设备型号
著录制作源版数字副本设备的型号
字符串(40字符)
写入EXIF:
Model(型号)
11
数字化软件名称
著录数字化软件名称
字符串(40字符)
写入EXIF:
Software(软件)
12
数字化软件生产商
著录数字化软件开发商名称
字符串(40字符)
写入EXIF:
Software(软件)
13
图像宽度
图像(宽度)像素数
正整数(4位)
文件属性自带
14
图像高度
图像(高度)像素数
正整数(4位)
文件属性自带
15
文件大小
数字副本所占的容量大小,以字节为单位
正整数(20位)
文件属性自带
1.4.6.图像处理具体要求
中标人应对扫描后形成的图像文件进行清晰度、色调、污渍、黑边、偏斜等的检查、调整、清除等,以达到较高的图像质量。
图像的背景色调不能太深,要求能用彩色激光打印机打印出清晰的扫描图像。
1.4.6.1.图像正向及纠偏
对扫描过程中出现的方向不正确的图像进行旋转还原,以符合阅读习惯;对偏斜图像进行纠正,以图像顶端文字(标题、第一行文字)的水平线为参照物,使整幅图像与水平线平行,纠偏的倾斜角度不能大于0.5度,保证阅读时无明显倾斜感觉。
1.4.6.2.图像去污
(1)遵循展现档案原貌的原则,不得去除档案页面中原有的纸张褪变斑点、水渍、污点、装订孔、错误页码等痕迹。
(2)应去除在扫描过程中产生的污点、污线、黑边等影响图像质量的杂质。
1.4.6.3.图像裁边
(1)文件图像应去除无内容的、多余的边。
(2)图像裁剪需依照档案原件的幅面尺寸进行裁剪,例如原件是A4幅面的纸张,图片裁剪后必须是A4幅面的尺寸。
(3)若实体档案存在有档案内容在页面的边上时,应在距页边最外延至少2至3毫米处裁剪图像,以证明该页档案已扫描完整。
1.4.6.4.图像合并
中标人须将同一份纸质文件的单页JPEG图像文件,合并为多页PDF文件。
(1)图像合并时,要认真检查图像文件的页数、页序,确保图像文件的页数、页序与纸质档案实体一致。
(2)图像合并后的图像文件可以正常打开,多页图像品质应与单页图像品质相一致,多页文件的大小应与所对应的同一顺序号(件号)的单页图像文件的大小之和基本一致。
(3)多页PDF文件的命名方法见《佛山市档案馆纸质档案数字化验收标准》(佛档〔2013〕24号)中有关“图像文件命名规则”。
1.4.6.5.图像存储
(1)将经检查合格的单页JPEG图像文件依序存入“全宗号-单页文件夹”下的“案卷号文件夹”中。
(2)将经检查合格的多页PDF文件依序存入“全宗号-多页文件夹”下的“案卷号文件夹”中。
(3)图像文件名与所在的文件