中国第一历史档案馆馆藏清代军机处上谕档全文数字化概述.docx

上传人:b****8 文档编号:9323529 上传时间:2023-02-04 格式:DOCX 页数:11 大小:37.33KB
下载 相关 举报
中国第一历史档案馆馆藏清代军机处上谕档全文数字化概述.docx_第1页
第1页 / 共11页
中国第一历史档案馆馆藏清代军机处上谕档全文数字化概述.docx_第2页
第2页 / 共11页
中国第一历史档案馆馆藏清代军机处上谕档全文数字化概述.docx_第3页
第3页 / 共11页
中国第一历史档案馆馆藏清代军机处上谕档全文数字化概述.docx_第4页
第4页 / 共11页
中国第一历史档案馆馆藏清代军机处上谕档全文数字化概述.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

中国第一历史档案馆馆藏清代军机处上谕档全文数字化概述.docx

《中国第一历史档案馆馆藏清代军机处上谕档全文数字化概述.docx》由会员分享,可在线阅读,更多相关《中国第一历史档案馆馆藏清代军机处上谕档全文数字化概述.docx(11页珍藏版)》请在冰豆网上搜索。

中国第一历史档案馆馆藏清代军机处上谕档全文数字化概述.docx

中国第一历史档案馆馆藏清代军机处上谕档全文数字化概述

中国第一历史档案馆馆藏清代军机处上谕档全文数字化概述

王光越/栗维健

2012-11-2811:

27:

38  来源:

《历史档案》(京)2010年1期

  【英文标题】OntheDigitalFull-textofImperialEdictArchivesofMilitaryConfidentialAdministrationinQingDynastyintheFirstHistoricalArchivesofChina

  【作者简介】王光越中国第一历史档案馆研究馆员

  栗维健中国第一历史档案馆副研究馆员北京100031

  

  中国历代皇帝发布文告和指令的文书中有一种是谕旨。

清代,谕与旨所指各有不同,“凡特降者为谕,因所奏请而降者为旨,其或因所奏请而即以宣示中外者亦为谕”①。

有清一代,许多重要衙署为存档备查,各制有专门抄录谕旨的档册,但名称不同,汇抄内容与规则有异,如内阁有丝纶簿、外纪簿、上谕簿;军机处有寄信档、明发档、纶音档,还有剿捕档,等等。

有的记旨,有的记谕,有的记明发上谕,有的记寄信上谕,有的记专项事务相关谕旨。

除此种分类记载谕旨的档册外,军机处还另有一种综合记载谕旨的档册。

这类档册一般封面书有“上谕档”字样,或“寻常档”字样,或有按月成册书有现月档字样,或按季成册书有春、夏、秋、冬四季档字样。

本文所述中国第一历史档案馆(以下简称一史馆)馆藏清代军机处上谕档(以下简称“上谕档”),即指清代汇抄的诸种谕旨档册中的此类档册②。

  “上谕档”汇集了清帝日常所发布和密寄的重要政令,并附抄有与之直接相关的敕谕和折、片、咨、单等公文书。

就其内容而言,“上谕档”涉及的内容不仅十分广泛,而且特别重要。

凡清王朝对国家政治、军事、外交、民族、经济、文化等各项重要事务的最高决策,绝大部分在“上谕档”中都有记载。

它与军机处各项分类记载谕旨的档册和其他机构所形成的谕旨类档册,以及朱谕、朱批奏折、题本等互补,构成了清代最高政务活动的核心档案。

长期以来,一直深为中外清史学者和社会史学者所重视。

  随着文献数字化技术的进步,为给读者提供更多方便,一史馆利用国家专项经费,在北京书同文数字化技术有限公司的配合下,自2007年2月始,历时2年零5个月,完成了“上谕档”全文数字化项目。

  本文拟对“上谕档”全文数字化项目的背景、实施情况以及成果功能加以概述,以期读者能够对该项目和项目成果的利用价值有一个较为全面的了解,以便更好地利用这一大型的清代档案数字化成果。

  一项目背景

  1.全文数字化的实践基础和难点。

  “上谕档”以及“大清历朝实录”和“大清五部会典”三个全文数字化项目,作为一史馆“清代档案文献全文数据库”的首期工程一并立项。

其于档案文献数字化方面的意义在于,面对存世明清档案文献形制的复杂性,实践一种适用于诸如“实录”、“会典”、“上谕档”、“起居注”等一类篇幅巨大、记事繁复、内容重要却又缺少题名,并且按其内容逐条著录工作量极大的簿册式档案文献的数字化模式,以期与适用于折件式档案的目录数据库链接原文数字图像的数字化模式互为补充,从而丰富明清档案文献数字化的技术模式,满足社会对明清档案文献数字化成果多样性的需求。

  “大清历朝实录”和“大清五部会典”全文数字化项目先期完成,因其对档案文献形式与内容信息全面而深入的揭示,以及强大的全文检索功能和辅助阅读功能,受到了专家和读者一致好评。

同时,专家和读者也对其数字化中的版式处理、检索记录功能和软件结构等提出了一些建设性改进意见,为一史馆全文数字化工作的推进奠定了基础。

但是,“大清历朝实录”和“大清五部会典”属于官修典籍,其版本、版式状况,比之“上谕档”这类直接产生于政务活动的原始档案要规范、齐整得多。

原始档案所具有的复杂的文本状况,多眉批、夹条、夹批、夹注、删改的特点,都是“上谕档”全文数字化项目必须面对并须妥善解决的难题。

  2.以往“上谕档”的出版情况及纸质出版物的局限。

  1986年至1999年,一史馆曾分别与中国档案出版社、广西师范大学出版社合作,陆续影印出版了馆藏乾隆朝至宣统朝等七朝上谕档,受到读者的广泛欢迎。

但是,由于卷帙颇巨,该书仅有时序查阅一条检索途径,使得阅读十分不便。

此外,更关紧要的是,受当时出版经费、人力等条件所限,在出版前未能对馆藏上谕档进行必要的文本分析。

特别是未对馆藏相同年月的不同文本的上谕档档册进行相互比对和划分,仅按保证时间排序尽可能完整的编辑思路,采取了在相同年月的不同文本中选取品像相对完好的文本的编辑选材方案。

因此,不仅遗漏了不同文本中一定数量的不相同的内容,而且,占“上谕档”近34%的文本被视作无用的重复部分而未能入选,在应用时缺失了从文本方面判定其史料价值的参考依据,难以了解和把握“上谕档”的全貌。

并且,因为没有标注原档的档号,使得读者核对原文出处较为困难。

  3.当前社会需求。

  随着古籍数字化技术的日臻成熟,弥补因以往客观出版条件所限而造成的缺憾成为可能。

社会利用者对档案史料出版物,特别是大型档案史料出版物的内容查询功能和辅助阅读功能有了更高要求,希望能以不断完善的最新技术手段和方法,实现更加方便、快捷的查阅功能;从学术研究的严谨性出发,学者对档案文献的文本的了解有了更觉必须的要求;同时,从档案科学管理的理念出发,档案馆对档案数字化必须兼顾促进档案实体管理水平,也有了更深刻的认识和切实的要求。

  二项目实施情况

  1.实施组织准备和初设工作内容。

  立项伊始,根据项目预设实施模式和预想工作内容成立了12人组成的项目组。

项目组经集体研究讨论,明确了该项目主要工作内容,包括:

文档调研;《项目实施方案》制订;编辑体例制定;数字化前处理(含档案的清点、登记、文本划分、确定文字识别范围);选择专业数字化加工公司:

评估、核证专业公司的技术方案;与专业公司签订《委托加工服务合同》;按《委托加工服务合同》监督专业公司履行合同各项条款;在数字化加工中提调、派发、回收档案,并向专业;公司提供档案业务咨询;对项目成果的质量进行检测;组织专家评审验收;汇集项目工作文档整理归档。

  2.知识准备。

  为保证项目实施的科学性和成果的质量,项目组首先安排了文档调研并结合文档调研,进行了必要的知识准备。

  首先,了解和掌握“上谕档”的实体管理情况,以既有馆藏秩序目录为基础,经过清点、登记、添加档册封面题名、年月、页数,以及残破状况,更新完成对“上谕档”实体描述更为翔实、精准的秩序目录;同时,比对年月相同的档册,记录、分析其在形式与内容上的异同;另以5年为一时段,取样进行比对,记录、分析不同时段的档册在形式与内容上的异同,建立对“上谕档”较为全面的直观认知。

  其次,收集和学习有关清代军机处和军机处档册的文献资料及相关上谕档的研究成果,着重阅读了文献馆老一辈档案工作者和台北故宫博物院学者对清代军机处与军机处档册的研究文章,掌握清代军机处的运作和其文书流转规程,以及立档、管理的规定,还有台北故宫博物院所藏军机处上谕档的情况,并在此基础上,对照“上谕档”(包括馆藏“满文上谕档”)的实际情况,研究、分析文献记载和前人研究中的正讹,逐步了解了清代军机处上谕档文书程式从不规范到规范的过程,以及在这一过程中文档演变的特点,发现了一些一时难以明悉缘由的问题,如:

“现月档”的“现月”是何含义?

若如以往学者所说的即“当月”,那么,“四季档”上原粘丝条中的“现月”又为何义?

还有,一种小开本行草书写的“上谕档”是如何形成的?

等等。

实际情况与文献记载和以往学者所见不无出入,从而使项目组充分认识到原始档案文本的复杂性,为使数字化成果如何能够最大限度地维护和反映“上谕档”的原貌拓展了思路③。

  另外,针对“大清历朝实录”和“大清五部会典”全文数字化项目中遇到的问题,如版面处理方法不妥需要改进;缺少眉批、夹批、删改文字等的处理方法;辅助阅读功能不够完善;软件结构不适于互联网应用等问题,与多家数字化专业公司进行了分析、研讨,明确了技术解决思路。

  通过上述实施组织准备和知识准备工作,建立了对“上谕档”形成概况和文本类型以及改进拓展应用软件功能的基本认识,为科学制订《项目实施方案》和在后续工作中提供专业咨询、协作改进软件功能,做好了必要的准备。

  3.项目实施方案。

  在上述准备工作的基础上项目组着手制订《项目实施方案》,该《方案》包含以下内容:

  

(1)项目实施目标。

  可详细表述为:

首先通过扫描将“上谕档”原文转化成数字图像,然后进行文本划分选择用于文字识别的主要文本,进而以此作为内容比对基础,确定“上谕档”不同文本中的所有不重复内容,作为文字识别范围,并利用当前最高水平的古籍数字化技术进行汉字识别,形成可供全文检索的电子文本,之后,将扫描形成的原文数字图像与电子文本整合链接,最终制作成既可提供原文图像浏览,又可提供关键词检索,并具有多种检索途径和强大辅助阅读功能的大型档案史料电子图书(包括CS和BS两种结构的版本),达到方便当地和异地读者利用并最大限度地维护档案原貌和保护档案原件的根本目的。

  

(2)项目实施原则。

  在充分考虑了数字化过程中档案原件的安全。

以及档案数字化的保真性、客观性和规范性要求的基础上,确定了项目实施的四项原则:

以保证档案实体和数据安全,作为档案数字化全程必须遵守的首要原则;以最大限度地反映档案原有特征保证信息完整,作为档案数字化处理的基本原则;以技术方法服从实际需要,作为确定档案数字化模式的技术决策原则;以贯彻标准化、规范化作为档案数字化的科学操作原则。

  (3)项目实施基本工作思路。

  以维持现有档案实体秩序不变为基本工作前提;以综合考量档案的形式与内容特征为辨别文本异同的基本依据;以内容不重复、不遗漏为汉字识别的基本范围;以时序目录、馆藏秩序目录和全文检索为基本查询途径。

  (4)项目预期完成时限。

  不计算前处理工作共19个月。

  4.项目实施。

  第一步工作为文本分析:

根据封面字样、幅面尺寸、书写内容、书写格式、文字修改特点等特征,综合分析,区分文本,共分出8种文本,依照时间顺序排列,形成文本列表。

在此基础上按原馆藏序列,全部扫描形成电子文档。

  第二步工作为确定文字识别范围:

首先确定一套文本作为文字识别的基础文本,将此套文本全部纳入文字识别范围;其次,再按一定规则挑选形成时间不重复的其他文本纳入识别范围;而后,再逐页比对相同年月的不同文本中的不重复内容加以标记,将所有文本中的不重复内容纳入识别范围。

  第三步工作为文字识别;通过OCR汉字识别技术和计算机辅助校对系统,对所有纳入识别范围的文字加以识别,并进行多次人机对校,保证文字识别的差错率在万分之三以内。

  第四步工作为编辑,将所有原档数字图像按馆藏序列排序,并确定编目方法,编制按时间浏览查阅与按馆藏序列浏览查阅两种目录。

  第五步工作为开发检索浏览软件:

实现全文检索,做到字字可检,句句可查。

设计了原文图像页面与数字化文本页面的同幅比对,以方便读者查阅,并可以使读者即时将查索结果与原文图像进行核对,维护档案文献的权威凭证作用;建立汉字关联功能,将简繁字、异体字、通假字、正讹字、中日字、新旧字型、古今字型进行关联,提高检索关键词的命中率;设置笔记管理功能,可以对使用者所记录的笔记、书签进行分类管理,并且可以快速浏览曾经做过的笔记、摘要;设置检索词记录功能,便于管理者对读者检索过的关键词进行管理,逐步了解和把握读者检索的关注点和检索习惯,为软件功能升级积累经验;设置历史记录功能,记录读者曾经浏览过的页面,以日为单位进行记载,为读者查找曾经浏览的内容提供帮助;集成中西历换算、干支换算和《康熙字典》,便于读者在阅读中即时进行日历转换和查生字。

  第六步工作为运行检测:

产品制作完成后经过5个月的试运行,对期间发现的错误和软件设计缺陷进行修改、调优。

  三数字化中特殊问题的处置办法

  为在数字化过程中最大限度地维护档案原貌并兼顾读者查阅的便利,针对“上谕档”中存在的一些特殊问题采取了特别处置办法。

  1.上谕条目编目。

  在制作“朝—年—月—日—条”目录时,以每条上谕为基本编目单位,保证上谕条目的完整性。

由于同一天的上谕条目可能来自于不同的盒册版本,需要仔细翻阅每条上谕所在的“朝—年—月—日”。

  具体编目处理办法为:

  

(1)同页同日多条上谕,依多条处理。

  

(2)同页多条不同日上谕,各条分别出现在目录不同的“日”中。

  2.版面还原。

  由于上谕档部分原档册页书写不够工整规范,特做有如下数字化处理规定:

  

(1)删除、涂改过的文字,保留了其局部小图,这些文字不参与检索。

  

(2)原档页中字迹已经模糊不清或残损局部,保留了其局部小图。

  (3)批注、插入文字,在原文处,依据上下文语义顺序做正确连接,版面展现上依照原样,技术上采用“逻辑块—Block”,不仅保证显现贴近原版面,而且语义逻辑上也是正确的。

  (4)满文、蒙文或签名文字部分,不做文字识别处理,仅以图表示。

  (5)个别页中存在的故宫档案整理人员在整理时的说明文字或夹条,不做文字识别处理,只作为图像页予以保留。

  (6)个别省略写文字,数字化时采用原字予以还原。

  (7)遇到文字书写换位修改标注时,数字化按照文字正确顺序予以处理。

  3.常见草书和异体字的处理。

  原档中个别抄缮潦草的版本,存在大量难辨的行草字体,且又为不同年代不同人所书写,须经反复阅读上下文,查阅《草书大字典》(1924年扫叶山房编修)后,再经项目组专家予以校对方予确认。

  “上谕档”中常见的异体字则用规范正体字代换,以便于读者阅读。

例如:

  四项目成果

  1.主体成果。

  完成“上谕档”全文数字化项目,共收录馆藏雍正元年正月④至宣统三年十二月的各种文本的汉文上谕档档册,计2,504册,712,542页,6,035万字,是有史以来一史馆馆藏“上谕档”最为完整的公布。

  为了使中外读者能够更方便、更完整地应用这一部分珍贵档案,该项目利用目前最先进的古籍数字化技术,实现了完备的应用功能:

  全文检索:

在具有原文版面和繁体字原形,保证档案凭证作用的基础上,全部数字化内容实现“字字可查、句句可检”,差错率达到万分之三以下。

  汉字数字化标准:

采用ISO/IEC-10646:

2003国际标准,可以运行于全球各语言版本的Windows系统。

  汉字关联检索:

针对国内外不同的读者群(大陆、港澳台、日、韩),不同的语言电脑系统汉字存在同字不同形(图/図),以及各种简体、繁体字、通假字、异体字等复杂关系,采用在全文检索内置汉字关联,建立简繁、正异、通假、正讹、避讳、新旧字型、古今字型等各种汉字之间的关联,支持在任何电脑系统下输入的汉字均可准确检索到相关内容。

  辅助输入:

提供内置“巧笔”手写输入,可直接用鼠标写汉字,为不会应用键盘输入法的读者提供方便。

  多目录浏览方式:

可按馆藏顺序和时序查找、浏览,前后翻页、翻卷。

  辅助阅读工具:

软件内置联机《康熙字典》、《中西历对照表》,可随时查生字和进行中西历日期转换。

历史记录功能,则能记录读者曾经浏览过的页面。

同时,用户还可在阅读结果的任意处直接加注笔记、标注书签、标点和勘误等。

  由于上述勘误功能,该产品可做动态管理,项目组可根据读者反馈的纠错信息定期进行修订,使项目成果的差错率逐步趋向于零。

  此外,该项目成果在总结“大清历朝实录”和“大清五部会典”全文数字化项目的经验与不足的基础上,改进了功能,增加BS结构版本,使读者亦能通过互联网异地应用。

整体设计水平和功能、质量均超过前者,特别是针对原始档案中复杂的眉批、夹条、夹注、修改文字等所采用的技术处理,尽可能地保护了档案版面的原状,对探索原始档案的数字化处理方法做了有益的尝试。

  2.附属成果。

  首次对馆藏上谕档文本进行了辨识、登记,制作了《文本列表》,为学者从文本角度判定“上谕档”史料价值提供了参考。

  深化了馆藏“上谕档”的实体整理,在区分文本的基础上,统计了全部档册的总页数,标注出以往整理错分入“上谕档”的寄信档、剿捕档、密记档、衡工档,同时,生成了完全按实体顺序排序的数字化图像,用以支持今后出版、展览对“上谕档”的需求,改善了实体管理的条件。

  在实施过程中形成了“上谕档”《原档扫描规程》、《文本划分执行标准》、《文字识别范围确定办法》和《编目规则》,以及《实施工作流程与各类问题处置说明》和各种统计表和工作文档,为今后同类项目的实施积累了宝贵的经验。

  2009年9月12日,该项目在北京经由国内知名清史专家和档案学专家评审验收,其项目总体价值评审如下:

  一史馆与北京书同文数字化技术有限公司合作完成的一史馆藏清代军机处上谕档全文数字化项目,是进行清史研究和中国社会史研究不可或缺的基础史料,具有切实的社会利用需求。

该成果软件操作方便,功能选项非常完整,能够满足使用者多途径、多用途检索和阅读及引用的要求,是目前海内外规模最大的历史档案全文数字化产品,在数据采集和系统功能方面达到了国际先进水平。

其问世不仅为传承和保护民族文化遗产,开发和利用清代档案信息资源提供了新途径,同时,其项目工作内容也促进了珍贵原档的实体管理水平。

该数字化产品已确定由清华同方电子光盘出版社出版,标志着中国清代档案数字化产品的编辑和刊布方式已趋成熟。

  注释:

  ①见光绪朝《钦定大清会典》卷三,办理军机处,第2页。

另外,其有关“谕旨”的表述与中华书局出版之梁章钜、朱智《枢垣纪略》(朱智续编本)卷十三·规制一·第136页有关“谕旨”的表述意思一样。

因朱本取材下限以光绪元年十二月为断,故至少在此之前已有此说。

  ②在一史馆馆藏中还有995册满文上谕档,按开本尺寸可区分为小本上谕档(382册)和大本上谕档(613册)两类,两类之内又有军务档和寻常档之别,与馆藏汉文上谕档文本有所区别。

未将馆藏满文上谕档纳入本数字化项目的原因,则是目前尚没有满文字识别技术。

  ③清代军机处档册按定例5年另录一份,与原档一并收存备查(咸丰初年因军报纷集,改为3年办理一次),加之长年以来的修订补缀,故存世文本繁多,在项目文档调研中,发现“上谕档”有办理政务过程中即时记录的原本,有按文书制度定期汇抄、修缮的抄本,还有另抄本;有按年汇抄的文本、按季汇抄的文本、按月汇抄的文本等。

实际情况比文献所记更为复杂。

关于文本问题笔者将另文专述。

  ④在一史馆馆藏中发现有雍正元年的上谕档,此时军机处尚未成立,故不能准确判定其文本形成确切时间和缘由,为使读者对“上谕档”产生沿革的研究有所参考起见,特将其收入本数字化项目。

 

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 法学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1