电子文件元数据规范.docx
《电子文件元数据规范.docx》由会员分享,可在线阅读,更多相关《电子文件元数据规范.docx(162页珍藏版)》请在冰豆网上搜索。
电子文件元数据规范
电子文件元数据规范
11 范围
本规范适用于九省区各级国家档案馆、各级党政机关、社会团体、企事业单位对电子文件进行以保证凭证性为目的的管理活动。
其他社会组织可参照执行
在电子文件管理过程中使用元数据可实现以下目的:
——确保并证明归档电子文件的真实性、完整性与有效性,从而保证其凭证价值;
——有利于归档电子文件的保护,实现长期保存;
——在异构的信息系统中对归档电子文件进行规范、有效的管理,保证归档电子文件的可捕获、可收集、查长期利用;
——对归档电子文件及馆(室)藏档案数字化资源进行集成管理,实现有效、方便地查询、检索与利用。
12 规范性引用文件
下列文件中的条款通过本规范的引用而成为本规范的条款。
凡是注明日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规范,然而,鼓励根据本规范达成协议的各方研究是否可使用这些文件的最新版本。
GB2312-1980信息交换用汉字编码字符集基本集
GB/T3760-1995文献叙词标引规则
GB/T3792.1-1983文献著录总则
GB/T7156-2003文献保密等级代码
GB/T7408-2005数据元和交换格式信息交换日期和时间表示法
GB/T9704-1999国家行政机关公文格式
GB/T11714-1997全国组织机构代码编制规则
GB/T11821-2002照片档案管理规范
GB/T13959-1992文件格式与代码编制方法
GB/T13967-1992全宗单
GB/T15418-1994档案分类标引规则
GB18030-2000信息技术信息交换用汉字编码字符集基本集的扩充
GB/T18894-2002电子文件归档与管理规范
DA/T1-2000档案工作基本术语
DA/T12-1994全宗卷规范
DA/T13-1994档号编制规则
DA/T18-1999档案著录规则
DA/T19-1999档案主题标引规则
DA/T22-2000归档文件整理规则
DA/T31-2005纸质档案数字化技术规范
《中华人民共和国电子签名法》
中办发[1996]14号中国共产党机关公文处理条例
国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知
国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知
国家档案局第6号令《电子公文归档管理暂行办法》,2003年7月28日
国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》,2006年12月19日
ISO15489Informationanddocumentation—Recordsmanagement
ISO23081-1Informationanddocumentation–RecordsManagementProcesses–MetadataforRecords—Part1:
Principles
ISO14721Openarchivesinformationsystem(OAIS)
ISO/IEC11179-3:
2004INFORMATIONTECHNOLOGY-SPECIFICATIONANDSTANDARDIZATIONOFDATAELEMENTS-PART3:
BASICATTRIBUTESOFDATAELEMENTS
GUIDEFORMANAGINGELECTRONICRECORDSFROMANARCHIVALPERSPECTIVE,COMMITTEEONELECTRONICRECORDS,ICA(国际档案理事会电子文件管理委员会《电子文件管理指南》),1997
W3CNamespacesinXMLXML的命名空间(Namespaces)
13 术语与定义
13.1
电子文件(ElectronicRecords)
电子文件是指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件。
它由足以为其职能活动提供凭证的内容、结构与背景信息构成。
具有参考和利用价值并作为档案保存的电子文件称为归档电子文件。
13.2
电子文件元数据(ElectronicRecordsMetadata)
电子文件元数据是描述电子文件内容、背景和结构及整个管理流程,又能够被计算机及网络系统自动辨析、分解、提取和分析归纳的数据。
13.3
信息总体(InformationPackage)
信息总体,又称为信息包,是一组信息的集合。
包括为长期保存电子文件所需的所有内容信息与保存描述信息,即电子文件的内容、结构信息、背景信息,以及形成于管理过程的管理信息、为保证电子文件真实性与完整性而设置的固化信息。
档案信息包为分三种:
提交信息包(SIP,SubmissionInformationPackage),用于立档单位向同级国家档案馆进行归档电子文件的物理归档;档案信息包(AIP,ArchivalInformationPackage),用于国家档案馆长期保存归档电子文件;分发信息包(DIP,DisseminationInformationPackage),用于电子文件的查阅。
经过数字签名封装的档案信息包是保证归档电子文件凭证性、实现归档电子文件长期保存与海量存储的有效数据格式。
13.4
内容信息(ContentInformation)
内容信息是指电子文件的正文内容,包括主文件、附件的正文内容。
内容信息包括数据对象与数据对象表述信息。
数据对象是指表达并保存电子文件正文、附件正文等的比特流。
数据对象表述信息是指数据对象的描述信息,由电子文件的结构信息与语义信息构成。
13.5
保存描述信息(PreservationDescriptionInformation)
保存描述信息包含构成电子文件的结构信息及背景信息,是对电子文件自身最基本特征的描述,能在电子文件自生成直至永久保存全过程中用于显现、理解电子文件内容信息。
保存描述信息由内容描述信息、结构信息、背景信息、管理信息、固化信息构成。
13.6
内容描述信息(ContentDescriptionInformation)
内容描述信息是指描述、揭示与电子文件内容相关的内部与外部特征的信息。
13.7
结构信息(StructureInformation)
结构信息是指表述电子文件内容排列,各构成部分之间的连接方式、相关文件之间的关系以及在存储器中的构成等信息。
13.8
背景信息(ContextInformation)
背景信息是指描述生成电子文件的职能活动、电子文件的作用、办理过程、结果、上下文关系以及对其产生影响的历史环境等信息。
背景信息由来源信息、创建依据、关联信息、技术环境信息构成。
13.9
管理信息(ManagementInformation)
管理信息是指描述电子文件管理过程的信息,由鉴定信息、归档信息、权限管理、维护历史等信息集组成。
13.10
固化信息(FixityInformation)
固化信息是用以保障并确认电子文件及其元数据信息可信性与完整性的信息,如能够描述数字签名的内容值、校验和等。
14 电子文件元数据结构
14.1 电子文件元数据总体结构
本规范按照保障电子文件真实性、完整性与长期可读性的要求,根据电子文件的构成,及其生成、管理与利用等不同时期的特征,定义电子文件元数据表。
电子文件元数据表由2个元数据模块共7个元数据子集构成,如下表所示。
元数据模块
元数据子集
元素
内容信息
数据对象
数字对象
物理对象信息
表述信息
结构信息
语义信息
保存描述信息
内容描述信息
结构信息
背景信息
创建依据
全宗信息
创建过程
参考信息
数字化过程
参考信息
关联信息
管理信息
标识信息
鉴定信息
归档信息
权限管理
维护历史
利用历史
固化信息
14.2 电子文件元数据集结构
内容信息ContentInfo
元数据子集
元素
子元素
子元素
名称
标识
名称
标识
名称
标识
名称
标识
数据
对象
DateObject
数字对象
DigitalObject
物理对象描述信息
PhysicalObject
表述
信息
RepresentationInfo
数据对象结构信息
DOStructureInfo
语义信息
SemanticInfo
保存描述信息PreservationDesInfo
元数据子集
元素
子元素
子元素
名称
标识
名称
标识
名称
标识
名称
标识
内容描述信息
ContentDesInfo
题名
Title
并列题名
AlternativeTitle
副题名及说明题名文字
TitleAnnotation
责任者
Creator
文件编号
RecordNum
文件形成时间
CreateDate
附件
Annex
附件题名
AnnexTitle
附件标识符
AnnexIdentifier
稿本
Manuscript
主题词或关键词
Subject
提要或文字说明
Abstract
附注
Annotation
分类号
Classification
人物
Person
语种
Language
内容覆盖范围
Coverage
照片与音视频档案内容描述扩展信息
PAVContentDesExtent
拍摄地点
ShootPlace
录制地点
RecordPlace
内容描述扩展信息
ContentDesExtent
结构信息
StructureInfo
文种
RecordType
文件集合
AggregationLevel
集合类型
AggregationType
集合描述
AggregationDes
集合文件标识
AGGRecordsIdentifier
格式
Format
电子文件类别
ElecRecordsType
数据格式
DataFormat
存储介质
MediumType
特殊元数据描述
SpecialMetadataDes
格式扩展信息
FormatExtent
文件大小
ObjectSize
归档文件大小
ArchivingSize
数字化文件大小
DPSize
保存历史
PreservationHistory
操作类型
ActionType
操作描述
ActionDes
操作时间
ActionTime
操作责任人
Operator
原始技术环境
OriginalEnvironment
原始信息系统描述
OriginalSystemDes
原始档案管理信息系统描述
OriginalRecordsDes
数字化结构信息
DPStructureInfo
光学分辨率
AclinicResolution
色彩模式
ColorModel
色彩深度
BitDepth
总画幅数
ImageTotal
扫描仪生产商
ScannerMaker
扫描仪型号
ScannerSN
数字化结构扩展信息
DPExtent
数码照片
结构
信息
DPhotoStructureInfo
照片宽度
PhotoWidth
照片高度
PhotoHeight
水平分辨率
AclinicResolution
垂直分辨率
VerticalResolution
照片色彩模式
PColorModel
照片色彩深度
PBitDepth
数码相机生产商
CameraMaker
数码相机型号
CameraSN
音视频文件结构扩展信息
AVStructureInfo
结构扩展信息
StructureExtent
背景信息
ContextInfo
创建依据
CreateBG
法律法规依据
LegalBG
行政或行业依据
AdminBG
全宗信息
FondInfo
全宗名称
FondName
全宗类型
FondType
立档单位机构代码
ORGCode
立档单位组织沿革
HistoryofORG
立档单位联络方式
全宗构成
ComposingofFond
全宗维护历史
HistoryofFond
创建过程
CreateProcess
处理类型
ProcessType
处理人
Processor
接收处理时间
ReceiveTime
实际处理时间
ProcessTime
处理后发出时间
SendTime
处理意见
ProcessView
参考信息
ReferenceInfo
主送机关
SubmitTo
抄送机关
Copyto
印发机关
PrintDistribute
印发日期
PrintDate
关联信息
RelatesInfo
关联标识符
RelatesID
关联类型
RelatesType
关联描述
RelatesDes
数字化过程
DigitalProcessing
数字资源制作者
DPMaker
数字资源制作者身份证明
DPCertification
数字资源制作日期
DPMakeDate
数字资源制作地
DPMadePlace
数字资源审核人
DPExaminer
数字资源审核时间
DPExaminedDate
背景扩展信息
ContextExtent
管理
信息
ManagementInfo
标识信息
IdentifierInfo
标识符
Identifier
档案馆代码
ArchivesID
档案类别
ArchivesClassification
档号
RecordID
电子文件号
ERecordID
全宗号
FondID
目录号
CatalogueID
案卷号
FilesID
页号
PageNum
件号
ItemNum
全宗内分类代码
SeriesID
全宗内分类名称
SeriesName
缩微号
MicrofilmID
光盘编号
DiscID
照片档案扩展标识信息
PhotoIDExtent
照片号
PhotoID
底片号
FilmID
参见号
ReferenceID
册号
VolumID
音视频档案扩展标识信息
AVIDExtent
音视频文件类别
AVClassification
时间长度
TimeLength
开始时间
StartTime
结束时间
EndTime
鉴定信息
AppraisalInfo
鉴定类型
AppraisalType
鉴定时间
AppraisalDate
鉴定人
Appraiser
鉴定意见
AppraisalView
归档信息
ArchivingInfo
归档时间
ArchivingDate
归档方式
IsOnLine
归档类型
ArchivingType
移交责任者
HandoverActor
接收责任者
ReceiveActor
逻辑归档标识
LIsArchiving
物理归档标识
PIsArchiving
纸质文件归档标识
PRIsArchiving
权限管理
Rights
密级
SecurityLevel
解密期限
ExpiryDate
保管期限
PreservationPeriod
保管期限名称
PPeriodName
保管期限代码
PPeriodCode
保管期限值
PPeriodValue
版权说明
CopyrightStatement
授权对象
AuthorizationTo
授权行为
AuthorizationAct
安全分类
SecurityClassification
维护历史
HistoryofDisposal
处置类型
DisposalType
处置责任者
DisposalActor
处置时间
DisposalDate
处置依据
DisposalReason
处置过程
DisposalProcess
处置结果
DisposalResult
利用历史
UseHistory
利用日期/时间
UseDate/Time
利用类型
UseType
利用描述
UseDes
管理扩展信息
ManagementExtent
固化信息
FixityInfo
数字签名
DigitalSignature
数字签名时间
DigitalSignatureDate
数字签名描述
DigitalSignatureDes
校验和
Checksum
14.3 电子文件必备核心元数据表
元数据集
元数据子集
元素
子元素
内容信息
数据对象
数字对象
保存描述信息
内容描述信息
题名
责任者
文件编号
文件形成时间
结构信息
文种
文件集合
集合类型
集合描述
格式
电子文件类别
数据格式
文件大小
归档文件大小
数字化文件大小
背景信息
创建依据
法律法规依据
行政或行业依据
全宗信息
全宗名称
全宗类型
立档单位机构代码
创建过程
处理类型
处理人
接收处理时间
实际处理时间
处理后发出时间
处理意见
管理信息
标识信息
标识符
档案馆代码
电子文件号
档号
全宗号
目录号
案卷号
页号
件号
鉴定信息
鉴定类型
鉴定时间
鉴定人
鉴定意见
归档信息
归档时间
归档方式
归档类型
逻辑归档标识
物理归档标识
权限管理
保管期限
安全分类
固化信息
数字签名
数字签名时间
数字签名描述
14.4 元数据的应用
本规范对元数据表结构的定义依据XML规范进行,适用于基于XML规范的办公自动化等业务信息系统对元数据的设置、捕获与存储,以及最终生成基于XML的档案信息包。
在文档一体化管理系统中生成、运行、维护的结构化数据库中,档案管理人员可依据“6电子文件元数据元素定义及描述”中关于元数据注释属性的定义,进行元数据项的著录。
15 电子文件元数据元素定义方法
电子文件元数据表中各个元素都用11个属性进行描述:
名称(Name):
元素的名称。
版本(Version):
产生该元素的元数据规范版本。
标识(Identifier):
元素的唯一标识;
定义(Definition):
对元素概念与内涵的描述;
类型(DataType):
元素所属的数据类型;
值域(Value):
元素的指定值或允许范围;
必备性(Obligation):
说明元素是必备的还是可选的;
可重复性(Repeatability):
元素的可重复行与值域重复;
下层元素(Sub-elements):
某上位元素的下位子元素;
应用范围(Application):
元数据可应用的范围或领域;
注释(Comment):
对元素的补充说明及相关著录细则。
16 电子文件元数据元素定义及描述
16.1 信息总体(InformationPackage)
名称
信息总体
标识
InformationPackage
版本
Version1.0
定义
信息总体,又称为信息包,是一组信息的集合,包括为长期保存电子文件所需的所有内容信息与保存描述信息。
类型
复合类型
值域
-
必备性
必备
可重复性
不可重复
下层元素
名称
标识
必备性
内容信息
ContentInfo
必备
保存描述信息
PreservationDesInfo
必备
应用范围
应用于所有类别的电子文件及信息管理系统
注释
为实现对数字资源的长期保存,开放档案信息系统(OAIS)对信息包模型进行了详细定义,信息包是信息管理系统的最基本管理单元。
信息包内含相应的封装信息,如数字签名、电子文件名称、具有检索意义的目录信息等,用于保证信息包内部数据的真实性,界定并识别内容信息与保存描述信息。
内容信息(ContentInfomation)
名称
内容信息
标识
ContentInfo
版本
Version1.0
定义
内容信息是指电子文件的正文内容,包括文件的正文、附件的正文内容等,是电子文件行文或形成的目的。
内容信息包括数据对象与数据对象表述信息。
类型
复合型
值域
-
必备性
必备
可重复性
不可重复
下层元素
名称
标识
必备性
数据对象
DateObject
必备
表述信息
RepresentationInfo
必备
应用范围
应用于所有类别的电子文件及信息管理系统
注释
根据OAIS的定义,档案信息包的内容信息由数据对象和表述信息构成。
数据对象(DateObject)
名称
数据对象
标识
DateObject
版本
Version1.0
定义
数据对象是指表达并保存电子文件正文、附件正文等的比特流。
类型
复合型
值域
-
必备性
必备
可重复性
不可重复
下层元素
名称
标识
必备性
数字对象
DigitalObject
必备
物理对象描述信息
PhysicalObject
可选
应用范围
应用于所有类别的电子文件及信息系统。
注释
数字对象(DigitalObject)
名称
数字对象
标识
DigitalObject
版本
Version1.0
定义
用于保存、表示电子文件内容信息