元数据标准.docx
《元数据标准.docx》由会员分享,可在线阅读,更多相关《元数据标准.docx(134页珍藏版)》请在冰豆网上搜索。
元数据标准
元数据标准(总74页)
电子文件元数据标准
(征求意见稿)
1.范围
本标准适用于各级机关、团体、企事业单位、社会组织。
本标准规定了电子文件元数据的结构、定义、编码体系。
本标准描述的数字对象为通用的电子文件核心元数据,主要为原生电子文件与数字化文件(文本、图像)元数据。
根据发展需要,扩展编制图形、影像、声音等文件类型的元数据标准。
2.编制目的
对文件及相关实体进行标准化描述;
实现不同机构、不同系统之间文件及信息的互操作;
为电子文件在不同时间、不同空间、不同应用软件中的再利用提供统一的元数据;
为电子政务、办公自动化、电子文件中心、文档管理、档案管理等系统提供成熟的电子文件全过程管理的设计模式。
3.规范性引用文件
下列文件中的条款,通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T2659-2000世界各国和地区名称代码
GB/T2260-2002中华人民共和国行政区划代码
GB/T11714-1997全国组织机构代码编制规则
GB/T9704-1999国家行政机关代码编制规则
GB2312-1980信息交换用汉字编码字符集基本集
GB/T4880-1991语种名称代码
GB/T语种名称代码第2部分:
3字母代码
GB/T4881-1985中国语种代码
GB/T文献著录总则
GB/T13959-1992文件格式与代码编制方法
GB/T15418-1994档案分类标引规则
GB/T3760-1995文献叙词标引规则
GB/T9704-1999国家行政机关公文格式
GB18030-2000信息技术信息交换用汉字编码字符集基本集的扩充
GB/T18894-2002电子文件归档与管理规范
GB/T7156-2003文献保密等级代码
GB/T19667基于XML电子公文格式规范
DA/T12-1994全宗卷规范
DA/T13-1994档号编制规则
DA/T18-1999档案著录规则
DA/T19-1999档案主题标引规则
DA/T22-2000归档文件整理规则
DA/T1-2000档案工作基本术语
中办发[1996]14号中国共产党机关公文处理条例
国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知
国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知
ISO15489信息与文件—文件管理
ISO23081-1信息与文献—文件管理流程—文件元数据-总则
ISO23081-2信息与文献—文件管理流程—文件元数据-概念与实施问题
ISO14721空间数据和传输系统—开放档案信息系统—参考模型
ISO11179信息技术--元数据元素的规范与标准化
ISAD(G)档案著录规则(总则)
W3CNamespacesinXMLXML的命名空间(Namespaces)
4.术语与定义
下列术语和定义适用于本标准。
4.1通用术语
4.1.1业务系统Businesssystem
将硬件、软件、信息或服务、政策、程序、人有机地组合在一起,实现对机构业务信息的保存、整理和提供。
如:
电子政务系统、办公自动化系统等。
4.1.2电子文件管理系统ElectronicRecordsManageSystem(ERMS)
为了满足业务对电子文件管理需要而设计的系统,用以捕获、保存、提供获取业务处理过程中产生的有证据价值的文件的功能。
电子文件管理系统包括:
档案工作者和文件使用者;授权政策、责任分配、权力授予、程序和做法;政策声明、程序手册、用户指南和其他用以批准和颁布政策的文件、程序和做法;文件本身;控制和记录的专门资料和文件系统;软件、硬件、其它设备、必要工具等。
4.1.3实体Entity
指过去、现在和将来存在的任何具体或抽象的事物以及它们之间的联系。
比如:
人、物体、事件、想法、过程等等。
4.1.4文件实体Recordentity
在处理公务或事务过程中,由团体或个人形成或接收和保存的任何形式或载体的记录信息。
可以是单份文件,也可以是文件的集合。
4.1.5责任者实体Agententity
对文件的信息内容负有责任的个人或团体。
4.1.6业务实体Businessentity
指业务过程中对文件进行处理与管理的一系列活动。
4.1.7关系实体Relationshipentity
描述文件、责任者、业务等实体自身、相互关系及这种关系的背景信息实体。
4.1.8电子文件元数据ElectronicRecordsMetadata
描述电子文件内容、背景和结构信息及整个管理流程的数据。
4.1.9元数据集Metadataschema
规定和描述标准元数据集元素以及元素间相互关系的框架。
语句集为元数据元素提供正式的结构(句法)和语义(定义)。
4.1.10元数据结构Metadatastructures
元数据集由一系列的元素组成,元素之间的相互关系形成了元数据的结构。
元数据结构体现元数据扩展的方法与机制。
元数据抽象模型的建立对其元素的扩展与整个元数据方案的规范具有参考作用。
4.1.11元数据语义MetadataSemantic
元数据的本质是描述对象的各种属性及相关关系等内容,每一个元素的语义明确定义了其含义、内涵与外延。
语义定义是一个元数据规范的基本要素,也是元数据应用与元数据互操作的最重要的基础。
4.1.12元数据句法Metadatasyntax
句法的问题即是一个形式化描述的问题,元数据集所有语义与结构及描述的内容以计算机可读或人可读的形式化方法描述出来。
从标准、开放、互操作角度,采用标识语言对元数据集进行描述。
本标准采用XML语言对元数据集进行描述。
4.1.13编码体系EncodingScheme
编码体系有助于对元素修饰词值的理解。
这类体系包括控制词表及正规的符号或解读方式。
值的表示采用来自控制词表的标记符号(如分类体系或主题词表的术语)或者具有特定含义,或以一定形式组成的字符串。
4.1.14信息总体InformationPackage
电子文件与其元数据可以分开保存,也可以被封装在一起保存,后者称为电子文件信息总体。
封装是指创建的一个由电子文件及其元数据组成的自我包含的实体。
信息总体便于对电子文件的独立理解,支持并长期保证电子文件的真实性、可靠性和完整性,同时提供电子文件与其形成背景之间的可靠而有意义的逻辑联系。
电子文件封装入信息总体,该文件可以存在于任何存储或操作环境中,因其包含了嵌入其中的有关开始和过程的所有细节,包括那些用于存取、传递和表述文件的细节。
信息总体需要将元数据捕获的多个点包含进文件,因为文件的处理历史像其最初的捕获元数据一样至关重要。
本标准采用ISO14721《信息技术--元数据元素的规范与标准化》定义的封装技术,定义了信息总体的封装格式,包含维护真实性的技术机制。
信息总体封装格式(EncapsulatingFormatforInformationPackage-EIP)见附录B。
.
4.1.15信息总体固化FixityofInformationPackage
电子文件元数据与其文件一样,需要受真实性规则、规范或标准的控制,以保证电子文件具有可信性,这种控制称为元数据固化。
本标准采用数字签名技术来进行信息总体的固化。
4.2数据模型概念
4.2.1属性Attribute
物体或实体的特征。
4.2.2类别Class:
对具有相同属性,操作,方法,关系和语义的对象集的描述。
4.2.3概念数据模型/概念模型Conceptualdatamodel/conceptualmodel
通过数据模型对现实世界进行抽象地表达。
5.总则
电子文件形成、捕获、登记、分类、存储和保管、利用、跟踪、处置、传输、归档移交及长期保存等过程中都需记录在元数据中,并应保持连续、一致,以确保电子文件的真实性、完整性与有效性。
为实现电子文件全过程管理与监控,电子文件及其元数据与结构稳定、定义良好的元数据标准相一致,特制定本标准。
本标准的制定遵循国际文件管理的系列标准规范:
按ISO15489《信息与文件—文件管理》规定的文件管理过程要求定义电子文件管理元数据,采用ISO/TS23081《信息与文献—文件管理流程—文件元数据》定义的电子文件管理元数据概念模型、实体及关系模型;采用ISO14721《空间数据和传输系统—开放档案信息系统—参考模型》定义的信息包(SIP、AIP及DIP)数据模型,实现电子文件内容、背景、结构信息的封装,以确保在分散与集中管理过程中电子文件的真实性、完整性、有效性,确保电子文件在不同应用系统间的安全传输;采用ISO14721定义的数字信息长期保存模型,实现电子文件的长期保存与利用。
本标准支持元数据值的再利用、元数据元素的互操作及可扩展性和模块化。
元数据来源于机构文件处理方案、主题词表或关键词表、编码方案、电子政务系统、办公自动化系统、电子文件管理系统、档案管理系统、E-mail系统、网站。
6.元数据概念模型
文件管理业务系统的各个流程,需要通过元数据实现对文件或档案的管理。
元数据最主要的用途之一是用来描述业务系统中实体。
关键实体如下:
文件实体:
文件本身,不管是单份文件还是文件集合体;
责任者实体:
业务环境中的人或组织结构;
业务实体:
业务办理。
根据元数据类型,可将元数据分为下列几类:
关于文件自身的元数据、关于责任者的元数据、关于业务工作或过程的元数据、关于业务规章制度、政策以及法规的元数据、关于文件管理过程的元数据。
电子文件元数据模型的建立是以文件连续体理论为基础的。
文件实体、责任者实体和业务活动实体,是用元数据帮助确保文件真实性、完整性和有效性,实施档案化管理必须充分关注的要素。
文件作为交流、传递、贮存、利用信息的工具,其生成、处理、运转必然与文件责任者处理某项事务相关。
对该事务的办理,形成文件的业务活动,构成了文件的来源。
这种业务活动构成了文件的背景。
责任者作为文件的形成和处理者,为业务活动或事务处理活动的实施者。
作为业务活动的主体,责任者与业务活动的推进息息相关,人们的业务活动自身也是划分为一定层次并且与相关文件群体(文件集合)的层次相对应。
从微观到宏观区分为以下层次:
1)事务处理:
即处理每一件具体事务的业务活动,在这种业务活动中形成的文件一般情况下可以构成一个文件组合(案卷)。
2)业务活动:
即处理某种类型事务而进行的职能活动,有可能是由某个机构的一个职能部门进行;也可能该职能活动属于某个相对独立的业务活动项目,是其中的一个子项目。
在这种职能活动中形成的文件,往往构成全宗内的一个类别(系列)。
3)业务职能:
即具有相对独立性的业务活动过程。
其中以主体为核心的,是由一个立档单位进行的全部业务活动,在该项业务活动中形成的全部文件往往构成一个主体全宗;以客体为核心的相对独立而又具有相当规模的业务活动,则是围绕着该客体而跨立档单位进行的,所形成的文件一般情况下可以构成一个客体全宗。
人们进行的业务活动,同时也决定了文件所拥有的和将要拥有的各种有机联系。
除了在处理同一项业务活动过程中形成的所有文件相互之间的联系以外,还有:
业务活动与文件的联系;业务活动承担者(即文件形成者和处理者)与文件的联系。
它们是与文件的形成产生过程同步共生的。
因此,(由业务活动承担者进行的)“业务活动”所诱发形成的“与文件有关的各种有机联系”是文件来源信息的重要组成部分,因而也是文件背景信息的重要组成部分。
7.电子文件元数据集(Metadataschema)
7.1电子文件元数据元素简表
7.1.1文件实体(RecordEntity)
文件层级(RecordCategory)
文件标识(RecordIdentifier)
文件题名(RecordTitle)
文件分类(RecordClassification)
文件主题(RecordSubject)
文件摘要(RecordAbstract)
文件日期(RecordDate)
文件语种(RecordLanguageType)
文件种类(RecordForm)
文件覆盖范围(RecordCoverage)
文件技术环境(RecordTechnicalEnvironment.)
文件位置(RecordLocation)
文件权限(RecordRights)
文件处置(RecordDisposal)
文件管理历史(RecordManagementHistory)
7.1.2责任者实体(AgentEntity)
责任者层级(AgentCategory)
责任者标识(AgentIdentifier)
责任者描述(AgentDescription)
责任者权限(AgentRights)
责任者行为历史(AgentActivityHistory)
7.1.3业务实体(FunctionEntity)
业务层级(FunctionCategory)
业务标识(FunctionIdentifier)
业务法规依据(FunctionMandate)
业务描述(FunctionDescription)
业务权限(FunctionRights)
业务处理过程(FunctionEventIdentifier)
7.1.4关系实体(RelationEntity)
关系实体标识(RelationEntityIdentifier)
关系实体类型(RelationEntityClassification)
相关实体标识(IdentifierOfTheRelatedEntity)
相关实体类型(TypeOfTheRelatedEntity)
关系定义(RelationshipDefinition)
关系时间(RelationshipTime)
7.1.5长期保存实体(PreservationEntity)
签名信息(SignatureInfo)
锁定签名信息(LockSignatureInfo)
编码(Encoding)
7.2电子文件元数据总体框架表
序号
元素集
元素
元素标识
限定元素
限定元素标识
1
1文件实体
RecordEntity
文件层级
RecordCategory
2
文件标识
RecordIdentifier
文件标识码
RecordIdentifier
3
文件编号
RecordNumber
4
文件题名
RecordTitle
正题名
RecordTitle
5
并列题名
AlternativeTitle
6
副题名
AnnotationTitle
7
缩略题名
AbbreviatedTitle
8
文件分类
RecordClassification
职能分类
FunctionClassification
9
主题分类
SubjectClassification
10
文件主题
RecordSubject
主题词或关键词
Subject/Keyword
11
次关键词
SecondLevelKeyword
12
第三关键词
ThirdLevelkeyword
13
文件摘要
RecordAbstract
14
文件日期
RecordDate
创建日期
CreationDate
15
登记日期
RegistrationDate
16
传输日期
TransferingDate
17
文件语种
RecordLanguageType
18
文件种类
RecordForm
19
文件覆盖范围
RecordCoverage
覆盖时间
CoveragePeriod
20
覆盖区域
CoverageArea
21
文件技术环境
RecordTechnical
Environment.
媒体格式
MediaFormat
22
数据格式
DataFormat
23
载体类型
MediumType
24
扩展名
Extent
25
原始创建环境
OriginalCreatingEnvironment
26
载体到期时间
MediumDueDate
27
文件位置
RecordLocation
当前位置
CurrentLocation
28
存储位置
StoreLocation
29
存储日期
LocationDate
30
存储说明
StoreStatement
31
文件权限
RecordRights
访问控制
RecordAccess
32
使用条件
RecordUseCondition
33
安全等级
RecordSecurityClassification
34
存取警告
RecordAccessCaveat
35
存取说明
RecordAccessStatement
36
存取时间
RecordAccessDate
37
到期时间
RecordDueDate
38
文件处置
RecordDisposal
处置授权
DisposalAuthorisation
39
处置内容
DisposalSentence
40
处置状态
DisposalStatus
41
处置日期
DisposalDate
42
处置说明
DisposalStatement
43
文件管理历史
RecordMangementHistory
事件标识
EventIdentifier
44
事件类型
EventHistoryType
45
事件描述
EventHistoryDefinition
46
事件实施日期
EventHistoryDate
47
2责任者实体
AgentEntity
责任者层级
AgentCategory
48
责任者标识
AgentIdentifier
责任者标识码
AgentIdentifier
49
责任者数字签名
DigitalSignature
50
责任者描述
AgentDescription
责任者名称
AgentTitle
51
责任者简称
AbbreviatedName
52
责任者职责范围
AgentDomain
53
责任者办公地址
AgentBusinessAddress
54
责任者联系地址
AgentContactAddress
55
责任者建立日期
AgentCommencementDate
56
责任者撤销日期
AgentCessationDate
57
责任者行为日期
AgentOperationalPeriodDate
58
责任者权限
AgentRights
责任者存取安全等级
AgentAccessSecurityClassification
59
责任者存取警告
AgentCaveat
60
文件保管许可
RecordkeepingPermissions
61
责任者存取说明
AgentAccessStatement
62
责任者存取生效日期
AgentDeterminationDate
63
责任者存取到期日期
AgentReviewDueDate
64
责任者行为历史
AgentActivityHistory
责任者行为标识
AgentActivityIdentifier
65
责任者行为类型
AgentActivityType
66
责任者行为定义
AgentActivityDefinition
67
责任者行为日期
AgentActivityDate
68
3业务实体
Function
Entity
业务层级
FunctionCategory
69
业务标识
FunctionIdentifier
业务标识码
FunctionIdentifier
70
业务法规依据
FunctionMandate
业务法规类型
FunctionMandateType
71
业务法规题名
FunctionMandateTitle
72
业务法规标识
FunctionMandateIdentifier
73
业务法规描述
FunctionMandateDescription
74
业务法规有效日期
FunctionMandateValidDate
75
业务法规赋予权限
FunctionMandateJurisdiction
76
业务描述
FunctionDescription
业务范围
FunctionActivityArea
77
业务名称
FunctionTitle
78
业务说明
FunctionStatement
79
业务执行日期
FunctionExecutiveDate
80
业务完成日期
FunctionCompletedDate
81
业务失效时间
FunctionInvalidDate
82
业务权限
FunctionRights
业务存取安全等级
FunctionAccessSecurityClassification
83
业务存取警告
FunctionCaveat
84
业务使用条件
FunctionUseCondition
85
业务存取说明
FunctionAccessStatement
86
业务存取生效日期
FunctionDeterminationDate
87
业务存取到期日期
FunctionReviewDueDate
88
业务处理过程
FunctionHistory
业务处理标识
FunctionEventIdentifier
89
业务处理类型
FunctionEventType
90
业务处理定义
FunctionEventDefinition
91
业务处理日期
FunctionEventDate
92
4关系实体
Relation
Entity
关系实体标识
RelationEntityIdentifier
93
关系实体类型
RelationEntityClassification
94
相关实体标识
IdentifierOfTheRelatedEntity
95
相关实体类型
TpyeOfTheRelatedEntity
96
关系定义
RelationshipDefinition
97
关系时间
RelationshipTime
98
5保存
实体Preservation
Entity
签名信息
Signature