ImageVerifierCode 换一换
格式:DOCX , 页数:8 ,大小:76.35KB ,
资源ID:30576796      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/30576796.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(元数据开发应用的标准化框架.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

元数据开发应用的标准化框架.docx

1、元数据开发应用的标准化框架元数据开发应用的标准化框架1. 数字图书馆资源组织框架元数据开发应用的标准化框架2. 元数据开发应用框架2.1 元数据的基本意义 Metadata(元数据)是“关于数据的数据”;元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具; 元数据为分布的、由多种数字化资源有机构成的信息体系(如数字图书馆)提供整合的工具与纽带。离开元数据的数字图书馆将是一盘散沙,将无法提供有效的检索和处理。 元数据开发应用的标准化框架3. 元数据应用环境3.1 Metadata的应用目的 (1)确认和检索(Discovery andentification),主要致力

2、于如何帮助人们检索和确认所需要的资源,数据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。(2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体、位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和FGDC/CSDGM是这类Metadata的典型代表。 (3)资源管理(Resource Administration),支持资源的存储和使用管理,数据元素除比较全面的著录描述信息外,还往往包括权利管理(Rights/Privacy Management)、电子签名(Dig

3、ital Signature)、资源评鉴(Seal of Approval/Rating)、使用管理(Access Management)、支付审计(Payment and Accounting)等方面的信息。(4)资源保护与长期保存(Preservation and Archiving),支持对资源进行长期保存,数据元素除对资源进行描述和确认外,往往包括详细的格式信息、制作信息、保护条件、转换方式(Migration Methods)、保存责任等内容。3.2 Metadata在不同领域的应用 根据不同领域的数据特点和应用需要,90年代以来,许多Metadata格式在各个不同领域出现例如:网络

4、资源:Dublin Core、IAFA Template、CDF、Web Collections 文献资料:MARC(with 856 Field),Dublic Core 人文科学:TEI Header 社会科学数据集:ICPSR SGML Codebook博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core政府信息:GILS 地理空间信息:FGDC/CSDGM 数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadat

5、a for Images 档案库与资源集合:EAD技术报告:RFC 1807连续图像:MPEG-73.3 Metadata格式的应用程度 不同领域的Metadata处于不同的标准化阶段:在网络资源描述方面,Dublin Core经过多年国际性努力,已经成为一个广为接受和应用的事实标准;在政府信息方面,由于美国政府大力推动和有关法律、标准的实行,GILS已经成为政府信息描述标准,并在世界若干国家得到相当程度的应用,与此类似的还有地理空间信息处理的FGDC/CSDGM;但在某些领域,由于技术的迅速发展变化,仍然存在多个方案竞争,典型的是数字图像的Metadata,现在提出的许多标准都处于实验和完善

6、的阶段。 3.4 Metadata格式“标准化”程度问题Metadata开发应用经验表明,很难有一个统一的Metadata格式来满足所有领域的数据描述需要;即使在同一个领域,也可能为了不同目的而需要不同的但可相互转换的Metadata格式。同时,统一的集中计划式的Metadata格式标准也不适合Internet环境,不利于充分利用市场机制和各方面力量。但在同一领域,应争取“标准化”,在不同领域,应妥善解决不同格式的互操作问题。 元数据开发应用的标准化框架 4. 元数据结构4.1 总体结构定义方式 一个Metadata格式由多层次的结构予以定义:(1)内容结构(Content Structure

7、),对该Metadata的构成元素及其定义标准进行描述。(2)句法结构(Syntax Structure),定义Metadata结构以及如何描述这种结构。 (3)语义结构(Semantic Structure),定义Metadata元素的具体描述方法。4.2 内容结构 内容结构定义Metadata的构成元素,可包括: 描述性元素、技术性元素、管理性元素、结构性元素(例如与编码语言、Namespace、数据单元等的链接)。这些数据元素很可能依据一定标准来选取,因此元数据内容结构中需要对此进行说明,例如MARC记录所依据的ISBD,EAD所参照的ISAD(G),ICPSR所依据的ICPSR Dat

8、a Preparation Manual。 4.3 句法结构句法结构定义格式结构及其描述方式,例如元素的分区分段组织、元素选取使用规则、元素描述方法(例如Dublin Core采用ISO/IEC 11179标准)、元素结构描述方法(例如MARC记录结构、SGML结构、XML结构)、结构语句描述语言(例如EBNF Notation)等。有时,句法结构需要指出元数据是否与所描述的数据对象捆绑在一起、或作为单独数据存在但以一定形式与数据对象链接,还可能描述与定义标准、DTD结构和Namespace等的链接方式。 4.4 语义结构 语义结构定义元素的具体描述方法,例如 描述元素时所采用的标准、最佳实践

9、(Best Practices)或自定义的描述要求(Instructions)。 有些元数据格式本身定义了语义结构,而另外一些则由具体采用单位规定语义结构,例如Dublin Core建议日期元素采用ISO 8601、资源类型采用Dublin Core Types、数据格式可采用MIME、识别号采用URL或DOI或ISBN;又如OhioLink在使用VRA Core时要求主题元素使用A&AT、TGM和TGN,人名元素用ULAN。元数据开发应用的标准化框架 5. 元数据编码语言与制作方式5.1 元数据编码语言 元数据编码语言(Metadata Encoding Languages)指对元数据元素和

10、结构进行定义和描述的具体语法和语义规则,常称为定义描述语言(DDL)。 在元数据发展初期人们常使用自定义的记录语言(例如MARC)或数据库记录结构(如ROADS等),但随着元数据格式的增多和互操作的要求,人们开始采用一些标准化的DDL来描述元数据,例如SGML和XML,其中以XML最有潜力。5.2 元数据制作方式(1)专门编制模块(例如对MARC、GILS、FGDC等)(2)数据处理时自动编制(例如对Dublin Core等)(3)数据物理处理时自动编制(例如数字图像扫描时的某些元数据参数)(4)共享元数据(例如OCLC/CORC、IMESH 元数据开发应用的标准化框架 6. 元数据互操作性6

11、.1 元数据互操作性问题 由于不同的领域(甚至同一领域)往往存在多个元数据格式,当在用不同元数据格式描述的资源体系之间进行检索、资源描述和资源利用时,就存在元数据的互操作性问题(Interoperability):多个不同元数据格式的释读、转换和由多个元数据格式描述的数字化信息资源体系之间的透明检索。 6.2 元数据格式映射 利用特定转换程序对不同元数据元格式进行转换,称为元数据映射(Metadata Mapping/Crosswalking)。 目前已有大量的转换程序存在,供若干流行元数据格式之间的转化,例如 Dublin Core与USMARC; Dublin Core与EAD Dubli

12、n Core与GILS; GILS与MARC TEIHeader与MARC FGDC与MARC也可利用一种中介格式对同一格式框架下的多种元数据格式进行转换,例如UNIverse项目利用GRS格式进行各种MARC格式和其它记录格式的转换。格式映射转换准确、转换效率较高。不过,这种方法在面对多种元数据格式并存的开放式环境中的应用效率明显受到限制。6.3 标准描述框架解决元数据互操作性的另一种思路是建立一个标准的资源描述框架,用这个框架来描述所有元数据格式,那么只要一个系统能够解析这个标准描述框架,就能解读相应的Metadata格式 实际上,XML和RDF从不同角度起着类似的作用。XML通过其标准的

13、DTD定义方式,允许所有能够解读XML语句的系统辨识用XML_DTD定义的Metadata格式,从而解决对不同格式的释读问题。RDF定义了由Resources、Properties和Statements等三种对象组成的基本模型,其中Resources和Properties关系类似于E-R模型,而Statements则对该关系进行具体描述。RDF通过这个抽象的数据模型为定义和使用元数据建立一个框架,元数据元素可看成其描述的资源的属性。进一步地,RDF定义了标准Schema,规定了声明资源类型、声明相关属性及其语义的机制,以及定义属性与其它资源间关系的方法。另外,RDF还规定了利用XML Name

14、space方法调用已有定义规范的机制,6.4 数字对象方式建立包含元数据及其转换机制的数字对象可能从另一个角度解决元数据互操作性问题。 Cornell/FEDORA项目提出由内核(Structural Kernel)和功能传播层(Disseminator Layer)组成的复合数字对象。内核里,可以容纳以比特流形式存在的文献内容、描述该文献的元数据、以及对这个文献及元数据进行存取控制的有关数据。功能传播层,主功能传播器(PrimitiveDisseminator)支持有关解构内核数据类型和对内核数据读取的服务功能,还可有内容类型传播器(Content-Type Disseminators),它

15、们可内嵌元数据格式转换机制。例如,在一个数字对象的内核中存有MARC格式的元数据,在功能传播层装载有请求Dublin Core格式及其转换服务的内容类型传播器。当数字对象使用者要求读取以Dublin Core表示的元数据时,相应的内容类型传播器将通过网络请求存储有Dublin Core及其转换服务程序的数字对象,然后将被请求数字对象中的MARC形式元数据转换为Dublin Core形式,在输出给用户。元数据开发应用的标准化框架 7. 几点建议跟踪元数据发展、积极参与制定元数据标准、加快元数据应用、注意国际接轨加快研究有效利用元数据进行检索(包括异构系统透明检索)、相关性学习、个性化处理等的机制 加快研究元数据与数字对象和数字化资源体系有机整合的途径与方法推进研究利用元数据进行基于知识的数据组织和知识发现

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1