1、DC元数据郑州航空工业管理学院信息描述课程论文 信息管理与信息系统 专业 71 班级题 目 DC元数据的发展前景分析 姓 名 武冰雪 学号 110497128 指导教师 武利红 2012 年 5 月 4 日内 容 提 要DC元数据是一套简洁有弹性、非图书馆专业人员也可轻易掌握和使用的信息资源著录格式,是当前图书馆界应用最广、影响最大的标准化元数据。本文介绍了DC元数据的产生和发展,并从15个方面描述了DC元数据的构成,结合网络信息资源的编目论述了DC元数据标准化著录格式在网络信息中的应用。本文简述DC 元数据的定义、特点及应用情况, 简析了DC 元数据的发展前景。关键词:DC 元数据; 元数据
2、系统; DC 元数据应用The prospect of the development of DC metadata analysisStudent ID 110497128 Name Wu Bingxue Instructor Wu LihongABSTRACTDC metadata is a concise elastic, the library professionals can also be easily master and use of information resource description format, the current is the most widely
3、 used library, the biggest impact on standardization Yuan data. This paper introduces the DC metadata generation and development, and from 15 aspects described the composition of the DC metadata, combining of the network information resource cataloguing discusses the DC metadata standard description
4、 format in the application of network information.This paper briefly describes DC metadata definition, characteristics and applications, summarizes the development prospect of the DC metadata.KeywordsDC metadata; Yuan data system; DC metadata applicationDC元数据的发展前景分析学号 110497128 姓名 武冰雪 指导教师 武利红一 引言DC
5、元数据( Metadata)是描述、提供某种资源的有关信息的结构化数据,就是关于其他数据的数据。它是用于描述网络信息资源、加强对网上信息资源的发现、开发、组织和利用的网络数据元素集。DC 元数据是都柏林核心元数据集( Dublin Core) 的简称。DC 元数据是元数据集中发展比较成熟、成功的一种元数据,属于典型的描述型元数据。DC 元数据由网络信息资源提供者创建,网络信息资源提供者按DC 元数据的要求对其提供的信息资源的属性、内容进行描述、定位。帮助人们尽快在网上发现所需要的有效信息资源。二 DC 元数据的构成要素及其特点1 DC 元数据的构成要素DC 元数据集共包括15 个元数据元素。根
6、据功能的不同,这15 个元素可分为资源内容描述、知识产权描述及外部属性描述三种类型。资源内容描述类元数据包括标题、主题、资源描述、语言、信息来源、关联、资源的覆盖范围等七个元素。知识产权描述类元数据包括著者、出版者、其他责任者、版权等四个元素。外部属性描述类元数据包括日期、资源类型、格式、标识等四个元素。2 DC 元数据的描述方式目前描述DC 元数据所采用的语言主要是HTML和XML 两种网络通用标记语言。HTML格式固定,扩展性差,用户无法定义自己的标记。XML为用户提供了灵活的标记扩展机制,不同内容的资源能以格式良好的自定义的标记元素表现。XML的优势使其将成为描述DC元数据的主要标记语言
7、。DC元数据的描述手段采用RDF模式,以方便与其它格式的元数据进行相互交换和利用。RDF 是资源描述框架的简称,其功是利用当前存在的多种元数据标准,描述各种网络资源,形成人机可读计算机可自动处理的文件。3 DC 元数据的特点DC元数据具有简单易用、可选择、可重复、描述灵活及国际通用等特点。DC 元数据所包含的15 个元素,不论是图书情报专业人员还是一般的用户都能掌握和使用,所有的元素都具可选性,标引者可根据资源的内容及行业的不同选择合适的元素加以描述,所有元素都可重复使用,多创建者、多版本、多语种资源的描述可通过DC 的可重复性实现,网络资源的描述,既可使用规范词,也可使用自由词( 关键词)。
8、三 DC 元数据的应用DC 元数据所具有的简单易用性、国际一致性、灵活性等特点, 使其受到了广泛的重视与推广应用。1 网络信息的组织与检索中的应用DC 元数据中包含了搜索引擎可以查询的属性信息,可以提高资源检索的准确性。它在网络信息组织及检索效率上占有绝对优势。据调查DC 元数据误检率仅2. 9%,而其它7个搜索引擎的误检率均超过20%。国际上有许多国家采用DC 元数据组织和检索网络信息。2 数字图书馆、数据库建设中的应用(1) 数字图书馆建设中的应用国内数字图书馆建设多采用DC 作为元数据方案或参照DC 元数据并根据实际需要对DC 元数据进行扩展, 实现对信息资源的组织及提供检索。上海图书馆
9、在数字图书馆建设中, 要实现善本古籍、上海图典、上海文典、中国报刊、民国图书、点曲台和科技百花园等七个数字化项目。这些文献资源中的图书已有完整的MARC 记录, 古籍已用特殊的元数据进行描述, 图典则需重新组织。多种元数据并存将影响不同元数据集间的使用及管理效率, 为了实现不同数据集间的互操作, 上海图书馆选用DC 元数据作为核心元数据集, 实现了不同元数据间的转换与整合。清华大学建筑数字图书馆收录了清华大学建筑学院图书馆收藏的中国古建筑史资料, 这些资料的形式复杂多样, 有图片、文字资料、动画及视频。该数字图书馆设计者选用DC 元数据作为主要参考设计依据。他们的设计既基于DC 元数据, 又不
10、拘泥于DC 元数据。他们把描述对象分成图纸、测稿、照片、汇刊、专著、论文、音频及视频等八种类型, 为不同类型的资料设定相应的标引模板。为满足系统管理需求, 解决数字化资源长期保存的问题, 清华大学建筑数字图书馆的元数据方案, 在DC 的基础上增加了本地数据块及 生存期技术环境 元素。(2) 数据库建设中的应用中国21 世纪议程管理中心、国家科委、国家计委、国家经贸委和中国科学院等共同开发的 中国可持续发展信息共享示范系统 , 推出了地理、海洋、植物、自然灾害等元数据库。万方公司于2003 年8 月正式启动元数据标准项目, 经过对中外各类成熟的元数据的分析
11、和对国内几大图书馆元数据方案的调研, 除人物类采用vCard 外, 文献类数据库、机构类数据库、标准法规类数据库、成果专利类数据库均采用DC 作为描述型元数据核心集。3 网络教育中的应用DC元数据( Metadata) 在网络教育中的应用, 能够实现对各类教育信息资源的有效描述、组织与管理。元数据在网络教育中的应用体现在教育信息资源的组织、教育信息资源的检索与导航、元数据的搜集、管理机制定制和修改等四个方面。四 DC 元数据的发展前景DC 元数据所特有优点,DCMI为适应更多领域、描述复杂的和特殊的信息对象而不断扩展、完善DC 的努力, 为DC 元数据的发展提供了广阔的空间。1 普及率将超过现
12、有各种元数据除DC 元数据外,现有的各种元数据普遍存在专业性较强、扩展困难及使用复杂的现象, 使用者仅为部分专业人员,适用范围也只局限于某些专业领域,无法大范围推广应用。如MARC, 只适用于图书馆界,掌握并使用MARC的仅有图书馆中从事文献描述的一小部分编目人员。DC 元数据的简单易用性是其大范围普及的基础。因为简单易用,使用者不需接受专业培训即可使用DC 元数据描述其所要描述的资源,如网站、网页的名称、特征、内容、文献、档案资料的特征及内容等等。掌握使用元数据的不再是少数的专业人员而是使用元数据需求的所有人。2 元数据系统将占据网络教育信息资源描述领域的主流地位在教育信息资源领域较有影响的
13、元数据格式有IEEE LOM、DC、GEM及其元数据、ADL/ SCORM内容整合模型及其元数据等。在专业元素设置、应用实施成熟度方面, IEEELOM 等元数据格式较DC 元数据( DC- Education) 有优势, 但从发展角度看, DC- Education 必将占据未来网络教育信息资源描述领域的主流地位。理由有两个:一是DC目前作为网络资源描述格式在全球已是大势所趋,采用DC 核心集的扩展应用有利于资源共建共享。二是随着DC-Education 的进一步完善,其对教育信息资源的描述能力将更趋专业。与IEEELOM等元数据格式的差距必将不断缩小。3 可能取代MARC 元数据(1) D
14、C 元数据与MARC 的共同点MARC是用于描述、存储、交换、控制和检索的一套机读书目数据标准,MARC 元数据是一种比较成熟的元数据。DC 元数据是在充分吸纳了图书情报界所具有编目、分类、文摘等经验。同时在利用计算机和网络的自动搜索、编目、索引、检索等研究成果的基础上发展起来的。虽然DC 与MARC 在类目的定义和设置上不同,但两者描述的内容比较一致。DC 元素集的15个元素与MARC格式所有的著录项基本是对应的,这是DC 元数据可能取代MARC 元数据的基础。(2)DC 元数据与MARC 的差异数据创建的复杂程度不同。DC 元数据已被结构化并支持字段查询,著录相对MARC 元数据简单,制作
15、者无需接受专门培训即可创建自己文件的元数据。MARC格式的字段、子字段及标识符多,还有繁杂的头标区,要求数据创建者依据一定著录标准进行著录,每个单元加有著录标识,可直接使用HTML语言输出著录结果,并保留自己的著录标识和系统。MARC 格式必须先在特定软件系统中著录并输出著录结果。再使用HTML语言为著录结果加标识,比较复杂。数据产生途径不同。DC 元数据可由系统自动生成,MARC 则不能。DC 元数据的产生主要有两条途径:一是使用OCLC 网络编目软件直接制作,数据制作者在空白工作单中按DC 著录规则,填入每个字段的内容,或使用自己熟悉的MARC、MARC Text Area、DC Text
16、 Area、DC REF、DC HTML 等方式输入数据。由系统自动生成DC 元数据。二是通过import 的方式获取。数据制作者将记录从其他系统中按ISO- 2709 通讯格式以纯文本输出,并粘贴到import 文本框中,然后转入CORC系统,由系统自动生成DC 元数据。(3) DC 元数据可能取代MARC 元数据DC 元数据简单易用、适应性强、可由系统自动生成等特性,决定了其对信息资源的描述具有经济高效的优势, 图书馆馆藏中电子出版物比例的不断提高也为DC元数据的应用提了机会。MARC 元数据虽然成熟、专指性高, 但数据创建过程复杂且不可以由系统自动生成, 数据创建成本高。DC 元数据与M
17、ARC 元数据的描述元素基本相同,功能相当。追求低成本高效率是人类的共同偏好,面对功能相当,成本不同的两种元数据,理性的应用者必定选择低成本的,也就是说DC 元数据有可能取代MARC 元数据。五 结束语DC 元数据的广泛应用缘于它的简单易用、可选择、可重复、描述灵活及国际通用等特性,其发展也依靠这些特性。DC 元数据一旦走向复杂化,其发展前景则将变得暗淡无光。参考文献:1 原福永, 宗永升. 多元数据携带工具RDF J . 现代计算机, 2004, (12): 59! 62.2 张云瑾. DC 元数据! 组织网络信息资源的有效工具 J . 引进与咨询, 2004, ( 1) : 30 ! .3
18、 王正兴,刘闯.政府信息资源共享两种模式及其效益比较J中国基础科学,2005,(5):36! 42.4 蒙应杰等,敦煌学WEB 数字博物馆的研究 J.计算机工程与应用, 2004,(17):184!86, 189.5 张崇. DC 元数据在国内的应用 J . 现代图书情报技术, 2004, (11): 6! 9.6 曹咏梅等. DC 元数据与MARC 的分析比较 J . 情报杂志, 2004, (3): 105! 106.7 孙华, 郑巧英.MARC与DC元数据的映像与转换 J.上海交通大学学报, 2003,( 9):247 ! 249.8 罗昊.元数据在网络教育中的应用 J.情报科学, 2004, (1): 59! 62. (注:文档可能无法思考全面,请浏览后下载,供参考。可复制、编制,期待你的好评与关注)
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1