数字图书馆资源组织建设Word下载.docx
《数字图书馆资源组织建设Word下载.docx》由会员分享,可在线阅读,更多相关《数字图书馆资源组织建设Word下载.docx(8页珍藏版)》请在冰豆网上搜索。
3.1数字图书馆信息资源组织的目标6
3.2数字图书馆信息资源组织的结构6
3.3数字图书馆信息资源组织的必要性7
4如何进行数字图书馆信息资源组织8
4.1关于数字图书馆信息资源内容创建的标准规范8
4.2关于数字图书馆信息资源描述的标准规范8
4.3数字图书馆异构系统间信息资源的共享性8
4.3.1创建一个新系统8
4.3.2使用CORBA技术8
4.3.3采用XML技术9
4.4置标语言标准9
5数字图书馆信息资源组织中应重点注意的问题9
5.1数字图书馆信息资源组织的工具选取9
5.2数字图书馆信息资源组织框架设计10
5.3数字图书馆信息资源组织中标准体系建设10
5.3.1数据格式的标准10
5.3.2资源描述语言的标准10
6结论11
浅析数字图书馆信息资源组织建设
摘要:
随着互联网技术的迅猛发展,数字图书馆信息资源呈指数增长趋势。
面对庞大的信息资源,如何来选择一种对数字图书馆的信息资源进行组织与描述的标准,以方便读者查找和利用,成为图书情报界亟待解决的问题。
本文分别从数字图书馆的特征、数字图书馆信息资源建设的必要性、如何进行数字图书馆信息资源组织建设和数字图书馆信息资源组织应注意的问题等几个方面详细阐述数字图书馆信息资源组织建设的相关问题。
从而为我国建设数字图书馆信息资源共享和发展数字图书馆提供一定的指导,加快我国数字化资源建设。
关键词:
数字图书馆;
信息资源;
资源组织;
标准规范
1引言
发展数字图书馆事业最为重要的两个方面是信息基础设施建设和数字化馆藏信息资源建设的建设。
然而,随着信息基础设施建设和数字化馆藏信息资源建设的严重失调,数字化信息资源的建设成为当务之急。
为了改变这种局面,最好的办法是发展数字图书馆事业的同时,合理组织数字图书馆网上信息资源。
作为信息资源存储和交流重要基地的图书馆,不失时机地利用计算机对馆藏原始文献实行数字化管理,把原先用纸张形式存储的信息转换为用电子计算机中的电磁信号存储的信息。
将分散于不同载体、不同地理位置的信息资源以数字方式贮存,以网络方式相互联接,以形成利于一切以用户为中心,实现智能检索和资源共享的数字图书馆新资源。
2数字图书馆概述
2.1数字图书馆概念
关于数字图书馆[1](DigitalLibrary),目前还没有一个统一、权威的定义,但参考大多数定义来看,可以总结出数字图书馆是对传统图书馆功能的进一步扩展,数字图书馆描述的是一种数字化的信息体系结构和现代化的服务机制,并非指的是图书馆实体。
这种体系结构中的信息资源是用数字技术处理加工而成的,并能通过网络存取而达到全球信息资源共享的目的。
它包括图像、文字、语音、音响、影像、软件和科学数据等多媒体信息。
2.2数字图书馆的特征
数字图书馆是充分利用计算机和通迅技术等优势的信息服务系统,能智能地存取网络上以数字化格式存在的信息,是世界图书馆的发展趋势。
数字图书馆建设是以统一的标准和规范为基础,以数字化的各种信息为底层,以分布式海量数据库群为支撑,以智能检索技术为手段,以电子商务为管理方式,以宽带高速网络为传输通道,将丰富多彩的多媒体信息传递到千家万户。
笔者认为,数字图书馆应具备以下3个基本要素。
2.2.1数字化资源
数字图书馆是一个数字化的信息系统,它将分散于各种载体,不同地理位置的信息资源以数字化方式存储,以网络化方式互相连接,提供远距离访问与跨库查询,即时利用、实现资源共享。
大量的数字化资源是数字图书馆的“物质”基础。
具有一定规模并在内容或主题上相对独立的数字化信息资源,不仅包括书目、索引、文摘等二次文献(获得文献的线索),更重要的是要将传统的纸质型一次文献转化为计算机能识别的数字化信息。
2.2.2分布式管理
分布式管理是数字图书馆发展的高级阶段,它意味着全球数字图书馆遵循统一的访问协议之后,数字图书馆可以实现“联邦访问”[2]。
数字图书馆将资源分为元数据库和对象数据库。
元数据是描述和管理对象数据的数据,对象数据是指数字化的文本、图片、声音、影像等数据。
元数据要集中在数字图书馆中心的超大规模服务器上,对象数据库则可分布式存放在资源所在地,当用户查询时,中心调度系统通过元数据调度各个对象数据库中的数据,提供给用户使用。
2.2.3智能化服务
智能化的知识服务是数字图书馆的建设宗旨。
数字图书馆系统首先应该以简单的用户操作接口提供对海量多媒体数据的高性能检索服务,同时应该朝着个性化、主动化、多样化的目标迈进,提供个人数字图书馆、信息推送等用户喜闻乐见的服务形式。
3数字图书馆信息资源组织标准的必要性
数字图书馆是一座巨大的信息资源宝库,美国人WilliamY.Arms将数字图书馆定义为有组织的信息馆藏及相关服务,信息以数字化形式保存,并通过网络进行访问。
其核心在于说明数字图书馆中的资源是有组织的。
数字图书馆信息资源组织的目标和结构是了解数字图书馆信息资源平台建设的前提,也是数字图书馆信息资源实现的思想。
3.1数字图书馆信息资源组织的目标
数字化图书馆和传统图书馆一样,其信息资源组织的基本目标是为用户提供信息,只不过数字化图书馆是利用先进的技术手段将分布不同的数据服务器上的数字化信息有效地组织起来,使得数字图书馆用户可以方便的远程查询和使用这些数字信息,来完成社会所赋予的传递信息的基本职能。
3.2数字图书馆信息资源组织的结构
实现对传统图书馆文献资源数字化的转换对实现数字图书馆信息资源建设至关重要,但是相比传统图书馆的文献资源,其组织结构具有不同的特点。
传统图书馆文献的组织由二个部分组成:
排架号、目录和文献本身。
而数字图书馆信息资源的信息组织同样由三部分组成:
指针、元数据和数据[3]。
指针对应于排架号,用来唯一标识数据,赋予数字化信息的唯一标识号,是图书馆对数字化信息进行组织的主要内容之一。
目前主要有两种方法来标识数字化信息:
一种是赋予数字化信息一个唯一的名称,即所谓统一资源名称法;
另一种方法是赋予数字化信息一个固定的位置,即永久统一资源定位器法。
元数据对应于目录,是一组用来描述数据本身特征的数据集,是一种对数字化信息进行组织处理的数据结构标准。
它规定了数字化信息的组成,并对之进行规范组织,以利于检索和传递。
数据则对应于文献,是数字化信息的载体。
数据有多种表现形式,其最主要的是用SGML语言表示的数据。
3.3数字图书馆信息资源组织的必要性
目前,世界各国对数字图书馆建设的重视,使电子图书数字信息资源的数量、种类和类型迅速增加,成为网络的主流信息,对于这些电子文献的共享、挖掘、控制、组织和检索,也成为网络界和图书情报领域关注和努力解决的问题,希望能有一种基于数字信息和网络服务的标准,在保证相当检索、精度与准确的前提下,方便快速地建立对浩如烟海的数字信息的描述[4]。
建立一项世界各国统一的标准,一方面可以协调各个单位的资源建设,只要符合统一的标准,所建设的数字资源就可以时常方便地实现共享。
另一方面,统一的标准有助于相关软件的开发,在拥有数字资源的基础上,还要对其进行数据挖掘、知识查询、智能处理等。
最后,统一的标准还可以防止垄断,如果所建立的标准是由某个公司或企业制定的,那么其他人要想使用这个标准就会受到版权的限制,从而限制数字资源的建设和发展。
因此,选择研究数字图书馆信息资源组织的标准方案是数字图书馆建设中的首要问题。
迄今为止,国外已有若干元数据标准的研究项目和成果。
我国的许多单位也设计了自己的数字资源建设标准,但都尚未产生任何公认的用于中文的信息资源的标准,以后我们应加强在这方面的研究和探索。
4如何进行数字图书馆信息资源组织
4.1关于数字图书馆信息资源内容创建的标准规范
在数字图书馆信息资源中,数字内容包括由传统载体(印本、图片、录音录像等)数字化而形成的数字对象,或者是原生数字形态的内容对象(例如直接的数字文本、数字摄像或数字录音文件等)。
这些数字资源内容创建的标准规范涉及内容编码、内容对象格式、内容对象标识等方面。
4.2关于数字图书馆信息资源描述的标准规范
元数据[5]作为描述数字图书馆信息资派的数据,是所有数字信息资源建设项目的重要基础,需要规定描述数字信息资源在具体范围内规定实际应用的标准与规范:
元数据就是数据的数据。
元数据是一种用来描述数字化信息资源,特别是网络信息资源的基本特征及其相互关系,从而确保这些数字化信息资源能够被计算机及其网络系统自动辨析、分解、提取和分析归纳的一整套编码体系。
4.3数字图书馆异构系统间信息资源的共享性
当前,我国图书馆界存在着多种异构系统并存的局面,有些大型图书馆还是一馆两制或一馆多制,这种多种系统并存的局面使得图书馆信息资源组织和管理格式多种多样,在数字图书馆信息资源组织过程中,研究异构系统之间信息的交互性和共享性显得尤为重要。
实现不同图书馆系统之间信息资源共享的几种可能解决方案:
4.3.1创建一个新系统
最直接的方法就是把原先运行在各种软硬件配置上的各种图书馆系统结合起来,重新定制一个新的系统,所有的图书馆都应用这一系统,这样可以很好地实现各个图书馆的共享性,但是这种系统需要各大中型图书馆都要投入一定的资金和时间,如果过段时间需要增加一个新的应用程序或平台,那么集成这个新的应用程序或平台将要耗费大量的时间和金钱。
这个方案需要国家的大力支持才可以实施。
4.3.2使用CORBA技术
COBRA技术[6]是一种语言中性的软件构件模型,可以跨越不同的网络、不同的机器和不同的操作系统,实现分布对象之间的互操作,但CORBA技术比较复杂,学习起来比较困难,非计算机专业人员很难胜任,如果所有的图书馆人员都具有很强的计算机应用技术能力,应用这一技术就可以实现不同系统的互操作性。
4.3.3采用XML技术
XML是W3C确认的标准化的数据描述语言,它强调信息结构和内容的描述而不是信息的外观表示形式.在数据表示和数据交换上越来越受到重视。
它是一个格式独立、与平台和应用程序无关的语言。
XML可定义自我描述的文档架构,并且有RDF、XQL、DOM等附加标准的支持。
采用XML实现不同图书馆系统间的互操作性,这是一个有益的尝试。
这样做可以保持原有系统的独立性,成本开销相对较小,且系统具有良好的可扩展性。
4.4置标语言标准
最近几年来,与元数据标准浪潮相呼应,各种面向专业内容的置标语言纷纷涌现。
可扩展置标语言XML在过去几年内的完善和巩固,使这成为新的置标语言的代表,并且促进了更多专业置标语言的发展。
XML是由SGML和HTML发展而来的,并且已成为新一代超文本置标语言XHTML和许多面向专业的和面向特殊媒体的专业置标语言的根基[7]。
数字图书馆的资源标引则深入到文献内容,对其每一数据对象使用标准通用置标语言进行置标,并抽取元数据组织元数据库。
SGML和XML是信息处理的一系列国际标准,是用来定义具有特殊目的的标记语言。
它在文本的保护、交换、共用、分布、整合、安全、扩展、升级等方面的应用都是其它标准所无法比拟的。
它允许一个文件中包含文字、声音、图像、影像、符号、字型等各种类型的数据,可以定义一个无限的标识条款的集合,这些标识符具有各种语义。
SGML/XML提供了一种标引结构化数据的框架,一个元素可以说明与它关联的数据,当用户查询某一特定内容时,借助了支持SGML/XML的查询引擎,就可以将多个平台的相关信息一并呈现给用户。
5数字图书馆信息资源组织中应重点注意的问题
5.1数字图书馆信息资源组织的工具选取
分类法和主题法是近代两大主要的知识组织工具。
但随着信息的爆炸式增长,单纯使用主题和分类的方法组织数字图书馆馆藏信息资源,已经显得无能为力。
只有使用“分类-主题”的方法对知识信息进行组织,才能为不同层次和需求的用户分别提供分类的、主题的、分类-主题的信息查询功能[8],即把知识的自然语言表达与查询、受控自然语言表达与查询融为一体[9];
把知识的分类组织与词语组织融为一体,满足网上信息资源组织与查询的需求。
5.2数字图书馆信息资源组织框架设计
数字图书馆不是简单地将传统图书馆的文献堆砌变为数字化信息的堆砌,而是要在数字文献的基础上建设数据库,实施知识增值。
因此,数据库的组织必须要有一个科学的框架。
由于知识门类的互通性和人类学习的无止境,数字图书馆各数据库之间应该能够进行有效的链接,这就是所谓的的跨库检索和无缝链接,通过链接各数据库共同组成一个知识系统。
所以针对资源建设需要设计相关数据库及其数据结构。
数据库建设的重要指导思想是按知识点而不是按资源的媒体形式组织内容[10]。
因此,针对某个特定的选题,要按照知识点进行分析和划分,确定子数据库。
按照学科体系,子数据库的划分要涉及该专题的各个方面。
而该专题数据库,就是各子库的有序合成。
数字图书馆资源组织的关键是将信息资源在知识单元而非文献单元的层次上组织起来,从而提供有利于产生新知识的资源、工具及合作环境。
5.3数字图书馆信息资源组织中标准体系建设
组织数字图书馆信息资源需要有合理的方法,适宜的组织体系,标准的组织框架,以便实现各个图书馆的网络信息组织体系之间互操作。
数字信息资源组织标准化主要包括:
数据格式标准化和资源描述语言的标准化。
5.3.1数据格式的标准
数据格式是数字化信息的基本结构描述,它可以实现不同计算机系统间的数据交换。
是对不同类型的数字文件的格式进行了限定,它包括页面著录标准(如PDF),图形格式标准(如TIFF,GIF),结构信息标准(如SGML),移动图像与音频格式等。
其中超文本标记语言(HTML)、通用标记语言标准(SGML)与可扩充标记语言(XML)是用于数字信息资源组织方面的结构信息数据格式标准的典型,它们是人工可读格式文献与数据库超文本信息的标记语言[11]。
5.3.2资源描述语言的标准
描述语言的标准化可实现用户和系统以及系统和系统之间的有效沟通。
描述语言是用来描述数字化信息基本特征的一组代码体系,如信息的形式特征和内容特征以及检索要求等。
主要有元数据体系和资源著录标准。
在进行数字图书馆研究和数字数据库建设过程中,应尽量选用目前国际上已有的一些适合网络上数据描述和组织的相关标准,如SGML、HTML、XML、都柏林核心集、Meta内容框架、资源描述框架等。
同时还要组织国内有关专家制定和修改一系列适合我国数字图书馆建设的资源描述、标识、查询、交换和使用的标准与规范,加快元数据体系的规范化和标准化工作,及早建立通用的元数据体系。
元数据的多样化不利于数字图书馆的发展,因此,必须加强对包括元数据规范在内的标准化研究,以便制定出一种通用的、能支持多种元数据规范的国际公认的标准。
6结论
数字图书馆信息资源组织必须做到遵循标准化,数据标准采用MARC格式,通信采用TCP/IP协议,为图书馆的文献信息资源共建共享打好基础。
同时系统要具有开放性和通用性,数据字典开放,以用户为中心,用户可以根据本馆需要进行灵活设置,接收标准的外部数据源。
此外,系统具有实用性也是衡量标准之一,要应用到更多的图书馆,从而根据图书馆的专家和工作人员的意见反馈,反复完善和提高,使系统更加规范和专业化。
参考文献:
[1]张晓林,曾蕾,李广建.数字图书馆建设的标准与规范[J].中国图书馆学报,2002,(6):
30-36
[2]汤珊红.数字图书馆信息资源组织研究[J].情报理论与实践2004,5(27):
541-557.
[3]赵洗尘.数字图书馆资源组织[J].图书情报工作,2003,3:
76-80.
[4]孟凡静.数字图书馆的信息资源组织与控制[J].情报工作研究,2004,14(11):
49-53.
[5]白广思.数字图书馆平台建设研究[J].情报理论与实践,2010,4(33):
102-105.
[6]尚慧.数字图书馆信息资源组织研究[J].图书馆工作研究,2006,16(21):
51-56.
[7]杨济萍.数字图书馆信息资源组织浅探[J].中州大学学报,2003,20(3):
79-83.
[8]孙正东,方威明.论数字图书馆建设中信息资源的组织与管理[J].图书馆学刊,2002,5:
25-27.
[9]孙利红.数字图书馆资源组织[J].现代图书情报技术,2002,1:
3-5.
[10]张秀兰,刘璇.数字图书馆中网络信息资源的组织研究[J].图书馆学刊,2006,3:
110-113.
[11]宋苏荣.网格技术环境下的数字图书馆信息资源组织模式研究[J].现代情报,2008,6:
114-119.