数字图书馆原.docx
《数字图书馆原.docx》由会员分享,可在线阅读,更多相关《数字图书馆原.docx(13页珍藏版)》请在冰豆网上搜索。
数字图书馆原
数字图书馆原理与应用
数字图书馆原理与应用
一.熟悉和掌握
1.数字图书馆定义:
数字图书馆是同时具备数字资源、网络服务和特色技术三大特征的图书馆。
2.数字图书馆特征:
数字资源、网络服务和特色技术是数字图书馆最主要的三大特征。
(1)数字资源是指图书馆中所有数字形式的信息资源,包括经过数字化转换的文献或本来就是以数字形式出版的信息。
(2)网络服务:
高速数字通信网络是数字图书馆得以存在的基础。
数字图书馆的对内业务和对外服务都是通过网络进行的。
(3)特色技术:
现有特色技术包括分布式资源与运行管理技术、海量信息存储与组织技术、多媒体信息标引与检索技术等,建立特色技术的国际标准是数字图书馆建设的重要内容之一。
3.数字图书馆的理论模型:
P6*
(1)形象模型:
与数字资源、网络服务和特色技术三大特征相对应,数字图书馆的理论构架可以用一个形象模型来表达。
服务
技术
这是一个以资源为核心、技术为支撑、服务为目标的数字图书馆理论形象模型。
根据这一理论模型形成三大学派:
资源主导学派、服务主导学派、技术主导学派。
正确的认识应该是资源、技术、服务三者相辅相成,构成数字图书馆的三位一体。
没有资源,数字图书馆就失去存在基础;没有服务,数字图书馆就上去存在价值;没有技术,数字图书馆难以运行。
(2)抽象模型:
按照资源—技术—服务一体化思想,将形象模型抽象化,就可以得到抽象模型:
资源R服务S
基于一般信息系统模型和抽象模型,可以进一步建立数字图书馆的数学模型图:
IJ
B
I是信息供应量,J是信息获取量,B是反馈信息集,S是技术系统结构,
F(J,B)=f[G(I,S)]
4.数字图书馆的理论结构:
数字图书馆的理论框架由数字资源、网络服务和支持技术构成。
P7**
(1)数字资源:
有以下两大来源。
∙印刷资源的数字化:
对于版权已过期的图书、文献、资料,可以采用扫描、光学字符识别等处理技术进行数字化,形成数字资源的基础部分,以经典著作和古代文献为主。
∙原生数字资源:
原生数字信息资源也越来越多,如图书、期刊的出版都是先有数字化版本,再生成印刷本。
原生数字资源正逐步成为数字资源的主体。
(2)网络服务:
数字图书馆的网络服务模式可以分为被动服务和主动服务。
∙被动服务:
既然社会为建设数字图书馆投入了大量人力、物力和财力,那么不管是否情愿,数字图书馆就要提供服务,这就是非常被动的服务。
其特点是不考虑用户的个别要求,具体实现形式一般采用无交互Web网站模式。
∙主动服务:
主动服务是数字图书馆网络服务的高级方式,其特点是考虑用户的个别要求,具体实现形式一般是通过交互式Web网站形式。
a.双向交互式问答模式:
在这样的模式中,数字图书馆可以根据用户的请求组织资源,系统和用户处于同等地位,信息在系统和用户之间双向交流。
b.个性化信息推送模式:
在这样的模式中,用户可以根据自己的需求和爱好自行设计数字图书馆界面并定制数字图书馆资源,用户处于主动地位,数字图书馆系统屈于从属地位,数字图书馆只是在技术上按照用户的个性化需求定制并主动推动信息。
(3)支持技术:
包括通用信息技术和专用创新技术即特色技术。
∙通用信息技术:
建设数字图书馆所需的通用信息技术主要是计算机技术、网络技术和信息安全技术。
∙专用创新技术——特色技术:
数字信息处理与加工技术、海量信息存储与组织技术、多媒体信息标引与检索技术等对于数字图书馆都非常重要。
5.数字图书馆与图书馆自动化的关系:
图书馆自动化是数字图书馆的基础之一,数字图书馆中的数字化书目信息就来源于图书馆自动化系统,实现图书馆自动化是建设数字图书馆的必经阶段。
P11
6.数字图书馆的产生背景P13
(1)数字图书产生的内在因素:
一是印刷型文献的保存问题。
(变质、老化、自然灾害、人为损害)必须利用现代技术将图书馆保存的资料进行数字化。
二是文献信息的利用问题。
必须实现数字化才能使信息传递更快捷、方便,服务内容更具时效性和针对性。
(2)数字图书馆产生的外在因素:
a.文献信息资源的剧增;b.信息高速公路的建设和因特网的发展;c.数字化技术的发展。
(3)数字图书馆发展的社会背景:
a.数字图书馆是社会信息化发展的必然产物:
数字图书馆凭借高新技术可以快速地传播文化知识,从而提高全民族文化素质,促进社会进步。
b.数字图书馆是评价一个国家信息基础水平的重要标志。
c..数字图书馆是21世纪全球文化竞争的焦点之一:
在网络时代,谁先掌握了技术和资源库,谁就掌握了先机。
数字信息资源的网上交流具有先天的优势,这种竞争既是科学技术的竞争,也是文化和意识形态的竞争,更是知识经济时代的市场竞争。
因此,大力加强数字图书馆建设,其意义和影响将是深远的。
d.数字图书馆建设有利于带动相关行业的发展:
数字图书馆工程不仅是高科技项目,也是跨部门、跨行业的大文化工程。
数字图书馆工程的启动必将带动相关产业,特别是信息产业的发展。
7.数字图书馆的形成过程包括以下几方面:
第一,文献资源数字化。
第二,数字资源的集成。
第三,数字资源的共享。
P17
8.数字图书馆的发展大致经历了如下阶段:
a.早期的数字化技术和概念探索阶段:
1945年美国科学技术管理学家布什首次提出将传统的图书馆馆藏文献的储存、查找机制与计算机结合起来,构思了一个机械化的个人文档与图书馆,被公认为计算机辅助检索的先驱。
b.图书馆自动化管理系统的研究:
80年代末,美国一些大学和知名公司就开始研制开发大型的图书馆自动化管理系统。
c.数字图书馆研究计划的启动:
1994年,美国国家科学基金会联合其他单位正式实施“数字图书馆创始”计划。
d.数字图书馆的建设与利用:
20世纪以来,世界各国的数字图书馆建设有了较大的发展,许多已经投入实际应用。
P18
9.数字图书馆发展趋势:
P34*
(1)从基于数字化资源向基于集成服务和用户信息活动的范式发展,以用户信息活动为基础的第三代数字图书馆是今后的发展方向。
(2)数字信息存储的全息化:
全息数字存储由于同时具有巨大的存储容量、高速的数据传输率和短暂的访问响应时间等特点,全息数字化技术将称为21世纪数字图书馆的主流数字化技术。
(3)多种资源的高度集成,易用性更强:
多种资源的深度融合也是数字图书馆发展的一个基本特征,数字图书馆更具有人性化和更加易用。
(4)数字化技术进一步完善:
数字图书馆涉及计算机、网络通信等技术的综合集成,而计算机和网络通信技术发展十分快,新技术层出不穷。
目前数字化技术正在不断完善。
(5)标准化建设取得较大进展:
标准和规范化是实现数字图书馆资源共享的前提。
数字图书馆的信息和知识包括了所有学科,数量巨大,类型繁多,组织复杂。
各个单位所使用的软硬件规格不一。
如何将众多的力量协调组织起来,从技术管理的角度考虑,关键就在于标准化。
(6)社会化和国际化趋势:
数字图书馆将向社会化、国际化方向发展。
美国国家图书馆联盟就是一个组织全国15个大型图书馆及国家档案记录局的合作机构。
此外,有些联盟还有著名大公司加盟。
1995年法、日、英、德、意、美、加在法国成立了G7全球数字图书馆联盟,俄罗斯加入后又扩展为G8联盟,致力于数字图书馆的建设发展。
10.数字图书馆建设的方向P36
(1)加强数字图书馆建设的战略管理:
数字图书馆是跨部门、跨行业的大系统工程,所以应该由政府出面,统一规划、组织和协调。
为了正确把握数字图书馆的建设方向,提高项目建设的实际效益,避免决策失误,有必要从战略管理的高度处理好数字图书馆建设中的一些宏观关系问题,如数字图书馆与传统图书馆的关系、数字图书馆与国家信息基础设施建设、馆际协作与资源共享等,应该加强整体规划和可行性分析。
(2)加强特色化数字资源建设:
数字图书馆应该注意个性化服务和特色化资源的开发,提高生存发展的竞争力,走可持续发展之路。
(3)加强数字图书馆建设的合作与协调:
图书馆要主动与信息技术界、企业界等建立友好合作关系,广泛吸收资金、技术和人力,共同开展试验。
应加强数字图书馆的宏观管理,做好协调工作。
(4)加强数字图书馆的可用性评价:
可用性是评价数字图书馆的一项重要质量指标,关系到数字图书馆的性能是否满足用户的需要,流程是否符合用户的习惯,效果是否达到用户的期望。
可用性分为界面可用性和组织可用性两种。
评价数字图书馆可用性的原则可以概括为:
•易学•易记•必须是一个高效的系统,能有效地满足用户的信息需求。
•容错。
•愉悦。
•服务差异化。
(5)加强数字图书馆的知识管理:
数字图书馆的知识管理就是对图书馆所拥有的包括信息及知识各种要素再内的所有智力资本进行组织、开发和运营,实现知识创新、知识扩展和知识增值的过程。
其主要内容包括:
知识创新;知识组织;知识开发;知识扩散和应用;
(6)加强数字图书馆的标准化管理:
数字图书馆所管理的信息和知识包括了所有学科,数量巨大,类型繁多,组织复杂。
要将众多的力量协调组织起来,实现网络的互联互通,资源的共建共享,管理的有序化,关键在于标准化。
(7)加强数字图书馆用户的研究与关系管理:
用户是数字图书馆建设的出发点,也是数字图书馆赖以生存发展的基本条件之一,因此,必须重视数字图书馆的用户研究,以用户需求为导向来进行数字图书馆资源建设和管理。
其主要内容包括:
a.数字图书馆用户的需求分析;b.数字图书馆用户的数据管理和挖掘;c.数字图书馆用户的分类研究;d.数字图书馆用户的心理研究;e.数字图书馆的用户教育;f.数字图书馆用户的服务效果评价;g.数字图书馆服务方式的改进;h,数字图书馆用户的人文关怀。
10.网格技术的发展对数字图书馆的影响:
P40**
(1)网格技术的特点及其意义:
网格技术是因特网信息技术发展的新趋势。
目的是将计算能力和信息资源像电力网一样通过网格形式方便地传送给用户。
网格是高性能计算机、数据资料、因特网三种技术的有机组合,他把分布在各地的各种计算机连接起来,进行资源共享。
网格的根本特征是资源共享。
他吧整个网络整合成一台巨大的超级虚拟计算机,实现各种资源的全面共享。
网格可以实现因特网上所有资源全面连通,通过网格进行利用。
(2)网格技术在数字图书馆建设中的应用:
a.网格为数字图书馆构造统一的平台:
网格技术的优势是降低了建立网站和提供网络服务的成本。
网格的许多平台和资源都是共享的,它是一个将分布在各地的计算机、数据、信息、知识等组织成一个整体,在此基础上运行各自的应用网格,为数字图书馆提供各种一体化信息服务的信息基础设施。
b.网格有利于数字图书馆的信息集成:
网格将分布在不同地理位置的资源通过高速的因特网进行资源集成,从而提供一种高性能计算、管理及服务的资源能力。
c.网格有利于实现数字图书馆的资源共享:
网格把整个因特网整合为一个巨大的超级计算机,实现网上所有资源的全面连通,多种资源的全面共享。
d.网格有利于数字图书馆的海量数据处理:
网格能够很好地解决海量数据的计算处理和分析问题。
它能将分布在不同地方的计算机连接在一起,用户只需通过客户端发出指令,网格就把这些任务调配给各个计算机执行,然后将各个计算机计算出来的结果反馈给用户。
e.网格有利于数字图书馆进行知识管理:
网格的知识生产特性是网格与因特网的本质区别。
因特网本身不生产知识,而网格则能根据用户的要求自动的生产知识。
它把从数据源得到的各种原始数据,加工成信息和知识。
网格可以自动找到有关的数据源,进行综合分析和知识的发现,形成新认识。
可见,网格有利于数字图书馆进行知识管理。
(3)网格对数字图书馆的挑战:
很多现有的数字图书馆应用系如果被推向网格环境,将面临重新编写应用代码的问题,有许多技术问题需要解决。
面对网格技术的进一步发展,数字图书馆建设的指导思想应该具有前瞻性,要适应将来网格环境的发展需要。
二.了解
1.应当注意:
将传统的图书馆服务搬到网上去并不就是数字图书馆,而将馆藏资源数字化也不一定是数字图书馆。
数字图书馆就是要用特色技术将数字资源组织起来并提供服务,数字资源、网络服务和特色技术三大特征缺一不可。
在传统图书馆基础上可以发展出数字图书馆,数字图书馆往往拥有传统图书馆作为后盾,但数字图书馆并不是要取代传统图书馆。
2.数字图书馆的特点是:
收藏数字化、操作电脑化、传递网络化、资源共享化和结构连接化。
第二部分数字图书馆的体系结构
1.数字图书馆体系结构(K-W结构):
最早由罗伯特•卡恩提出的。
P42
数字对象:
元数据、数字资料、调度码
数字对象仓库
元对象
2.数字信息的特征:
P45
a.相关性b.数字格式不同c.数字对象是不断在变化的d.有权限与许可权的问题
3.数字图书馆的信息体系结构,其主要构件是数字对象、句柄(或调度码)和仓储,数字对象存储在仓储中,用句柄来标识,数字对象具有分布式的体系结构。
数字图书馆的信息体系结构具有开放性。
这种结构实现服务集的子系统有:
仓储服务系统、名录服务系统、索引服务系统和用户接口网关。
P47
4.数字图书馆技术体系结构:
P52
数字图书馆的网络基础设施
数字图书馆基础应用平台
数字资源采集加工系统
异构资源整合系统
数字资源的管理与存储系统
资源调度系统
资源分布和用户检索系统
联合编目和馆际互借系统
版权保护与安全认证系统
电子商务系统
5.数字图书馆的三角形体系结构:
P60
登记、提问图书馆客户返回结果
图书馆服务器转移提问对象服务器
6.中国试验型数字式图书馆体系结构:
P64
7.数字图书馆体系结构的评价标准:
P67
a.开放性b.互操作性c.扩展性d.可伸缩性
8.数字图书馆系统的结构模型:
P68*
用户界面
客户服务器调度系统
对象库
图书馆检索
服务器系统资源加工系统
这是一个面向对象的、分布式的网络结构模式,它适应多种不同的计算机系统,是由用户界面、调度系统、检索系统、图书馆服务器、对象库和资源加工系统组成的数字图书馆系统。
(1)用户界面:
(友好的)用户界面是用户与数字图书馆的接口,数字图书馆向用户提供的最终服务都是通过用户界面来实现的。
用户界面有两种类型:
供图书馆读者使用的和面向最终用户使用的。
(2)检索系统:
查询系统由查询协议、用户接口、检索引擎和索引组成,并与客户机、服务器、对象库相连。
(3)调度系统:
数字图书馆是通过调度码和调度系统对其进行管理和识别的。
(调度码:
是通用目的的标识符、也称句柄,用于确认因特网资源如数字对象,并管理存储在任何对象或数据库中的资料。
在数字图书馆系统中,用调度码识别数字对象和对象库。
调度系统:
是判断、识别和操控调度码的系统。
)
(4)图书馆服务器:
提供采访、编目、流通、连续出版物管理、参考咨询和书目检索等功能的服务。
(5)对象库:
对象库有不同的形式和种类,如现代对象库、法律数字库和Web服务器等,对象库是面向对象进行处理的。
(6)加工系统:
是数字图书馆的核心系统。
第三部分数字图书馆的常用技术
1.Web的基本概念:
P75**
(Web是一种特殊的结构框架,它的目的是为了访问遍布在Internet主机上的链接文件。
)Web是建立在客户机/服务器结构之上,以HTML语言HTTP协议为基础,能够提供面向各种Internet服务的、一致用户界面的信息系统。
2.Web服务的特点:
P76**
(1)Web是以超文本和多媒体形式存在的网络信息空间。
(2)Web与平台无关(无论系统的软硬件平台是什么,都可以通过Internet访问Web
(3)Web提供直观、易于使用的图形界面。
(4)Web是分布式的。
(超媒体文件可以存放在不同的Web站点上,通过超链接加以指引。
)
(5)Web是动态的、交互的。
3.Web的体系结构:
P76**
Web的本质是一个建立在Internet基础上的超文本信息传递系统。
Web服务器、Web浏览器、服务器与浏览器之间的通信协议HTTP、Web文档语言HTML以及用来标识Web资源的URL是构成Web体系结构的五大要素。
(1)客户机/服务器结构:
Web是基于客户机/服务器的一种体系结构。
客户机和服务器是相互通信的一对程序。
(2)统一资源定位器——URL:
(如何在浩如烟海的Web信息世界内定位一个信息资源呢?
URL是一种重要解决方案。
URL是Web的基本工具之一。
)
URL有三部分:
协议(http)、主机域名()、文件名组成。
(3)HTTP协议:
超文本传输协议(HTTP)是专门为Web设计的网络协议。
HTTP协议工作原理:
第一步:
浏览器与服务器建立连接。
第二步:
浏览器向服务器提出请求。
第三步:
如果请求被接纳,则服务器送回一个应答。
第四步:
断开连接。
(4)Web与数据库技术:
数据库技术在数字图书馆中的应用
a.存储与管理数据b.决策支持c.建立基于数据库的综合信息服务系统。
4.Web开发技术:
P81
客户端技术主要包括客户端脚本技术、多媒体技术、组建技术、DHTML和JavaApplet.
服务端技术包括公共网关系接口、服务器端脚本技术、Servlet技术等。
5.软件计算模式:
P87**
网络计算经历了a..大型机/小型机模式b.微机网络模式c.网络/文件服务器模式d.客户(浏览器)/服务模式。
B/S结构即浏览器/服务器结构,(随着因特网上的多媒体技术越来越成熟,浏览器的功能越来越强大,在许多场合,浏览器可以C/S结构中的客户端软件,于是C/S结构就演变成B/S结构。
)
6.B/S技术的优势在于:
P87
(1)基于开放的的非专用的标准。
(2)较低的应用开发及管理成本。
(3)对信息及应用系统的自由访问。
(4)主动服务的信息系统。
7.两层服务器模式:
P87**
网络应用可以分为表示层、业务逻辑层和数据层等。
早期的应用中,表示层和业务逻辑层不分开,都位于客户端,而数据层位于服务器端,逻辑上是两层,即所谓的两层客户/服务器结构。
8.两层客户/服务器结构计算模式的优势在于对数据集中处理,用户之间可以共享数据库资源。
缺点如下:
a.系统的可伸缩性差,安装维护困难。
b.开发人员提供给所有用户的程序都相同,而用户的实际需求是各不相同的。
c.系统安装复杂。
9.多层客户/服务器结构:
P88**
为了克服两层客户/服务器结构的缺陷,将业务逻辑层与表示层分离,在数据库服务器和客户端之间增加应用服务器,即中间层,构建三层客户/服务器结构。
将应用服务器作为中间层组件,我们称之为中间件。
10.三层客户/服务器结构的优点:
a.具有灵活的硬件系统。
b.提高了程序的可维护性。
c.严密的安全管理。
P88
11.中间件概念:
中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源。
中间件位于客户机服务器的操作系统之上,管理计算机资源和网络通信。
P89
12.中间件的分类及比较:
P89
(1)分类:
数据库中间件、远程过程调用中间件、面向消息的中间件、基于对象请求代理的中间件、事物处理中间件。
(2)比较:
相对而言,消息中间件、事物中间件、对象中间件和应用服务器(特殊的中间件)尤为重要,因为它们分布式应用的一些核心功能如事物处理、消息处理、安全管理都是由它们完成。
这些中间件有一些共同点,如跨平台、跨网络、能工作于多种异构环境下、支持多种语言和开发工具等。
13.应用服务器:
特殊的中间件P92
之所以说它是特殊的中间件,是因为应用服务器的作用除了管理客户端请求与数据库之间的通信外,同时具有跨系统平台(数据库、操作系统)的能力。
14.数据仓库的定义:
支持管理决策过程的、面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合。
P94
15.数据仓库特征:
P94
a.主题与面向主题b.数据的集成性c.数据是随时间不断变化的d.数据的相对稳定性。
16.数据仓库的关键技术可分为数据抽取、存储与管理以及数据表现等三个基本方面。
17.数据挖掘技术:
数据挖掘的基本思想是从数据中抽取有价值的信息,其目的是帮助决策者寻找数据间潜在的关联,发现被忽略的要素,而这些信息对预测趋势和决策行为是十分有用的。
P96
18.数据挖掘的模式:
a.分类模式b.回归模式c.时间序列模式d.聚类模式e.关联模式f.序列模式P97
19.数据仓库与数据挖掘技术的关系:
P98
a.数据仓库是数据挖掘的基础。
b.数据挖掘促进并指导数据仓库的建设。
20.数据仓库、数据挖掘技术与数字图书馆的关系:
P98**
数据仓库和数据挖掘技术为网络环境下的图书馆提供了强大的信息处理工具,这些工具对数字图书馆的支持概括为以下几方面:
数据搜集、存储和组织:
数据仓库将数据分主题、有组织、系统地进行存储,在较高层次上对分析对象进行了完整、统一的描述,保证了数据的完整性和一致性。
数据分析和知识挖掘:
数据挖掘技术是从数据中抽取有价值的信息,它可以帮助我们从数据集中识别出有效的、新颖的、潜在有用的以及最终可以理解的知识。
决策支持:
数据仓库和数据挖掘技术是科学决策的有效工具。
采用数据挖掘技术和数据仓库技术对馆藏数据库进行深加工。
馆藏数据中隐藏着许多重要信息,蕴涵着丰富的知识,把这些信息知识从数据库中抽取出来,进一步加工,为决策创造很多直接的、潜在的支持。
21.系统集成的定义:
P101
根据应用的需求,将硬件平台、网络设备、系统软件、工具软件及相应的应用软件等集成为具有优良性能价格比的计算机系统的全过程。
22.系统集成的特点:
a.接口是系统集成的技术关键。
b.系统协调与优化是系统集成的技术难关。
P101
23.数字图书馆系统集成的内容包括数据集成、业务过程集成、服务集成。
P101**
数据集成:
数据集成发生在应用领域内的数据库和数据源级别,通过从一个数据源将数据移植到另一个数据源来完成数据集成。
(数据集成采用的主要数据处理技术有数据复制、数据集合和接口集成。
)
业务过程集成:
业务过程集成包括业务管理、进程模拟以及综合任务、流程、组织和进出信息的工作流,还包括业务处理中每一步都需要的工具。
服务集成:
服务集成主要通过框架、事物、分布式对象以及其他机制,目前主要方向是通过“WebService”机制来提供内外应用集成业务。
24.数字图书馆应用集成的方式:
P102*
点对点集成、结构集成、流程集成、外部集成。
25.数字图书馆系统安全的概念:
P103
数字图书馆系统是一个计算机系统,其安全性是一个系统的概念,不仅与计算机系统结构有关,还与图书馆应用的环境、人员素质和社会因素有关。
为了理解各种安全性的含义,要了解以下术语:
密码安全:
由技术上提供的密码系统及其正确的应用来实现。
计算机安全:
限定计算机数据和程序不被非授权人员、计算机、非法程序访问、获取或修改。
网络安全:
包括所有保护网络的措施:
物理设施的保护、软件及职员的安全,以及防止非授权人员访问。
信息安全:
保护信息资源,使之免遭修改、破坏。
数字图书馆系统安全主要包括硬件安全、软件安全、运行安全、计算机系统安全立法等。
26.数字图书馆系统的安全需求:
P104*
(1)信息的保密性:
是指保护专用的和高度敏感的数据的机密。
(对信息进行加密)
(2)信息的完整性:
是指信息在传输、存储和管理过程中不能被篡改。
(3)信息的不可否认性:
防止通信时或双方交易时对已进行的业务给予否认,避免损害交易的某一方的利益。
(4)管理员和读者身份的认证性:
表示检查确认人员的合法资格。
(5)系统的可靠性:
表示防止计算机失效、程序错