计算机信息检索PPT推荐.ppt
《计算机信息检索PPT推荐.ppt》由会员分享,可在线阅读,更多相关《计算机信息检索PPT推荐.ppt(146页珍藏版)》请在冰豆网上搜索。
国际联机检索国际联机检索(1973-)(1973-)第四代计算机的出现,卫星通讯技术和光纤通讯技术第四代计算机的出现,卫星通讯技术和光纤通讯技术的实用化,使得计算机情报检索冲破时间和空间的限的实用化,使得计算机情报检索冲破时间和空间的限制,为快速全面地获取全球性科技情报资料和经济信制,为快速全面地获取全球性科技情报资料和经济信息提供了非常方便的条件,从而极大地提高了情报资息提供了非常方便的条件,从而极大地提高了情报资料的可获得性和利用价值,充分实现了人类情报料的可获得性和利用价值,充分实现了人类情报资源的资源的共享。
共享。
2.1光盘检索系统光盘检索系统(1985-)19851985年出现年出现CD-ROMCD-ROM数据库数据库.使用方便,使用方便,存贮量大,不受检索时间、通信费用、存贮量大,不受检索时间、通信费用、打印篇数的严格限制而深受读者欢迎。
打印篇数的严格限制而深受读者欢迎。
Internet检索检索(1985-)InternetInternet是世界上最大的互联网络;
是是世界上最大的互联网络;
是一个以一个以TCP/IPTCP/IP通讯协议连接各个国家、通讯协议连接各个国家、各个部门、各个机构计算机网络的数据各个部门、各个机构计算机网络的数据通信网;
是一个集合各个专业、各个领通信网;
是一个集合各个专业、各个领域、各种资源为一体的供网上用户共享域、各种资源为一体的供网上用户共享的信息资源网的信息资源网在在InternetInternet上的科技信息资源占全部信上的科技信息资源占全部信息资源的息资源的2020以上。
以上。
2.1.1脱机批处理检索据记载,最早的计算机信息检索系统雏形是美国海军兵器中心于1954年研制的。
随着具有批处理能力的第二代计算机问世,计算机信息检索进入了生产性开发和实际应用的年代。
批式检索是计算机信息检索的主要方式。
批式检索的优点:
比手工检索快捷、方便。
批式检索的缺点:
用户不能与系统进行实时对话,不能及时修正检索策赂,并且,检索结果不能立即得到,必须等待成批处理或定期检索处理。
2.1.2联机检索在60年代初人们就开始研制联机检索系统。
1965年,美国系统发展公司开始研制交互式的联机检索系统,这种系统能够使用户直接同所检索的数据库进行会话式交流。
1966年,洛克希德空间与导弹公司(后来的DIALOG情报服务公司)建立了DIALOG系统,并于1969年投人运行。
至70年代初,联机书目系统在美国和欧洲得到了广泛的利用。
这一时期还出现了其他一些联机检索系统,如IBM公司的“文献处理系统”(DPS,即STAIRS的身),欧洲空间组织的ESA-IRS系统等。
2.1.2联机检索联机检索是计算机系统与检索者之间通过检索语言和计算机命令进行的交互式检索,检索过程是人机对话式的,允许及时修改捡索策略;
可及时浏览,显示文献;
可根据用户不同需求,进行各种输出,及时取得检索结果。
联机检索网络的组成:
由联机检索中心、通讯网、检索终端等三部分组成。
著名的国际联机检索系统。
目前世界上比较著名的联机检索系统有:
美国的DIALOG系统、0RBIT系统、BRS系统、MEDLINE系统、欧洲的ESA-IRS系统、日本的JOCST系统、德美日联合开发的STN系统等。
1)DIALOG系统美国Dialog系统是目前世界上规模最大、影响最广泛的综合性商业联机检索系统,也是我国科技界广泛使用的系统。
Dialog联机检索用户遍布世界100多个国家。
D1ALOG现有全文、题录、事实及数据型数据库数百个,都是质量很高、很权威的核心数据库,其中包括著名的工程索引(Ei)、科学引文索引(SCI)、英国科学文摘(1NSPEC)、世界专利索引(WPI)等,其数量平均每年约增长20一28。
文献量已近数亿篇,内容涉及自然科学、社会科学、工程技术、人文科学、时事报道及商业经济等各个领域。
1)DIALOG系统利用DIALOG数据,可查找各个学科各种类型的文献信息,以及查找公司,专利、标准、科技报告、产品,市场等商业信息;
查找结构,人物,书刊出版等参考信息,还可以阅览美国各地及世界各国的报纸新闻。
DIALOG数据库信息量大,检索方式灵活,适用于做比较全面的文献调研检索。
如:
科研课题开题立项时进行文献回溯检索,课题中期跟踪检索和课题结题时的查新检索。
DIALOG提供的专业信息范围q科学技术科学技术化学工程、机械与民用工程、航空技术、计化学工程、机械与民用工程、航空技术、计算机科学和软件学等应用科学领域;
算机科学和软件学等应用科学领域;
q知识产权知识产权专利、商标和版权信息;
专利、商标和版权信息;
q能源与环境能源与环境石油、天然气、电能、原子能,环境污染石油、天然气、电能、原子能,环境污染与保护等;
与保护等;
q医学医学生物医学研究、医学实践、医疗仪器、药物相互生物医学研究、医学实践、医疗仪器、药物相互影响和治疗方法等;
影响和治疗方法等;
q制药制药追踪药物的发展,包括正在开发中的药物和新药;
追踪药物的发展,包括正在开发中的药物和新药;
药物登记、许可证、临床试验等。
q化学化学化学物质的合成、最新发现以及商业开发;
化学物质的合成、最新发现以及商业开发;
DIALOG提供的专业信息范围q食品与农业食品与农业农业、营养学、食品科学、包装技农业、营养学、食品科学、包装技术、食品立法和食品与饮料市场等信息;
术、食品立法和食品与饮料市场等信息;
q社会科学社会科学教育、信息科学、心理学、社会学、教育、信息科学、心理学、社会学、政治等;
政治等;
q政府和法规政府和法规立法和法规信息;
立法和法规信息;
q商业与金融商业与金融市场份额、销售指标、竞争情报、市场份额、销售指标、竞争情报、公司财务、商业目录等;
公司财务、商业目录等;
q新闻新闻报纸、专业时事通讯、商业杂志等;
报纸、专业时事通讯、商业杂志等;
q参考信息参考信息在印书籍、书评报道、名人录;
基金、在印书籍、书评报道、名人录;
基金、助学金;
标准、规范等信息。
助学金;
DIALOG提供的检索方式DIALOG根据不同用户的需求,提供了多种根据不同用户的需求,提供了多种检索界面和联机方式,并制定了相应的收费检索界面和联机方式,并制定了相应的收费办法:
办法:
专业检索人员使用的检索方式专业检索人员使用的检索方式非专业检索人员使用的检索方式非专业检索人员使用的检索方式1.通过CHINAPAC(专线)与DIALOG联机2.通过CHINANET或Internet与DIALOG联机,利用web直接上网检索。
DIALOGWeb(http:
/计算机技术与信息检索技术的结合,使信息检索向网络化、计算机技术与信息检索技术的结合,使信息检索向网络化、智能化方向发展。
智能化方向发展。
计算机信息检索,就是在人机共同作用下完成信息存取操计算机信息检索,就是在人机共同作用下完成信息存取操作。
在手工检索、机械检索和光电检索的基础上演变而来。
作。
各类数据库,如书目、事实和数字型数据库、全文数据库都是各类数据库,如书目、事实和数字型数据库、全文数据库都是计算机检索的信息源。
计算机检索的信息源。
其原理为其原理为:
将检索提问标识与系统中的存储文献的特征将检索提问标识与系统中的存储文献的特征标识进行比较,并输出命中文献。
标识进行比较,并输出命中文献。
用户提问用户提问匹配运算匹配运算数据库数据库命中情报命中情报2.2.2计算机检索系统的构成1)硬件部分2)软件部分3)数据库1)硬件计算机的硬件主要包括具有一定性能的主机、外部设备,以及与数据处理或数据传送有关的具他设备,外部设备包括:
外部存储器、输人输出设备等。
2)软件计算机软件分为系统软件和应用软件。
系统软件包括:
操作系统、编译程序与汇编程序、诊断程序等。
应用软件包括:
数据库管理系统、建库程序、数据输入输出程序、自动标引程序、文件管理程序等。
3)数据库数据库的定义为:
“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。
”数据库是计算机阅读的信息集合。
数据库:
海量数据的集合.数据库主要类型如下:
文献型数据库、非文献型数据库和多媒体数据库3)数据库的类型
(1)参考数据库(ReferenceDatabase)这是指用户从中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库。
它包括书目数据库和指南数据库。
书目数据库(BibliographicDatabase):
包括文摘、索引数据库为二次文献数据库。
提供存储和检索书目信息的文献数据库,通常是图书目录的计算机化的产物,又称机读目录,主要报道馆藏各种文献的书目信息和存贮地址。
注:
几乎所有图书馆的OPAC都是免费开放的,只要能够上互联网,就可以在线查询全世界图书馆的馆藏目录.指南型数据库(DirectoryDatabase)提供用户参考,给予用户指南的各类信息,商业、企业、人物等简要描述性信息的一类数据库。
例如,公司名录数据库、人物传记数据库、产品数据等。
例如公司名录数据库
(2)源数据库(SourceDatabase):
为用户提供原始资料或具体数据的一类数据库。
具体分为以下类型:
数值数据库(Numericdatabase)文本-数值数据库(TextualNumericdatabase)术语数据库(Termdatabase)全文数据库(Full-textdatabase)图像数据库(Graphicsdatabase)数值数据库(Numericdatabase)中国统计数据应用支持系统术语型数据库专门存储揭示各类名词、术语、词语的形、音、义与使用方法以及词义演变、发展等信息的检索工具,大多是辞书、词典、百科全书等的数字化版本.(见第三章)全文型数据库主要指各种图书、期刊、法律条文及案例、新闻报道以及百科全书、手册、年鉴等全部文字或原著的内容,被转换成计算机可读的形式.它将二次文献的检索同原文献的获取融为一体,用户可以从中直接查到所需文献全文及字、句、段、节、章及相关信息,不需再去查阅原文.具有更为直接、迅速、详尽而可靠的特点。
数字图书全文库(例如超星数