0905《计算机信息检索》期末考试指导课件Word文件下载.docx
《0905《计算机信息检索》期末考试指导课件Word文件下载.docx》由会员分享,可在线阅读,更多相关《0905《计算机信息检索》期末考试指导课件Word文件下载.docx(14页珍藏版)》请在冰豆网上搜索。
知识:
是指人类对客观事物规律性的认识,是人的大脑通过思维重新组合的系统化的信息集合。
文献:
是指记录知识的一切载体。
情报:
是指为一定目的而搜集和传递的有特定效用的知识。
2.信息资源的基本特征
信息资源的普遍性
信息资源的传递性
信息资源的时效性
信息资源的价值性
信息资源的可转换性
信息资源的可利用性
信息的共享性
3.电子信息资源的特征
电子信息资源是以数字化形式(即二进制代码0、1),把文字、图像、声音、动画等多种形式的信息存储在非印刷型介质上,以光信号、电信号的形式传输,并通过相应的计算机和其他外部设备再现出来的信息资源。
电子信息资源具有如下的特点:
存储形式多样化
资源数字化
交流程度高
提高了利用效率
内容丰富
载体容量大
4.电子信息资源的类型
(1)按照网络传输协议不同,可将电子信息资源分为:
Web信息资源
Telnet信息资源
FTP信息资源
用户服务组信息资源
Gopher信息资源
(2)按照存取方式的不同,可以将电子信息资源分为:
邮件型信息资源
电话型信息资源
揭示板型信息资源
广播型信息资源
图书馆型信息资源
书目型信息资源
交互型信息资源
(3)按照信息传播与交流过程,可将电子信息资源分为:
稳定的电子信息资源
不稳定的电子信息资源
(4)按照正式出版物类型的不同,可将电子信息资源分为:
电子图书(E-book,Electronicbook)
电子期刊(ElectronicJournal)
电子报纸(ElectronicNewspaper)
中国博客网电子期刊
北京青年报的电子报纸
第2章信息检索的基本原理
1.信息检索的基本原理
信息检索就是把检索提问与存储在检索工具中的标引、标识进行比较,两者一致或信息标引的标识包含着检索提问的标识。
则具有该标识的信息就从检索工具输出,输出的信息就是检索命中的信息。
实际上,信息检索的过程涉及信息的存储和检索两个过程。
信息检索可以按照广义和狭义的信息检索来进行定义:
广义的信息检索包括信息存储与查询两个部分:
信息的存储即对信息的本质特征与形式特征进行记录和描述的过程。
信息的查询则首先要将信息提问转换成信息系统可以接受的检索式,然后将检索提问与系统标识进行比较与匹配。
狭义的信息检索是以信息系统为基础的单纯的检索过程。
狭义的信息检索有许多类型
(1)按检索活动的执行主体可划分为手工检索和计算机检索
(2)按查询信息的特征可划分为全文检索、多媒体信息检索、事实检索、书目检索、图像检索、数据检索等。
2.信息检索语言的概念
信息检索语言是一种专门的人工书面语言,它是信息检索系统存储和检索所使用的共同语言。
3.信息检索语言的类型
检索语言是用于文献信息的存储和检索的。
对于非文献信息,若运用检索语言,就要把非文献信息转换为文献信息后再使用。
文献检索语言主要反映的是文献信息的内容特征和表象特征。
按检索语言的结构原理可以划分为分类语言、主题语言、代码语言。
分类语言,如中图分类法中,以大写字母表示一级类目,以数字表示二级和二级以下的类目。
二级类目,如工业技术(T)类下进行的细分,双字母。
分类语言还包括:
体系分类语言,组面分类语言,混合分类语言等。
主题语言:
一种规范化的自然语言,揭示文献信息的主题特征,用主题词汇表达各种概念, 并按字顺排列。
包括标题词语言,单元词语言,序词语言以及关键词语言等。
代码语言:
针对事物的某种特征,用代码加以标引和排列,如学科代码等。
按组配方式可划分为先组式检索语言和后组式检索语言。
4.信息检索的过程
(一)分析研究课题,明确查找要求。
(二)选择检索工具
(三)确定检索途径及检索方法
(四)查阅原始文献
信息检索的基本方法
(1)追溯法。
是利用文献末尾所附的参考文献进行追溯查找的方法。
(2)常用法。
是利用各种检索工具进行查找文献资源的方法。
(3)循环法。
是常用法和追溯法的结合,先利用检索工具查找出一批有用的文献,然后利用这些文献所附的参考文献进行追溯查找。
第3章计算机信息检索系统
1.计算机检索系统的组成
(一)计算机检索系统由以下几部分组成:
1)信息源
信息源是计算机检索系统信息或数据的来源。
信息检索系统中的数据主要来自各种公开文献。
2)信息组织管理
信息组织管理关键要注意信息标引的方法、组织方式、更新周期这几方面。
3)系统功能
信息检索系统的功能取决于系统所能提供的检索途径、检索方式和检索方法。
4)用户接口
用户结构主要研究用户模型、信息显示、命令语言、反馈机制这几点
5)系统支持技术
信息技术支持关系系统及其软、硬件平台的通用性、兼容性、可靠性和稳定性。
(二)计算机信息检索系统的基本结构
1)硬件部分:
以计算机主机为中心的一系列机器设备
2)软件部分:
信息检索系统中的有关程序和各种文件资料的总称。
3)数据库:
将数据按一定格式存储在计算机内的数据的仓库,即存储在计算机内的相关数据的集合。
2.计算机信息检索系统的工作流程与功能
(1)输入环节
针对系统建设的目标,搜集和选择特定范围内的信息资源;
把收集的信息资源按照所规定的格式进行登载与记录。
(2)处理环节
处理经过选择的数据和信息。
(3)存储环节
存储子系统的功能是将加工处理后的信息,按照某种规则和程序聚积在存储载体上,构成可检索的文档。
存储的对象由三个方面的内容构成:
计算机需要执行的各种程序、数据和文档。
(4)传输环节
传输子系统的功能主要是通过计算机与通信线路的连接,完成信息编码的传递、转接、接收与处理等工作。
(5)输出环节
根据用户需求,输出各类有关信息。
(6)控制环节
控制子系统的功能是根据存取系统内部状态和外部环境的变化,进行管理与调节,来保证系统的有效输入、有效存储、有效输出等环节的协调运行。
对信息系统进行控制的方式主要有三种,即:
集中控制、分散控制和多层控制。
3.五种联机检索的检索策略
(1)最专指面优先(mostspecificfacetfirst)
(2)最低登录量的面优先(lowestpostingfacetfirst),其中登录量是指索引词在标引中的使用次数。
(3)积木型(build-block),形成若干个概念面,分别进行检索。
(4)引文珠形增长(citationpearl-growing)指的是依据一两篇最专指面文献逐步扩展,越找越多。
(5)逐次分馏(successivefractions),指的是确定一个较大的初始信息集合,再慢慢提高检索的专指度。
第4章联机检索系统
1.联机检索系统的基本结构
联机存取系统由用户检索终端、通信网络、联机存取中心等三个部分组成。
1)联机存取中心包括中央计算机(服务器)及其外部设备、数据库检索与管理软件、联机数据库;
2)通信网络,联机存取系统的通信网络是指通信子网通过分组交换技术,来完成用户联机检索终端和联机存取中心之间的数据传输。
3)用户检索终端及用户接口软件
用户检索终端是每个联机信息检索用户必需的设备,用户通过接口软件发送请求和接受结果。
2.国外主要联机检索系统
(1)DIALOG系统数据库
DIALOG系统数据库是目前世界上规模最大的、检索功能最完善、用户总数最多的联机存取系统。
它拥有各种数据库600多个,记录量超过3亿条,为全球100多个国家和地区的15万用户提供各种类型的联机存取服务。
DIALOG拥有大量的检索符号和完备的索引系统,能够进行广度和深度检索。
(2)OCLC系统数据库
OCLC(OnlineComputerLibraryCenter),即联机计算机图书中心,OCLC创建于1967年,是世界上最大的文献信息服务机构之一。
使用OCLC产品和服务的用户已有70多个国家和地区的38000多个图书馆和教育科研机构。
3.光盘检索的原理和特点
光盘的工作原理:
用激光读写信息
光盘检索具有以下特点:
检索速度快、检索效果好、检索成本低、安全性能高。
4.国内主要光盘数据库检索系统
(1)《中国学术期刊(光盘版)》的全文检索管理系统(简称CAJ)有检索网站版、专业版、普通版三种类型。
其基本检索功能包括:
全文检索,篇名检索,作者检索,机构检索,关键词检索,摘要检索,引文检索,基金检索,分类检索,二次检索和位置检索。
高级检索功能包括:
组合检索,检索表达式检索,词频检索。
输出功能:
提供中文、英文、中英文对照3种显示方式,其输出方式如下:
输出题录,输出题录摘要,网上浏览全文,下载全文,打印全文,摘录功能。
辅助功能:
检索词索引,保存检索结果,保存检索表达式,取出检索表达式,设定检索结果顺序。
(2)《中文科技期刊》光盘数据库
收录了国内出版的中文科技期刊6000多种(包括部分港台期刊),数据每半年更新一次,内容涉及16个专业大类。
(3)《中国人民大学报刊复印资料索引》光盘数据库
由中国人民大学书报资料中心编选的,因其覆盖面广,信息量大,分类科学,筛选严谨,结构合理完备,成为国内最有权威的具有大型、集中、系统、连续和灵活五大特点的社会科学、人文科学专题文献资料库。
1995年开始发行光盘版。
5.国外著名光盘数据库系统
(1)SPIRS检索系统与GREADLINE数据库
1984年美国银盘公司开发了SilverPlatterInformationRetrievalSystem(SPIRS)光盘存取系统。
银盘公司出版的光盘数据库范围涉及社会科学、人文科学、医学与生命科学、科学技术、综合参考、商业、健康与卫生、产品与服务指南等领域。
(2)ProQuest检索系统与INSPEC光盘数