ImageVerifierCode 换一换
格式:DOCX , 页数:8 ,大小:283.04KB ,
资源ID:10386502      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/10386502.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(信息检索考试重点.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

信息检索考试重点.docx

1、信息检索考试重点信息检索考试重点信息检索考试类型:闭卷 考试题型:单选、判断、名词解释、应用(信息检索过程)考试重点:1、文献:文献是记录知识的一切载体。凡是用文字、图形、符号、声频、视频记录下来,具有存贮和传递知识功能的一切载体都称为文献。2、文献类型:印刷型 缩微型 视听型 机读型 3、知识:是在人们对信息进行分析的基础上提供的解决方案。知识管理的主要目的是使信息能够服务于人们的行动和决策。4、信息:是凭借人的认知能力和经验对数据进行选择、评价、组织和分析的结果。信息管理主要是解决数据的相关性、系统化和规范化的问题。5、数据:指离散孤立的互不关联的事实、文字、数据和符号,这些资料之间缺乏相

2、关性。6、文献级次:零次文献(灰色文献):指非正式出版物或非正式渠道交流的文献。一次文献(原始文献):凡是著者在科学研究,生产实践中根据科研成果,发明创造撰写的文献,称为一次文献。一次文献是文献的主体,是最基本的情报源,是文献检索的对象。二次文献:它是将分散、无序的一次文献,按照一定的原则进行加工,整理、提炼、组织,使之成为便于存贮、检索的系统。如目录等检索工具。 三次文献:它是在利用二次文献的基础上,选用一次文献的内容,进行分析、概括、综合研究和评价而编写出来的文献。它又可分为综述研究类和参考工具类两种类型。前者如动态综述、学科总结、专题述评、进展报告等;后者如年鉴、手册、大全等。三次文献源

3、于一次文献,又高于一次文献,属于一种再创性文献。三次文献一般来说系统性好,综合性强,内容比较成熟,常常附有大量的参考文献,有时可作为查阅文献的起点。 高级文献:计算机型文献,如:PTF、HTM等。7、十大文献源1图书(Books) 2期刊(Periodicals)或(Journal,Magazine) 3科技报告(Technical reports) 4政府出版物 5会议文献(Conference papers) 6专利文献:(patents) 7学位论文(Thesis,Dissertation) 8技术标准(Technical standards) 9科技档案 (document) 10产品

4、样本 8、文献检索:从大量的文献中查找与特定课题有关的文献的过程。9、检索语言是根据信息检索的需要,专门用于各种手工和计算机化的文献信息检索与存贮系统描述文献主题概念和研究课题主题概念的表达检索提问的人工语言。检索语言又称为索引语言、存贮与检索语言、文献语言、文献工作语言、标引语言、标引符号、标识系统等等。9、检索方法:常用法:顺查法、倒查法、抽查法。追溯法:最新引文法。循环法(分段法):常用法+追溯法10、检索步骤 :分析课题-选择检索系统-检索途径-检索标识-检索方法-查找文献线索-获取原文11.信息检索的涵义:从广义上讲,信息检索包括两个过程,一是信息存储(information sto

5、rage),即信息的标引、加工和存储过程:二是信息检索(information retrieval),即信息用户的查找过程。从狭义上讲,信息检索仅指后一部分。信息检索的本质是一个匹配的过程,即用户的信息需求和信息存储的信息集合进行比较和选择的过程12、信息存储和检索过程的基本原理 13、信息检索的类型:按信息检索的内容划分:文献检索 数据检索事实检索概念检索按信息检索的组织方式划分:全文本检索 多媒体检索 超文本检索14、检索语言(retrieval language)是文献信息标引和检索提问而约定的人工语言。15、检索语言的种类 16、检索方法:查找(Searching)就是实施检索策略、搜

6、寻所得文献信息的过程。17、拉网法:在不了解查询某一专题信息的URL地址时,可从提供信息总目的Web 页面开始浏览,沿着专题链接层层查找,直至找到有关的内容为止。然后用“书签”保存这个页面的URL,转向另一个分支。这种方法可以迅速获得较多的相关地址,然后进行筛选。就使用引擎而言,国外专家也建议先用链接页面多、响应时间快的引擎。18、引文法(跟踪法):文献之间的引证和被引证关系揭示了文献之间存在的某种内在联系,引文法(也有称为跟踪法)就是利用文献后所附的参考文献、相关书目、推荐文章和引文注释查找相关文献的方法。引文法又可分为两种,一种是由远及近地搜寻,即找到一篇有价值的论文后进一步查找该论文被哪

7、些其它文献引用过,以便了解后人对该论文的评论、是否有人对此作过进一步研究、实践结果如何、最新的进展怎样等等。由远及近地追寻,越查资料越新,研究也就越深入,但这种查法主要依靠专门的引文索引。另一种较为普遍的查法是由近及远地追溯,这样由一变十,由十变百地获取更多相关文献,直到满足要求为止。这种方法适合于历史研究或对背景资料的查询, 其缺点是越查材料越旧,追溯得到的文献与现在的研究专题越来越疏远。因此,最好是选择综述、评论和质量较高的专著作为起点,它们所附的参考文献筛选严格,有时还附有评论。19、常规法:所谓常规法就是利用常规检索工具查找有关文献的方法,是信息时代应掌握的最基本的信息查找方法。常规法

8、可分为顺查法、逆查法和抽查法。20、排除、限定和合取法 这实际上是将信息加工的方法融入检索中去。思维中使用排除这一概念,是指对查找对象的产生和存在的状态在时间和空间上加以外在否定。把这一方法移植到检索中,就是在时间或空间上极大地收缩检索范围。限定法是相对于排除法而言的,指对查找对象在时间和空间上加以内在的肯定。排除的结果必然是限定,反之亦然。21、分类检索的步骤(1)分析待检课题,确定其学科,并弄清学科间的各种关系。(2)查出待检课题的分类号(工具简单时可以省略)(3)选择适当的检索工具 (4)进入检索系统后选择分类号途径,并在对话框内输入分类号,开始检索。(5)对比题目,阅览相关信息,选出所

9、需信息,并下载相关信息。(6)原文的索取22、检索技术(1)布尔检索(boolean retrieval)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配的一种技术,也是目前最常用的一种检索技术。 (2)截词检索(truncation retrieval)是指在检索词的适当位置截断,用截断的词的一个局部进行的检索。由于检索词与数据库所存储信息字符是部分一致性匹配,所以又称部分一致检索。截词符多采用通配符“?”、“$”、“*”(3)邻近检索(proximity retrieval),又称为“位置检索”、“词位检索”、“全文检索”是一种可以不依赖叙词表而直接使用自由词进行检索的一种技术,它以数据库

10、原始记录中词语的相对次序或者位置关系为对象进行组配运算。 (4)字段限定检索:是用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,是提高检索效果的一种有效检索方法。例子:(minicomputer/DE, TI OR personal computer/ID, TI)AND PY=2008 AND LA=English这个检索式所表达的检索要求是:查找2008年出版的关于微电脑或者个人电脑的英文文献,并要求“微电脑”一词在命中文献的叙词字段、标题字段出现,“个人电脑”一词在命中文献的自由词字段出现。23、信息检索的基本步骤24、确定检索词 1切分:是对课题的语句以自由词为单位进

11、行拆分,转换为检索的最小单元。自由词切分仅适用于自然语言检索。2删除:是对自然语言中不具有实质性检索意义的虚词(如介词、连词、副词等),或者使用频率较低的词,或者专指性太高、过分宽泛的词,或者过分具体的限定词、禁用词,或者不能表达课题实质的高频词,或者存在蕴含关系可以合并的词,一律予以删除,使自然语言转换成为关键词和主题词的集合。3替补:在进行切分、删除后,对检索词进行替换和补充。4组合 概念相交组合。这个新概念是原来用以组合的两个概念的下位概念,如曲柄连杆机构*发动机=汽车发动机。 概念限定组合。这个新概念可用来表示这一事物的某一属性或某一个方面。如电视机*数字化=数字电视机。概念并列组合。

12、具有概念并列关系的自由词间的组配,其结果使概念检索的范围扩大,如环境污染+环境保护=环境污染和环境保护。概念删除组合。是指两个具有上下位关系的自由词间的组合,其结果使概念检索的范围缩小,如信息处理-模拟信息处理=数字信息处理。增加(1)增加“限义词”。有两种方法:直接增加限义词、挖掘隐含词、提取潜在的检索词;把限义词以逻辑的方式加入,可采用逻辑“与”或逻辑“非”的方法增加限义词。(2)分析隐含概念。挖掘潜在的主题词还可以通过对上位词、下位词、同类词关系的分析得到其它相关主题词。如例1:“妇女吸烟与肺癌的关系研究”,切分、删除后得:吸烟、肺癌两个检索词,分析、补充上位词可增加检索词:烟、癌症、恶

13、性肿瘤。提取检索词首先是切分、删除,其次是进行替补、组合和增加。当检索结果信息量过多时原因:选用了多义性的检索词 截词截的过短,输入检索词太少 应该使用“与(AND)”的使用了“或(OR)”;优先运算符()使用错误。考虑缩小检索范围。方法如下:(1)采用专指性强的主题词,减少同义词 同族相关词等相关性不强的检索词。(2)增加限制概念,采用AND算符连接检索词或进行二次检索。(3)使用字段限定,把检索词限定在题目主题词等主要字段。(4)缩短检索年限,限制检索结果的文献类型 语种及出版国。(5)使用NOT算符,排除无关概念。(6)调整位置算符,由松变严。(7)改模糊检索为精确检索。 当检索结果信息

14、量太少时原因:检索词拼写错误;遗漏重要的同义词或隐含概念;检索词过于生僻具体;没有使用截词算符;位置算符和字段算符使用的过多 使用过多的AND考虑扩大检索范围方法如下:根据词表的分类结构体系口占关键的检索词,用扩展按钮增加同义词和相关词并用or算符连接这些词(2)降低检索词的专指度,可从词表或检出文献中选择上位词或泛指词补充道检索式中(3)减少检索年限 文献类型 语种以及出版国的限制(4)取消某些限制过严的字段限制 位置算符限制(5)在词干相同的单词后使用截词符(6)改精确检索为模糊检索(7)同时使用拼写正确的词 以及拼写错误的词或存在多种普遍错别字的词作为检索。 计算机信息检索的本质是信息用户的提问标识和信息集合数据库特征标识的匹配过程。计算机信息检索的系统构成 : 服务器 通信网络 检索终端 数据库文献检索过程:制定检索策略选择检索路径使用检索方法熟悉检索步骤(分析课题选择检索系统检索途径检索标识检索方法查找文献线索获取原文)。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1