《信息检索教案》ppt课件.pptx

上传人:zf 文档编号:10844396 上传时间:2023-02-23 格式:PPTX 页数:91 大小:6.05MB
下载 相关 举报
《信息检索教案》ppt课件.pptx_第1页
第1页 / 共91页
《信息检索教案》ppt课件.pptx_第2页
第2页 / 共91页
《信息检索教案》ppt课件.pptx_第3页
第3页 / 共91页
《信息检索教案》ppt课件.pptx_第4页
第4页 / 共91页
《信息检索教案》ppt课件.pptx_第5页
第5页 / 共91页
点击查看更多>>
下载资源
资源描述

《信息检索教案》ppt课件.pptx

《《信息检索教案》ppt课件.pptx》由会员分享,可在线阅读,更多相关《《信息检索教案》ppt课件.pptx(91页珍藏版)》请在冰豆网上搜索。

《信息检索教案》ppt课件.pptx

信息信息检检索索教学目的一、培养信息素养二、增强主动获取信息的意识三、提高信息收集和利用的能力四、掌握计算机信息检索的基本技能课程重要性一、促进智力资源开发二、协助管理者作出正确的决策三、帮助研究人员继承和借鉴前人的成果,避免重复劳动,少走弯路四、节省研究人员查找信息的时间,提高科研效率教学内容一、计算机信息检索基本知识二、数据库信息检索技术三、网络信息检索技术第一章计算机信息检索基本知识1信息检索(InformationRetrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索(InformationStorageandRetrieval),这是广义的信息检索。

狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(InformationSearch)。

2计算机检索原理用户在计算机检索系统终端上,输入特定的检索指令(检索词或检索提问),计算机检索系统则根据指令要求从数据库中检索出用户所需要的信息,然后再由终端设备显示、下载或打印。

注意:

计算机检索的实质是类比、匹配,即从字面上进行对比,因而容易产生误检,这一点和手工检索不同。

信息需求(检索要求)必须用检索提问式的形式表达3检索提问式亦称“检索表达式”,或“布尔逻辑表达式”,检索系统可执行的语句由若干检索词按布尔逻辑组配关系构成检索词能够表达信息需求主要概念的词语,如:

论文的关键词、作者姓名、作者单位、分类号等布尔逻辑算符包括逻辑“与(and)”、逻辑“或(or)”和逻辑“非(not)”检索式举例:

1、关键词=(通信and卫星)检索字段运算符检索词2、作者=李鹏飞and作者单位=(西安工程大学or西安工程科技学院or西北纺织工学院)4布尔逻辑“与”算符表示方式有:

“and”、“*”、“并且”等含义是:

检出的每一条记录中必须同时含有进行“与”运算所有检索词基本作用是:

对检索词表达的概念加以限定,缩小检索范围,提高检索结果的查准率。

比较:

“通信”和“通信and卫星”查准率=检出有关信息量/检出信息总量逻辑“与”文氏图通信卫星通信and卫星5布尔逻辑“或”算符表示方式有:

“or”、“+”、“或者”(一般用于同义词、近义词之间)含义是:

检出的每一条记录中至少含有一个进行“或”运算的检索词基本作用是:

对检索词表达的概念加以扩充,扩大检索范围,防止漏检,提高检索结果的查全率。

比较:

“西安工程大学”和“西安工程大学or西安工程科技学院”查全率=检出的有关信息量/系统有关信息总量逻辑“或”文氏图卫星通信通信or卫星6布尔逻辑“非”算符表示方式有:

“not”、“-”、“不包含”含义:

从含有某个检索词的信息集合中排除含有另一个检索词的信息集合之后所剩余的部分,即检出的记录中只含有“not”算符前的检索词,而不含其后的检索词基本作用:

缩小检索范围,减少信息输出量,但有排除掉相关信息的可能,慎重使用。

比较“通信”和“通信not卫星”逻辑“非”文氏图通信卫星通信not卫星7优先运算符“()”逻辑算符的优先执行顺序一般为NOT-AND-OR优先运算符可改变上述逻辑算符的执行顺序检索系统只认“()”,不允许使用“”和“”比较检索表达式Aand(BorC)和AandBorC运算顺序改变,则结果不同BCABCAand(BorC)AandBorCA8查准率与查全率的关系查准率与查全率彼此有反比关系,查准率提高,查全率相应就会降低;反之亦然影响查准率的因素是误检,影响查全率的因素是漏检误检检出有关信息的同时带出了不相关的信息漏检系统中存储的有关某一方面的信息没有被完全检出误检会降低检索的效率,但不是影响检索质量的最主要因素,而漏检才是影响检索质量的最主要因素,因此必须把它减少到最底限度实际检索时要尽可能克服漏检,同时最好能避免误检,要适当选择出查准率和查全率之间的最优关系查准率与查全率的反比关系100755025255075100查全率查准率9模糊检索“模糊检索”与“精准搜索”是两个相对应的概念,模糊检索,亦称包含检索,即在返回的检索结果中您会发现:

您输入的检索词包含在命中文献的检索字符串中。

例:

输入作者姓名“张明”,在选择了“模糊检索”的情况下可检出作者为“张明”、“刘张明”、“张明丽”等人的文献。

输入题名为“计算机应用”,选择“模糊检索”后可检索出水泥厂的计算机应用技术、计算机应用中的几个问题、微型计算机应用于测量等文章与精确检索(检索词与命中检索字符串完全等同)相比,模糊检索能够扩大您的检索范围,提高查全率。

10计算机检索步骤

(1)分析信息需求,确定检索词例一:

查找“电动汽车蓄电池”的有关信息该题目包含主要检索词有:

“电动汽车”、“蓄电池”、“电池”、“电瓶”例二:

查找“我院姚穆院士撰写的有关纺织品热湿舒适性”的论文该题目包含的主要检索词有:

“纺织品”、“织物”(纺织品的下位概念)、“热湿舒适性”、“姚穆”、“西安工程大学”、“西安工程科技学院”、“西北纺织工学院”确定检索词注意:

从信息主题内容检索时,应该根据信息内容涉及的主要概念确定关键词,同时考虑有无同义词和近义词,如有则一并选出隐含概念需要从信息内容所属的专业角度作深入分析,才可提炼出能全面、确切反映信息主要内容的检索概念。

如:

“工业废水处理”,其中“处理”一词隐含了“回收”、“再生”等概念。

一些泛指的、且检索意义不大的概念可不予以考虑。

如:

“发展”、“趋势”、“现状”、“进展”等,在不是查找综述性文章时可以排除

(2)选择信息资源根据查找的信息类型选择:

互连网搜索?

专业文献数据库检索?

根据查找的文献类型选择:

期刊论文?

专利文献?

标准文献?

学位论文?

其他?

根据查找的地域范围选择:

国内?

国外?

(3)制订检索策略(列出检索提问式)根据检索要求,确定检索词之间应有的逻辑关系对每一个独立的检索概念(检索词),先考虑相互之间有无同义性或近义性,并用“or”进行组配,同时采用优先算符,其次再与其他检索概念进行“and”和“not”组配,形成检索提问式给每一检索词确定检索字段进入检索系统,输入检索提问式进行试检,评判检索结果满意度,以确定是否需要调整检索策略(4)检索策略的调整检索提问式输入检索系统进行试检,其结果有三:

a。

检索结果较理想,能够满足需要b.检索出信息量较大,并且不相关信息较多c.检索出信息量较少,无法满足需要,甚至一篇未检出检索出信息量较大,并且不相关信息较多此情况的发生多数是由“误检”造成,产生原因是:

a、检索词的多义性导致“误检”例如:

使用“CAD”查找计算机辅助设计的信息,可能将通信存取装置(CommunicationsAccessDevice通信存取装置)、计算机辅助诊断(Computer-AssistedDiagnosis)、计算机辅助探测(Computer-AssistedDetection)等方面的信息一并带出。

b、检索词截词过短导致“误检”截词过短,致使检索概念放大,专指性变差。

例如:

使用“财务”或“财务管理”,查找“财务管理软件”的信息,都会造成“误检”。

c、检索字段选择不当专业文献数据库一般提供有检索字段选择菜单,从信息内容这一角度检索,一般使用“关键词字段”检索的误检率要比用“文摘字段”、“全文字段”低。

降低误检率的措施:

1、增加相关限制词语,并用逻辑“与”组配例如:

用检索式“服装andCAD”,可将“CAD(计算机辅助设计)”表示的其他含义删除。

2、选择专指性高的检索词例如:

使用检索词“抗荷服”查找有关信息,可避免用检索词“防护服”或“服装”检索后带来的大量不相关信息。

3、使用逻辑“非”,排除无关概念4、使用数据库中的恰当的字段限制检索出信息量较少,甚至一篇未检出产生这种情况多数是“漏检”造成,原因是:

1、同义词、近义词没有运用全例如:

仅用“非织造布”一词查找有关信息,而未使用“非织造织物”、“无纺布”、“无纺织物”、“不织布”等。

2、上位概念词和下位概念词没有完整运用例如:

“计数器”是上位概念,而“程序计数器”、“脉冲计数器”、“光子计数器”、“可逆计数器”等是其下位概念,在查找“程序计数器”的有关信息时,可酌情考虑“计数器”一词。

3、逻辑“与”用得过多,附加条件过于苛刻比较:

计算机and软件and开发and财务管理(同时满足4个条件)计算机and软件and开发(同时满足3个条件)计算机and软件(同时满足2个条件)4、检索词概念专指度太高比较:

专指度“青藏高原湖泊环境”“高原湖泊环境”“湖泊环境”比较:

检索信息量“青藏高原湖泊环境”“高原湖泊环境”“湖泊环境”提高查全率的措施:

1、减少逻辑“与”运用,增加同义词或近义词的“或”运算2、采用截词检索技术(模糊检索)3、适当扩大检索词的概念4、适当扩大检索内容的范围第二章数据库信息检索技术1高校图书馆电子资源状况可以通过教育网http:

/了解各学校拥有的电子资源,这些资源只在各学校范围内免费开放,即可以检索、浏览、下载和打印全文等。

教育网主页(http:

/)我校图书馆主页(http:

/)馆藏书目查询电子图书电子期刊学位论文专利文献西安交通大学图书馆主页清华大学图书馆主页北京大学图书馆主页2重庆维普中文科技期刊数据库该数据库由重庆维普咨讯有限公司出品,是国内著名的检索期刊论文的专业数据库收录了1989年以来国内九千余种期刊中论文的信息,并附有全文,可拷贝、打印内容含盖了大部分学科提供有“快速检索”、“传统检索”、“高级检索”等多种检索界面可从多种字段检索,如:

关键词、分类号、作者、机构、题名、刊名、文摘等字段检索系统支持精确检索和模糊检索输入逻辑运算符时分别用半角字符“*”、“+”、“-”表示“与”、“或”、“非”快速检索界面快速检索结果传统检索界面传统检索结果高级检索界面高级检索结果3CNKI中国知网中国期刊全文数据库CNKI(ChinaNationalKnowledgeInfrastructure)-中国国家知识基础设施,由清华大学、清华同方发起并承建收录了1994年以来国内8200余种中文期刊论文信息,内容涉及各个学科。

提供了“初级检索”、“高级检索”、“专业检索”等多种检索界面可从“篇名”、“主题”、“关键词”、“作者”、“单位”、“分类号”等多个字段进行检索初级检索界面(单词检索)初级检索界面(双词检索)初级检索结果高级检索界面高级检索结果专业检索界面专业检索结果4CNKI中国知网“中国博、硕士学位论文全文数据库”收录了1999年以来国内420博士培养单位,652家硕士培养单位的研究生论文提供“初级检索”、“高级检索”、“专业检索”等多种检索页面可从“题名”、“主题”、“关键词”、“作者”、“作者单位”、“学位授予单位”、“导师”、“分类号”等多种字段进行检索初级检索界面初级检索结果高级检索界面高级检索结果专业检索界面专业检索结果5美国ProQuest博硕士学位论文全文数据库收录有欧美,以及香港地区1,000余所大学文、理、工、农、医等领域的博士、硕士学位论文,是学术研究中十分重要的信息资源。

检索界面检索结果6国家知识产权局专利检索系统()国家知识产权局主办,面向公众提供免费专利检索服务,专利说明书每日限浏览或下载100页可检索在我国申请的发明专利、实用新型专利和外观设计专利提供多种字段检索,且均可实行模糊检索(前方一致、后方一致、两端一致)“名称”和“摘要”字段还可实行“and”(逻辑与)关系和“or”(逻辑或)逻辑检索。

国家知识产权局主页专利检索界面专利检索结果专利摘要第三章网络信息检索技术3.1网络信息检索工具搜索引擎搜索引擎是一种能够通过Internet接受用户查询指令,并向用户提供符合其查询要求的信息资源网址的系统。

搜索引擎既是用于检索的软件又是提供查询的网站。

所以搜索引擎也称为Internet上具有检索功能的网页。

搜索引擎可以帮助使用者在Internet上找到特定的信息,但它们同时也会返回大量无关的信息。

如果您多使用一些下面介绍的技巧,将会使得搜索结果得到改善。

3.2搜索引擎使用技巧尝试使用更具体的关键词通常,比较广义的关键字搜索出来的结果会很多,而当您想要更精确的搜索结果时,最好选用一些狭义的、更具体的关键字进行搜索。

如:

用“数码相机”取代“相机”用“宝马汽车”取代“汽车”您所提供的关键字越具体,搜索引擎返回无关Web站点的可能性就越小。

使用多个关键词搜索您还可以通过使用多个关键字来缩小搜索范围。

例如,要搜索“北京烤鸭”的信息,则输入两个关键词“北京”和“烤鸭”。

如果只输入其中一个关键词,搜索引擎就会返回诸如“北京布鞋”或“烤鸭店”的无关信息。

一般而言,您提供的关键字越多,搜索引擎返回的结果越精确。

使用布尔逻辑运算搜索许多搜索引擎都允许使用布尔逻辑运算进行搜索,如果您想搜索所有同时包含单词“车载”和“计算机”的站点,只需要在搜索引擎中输入如下关键字:

车载AND计算机或:

车载计算机或:

+车载+计算机搜索引擎将返回以车载为主题的站点,如果想要搜索所有包含单词“车载”或单词“计算机”的站点,您只需要输入下面的关键字:

车载OR计算机或车载|计算机或车载,计算机搜索会返回与这两个单词有关的站点。

注:

百度、雅虎均可,谷歌用OR如果你要搜索“申花”的企业信息,输入“申花”却找到一大堆申花队踢足球的新闻,在发现这些新闻的共同特征是“足球”后,输入“申花-足球”来搜索,就不会再有体育新闻来麻烦你了。

使用双引号进行精确搜索搜索引擎在默认情况下会对检索词进行分词搜索,这时往往会返回大量无关信息,如输入上海科技大学,除了返回有关站点,还返回了上海科技干部管理学院,陕西科技大学上海校友网等无关的站点。

而用“上海科技大学”进行搜索结果会准确地多。

搜索某一个网站下的信息需要使用site:

语句格式如下:

site:

网站域名关键词例子:

搜索华夏大地教育网主站中所有包含“2008年10月”的页面,应该在搜索引擎中输入:

site:

www.edu-2008年10月仅仅搜索华夏大地教育网论坛中所有包含“2008年10月”的页面,应该在搜索引擎中输入:

site:

bbs.edu-2008年10月搜索标题信息需要使用intitle:

或allintitle:

语句格式如下:

intitle:

关键词allintitle:

关键词例子:

如果我要搜索所有关于“08年10月自考成绩查询”标题的页面,则应该在搜索引擎中输入:

intitle:

08年10月自考成绩查询如果要求输入的这个关键词必须完全包含在页面标题中,则应该在搜索引擎中输入:

allintitle:

08年10月自考成绩查询在网页的正文中搜索,需要使用到intext:

和allintext:

语句格式如下:

intext:

关键词allintext:

关键词例子:

如果我要搜索所有所有网页内容中包含“华夏大地教育网自考网络课程”的页面,则应该在搜索引擎中输入:

intext:

华夏大地教育网自考网络课程如果要搜索所有所有网页内容中完全包含“华夏大地教育网自考网络课程”的页面,则应该在搜索引擎中输入:

allintext:

华夏大地教育网自考网络课程搜索某一类型的文件时,需要使用到filetype:

语句.格式:

关键词filetype:

文件类型例子:

如果我要搜索word类型的2008年10月自考试题,则应该在搜索引擎中输入:

2008年10月自考试题filetype:

doc

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1