信息检索论文范本.docx

上传人:b****3 文档编号:27528967 上传时间:2023-07-02 格式:DOCX 页数:13 大小:88.80KB
下载 相关 举报
信息检索论文范本.docx_第1页
第1页 / 共13页
信息检索论文范本.docx_第2页
第2页 / 共13页
信息检索论文范本.docx_第3页
第3页 / 共13页
信息检索论文范本.docx_第4页
第4页 / 共13页
信息检索论文范本.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

信息检索论文范本.docx

《信息检索论文范本.docx》由会员分享,可在线阅读,更多相关《信息检索论文范本.docx(13页珍藏版)》请在冰豆网上搜索。

信息检索论文范本.docx

信息检索论文范本

信息检索结课论文

题目:

网络信息资源检索、技巧及问题研究

学  院:

艺术与设计学院

专业:

多媒体技术动画

学生姓名:

******

学号:

***********

授课教师:

李凤英

 

网络信息资源检索、技巧及问题研究

******

(桂林电子科技大学艺术与设计学院,广西桂林541004)

摘要:

互联网已经成为全球最大的信息资源库,这对于网络信息资源的检索提出了更高要求从网络信息资源的发展及探讨检索的意义入手,分析网络信息资源检索工具的类型内容和作用,探讨网络信息资源检索的若干技巧,指出网络信息资源在检索过程中存在着诸如信息质量网络检索工具信息用户等方面的问题,并提出了相应的解决对策,重点为网络用户介绍了一些常用的网络信息检索途径方法和技巧。

关键词:

网络信息资源;检索途径;检索方法;检索技巧

中图分类号:

G354文献标识码.A

Techniquesandproblemsofthenetworkinformationresourcesretrieval

******

(CollegeofartanddesignofGuilinUniversityofElectronicTechnology,GuangxiGuilin541004)

Abstract:

theInternethasbecometheworld’slargestinformationresourcedatabase,theretrievalofnetworkinformationresourcesputforwardhigherrequirementsfromthedevelopmentofnetworkinformationresourcesandtoexplorethesignificanceofanalysisofthetypesofretrieval,contentandfunctionofthenetworkinformationresourceretrieval,researchesonTechniquesofnetworkinformationresourceretrieval,andpointsoutthatnetworkinformationresourcesinthetheretrievalprocesssuchastheexistenceofinformationqualityofnetworkinformationretrievaltoolsusersandotherissues,andthecorrespondingcountermeasuresareputforward,mainlyintroducestheretrievalmethodsandskillsofsomecommonlyusednetworkinformationforInternetusers。

Keywords:

networkinformationresources;search;retrieval;SearchTips

1.网络信息资源及检索

网络信息资源是指以电子数据形式的文字图像、声音、动画等,以光磁等非纸质为载体存储,通过网络和计算机等方式再现的信息资源。

或者说,是网络和计算机交流利用所有信息资源的总和。

目前,网络信息已成为世界上信息量最丰富利用最便捷用户群最大拓展性最强的信息资源。

据2013年12月《中国互联网状况》白皮书显示,截至2013年底,中国网民人数达到8亿多,年均增长3195万人,互联网普及率达到60.9%,超过世界平均水平;中国境内网站达323万个,比1997年增长了2152倍;中国拥有IPV4地址约2。

3亿个,已成为世界第二大IPV4地址拥有国;中国宽带网民达到5。

46亿人,手机网民达到2。

33亿人网民人数的迅速增加和信息需求的不断增强,促进了互联网的飞速发展,而网络机构及技术的快速发展,又极大地丰富了网络信息资源网络信息资源的发展,有效地补充了信息咨询机构的资源不足,使其信息资源保障能力大幅度提高基于信息资源的检索,无论是对于信息资源的提供者还是获取者都提出了更高的要求.

网络信息资源检索有别于传统的文献资源检索。

其不同在于,它以计算机高速信息网络作为检索平台,对于用户检索提问以“匹配运算”方式,对存储在检索系统中的信息进行逻辑比对、组配,将符合者调出;与传统检索一样也是信息的查找过程,但需要人、计算机、互联网的协调来完成网络信息资源数量庞大内容繁杂且无序,对于信息提供者或获取者来说,快速准确高效获取网络信息资源,网络信息资源检索工具是必须面对的问题。

同时在信息类型多样化,如何在巨大的网络信息中找到所需要的内容,是每个上网者都面临的问题。

2.基于网络信息资源的检索工具

快速准确高效地获取网络信息资源,是信息提供者或获取者追求的目标;而合理利用网络信息检索工具,则是实现其目标的有效途径。

网络信息检索工具,泛指由因特网提供的网页信息资源检索和网站导航服务站点,通常又称搜索引擎搜索引擎利用网络自动搜索技术,对各种互联网资源进行采集标引组织加工整理,并将其建立管理和存储信息的索引数据库,以此实现为用户提供基于数据库的检索服务主要有以下几种类型:

2。

1关键词型

关键词型搜索引擎,是指根据用户在检索界面输入的检索词(词组或语句),与数据库中的索引记录进行匹配比较,以此查找用户所需信息的一种网络检索工具,如GoogleXX等它采用自动索引软件来发现收集并标引网页和建立数据库其优点在于,信息量大更新及时,检索界面直观、简洁方便,而且绝大多数都支持布尔逻辑、截词运算模糊检索和自然语言检索等检索技术,并可准确表示检索需求。

还在于,借助于全文检索技术,可实现网页内容的全文检索由于检索结果与输入的关键词相关,是一个个网页的地址和信息全文的小段文字提要,因此也称其为全文搜索引擎。

其缺点是,返回的检索结果数量大,无关和冗余信息较多,用户必须从中进行筛选。

2。

2目录型

目录型搜索引擎,或称指南目录,是一种按照某种分类体系编制可供分类浏览和检索的等级结构式目录,属于浏览式搜索引擎,如雅虎搜狐等用户通过浏览其树形分类目录,可循类逐层点击各大小类目,层层递进不断缩小检索范围,最终获取所需信息目录型搜索引擎采取人工方式或半自动方式,进行搜集信息编写网站概述来形成摘要信息,并将这些信息置于分类目录体系中,用户从中可获得网站的站名、地址和内容简介这种类型的检索工具层次和结构清晰、易于查找,网站简介一目了然便于取舍由于人工的介入,确保了信息的准确性和较高的导航质量其缺点是,有时分类目录体系不够完善与合理,人工介入引起维护量大,导致信息量少更新不及时查全率不高。

2.3元搜索型

元搜索引擎,也称集合型搜索引擎,如InfoSDogpile等它包含多个单一型搜索引擎,在统一的用户查询界面与信息反馈形式下,共享多个搜索引擎的资源库,并以此为用户提供信息检索服务,因此又称为是对搜索引擎进行搜索的

引擎用户为了全面准确查询信息,需访问不止一个搜索引擎,并希望只通过一次性查询,获得多个搜索引擎的查询结果,而不是枯燥繁琐的重复劳动,而元搜索引擎可以满足用户这一要求它的最大特点,是没有属于自己的信息资源库,只相当于一个中间代理;还在于具有搜索范围广泛查全率高,能够在较短时间提供相对全面准确的信息之不足在于,不能充分概括所用搜索引擎的所有功能,用户需要对反馈结果进行进一步筛选。

2.4垂直搜索型

垂直搜索引擎是针对某个行业的专业搜索引擎,是搜索引擎的细分和延伸其特点在于:

针对某一特定的领域人群需求提供信息及相关服务,且“专、精、深”,具有行业色彩,如音乐搜索、旅游搜索、车票搜索、文学搜索、视频搜索等,都有着较好的用户体验;硬件成本低,用户需求特定,查询方式多样,且具有行业化分工众多的专业行业网站独立服务于互联网,从这一层面证明了互联网格局的多方面性通用搜索引擎性质使然,决定其不能满足特殊领域和人群的精准化信息需求,而市场需求多元化又决定了搜索引擎服务模式的细分,以针对不同行业提供更加精确的行业服务。

可以说,通用搜索引擎的发展,为垂直搜索引擎的出现提供了良好的市场空间,为垂直搜索引擎在互联网中占据部分市场提供了机会,因此也使搜索引擎行业细分化成为了必然.

3.网络信息资源检索的若干技巧

随着网络信息资源的发展,互联网已成为全球最大的信息资源库,这就为网络信息检索的查全率查准率及效率提出了更高的要求然而,了解网络信息资源特征以及掌握网络信息检索技巧,是优化检索结果实现其要求的有效途径。

3。

1选择适当的检索工具

各类搜索引擎的查询范围检索功能各有侧重,因此根据检索主题的需要和要求,选择适当的检索工具,是提高检索查全率查准率及效率的首要条件选择检索工具应遵循以下原则:

其一,以专业对口高质量为原则一般来说,网络资源信息检索应从本单位本地区或系统现有检索工具的实际出发,选择专业对口质量高的搜索引擎.其二,以先综合性后专业性为原则先考虑综合性的全文索引搜索引擎,然后选择专业性垂直搜索引擎加以补充这是由于综合性全文搜索引擎通常以全球网络资源为目标,而一些中小型垂直搜索引擎则以某一区域或专业的专题信息为侧重点,前者的搜索范围虽然广泛,但就某一局部或某个专业而言,内容却未必有后者的丰富和完备。

其三,以先中文后外文为原则在选择语种方面,先考虑选用中文的检索工具或系统,然后考虑英文语种,最后使用其他语种,这是基于中国人语言实际而考虑的此外,选择检索工具应了解其工具特有的检索方式所支持的检索功能,以及了解和掌握检索结果有几种表达方式。

3。

2选用贴切的关键词

选用贴切的关键词,既是检索中的技巧,也是检索经验积累的结果选用关键词能力的提升除了实践中不断尝试和积累外,还应掌握以下原则:

其一,表述准确贴切网站或数据库都有自动搜索关键词的功能,因此,准确表述关键词是获得良好搜索结果的前提条件搜索结果欠佳。

存在的问题有:

主题思路正确,但不能正确的作出表述,如关键词语义不清或有错别字,因此应在提升关键词准确度上发力。

其二,主题关联并简练搜索引擎要求关键词简练匹配,因此提交搜索请求,应把关键词提炼成简单的所希望找到的并与信息主题相关联的查询词关键词并不是越长越好,而是合适贴切。

其三,使用多个关键字对于大部分搜索请求来说,都能够通过搜索网站找到需要的网页,但如果选择关键字不合适贴切,搜索网站会返回很多不是所需的结果如果将另一搜索目标相关的关键词加在一起搜索,返回的结果就会少很多,结果也会更加准确。

3.3构造正确的检索式

检索式是检索策略的具体体现,它控制着检索过程,构造是否合理正确关系到检索结果一个好的检索式应准确地反映检索的内容主题,符合检索系统的功能限制条件和规定,将检索结果控制在准确的范围内基于布尔逻辑检索理论的成熟性,其理论便成为了构造检索表达式最基本、最简单的匹配模式。

这是由于数据库或搜索引擎的基本检索命令,与布尔逻辑规则、字符串检索、截词检索、字段索、限制检索等的语法基本上是通用的针对不同的搜索引擎、数据库和信息需求,应有不同的检索策略,这样检索式构造也应有所不同常用的检索式有以下几种:

其一,逻辑“与”,以“AND”或“*"表示以此表示其所连接的两个检索项的交叉部分,即交集部分逻辑与检索能增强检索的专指性,使检索范围缩小。

其二,逻辑“或”,以“OR”或“+"表示,用于连接并列关系的检索词、运算逻辑或检索可扩大检索范围,提高检索的查全率。

其三,逻辑“非",以“NOT”或“—”号表示,用于连接排除关系的检索词,即排除不需要的和影响检索结果的概念逻辑“非”用于表达两个或两个以上检索词之间中排除不需要的检索词、(关键词主题词)、运算,以缩小检索范围,

增强检索的准确性.若使用不当,将会排除有用信息,导致漏检。

其四,邻近度算符With,以“With”表示用于表示同时出现在同一文献的一个字段的两个词,用With连接检索词A和B,检索式为A表示检索词A和B不仅要同时出现在一条记录中,还要同时出现在一个字段里的文献才是命中文献

其五,邻近度算符Near,以Near表示用于表示不仅要同时出现在一条记录的同一字段,还必须在同一个子字段里的两个词,用With连接检索词A和B,检索式为ANearB表示检索词A和B不仅要同时出现在一条记录中,还要同时出现在一个字段里的文献才是命中文献.

其六,逻辑运算次序在一个检索式中可以同时使用多个逻辑运算符,构成一个复合逻辑检索式复合逻辑检索式中,运算按级别从高至低的方式进行,依次

是not、and、near、with、or,可以使用括号改变运算次序检索中逻辑算符使用是最频繁的,逻辑算符使用的技巧可决定检索结果的满意程度。

3。

4调整检索范围

3.4。

1扩大检索范围策略

当检索结果为零或检索结果太少时,可扩大检索范围,以提高检索查全率其主要途径有:

其一,使用多个搜索引擎和数据库检索任何大型搜索引擎都不可能将公开网页全部收录,且都有收录的侧重点因此,对于难于检索或高检全率检索,必须进行多搜索引擎检索对于要求高且复杂的检索,至少要分别使用google、XX、搜搜、bing、搜狗等五个以上搜索引擎进行搜索,或利用元搜索进行多库搜索。

其二,扩大检索主题在布尔检索式中,增加布尔“或"相连的关键词,减少“与”相连的关键词,即扩大搜索的主题。

其三,利用近义词和同义词检索可使同一主题的检索其检索结果更加全面,反映同一概念的检索词越多,就越能

保证查全率。

其四,采用上位词检索“如"检索是文献检索的上位词,通过扩大检索概念范围的方式提高检索效果其五,在文摘或全文字段中检索除搜索题名和关键词外,把搜索范围扩大到文献和全文字段能够使检索结果大大增加.另外,为了获得较多的检索结果,可应用循环法来不断扩大检索范围,或利用减少限制站点推荐模糊检索来扩大检索范围,这些策略的运用都有利于检索结果的提高

3。

4.2缩小检索范围策略

检索结果若太多或不相关,可缩小检索范围,以提高检索的查准率,其主要途径有:

其一,增加检索概念在检索式中增加检索概念,如加入算符,或利用二次检索功能,逐次附加新的检索条件,进行概念限制,缩小检索范围其二,排除无关概念检索结果中反复出现无关或重复信息,可利用NOT算符排除无关概念,即在不需要出现的关键词前加—排除之其三,短语检索将拟检索词加双引号进行检索,以提高检索精确度。

其四,限定检索一是对检索的字段、时间网域语言或其它辅助字段加以限定;二是将检索词限定在篇名或叙词字段中,以此提高检索的查准率其五,专业术语检索使用专指度较强的词汇和专业术语检索,以提高检索的专指性其六,搜索具体化检索前,明确检索主题,限定查询范围,选择确切的检索词,使之具体化明确化,以提高检索的查准率。

3。

5利用检索帮助

互联网的检索工具搜索引擎都是在不断地更新和改进的,信息提供者或获取者应了解它的新功能,而网站上的诸如about、us(关于我们)(在线帮助)FAQ(经常提问的问题)SearchTip(检索提示)等介绍性文件能够给予帮助这些介绍性文件图文并茂,通俗易懂,也便于掌握初次接触时,可花费少量时间熟悉它的特性,浏览它的帮助和提示,以了解其设计数据库范围新增功能常用检索窍门检索具体要求查询注意事项等。

利用“检索帮助"进行检索,可以提高检索的查全率和查准率.

4。

网络信息资源检索存在的问题

由于信息技术与互联网的迅速发展,人们在日常工作学习和生活中越来越依赖于网络来检索和获取各种信息资源然而由于因特网信息资源的分散性复杂性等特点,面对浩如烟海的网络信息,用户想在最短的时间内获取需要的信息却经常会感到相当困难产生这些困难的主要有以下几个原因[1]。

4.1网络信息资源质量低

信息质量低包含两个方面,一方面是指出现了大量的冗余信息,即信息大爆炸;另一方面是指信息污染严重出现这样的状况是由于网上言论自由出版自由,任何组织和个人都可以在网上发布信息,使网上信息以几何级数急剧膨胀,从而导致了信息大爆炸因此网络信息质量和精度低,可靠性权威性利用价值都受到质疑同时,信息种类庞杂,垃圾虚假冗余过时信息等增加了信息的不确定性和降低了信息的时效性,造成了信息污染网络中出现了大量的非结构化信息和重复信息,以致网络中的信息以几何级数急剧增长,使网络信息呈现出庞大分散无序等特点,使人们承受过度信息的冲击,以至于用户获取有用信息如同大海捞针,困难重重[2].

4。

2网络检索工具的功能不完善

互联网是一个信息的海洋,里面信息的格式包括纯文本信息各种文件信息图片信息声音信息视频信息等,互联网是按照超文本将这些信息连接起来的由于各网络信息检索工具收集信息的方式信息的覆盖面索引编制和标引方式检索功能和检索结果的描述和排列方式都不一样,因此,目前没有一种检索工具能够全面地检索到各类信息比如,网络搜索引擎只能检索网页信息而不能检索数据库信息,具有代表性的常用中文网络搜索引擎有XX和搜狐等;专业信息数据库的检索系统却不能直接检索互联网网页信息,不同的信息数据库系统也是相对独立,很少能够跨库检索,由此使得相同的检索在不同的网络信息检索工具中会产生不同的检索结果.

4。

3用户检索信息能力存在差异

除了以上的客观因素外,用户本身的因素也不容忽视由于大部分用户并没有检索方面的专业知识,这在信息检索过程中会大大降低工作效率用户所拥有的检索信息能力查找信息的经验以及对搜索引擎的熟练程度等都影响对网络信息的检索不同信息能力程度的信息用户对同一个检索问题,使用的检索词不同,查找信息的过程也不相同信息用户从海量的结果中挑选结果也带有一定的主观性和随机性,从而影响对检索网络信息资源结果的选定.

5。

网络信息资源检索应采取的对策

用户如何有效地在网上找到需要的信息资源,以及针对上面出现的问题,笔者在下文将提出解决这些问题的对策,重点强调提高用户检索信息的能力,为用户检索网络信息提供一定的帮助。

5。

1制定优化网络信息资源相关的标准

网络信息资源纷繁杂乱,需要制定一些标准来管理这些信息根据这些标准限制个人或组织在网上任意地发布一些无用的信息,从而达到优化信息的目的同时,国家应制定相关法律加强网站管理监督,严格把关,对质量较差的网站加以限制,甚至予以取缔;制定相关政策,提高网络规范程度,以保证用户的检索效率;规范网络术语,使其与常规术语接轨,提高资源共享程度.

5。

2发展搜索引擎技术并弥补不足

现有的搜索引擎漏检误检率较高,功能不全面,检索效率不理想我们一方面需要开发新的搜索引擎技术克服这些弱点;另一方面需要用户掌握常用的搜索引擎网站和网络数据库的特征对于新开发的搜索引擎技术必须具有以下功能:

多途径检索功能,高检索效率功能,过滤虚假信息和垃圾信息,真实信息不遗漏,查准率和查全率最佳化;为用户提供所需信息,搜索引擎技术需要运用数据库选择文本选择和结果综合等技术,将多个搜索引擎有机整合,使网络信息搜索能力和覆盖面增大[3].

5.3提高检索信息能力

为了读者系统地学习网络检索信息资源的理论和方法,以下从检索的途径方法、技巧等方面向读者介绍了有关检索知识,并且介绍了一些质量较高的并具有广泛代表性的网站以及列举了一些实例以供读者参考,提高检索网络信息资源的能力.

5。

3。

1选择适当的检索途径

网络信息丰富而复杂,用户要快捷地找到所需信息,必须针对不同情况和不同需求采用相应对检索途径,下面就介绍一些常用的途径,以供参考。

(1)搜索引擎搜索引擎是Internet上的一个网站,是目前检索网页信息最常用的方法,其主要工作原理是在Internet上主动搜索一定范围内的服务器信息并将其自动索引,索引内容存储于可供查询的大型数据库中当用户输入关键词查询时,该搜索引擎网站会罗列出包含该关键词的所有网址,并提供通向该网站的链接我们比较熟悉的有XX雅虎等这是一种我们大多数人通常使用的检索方式这类的搜索引擎比较适用于比较简单的课题,对于非常复杂的课题或学术信息时,需要先借助于这类的搜索引擎,理清思路,然后深入到各个学科了解熟悉和掌握各种专业的搜索引擎网络目录和专业数据库。

(2)网络数据库对于学术课题,国内著名的数据库有中国期刊全文数据库中国优秀博硕士论文全文数据库中国重要会议论文全文数据库中国重要报纸全文数据库中国专利数据库万方数据资源系统维普中文科技期刊数据库等这些数据库均由专门的信息机构或公司制作和维护,由于其信息质量高,成为专业领域的常用数据库网络文献数据库是网上信息资源的基础,成为检索专业性文献信息用户的首选

(3)网上图书馆多数图书馆都提供网上检索,如中国国家图书馆中国科学院文献信息中心等通过上海图书馆的Web、PAC可以查询到世界上任何Z3950服务器上的书目数据库也可访问网上图书馆网上书目查询或网上书店,如CALIS联机公共书目查询系统超星数字图书馆[4]。

5。

3.2选择适当的检索方法

无论使用哪一种搜索引擎,方法基本都是一样搜索引擎最常用的搜索方法为关键词检索分类检索(目录检索)和多元检索分类检索即目录型检索是信息工作者对网络资源进行加工整理的基础上,按照某种分类体系编制的一种可供检索的等级结构式目录大部分采用学科分类,少数也使用图书分类方法此类检索工具的优点是检索质量较高,缺点是检索到的信息数量有限,且新颖性不够有代表性的目录型检索工具如雅虎(Yahoo)用这种方法在雅虎搜索娱乐方面的信息,自顶娱乐开始,在娱乐层分布有若干链接点,选择其中一个,就可沿此分支进入下一层,直到出现所需目标关键词检索是搜索引擎提供的最基本功能需快速查找所需的网络资源,或无法确定所要搜索的网络资源的类别时,可以使用关键词检索方法只需在搜索引擎的提问框中输入关键词,按回车键之后,搜索引擎便会将与关键词匹配的结果罗列出来多元检索可集成多个搜索引擎,提供统一的检索界面,可将一个检索提问同时发送给多个搜索引擎,同时检索多个数据库,经加工整合后输出检索结果其优点是省时,缺点是不同搜索引擎的检索机制所支持的检索算法对提问式的解读等均不相同,致使检索结果的准确性差速度慢搜星(Soseen)就属于这类搜索引擎[5].

5.3。

3网络信息资源检索技巧

(1)布尔逻辑语言的使用not表示逻辑非,使用not寻找包含not前的关键词,但排除not后的关键词的文档Not的另一种常用表示方式是“-”例如:

大学生not研究生,则检索结果为包含大学生,但排除研究生的资料。

and表示逻辑“与”,使用and操作符检索得到的文档中包含所有的关键字例如:

情报学and图书馆学,检索结果包含情报学和图书馆学两个词的资料在逻辑检索中,结合越多的词在一起,将检索到越少的记录and的另一种表示方式是用空格和“+”表示。

r表示逻辑“或”。

使用or可检索出几个关键字中至少包含一个的文档例如查询语文or汉语,则该检索式将检索到所有包含语文的和所有包含汉语的记录一方面,or被普遍用来检索同义词或概念,可检索到所有包括至少一个词的检索结果;另一方面,在使用逻辑or的过程中,结合越多的词或概念,将检索到越多的记录另外,需要指出的是,or的另一种表示方式是逗号括号的作用相似于数学中的括号,可使括在其中的操作符先起作用以上操作符可互相结合使用,但有一定的执行次序,其优先顺序依次为括号no、tan、dor。

(2)双引号的使用。

双引号的作用,主要是将引号中的词作为一个整体,在文本中查找例如检索信息产业方

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 教学研究 > 教学案例设计

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1