完整word版武汉大学信息检索整理.docx

上传人:b****6 文档编号:4653215 上传时间:2022-12-07 格式:DOCX 页数:25 大小:53.17KB
下载 相关 举报
完整word版武汉大学信息检索整理.docx_第1页
第1页 / 共25页
完整word版武汉大学信息检索整理.docx_第2页
第2页 / 共25页
完整word版武汉大学信息检索整理.docx_第3页
第3页 / 共25页
完整word版武汉大学信息检索整理.docx_第4页
第4页 / 共25页
完整word版武汉大学信息检索整理.docx_第5页
第5页 / 共25页
点击查看更多>>
下载资源
资源描述

完整word版武汉大学信息检索整理.docx

《完整word版武汉大学信息检索整理.docx》由会员分享,可在线阅读,更多相关《完整word版武汉大学信息检索整理.docx(25页珍藏版)》请在冰豆网上搜索。

完整word版武汉大学信息检索整理.docx

完整word版武汉大学信息检索整理

名词解释

1.信息检索(InformationRetrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。

2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。

3.CALIS:

ChinaAcademicLibraryandInformationSystem中国高等教育文献保障系统。

4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。

5.搜索引擎(SearchEngine)是一种Web上应用的软件系统,它以一定的策略在Web上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。

用户可以通过主题浏览和关键词检索的方式搜索所需信息。

6.截词检索:

是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。

检索中,计算机会将所有含有相同部分标识的记录全部检索出来。

截词符一般用“?

”或“*”表示,但不同的数据库中有所差别。

7.查准率:

是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。

8.查全率:

是指检出的文献数量占数据库中全部相关文献数量的比例。

9.文献及其要素

“文献”是泛指“有历史价值或参考价值的图书资料。

要素:

1、构成文献内核的信息、知识、数据、事实.2、载体信息、知识、数据、事实的物质载体。

3、记录信息、知识、数据、事实的符号系统。

10.专利文献:

专利文献是实行专利的国家、地区及国际专利组织在批审专利过程中产生的官方文件及出版物,包括专利说明书、专利权利要求书、专利公报、专利分类表、专利检索工具等。

11.三大检索系统:

SCI(《科学引文索引》,EI是美国《工程索引》(TheEngineeringIndex)的简称,ISTP是IndextoScientific&TechnicalProceedings的缩写。

12.二次文献:

二次文献又称二级次文献,它是文献检索工具,能比较全面、系统地反映某个学科、专业或专题在一定时空范围内的文献线索,是积累、报道和检索文献资料的有效手段.

13.受控语言:

受控语言是一种规范化的人工语言,包括具有较强族性检索功能的分类语言和具有较强特性检索功能的主题语言。

14.信息素质教育:

是指一个人的信息意识教育、信息道德教育、信息能力教育

15.引文追溯法:

追溯法是指不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文”的一种最简便的扩大情报来源的方法。

它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的内容相关文献。

16.同引文献:

与本文有相同参考文献的文献,与本文有共同研究背景或依据的文献。

17.学科导航:

学科导航是按学科门类将学科信息、学术资源等集中在一起,以实现资源的规范搜集、分类、组织和序化整理,并能对导航信息进行多途径内容揭示,方便用户按学科查找相关学科信息和学术资源的系统工具。

18.知识产权:

知识产权是指对智力劳动成果依法所享有的占有、使用、处分和收益的权利。

知识产权是一种无形财产,它与房屋、汽车等有形财产一样,都受到国家法律的保护,都具有价值和使用价值。

有些重大专利、驰名商标或作品的价值也远远高于房屋、汽车等有形财产。

19.IPC:

国际专利分类法是国际上通用的专利文献分类法。

用国际专利分类法分类专利文献(说明书)而得到的分类号,称为国际专利分类号,通常缩写为IPC号。

 IPC采用了功能和应用相结合,以功能性为主、应用性为辅的分类原则。

采用等级的形式,将技术内容注明:

部——分部——大类——小类——大组——小组,逐级分类形成完整的分类体系。

20.NSTL:

NSTL是国家科技图书文献中心的简称,它是根据国务院领导的批示于2000年6月12日组建的一个虚拟的科技文献信息服务机构,成员单位包括中国科学院文献情报中心、工程技术图书馆(中国科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院、中国化工信息中心)、中国农业科学院图书馆、中国医学科学院图书馆。

网上共建单位包括中国标准化研究院和中国计量科学研究院。

中心设办公室,负责科技文献信息资源共建共享工作的组织、协调与管理。

21.百科全书:

百科全书是全面系统的介绍文化科学知识,收集各种专门名词、术语,按词典形式编排,解说详细的大型参考工具书。

它汇总了各学科或某一学科的知识,提供人类有关知识领域的基本事实、基本概念和基本理论。

百科全书由众多专家撰稿、编审,故有较高的权威性。

 

简答

1.电子图书有哪些特点?

存储空间大(磁介质存储密度高、容量大,一张光盘甚至可以存上百部中外名著)、节省资源(不需消耗纸张等物质资源)、使用方便(借助于专门的软件便可使用,可以便捷地编辑和查找特定内容)、传播过程中的无独占性和无损坏性(可以同时供多人使用,可无失真地重复使用)。

2.对搜索引擎的选择与比较主要从哪些方面考虑?

收录范围(索引库中内容的数量、地域范围、语言种类、资源类型、资源的深度和广度)、分类(分类方式是否合理多样、类名是否规范、分类的广度与深度是否合适)、检索功能与效果(是否包含浏览检索和关键词检索功能、是否支持布尔检索、截词检索等高级检索功能、是否有检索帮助和提示功能、检索结果和查全率、查准率及响应时间)、结果处理(结果的排序方式是否多样、是否有去重功能、能否按照用户反馈动态调整和显示检索结果)、页面组织(页面组织是否清晰、类目设置是否合理、界面是否友好)、其他功能与服务(能否满足用户多方面的信息需求)、用户评价(是否有用户评价及统计功能)。

2.1搜索引擎有哪些类型?

  搜索引擎按信息搜集方式分:

有目录式搜索引擎和机器人搜索引擎;按照信息组织方式分:

有网络资源指南与关键词搜索引擎;按学科范围与资源种类分,有综合性搜索引擎和专门性搜索引擎;按照功能和是否有自建索引库分,有独立搜索引擎和元搜索引擎。

2.2按信息采集方式,搜索引擎分为哪两种类型?

各自的基本特点?

列举至少2个有代表性的搜索引擎名称?

3.网络信息选择的标准有哪些?

权威性(网站及其建站机构的权威性和知名度)、内容(内容应当客观、切题、标题清楚、组织规范、逻辑性强、有明确的范围和边界、有足够的深度和广度、有自己的特色)、时效性(网站内容及其链接应当新颖、应明确地说明其创建和更新周期)、网页设计(应以合理的方式综合使用图像、声音和文字、界面的友好性、清晰直观)、适用性(应保证用户能用较短的时间、点击较少的链接找到所需信息)、用户对象(信息的专业化程度应能满足目标用户的特定需求)、访问次数或被链接次数(网络信息的被访问和被其他网页链接的次数)。

4.查找国内外引文与学位论文分别有哪些数据库?

每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。

(1)查找国内外引文可用引文索引数据库,如查找国外引文可选择《科学引文索引》(SCI)、《社会科学引文索引》(SSCI)、《艺术与人文科学引文索引》(A&HCI),即著名的三大引文索引SCI、SSCI、AHCI;查找国内引文可选择中国科学引文数据库(ChineseScienceCitationDatabase,简称CSCD)、中文社会科学引文索引(ChineseSocialScienceCitationInformation,简称CSSCI)等。

  

(2)查找国内外学位论文可用学位论文索引与摘要数据库,如CALIS的《学位论文库》,万方数据资源系统中的《中国学位论文数据库》,CNKI的《优秀硕博士论文数据库》,美国博硕士论文库PQDD(ProQuestDigitalDissertations),美国学位论文网络数字图书馆NDLTD(NetworkedDigitalLibraryofThesisandDissertations)等。

5.除商业数据库和搜索引擎外,还可以从哪些途径获取网络信息资源?

请至少给出5种,每种举一例。

学科信息门户(如CALIS的学科导航库、SOSIG等)、数字图书馆(如国家数字图书馆)、开放获取资源(如OA期刊、机构知识库等)、专业机构的网站、专业人员的个人网站或博客、国内外政府机构的网站、国家精品课程网站、国外大学的免费课程资源网站等。

鼓励自由发挥。

6.布尔逻辑检索的主要运算符有哪些?

它们各代表什么含义?

请分别举一例说明。

  布尔逻辑检索的主要运算符有“AND”、“NOT”、“OR”,它们分别代表逻辑与(表示检索结果中必须包含所有的检索词)、或(表示检索结果中只要包含任何一个检索词即可)和非(表示检索结果中一定不能出现“not”后面的检索词),如:

美国AND社会保障,数字图书馆OR虚拟图书馆,玉米NOT甜玉米。

论述题

一、从哪些方面全面地查找关于某一主题的研究成果?

(20分)

  

(1)图书的查找,包括图书馆目录、网络书店、读秀、GoogleBooks等图书搜索引擎的使用等;

  

(2)期刊论文的查找,包括检索国内外的期刊数据库、引文索引库和OA期刊,利用GoogleScholar查找等;

  (3)学位论文的查找,包括国内外学位论文库的查找;

  (4)会议论文的查找,可以通过搜索引擎或专门的会议文献数据库查找相关会议文献;

二、 通过检索实践,你认为网络信息检索中的主要问题有哪些(10分)?

应掌握哪些技巧与注意事项(15分)?

该题鼓励同学们在课本有关内容基础上进一步发挥。

网络信息检索中存在的问题

一是网络信息良莠不齐。

网络信息的发布具有很大的自由性和随意性,缺乏规范,无用信息掺杂其间,垃圾信息、虚假信息、冗余过时信息的存在,增加了信息的不确定性和用户的不安全感,使信息质量和精度降低,其可靠性、权威性和利用价值受到质疑,令网络用户无所适从。

二是检全率低。

虽然在网络信息检索工具的索引数据库中包含了成千上万的网页,但由于网络蜘蛛跟不上网络发展的速度,加之网络信息格式多样性等因素,致使没有一种网络信息检索工具能够为整个网络建立索引,从而使网络中大量质量高、实用性强的隐性信息难以查全。

三是检准率低。

利用网络信息检索工具找到的往往是一大堆网址,检索结果的重复率相当高,用户只有逐个浏览才能从中筛选出所需的信息。

与利用商业性联机检索数据库相比较,用户虽然可以节省昂贵的查询费用,但却要花费大量的时间对信息进行判断。

四是检索效率低。

网络信息导航只支持单步信息定位,只允许导航系统一步一步地追踪信息,客户机在追踪过程中接受了诸多冗余信息,造成效率降低,即使是一些优秀的搜索引擎,也需按屏幕揭示一步一步追踪,如果查到的地址有几百条、几千条,要确定哪个符合要求就很困难。

五是无统一检索规范。

由于各网络信息检索工具收集信息的方式、信息覆盖面、索引编制和标引方式、检索功能和检索结果的描述和排列方式都不一样,一方面使得相同的检索在不同的网络信息检索工具中会产生不同的检索结果;另一方面用户在利用不同的网络检索工具时需要经过不同的适应过程,增加了用户的负担。

六是缺乏多语种检索。

互联网是一个巨大的数字资源信息库,包含着不同语言信息。

但当前的检索工具不能将检索词自动转换成其他语种进行检索,容易造成信息的漏检。

七是缺少基于内容的信息搜索引擎。

网络上的信息除了文本外,还有大量的声音、图像、动画等多媒体信息,但目前信息检索技术还是以线性的文本检索为主,对多媒体信息的检索主要借助于文本的信息检索,一般不涉及图像自身特征的分析处理,使得对多媒体信息的检索受到了很大限制。

所以,传统信息检索技术无法满足现代图像数据检索的需要,必须从一个新的角度来管理图像信息,使非结构化的数据向结构化的数据转换。

八是索引数据库更新速度慢。

网络检索工具是通过网络蜘蛛建立索引数据库的,但网络蜘蛛只能在系统管理员确定的时间间隔内跟踪特定信息,不能保证信息的及时更新,容易出现信息过时或死链现象。

九是个性化需求差。

信息服务的内在机理要求信息服务的出发点和立足点是用户信息活动,而不是信息资源。

不同的用户有着不同的信息需求,若要每一位用户都感到满意,仅仅提供网络信息获得途径或者是直接从网上获得信息远远不够,只有针对不同用户的不同需求,对症下药,提供个性化服务,才有可能使每位用户都感到满意,信息的价值才能得以实现,但这方面的技术还不成熟。

✓Internet检索技巧

1.分析检索的主题

  即要确切了解所要查询的目的和要求,确定需要的信息类型(全文、摘要、名录型等;文本、图象、声音)、查询方式(浏览、分类检索、关键词检索)、查询范围(所有网页、标题、新闻组文章、FTP、软件;中文、外文)、查询时间(所有年份、最近几年、最近几周、最近几天、当天)等。

  2.选择合适的检索工具

  各种搜索引擎在查询范围、检索功能等方面各有千秋,不同目的的检索应选择不同的搜索引擎。

选择合适的检索工具主要从工具的类型、收录范围、检索问题的类型、检索具体要求等方面综合考虑。

一般来讲,如果用户希望获得关于某个问题的广泛性信息,那么最好使用像YAHOO这样的目录式搜索引擎,而要获得关于该问题的细节性信息,则要利用像AltaVista这样的关键词检索工具。

对搜索引擎的了解与选择,可以借助于搜索引擎的集合与评价站点,如搜索引擎大全(

  在进入新的检索前,应首先了解如何使用这种检索工具,尤其要注意了解该系统所特有的检索方式,它所允许的检索功能(布尔逻辑检索、字段限制检索、截词检索、短语检索等)同时还应了解检索结果有几种表达方式,所使用的搜索引擎的缺省语法。

不同的引擎缺省的运算符不同,如LYCOS为“OR”,有的引擎不支持某些运算符,如YAHOO,LYCOS不支持NOT。

许多搜索引擎使用各自的标准去排列检索结果,这些标准包括:

题目、URL、HTML、METAtag等。

  3.抽取适当的关键词。

应尽量选专指词、特定概念或专业术语,避免普通词和太泛的词,如计算机、互联网、中国、世界等,太多太泛,失去了检索价值,会反馈数以万计的检索结果,失去检索意义,被称为“禁用词”。

现对关键词的选择提出以下建议:

  

(1)使用名词或物体做关键词

  

(2)检索式中使用2——3个关键词

  (3)使用截词检索(可检索出词根相同的词或同一词的单复数形式),如,film*

  (4)通过OR连接同义词、近义词、相关词或术语的不同表达方式,如,InternetORWebORwwwOR(thenet)

  (5)对专有名词,如人名、地名、机构名,使用大写字母指定检索,如UnitedStates

  (6)对固定短语,用“”括起进行短语检索,如“WorldWideWeb”,以提高检索的精度

  (7)用括号将各个概念分开,如(InternetORWeb)AND(search*ORretriev*)

  4.正确构造检索式

  利用搜索工具支持的高级检索功能、允许使用的检索标识和各种限定,正确构建检索式。

  许多搜索引擎都提供简单查询和高级查询,建议使用后者,如组合使用布尔逻辑运算符AND(+)、NOT(-)、双引号、使用日期与语种限定,可使检索结果控制在一定范围内。

充分利用进阶检索,即某些工具提供的Refine,Searchwithintheseresults等功能,在前一次检索产生的结果基础上做进一步的检索,如可在“Refine”检索框内继续增补检索词或修改检索式,使检索范围缩小。

  5.及时调整检索策略

  

(1)扩大检索范围。

  当检索结果为零或检索结果太少,需要扩大检索范围。

可以使用同义词、近义词或相关词,使用较普遍的词,或改用上位词;使用缩写与全称;使用截断技术;利用某些搜索引擎的自动扩检功能进行相关检索;使用多个搜索引擎,或者直接利用多元搜索引擎。

(2)缩小检索范围。

  检索时如果得到太多的检索结果,或检索结果不相关,需要缩小检索范围。

可使用布尔逻辑算符、位置算符和固定词组检索(短语检索)等方式限制查询范围。

  6.加快检索速度,节省检索时间与费用

  

(1)直接进入相关站点。

平时多积累有用的网址,利用浏览器的“书签”功能,将经常访问的网站加入“收藏夹”对其进行保存,再次使用时,直接点击便可进入,省去大量输入网址和利用工具搜索的时间。

另外,还可以利用网上书签。

三、最常用搜索会议论文的数据库?

如何搜索最有影响期刊数据库?

1、会议论文数据库

(1)CALIS的会议论文数据库

CALIS会议论文数据库收录来自于“211工程”的61所重点学校每年主持的国际会议的论文,目前该数据库正在建设中。

(2)万方学术会议论文数据库

万方数据资源系统会议论文数据库收录国家一级协会、二级协会、二级以下协会、一级会议、二级会议、二级以下会议、国家重点实验室、研究会和其它机构主办的学术会议,涉及哲学、宗教、社会科学等20大类。

(3)CNKI中国重要会议论文全文数据库

中国知网的中国重要会议论文全文数据库收录我国2000年以来国家二级以上学会、协会、高等院校、科研机构、学术机构等单位的论文集。

(4)NSTL的中外文会议论文库

国家科技图书文献中心NSTL的会议数据库包括了中文会议论文数据库和外文会议论文数据库。

(5)OCLCFirstSearch会议论文与会议录索引

OCLCFirst中的国际学术会议论文索引库包括在世界范围的各种会议、座谈会、博览会、研讨会、专业会、学术报告会上发表的论文的索引,收录了自1993年以来在不列颠图书馆文献提供中心(BLDSC)的会议录上收集到的已出版的论文,并通过馆际互借获取全文。

(6)ISI会议论文集引文索引

ISI会议论文集引文索引包括自然科学版和社会科学与人文科学版,收录1996年以来世界上最著名的会议、座谈会、研讨会、专题讨论会及其它各种会议中发表的会议录论文及其引文信息,分别取代原来的科技会议录索引和社会科学与人文会议录索引,其覆盖的学科范围非常广泛,是目前世界上了解会议文献信息最主要的检索工具。

2、

四、个人文献管理软件的主要功能?

比较几个典型的文献管理软件?

以下是课件上资料(PDF第九章)

个人文献管理软件的主要作用是帮助用户有效管理已经获取的文献信息,并且对已经获得的文献信息进行方便快捷的利用

基本功能包括:

1.建立个人的数目文献数据库,或者是个人的虚拟图书馆

2.帮助用户组织、管理已获取的文献信息

3.对个人的数目文献数据进行快速检索

4.按特定格式要求快速插入引文(参考文献)

5.导出/导入、备份/恢复个人文献数据库中的内容

6.网络发布或者共享数据库中的全部或者部分内容

7.添加阅读笔记和附件

8.利用已经保存在PC中的全文生成数据库中的记录

9.利用RSS导入记录数据

10.只能捕获网页信息

网上资料

个人文献信息管理系统可以帮助读者处理个人所汇集的各种书目信息,主要功能包括建立并维护个人文献资料库,使用者在输入文献信息后,可以按纪录中有内容的字段进行检索,如利用关键词、作者、标题等字段进行布尔逻辑检索。

它还包含有一般管理系统的功能,如排序、增删纪录等。

这种个人研究领域的文献资料库,无论在撰写研究报告时的参考引用、查阅文献纪录的书目资料或者为学生开列参考书目时都很方便。

目前市场上可以提供给读者使用的个人文献信息管理软件的基本功能大同小异,主要有以下一些功能:

  

(1)批次输入信息资料:

系统提供了各种资料库的检索结果直接转入系统的功能。

用户可以将不同数据库的检索结果直接转入系统,成为格式一致的资料信息。

  

(2)检索查询功能:

文献信息输入后,可按不同的字段进行检索,例如用author,title,journal,keyword,subject等进行布尔逻辑组配检索,并可作排序或增删纪录等。

该功能有效帮助读者写研究报告查阅文献纪录

  (3)查重:

当用户陆续汇集许多资料后,系统可以自动查重,并允许将重复的纪录删除。

几个典型的文献管理软件对比:

(1)EndNode

优点:

覆盖的数据库最多,使用人数众多;参考文献可以与本地电脑中的PDF原文建立关联,对其进行管理。

缺点:

笔记功能太弱,不支持图形绘制功能,只能以关联方式链接图片、表格等信息;对中文数据库支持不好;无法再一种Outstyle下同时体现中文和英文两种参考文献的格式;不支持交叉引用(即不同文章的相互引用关系);授权花费大;需要花一定时间学习其功能。

(2)NoteExpress

优点:

对中文数据库的支持是最好的,大部分数据库都有所覆盖,笔记功能也很强大,可以图文并茂,Word插件写作论文时也很方便。

缺点:

把数据库的检索结果添加到NE中的操作比较繁琐;没有网络同步功能,不能通过Web与他人共享文献,不能进行研究交流。

(3)NoteFirst

优点:

文献数据库可进行网络同步;可抓取网页,全文共享。

缺点:

覆盖的数据库还比较少;笔记功能较弱;

(4)Zotero

优点:

开源工具;数据可以在网络上同步,也能在本地管理文献,也可以在网络上管理;不但可以管理学术文献,也可以管理各种形式的信息;自动识别文献题录信息,一键保存;对中文的支持不错,也支持CNKI的自动识别。

缺点:

不能直接链接本地文件。

(5)Mendeley

优点:

免费;PDF导入;内置PDF阅读功能;提供在线和桌面两种方式,可将文献上传到网络个人空间中。

缺点:

不支持中文数据库。

五、三大检索的中英全称,应用

(1)《科学引文索引》(ScienceCitationIndex,SCI)是由美国科学信息研究所(ISI)1961年创办出版的引文数据库,其覆盖生命科学、临床医学、物理化学、农业、生物、兽医学、工程技术等方面的综合性检索刊物,尤其能反映自然科学研究的学术水平,是目前国际上三大检索系统中最著名的一种.

(2)《工程索引》(EngineeringIndex,EI),1884年创刊,由美国工程信息公司出版,报道工程技术各学科的期刊、会议论文、科技报告等文献。

收录文献几乎涉及工程技术各个领域。

例如:

动力、电工、电子、自动控制、矿冶、金属工艺、机械制造、土建、水利等。

它具有综合性强、资料来源广、地理覆盖面广、报道量大、报道质量高、权威性强等特点。

(3)《科技会议录索引》(IndextoScientific&TechnicalProceedings,ISTP),也是由ISI出版,1978年创刊,报导世界上每年召开的科技会议的会议论文。

该索引收录生命科学、物理与化学科学、农业、生物和环境科学、工程技术和应用科学等学科的会议文献,包括一般性会议、座谈会、研究会、讨论会、发表会等。

在ISTP、EI、SCI这三大检索系统中,SCI最能反映基础学科研究水平和论文质量,该检索系统收录的科技期刊比较全面,可以说它是集中各个学科高质优秀论文的精粹,该检索系统历来成为世界科技界密切注视的中心和焦点。

ISTP、EI这两个检索系统评定科技论文和科技期刊的质量标准方面相比之下较为宽松

查找某学科有哪些三大索引的源刊物、数据库、英文全称、简称、中文

(1)ScienceCitationIndexExpanded(简称SCIE)科学引文索引扩展版,收录全球自然科学、工程技术、临床医学等领域内170多个学科的8,600多种有影响力的学术刊物,数据可回溯至1900年。

目前我馆订购的是1999年以来的数据。

数据库每周更新。

(2)SocialScienceCitationIndex(简称SS

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 高中教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1