医学信息检索习题及答案.docx
《医学信息检索习题及答案.docx》由会员分享,可在线阅读,更多相关《医学信息检索习题及答案.docx(29页珍藏版)》请在冰豆网上搜索。
医学信息检索习题及答案
《医学信息检索》精品课程习题参考答案
单项选择题
1-5.BAADB6-10.CDACB11-15.CBABD
16-20.CDBBB21-25.CDACB26-30.CABCD
31-35.BAACC6-40.ABCAB41-45.CBBBD
46-50ACCAD51-55.ABDAA56-60.ABDCC
判断题
1-5×××√×6-10√√×××11-15√√××√
16-20√√××√21-25√×√××26-30×√√√√
填空题
1.知识、载体、记录、知识
2.图书、期刊、特种文献
3.零次文献、一次文献、二次文献、三次文献、零次、三次、二次、一次
4.知识性、传递性、效用性
5.顺排文档、倒排文档
6.组织、查找
7.相关文献
8.分类途径、主题途径
9.姓、名
10.and、or、not
11.截词符、0-n、后截断(或者前方一致截断、右截断)
12.组织、查找
13.自然语言障碍、专业语言障碍、检索语言障碍
14.类名
15.中图法
16.标题词法、单元词法、关键词法、叙词法
17.核心期刊
18.中国知网(中国知识基础设施工程)、维普(维普资讯)、万方(万方数据资源系统)
19.硕士学位论文、博士学位论文
20.综合性搜索引擎、专业性搜索引擎
21.独立式搜索引擎、元搜索引擎
22.检索词、运算符
23.词典、百科全书、年鉴、手册、名录等
24.类书、政书
25.在上次检索结果的基础上继续检索
26.TI、AB、AU、KW
27.出版年(PY)、文献类型(PT)、语种(LA)、标题(TI)、关键词(KW)、文摘(AB)、主题词(SU)、文摘(AB)、来源(SO)、著者地址(AD)
28.国际标准、国家标准、行业或专业标准,地区标准、企业标准、强制性国家标准、标准颁布时间
29.发明专利、实用新型专利、外观设计专利
30.Pubmed、protein、gene
31.社科版、科技版
32.标题、摘要
33.美国国立医学图书馆、医学主题词表(MeSH)
34.“Computernetwork”
35.误检、查准率
36.来源文献检索、引文检索
37.浏览检索、输词检索、化学物质名称检索、分子式检索
38.分子式检索
39.SCI、EI、ISTP
40.Title(题名)、Abstract(文摘)、Keywords(关键词)
名词解释
1.文献
文献是记录有知识的一切载体。
2.情报
情报是人们以各种方式传递与交流的具有一定目的与时效的信息,是人们为一定目的搜集的有使用价值的知识或信息。
3.信息
信息指物质存在或运动方式与状态的表现形式或反映,是现实世界事物的反应,它提供了客观世界的消息、知识,是事物的一种普遍属性。
4.索引
将文献中具有检索意义的事项(可以是人名、地名、词语、概念、或其他事项)按照一定方式有序编排起来,以供检索的工具书。
5.倒排文档
倒排文档就是把记录中一切可检字段或属性值抽出,按某种顺序重新加以组织后所得到的一种文档.倒排档从主文档中派生出来,所以,又叫做辅助文档.
6.信息检索
广义的信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术。
狭义的信息检索是指从信息集合中找到所需信息的过程。
7.信息素养
信息素养是指判断何时、何地需要信息,并有效地定位、获取、评价和利用信息的一系列能力的总和。
8.信息意识
信息意识又称信息观念,是人们对信息需求的自觉反映,即对信息的捕捉、分析、判断和吸
收的敏感性。
9.信息能力
是人们有效快速的获取、加工、存储、利用和传递信息的能力。
10.信息道德
是指在整个信息活动中,信息创建者、信息服务提供者和信息使用者所必须要遵守的社会法律法规和行为准则。
11.零次文献
是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等。
12.一次文献
指以作者本人的研究成果为依据而撰写并公开发表或出版的信息。
13.二次文献
是对一定范围、时间或类型的大量一次文献按其特征收集整理、压缩、加工,并按一定顺序组织编排、用于检索查找利用这些文献而编制的文献。
如书目、索引、文摘、题录、简介等。
14.三次文献
三次文献是在充分利用二次文献的基础上对一次文献做出的系统整理和概括的论述,并加以分析综合编写而成的概括性文献。
15.追溯法
查找文献的方法之一。
以某一文献后所附的参考文献为线索,逐一追查原文;再根据这些原文后的参考文献逐渐扩大线索,不断追查下去,获得相关文献的方法。
用追溯法查找文献可以以各种引文索引为工具,也可利用述评、总结性文章后面的参考文献。
一般在没有适用的检索工具或检索工具不完备的情况下,利用追溯法可获得一批相关文献。
16.主题词
是以自然语言为基础,以概念组配为基本原理,并经过规范化处理,表达主题的最小概念单元,作为信息存储和检索依据的一种检索语言。
17.关键词
关键词是出现在文献题名、文摘、正文中,能够表达文献主题,具有检索意义的语词。
18.叙词
所谓叙词,是指从自然语言中优选出来并经过规范化处理的术语,又称主题词。
19.搜索引擎
Internet上具有查询功能的网页的统称,即允许用户递交查询,检索出与查询相关的网页结果列表,并且排序输出。
20.元搜索引擎
通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。
21.数字图书馆
数字图书馆(DigitalLibrary)是用数字技术处理和存储各种图文并茂文献的图书馆,实质上是一种多媒体制作的分布式信息系统。
它把各种不同载体、不同地理位置的信息资源用数字技术存贮,以便于跨越区域、面向对象的网络查询和传播。
它涉及信息资源加工、存储、检索、传输和利用的全过程。
22.脱机检索
脱机检索是指检索者直接在计算机旁进行文献检索的一种方式,在此方式中,用户勿需利用终端和电讯网络直接与计算机联系,只需要把检索要求送往检索中心,由专职操作计算机的人员(即检索者)进行检索。
23.联机检索
用户借助通讯线路,通过终端设备同检索系统联机所进行的文献与数据检索
24.文件传送协议
FTP是filetransferprotocol的缩写,其功能是利用网络建立本地计算机同远程计算机之间的连接,相互传送信息。
FTP是共享网络信息资源高效率、使用频率相当高的工具。
25.默认检索
默认检索又称缺省检索、隐含检索,是指在检索系统预先设定的多个字段中进行检索。
26.查全率
查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。
查全率=【检出相关文献量/文献库内相关文献总量】×100%
27.查准率
查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。
查准率=【检出相关文献量/检出文献总量】×100%
28.字段
字段是组成记录的数据项。
书目数据库中的字段反映一篇文献的具体特征,如标题字段、著者字段、文献来源字段、主题词字段、关键词字段、文摘字段、语种字段等。
29.书目数据库
书目数据库是文献检索中最常见的一种数据库,它提供文献的各种特征,如文章的标题、作者、文献出处(刊名、年、卷、期、页码)、文章摘要、馆藏单位等。
30.专利文献
是实行专利制度的国家及国际组织在审批专利过程中产生的官方文件及其出版物的总称。
31.循证医学
循证医学(EvidenceBasedMedicine,EBM)是遵循科学证据的临床医学。
它提倡将临床医师个人的临床实践和经验与客观的科学研究证据结合起来,将最正确的诊断、最安全有效的治疗和最精确的预后估计服务于每位具体患者。
32.影响因子
某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。
问答题
1.答:
信息:
是事物存在方式、运动状态及其特征的反映,是事物发出的信号、消息。
知识:
是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。
文献:
记录有知识的一切载体
三者从概念范畴上看,信息大于知识大于文献,知识是信息的一部分,是理论化系统化的信息,文献是知识中记载下来的那部分。
2.答:
文献按载体形式的不同分为:
手写型文献,如甲骨文、金文
印刷型文献,如图书、期刊
缩微型文献,如缩微胶卷、缩微胶片
视听型文献,如录像带、录音带、科技电影
电子型文献,如数据库文献和网络文献
3.答:
文献按照加工程度不同分为零次、一次、二次和三次文献四种。
其中零次文献是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等;零次文献在作者的加工处理后公开出版进入社会流通领域就变成一次文献;根据一次文献的各种特征按照一定的规则和方法对其进行整理、加工、浓缩,后形成的文献就是二次文献;利用二次文献线索对大量的一次文献内容进行综合、分析、加工、提炼后形成的文献就是三次文献。
4.答:
在计算机检索中,缩小检索范围的方法包括:
(1)增加用and连接的检索词,或用“二次检索”
(2)用特定的副主题词进行限定
(3)用字段限定检索,如标题词检索、主题词检索、加权检索等
(4)进行文献类型、语种、重要期刊、临床核心期刊、年份等的限定检索
(5)进入更专指的分类范围内输词检索
5.答:
获取全文的方法包括:
(1)检索网上全文数据库
(2)利用网上出版社、杂志
(3)利用图书馆馆藏目录(馆藏联合目录)
(4)利用“网上全文传递服务”
(5)向著者索取
6.答:
常用的检索途径包括:
自由词检索、主题词检索、分类检索、著者检索、机构检索、引文检索、限定检索等
7.答:
信息检索的原理是:
将描述特定用户所需信息的提问特征,与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本一致的信息。
本质是用户的信息需求与存储在信息集合中的信息进行比较和选择,即匹配的过程。
8.答:
信息检索的步骤包括:
(1)分析检索课题,明确目的和要求
(2)选择合适的检索工具
(3)选择检索途径,确定检索标识。
(4)查找文献线索。
(5)浏览检索结果,获取原始文献。
9.答:
主题索引的排列规则如下
(1)整个索引按主题词字顺排
(2)同一主题词下按副主题词字顺排
(3)相关内容的文献题录分别纳入相应的主题词或者主题词/副主题词之下;一般总论性文献直接入主题词下,专指性文献入相应的副主题词下;同一文献题录可入多个主题词之下
(4)同一主题词或副主题词下的文献题录,先排列英文文献,后排列非英文文献,非英文文献的英译标题用"[]"括起,以示区别
(5)英文文献按刊名缩写字顺排
(6)非英文文献先按文种缩写字顺排,同一文种下按刊名缩写字顺排。
10.答:
第一组:
用代参照,用于处理词与词间的等同关系。
在MeSH词表中,对于多个同义词只采用其中一个比较科学而通用的词作规范化主题词,其它的词作为非主题词(即款目词)。
用“款目词see主题词”和“主题词X款目词”表示。
如:
CancerseeNeoplasmsNeoplasmsXCancer
第二组:
属分参照,用于处理词与词之间的等级关系,即整体与部分,上位概念与下位概念之间的关系。
如某些范畴较小的主题概念主题词,包含在某些范畴较大的主题词之下,内容范围较广的词是主题词,其下的内容范围较窄的词不作主题词,只作为次要主题词。
用“次要主题词seeunder主题词”和“主题词XU次要主题词”表示。
如:
HealthPrioritiesseeunderHealthPlanningHealthPlanningXUHealthPriorities从1991年开始取消此种参照关系,所有次要主题词升格为主题词。
第三组:
相关参照,用于处理词间的相关关系,达到扩大检索,提高查全率的目的。
用“主题词seerelated主题词”和“主题词XR主题词”表示。
如:
PopulationControlseerelatedFamilyPlanningFamilyPlanningXRPopulationControl
为提高查全率和方便检索,MeSH词表于1991年和1992年又先后增设了“还应考虑参照(consideralso)”和“主题词/副主题词组配参照”。
11.答:
书目数据库、事实数据库、数值数据库、全文数据库、图像数据库
12.答:
选择主题词的扩展功能可以同时检索主题词和它的所有下位词,这样就可检出用所选主题词和更专指主题词标引的所有文献,可以更好的提高检索的查全率。
不扩展的情况下只会检出用所选主题词标引的文献,不会检出它的下位词,即那些更专指主题词标引的文献。
13.答:
查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。
查全率=【检出相关文献量/文献库内相关文献总量】×100%
查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。
查准率=【检出相关文献量/检出文献总量】×100%
查全率与查准率是呈互逆关系的。
要想做到查全,势必会要对检索范围和限制逐步放宽,则结果是会把很多不相关的文献也带进来,影响了查准率。
企图是查全率和查准率都同时提高,不是很容易的。
强调一方面,忽视另一方面,也是不妥当的。
应当根据具体课题的要求,合理调节查全率和查准率,保证检索效果。
14.答:
(1)影响查全率的因素
影响查全率的因素从文献存储上来看,主要有:
文献库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一致;标引人员遗漏了原文的重要概念和用词不当等。
此外,从情报检索来看,主要有:
检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟悉和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等。
(2)影响查准率的因素
影响查准率的因素主要有:
索引词不能准确描述文献主题和检索要求;组配规则不严密;选词及词间关系不正确;标引过于详尽;组配错误;检索时所使用检索词专指度不够,检索面宽于检索要求;检索系统不具备逻辑“非”功能和反馈功能;检索式中允许容纳的词数量有限;截词部位不当,检索式中使用逻辑“或”不当等。
15.答:
独立式搜索引擎的工作原理是:
定期运行搜索软件(或人工),搜集网络信息。
利用索引软件进行自动标引,建立数据库。
以Web页面形式向用户提供有关的信息资源导航、目录索引及检索界面,由用户输入检索式。
通过检索软件进行检索,匹配,按相关度排序输出。
16.答:
提高查全率的方法:
(1)降低检索词的专指度,选出一些上位词和相关词补充到检索式中。
(2)调节检索式的网罗度,减少逻辑“与”的组配面。
(3)进行族性检索,可采用分类检索,或用一组同义词、近义词和相关词,用“或”连接在检索式中。
(4)采用截词技术,取消某些限制过严的限制符。
17.答:
提高查准率的方法:
(1)提高检索词的专指度,换用专指度较强的规范词或自由词。
(2)增加“与”连接,进一步限定主题概念。
(3)限定检索词所在的可检字段,用位置算符控制检索词的词间顺序与位置。
(4)限制输出文献的外部特征,如限制年限、语种、文献类型等。
(5)用逻辑“非”限制与提问不相关的文献的输出。
(6)用主题词检索,不用或少用自由词检索。
18.答:
依据专利法保护对象分三种类型:
发明专利、实用新型专利、外观设计专利
发明专利,是专利法主要的保护对象。
发明专利权有效期各国不同,我国为自申请之日起20年。
实用新型专利,在我国实用新型专利权有效期为自申请之日起10年。
外观设计专利,在我国外观设计专利权有效期为自申请之日起10年。
19.答:
信息检索系统的构成包括:
(1)检索文档,即文献检索标识的有机集合。
(2)技术设备,即能存储信息及其标识,并实现存储和检索操作的各种技术设备。
(3)作用于系统的人如:
文献加工者、用户、系统维护人员、管理人员。
(4)检索工具如:
检索语言、文献标引规则、输入输出标准等。
20.答:
顺序文档(Sequentialfile)是以文献记录作为信息存储单元,按文献记录入藏的存取号从小到大顺序排列而形成的目录式文档,由于它存储有关于每篇文献的最完整信息,所以通常又把它称为主文档(MasterFile),相当于印刷型检索工具的正文部分。
倒排文档(Invertedfile)就是把记录中一切可检字段或属性值抽出,按某种顺序重新加以组织后所得到的一种文档。
倒排档从主文档中派生出来,所以,又叫做辅助文档。
21.答:
获取网络信息资源的主要工具包括:
(1)电子邮件
(2)FTP
(3)Archie
(4)Telnet
(5)Gopher
(6)Usenet
(7)www浏览器
(8)搜索引擎
22.答:
少数刊载某一学科大量高质量专业论文的期刊称为核心期刊,其主要特点为:
(1)刊载专业文献密度高,信息含量高;
(2)水平较高,代表本学科的最新发展水平;
(3)出版相对稳定,所载文献寿命较长;
(4)利用率和被引率较高。
23.答:
搜索引擎是Internet上具有查询功能的网页的统称,即允许用户递交查询,检索出与查询相关的网页结果列表,并且排序输出。
根据检索内容分为:
综合性搜索引擎和专业性搜索引擎;
根据检索功能分类:
目录式搜索引擎、全文式搜索引擎、智能式搜索引擎;
根据检索范围分类:
独立搜索引擎和元搜索引擎。
24.答:
会议文献是指各种科学技术会议上所发表的论文、报告稿、讲演稿等与会议有关的文献。
会议文献的主要特点是:
传播信息及时、论题集中、内容新颖、专业性强、质量较高,数量较大,出版类型多种多样,往往代表某一学科或专业领域内最新学术研究成果,基本上反映了该学科或专业的学术水平、研究动态和发展趋势。
会议文献是科技查新中重要的信息源之一。
国外会议论文检索工具包括:
ISI的Proceedings(ISTP+ISSHP);PapersFirst(OCLCfirstsearch的一个子库);IEEE/IEEElectronicLibrary;AIPCofferenceProceedings
国内可以进行会议论文检索的系统包括:
中国学术会议论文全文数据库(万方数据);中国重要会议论文全文数据库(CNKI)
25.答:
缩小检索范围的方法包括:
(1)提高检索词的专指度,换用专指度较强的规范词或自由词。
(2)增加“与”连接,进一步限定主题概念。
(3)限定检索词所在的可检字段。
(4)用位置算符控制检索词的词间顺序与位置。
(5)限制输出文献的外部特征,如限制年限、语种、文献类型等。
(6)用逻辑“非”限制与提问不相关的文献的输出。
(7)用主题词检索,不用或少用自由词检索。
26.答:
Pubmed和MEDLINE的区别主要体现在:
(1)文献的收录范围:
Pubmed除了收录MEDLINE数据库之外,还收录了PREMEDLINE数据库,以及出版商直接提供给Pubmed的数据。
(2)数据库的更新时间:
MEDLINE联机数据库为周更新,MEDLINE光盘的报道时差为1-3个月,而Pubmed为每天更新
(3)检索机理:
MEDLINE的检索途径只有两个主题和作者,掌握Mesh表是检索的首要条件,而Pubmed具有词汇自动转换匹配功能和主题词自动扩展功能。
(4)连接功能:
Pubmed具有与原文链接、相关文献链接、相关图书链接、相关分子生物学数据库链接的功能
(5)免费全文:
Pubmed提供超过60中期刊的免费全文浏览和检索功能。
(6)费用:
MEDLINE光盘需每年租赁数据库,Pubmed免费。
27.答:
专利文献是实行专利制度的国家及国际组织在审批专利过程中产生的官方文件及其出版物的总称。
专利文献具有以下特点:
(1)专利文献集技术、法律和经济信息于一体,是一种数量巨大、内容广博的战略性信息资源;
(2)利文献传播最新技术信息;
(3)专利文献的格式统一规范,高度标准化,并且具有统一的分类体系,便于检索、阅读;
(4)专利文献对发明创造的揭示完整详尽,技术内容相对可靠。
28.答:
查找“乙型肝炎的流行病学”的文献可选用的中文检索系统包括:
CNKI、维普、万方、CBM等,
可选的外文检索系统包括:
MEDLINE、Pubmed、EDSCO、springerlink、OpenAccess等其中,在CNKI中的检索策略为:
检索项:
篇名;检索词:
乙型肝炎;逻辑:
或者
检索项:
篇名;检索词:
乙肝;逻辑:
并且
检索项:
主题;检索词:
流行病学
在CBM中的检索策略为:
肝炎,乙型/[扩展全部树]流行病学
29.答:
可以选用的检索系统包括:
图书馆联机检索系统、超星数字图书、书生数字图书馆
30.答:
可在下列语法中任选5个举例
(1)“link”运算符:
查找与某一特定网页建立链接的所有网页,亦可在高级检索模式下实现
(2)“related”运算符:
自动查找与某一网页处于同一级别的相似网页,亦可通过高级检索模式及检索结果界面的“类似网页”实现
(3)“info”运算符:
可获取Google库存的有关某一网页的全部信息
(4)“site”运算符:
将检索结果限制在某一网域中,也可以通过高级检索界面的“网域”选项来
(5)“Allintitle”运算符:
要求提问词全部在网页标题中出现
(6)“allinurl”运算符:
要求提问词全部在URL中出现
(7)“inurl”运算符:
要求提问词部分在URL中出
(8)“filetype:
”运算符是Google开发的非常强大实用的一个搜索语法。
后面接文档类型,可限制获取某一文档类型的网页,后可接文献类型举例。
31.答:
有四种
“基本检索”中的著者检索有三种方式:
一是在“检索入口”下拉彩旦中选择“作者”字段,然后在检索提问框内输入著者姓名;
二是直接在检索提问框内输入著者姓名,后加“inau”;
三是直接在检索提问框内输入“au=”,后跟著者姓名,
“作者检索”方式:
直接在检索提问框内输入著者姓名。
32.依据按质量和可靠程度大体可分为以下五级(可靠性依此降低):
一级:
按照特定病种的特定疗法收集所有质量可靠的随机对照试验后所作的系统评价或Meta分析;
二级:
单个的样本量足够的随机对照试验结果;
三级:
设有对照组但未用随机方法分组的研究;
四级:
无对照的系列病例观察;
五级:
专家意见或基于生理、病理生理和基础研究的证据。
33.答:
可以检索引文的数据库有:
(任写以下6种均可)
(1)SCI
(2)SSCI
(3)H&ACI
(4)《中国科技论文与引文数据库》(CSTPC)
(5)《中国科学引文数据库》
(6)《中文社会科学引文索引》
(7)《中文科技期刊引文数据库》
(8)中国知识基础设施工程中的中国引文数据库
(9)《中国生物医学文献数据库》
选择题:
1.关于信息的说法错误的是()