文献检索总结.docx
《文献检索总结.docx》由会员分享,可在线阅读,更多相关《文献检索总结.docx(52页珍藏版)》请在冰豆网上搜索。
文献检索总结
信息资源分类:
简述文献分类依据
一、不同载体类型
1.印刷型:
利用纸张为存储介质,以手写、印刷为记录手段而产生的文献。
包括图书、期刊、专利文献等。
2.缩微型:
是以感光材料为存储介质,利用缩微照相技术使文献缩微化的文献。
缩微胶片、平片、胶卷。
3.视听型:
以磁性或感光材料为存储介质,利用特定的设备及技术,直接记录声音、图像信息的文献。
录音带、录像带、电影胶片
4.机读型:
以电子数据的方式将图、文、声、像等信息存储在磁光介质上,通过网络通信、计算机或类似设备再现的信息资源。
电子期刊、图书、数据库
二、按出版类型(填空)
1.图书:
内容比较成熟、系统、可靠的出版物,是学习和参考的主要信息源。
国际标准书号(ISBN)
2.连续出版物:
有固定名称和连续卷号、期号的定期出版物。
所含信息量大、新颖,是科研工作主要信息源。
期刊、报纸、年度出版物
期刊:
ISSN(国际标准刊号)
核心期刊:
是指某一学科中高水平、高影响力的期刊
3.特种文献(类型):
其它文献资料出版物的总称,信息全面、密度高,一般图书馆不做重点收藏。
专利文献、标准文献、学位论文、科技报告、会议文献、政府出版物、档案资料、产品资料
三、按加工程度
1.零次文献:
指未经公开发表或未交流于社会的文献。
如:
私人笔记、设计草图、实验记录、论文草稿、会议记录等
2.一次文献:
原始创作:
记录科研活动,报道新技术、新发明、新见解的文献。
指以著者本人的研究成果为依据而创作或撰写,并通过某种渠道而公开的文献。
如:
期刊论文、科技报告、会议论文、学位论文等(填空)
3.二次文献:
书目文献:
收集整理一次文献而形成的索引、目录、摘要等
指对一次文献进行浓缩、整序及加工处理而形成的报道性与检索性文献。
如:
各种检索工具
4.三次文献:
高级信息产物:
综合分析研究大量一次文献,浓缩提炼而成的文献。
指从一次文献中提取数据、事实和有关结论,并经过综合分析与重新组合而编写的文献。
如:
参考工具书、述评、综述、进展报告等。
关系:
零次文献是文献的毛坯、一次文献的素材;一次文献是检索的对象、知识的第1次加工、具创造性;二次文献是检索的工具、知识的第2次加工、具有序性;三次文献是检索的对象和工具、情报研究的成果、具创造性和有序性
四、网络信息资源:
通过计算机网络可以利用的各种信息资源的总和
网络资源类型:
网络搜索引擎:
Google,Medscape
联机馆藏目录:
OPAC(联机公共目录检索系统)
数据库资源:
CBM,cnki,Medline,PubMed
电子出版物:
电子期刊,电子图书
参考工具:
牛津大词典,网际金典
网络动态信息:
E-Mail,BBS,NewsGroup
人作用于信息和信息作用于人
一次文献(原始文献)=情报源
二次文献(检索工具)=情报线索
三次文献(综述专著)=高级情报产物
零次文献(作者原始创作阶段)
中国图书馆分类法
是我国目前统一使用的分类法,其分类号由字母与数字组成,共分为22个大类,R类为医药卫生类,共有17个二级类目,按概念间的隶属关系进行排列
信息检索的作用:
知识更新、继续教育;贯穿科研始终,是其重要组成部分;决策作用;节约时间、精力、金钱。
信息检索的原理:
是指通过一定的方法和手段,使信息存储与检索两个过程所采用的特征和标识达到一致,以便有效地获取和利用文献。
◎存储过程--对文献进行标引
◎检索过程--根据需求,确定提问式
三、信息检索语言(Retrievallanguage)
(一)检索语言的定义:
(填空)
用以描述文献信息特征,表达检索需求的一种专门的人工语言,是联系标引人员与检索人员的桥梁。
根据文献信息检索的需要而创制的人工语言。
(检索语言、文献存储与检索语言、标引语言、索引语言等)检索语言是一种在文献存储和检索过程中共同使用的语言。
它的用途是描述文献特征,表达情报提问,并使两者能相互沟通。
(二)检索语言的种类
描述信息特征
外部特征:
题名、著者、序号、引文
内部特征:
分类、主题、代码(分子式)
规范性----受控语言or自然语言
非规范化:
标题、关键词、文本词
规范化:
分类、叙词(主题词)
分类检索语言(Classificationlanguage):
按学科、专业集中文献,从知识分类的角度揭示多种不同文献在内容上的区别和联系,提供以学科分类为出发点的文献信息检索途径。
(美国国会图书馆图书分类法、杜威十进分类法、国际十进分类法、中国图书馆分类法、国际疾病分类等)
分类语言的特点:
体现学科系统性;反映事物间的从属、派生、平行等隶属关系
分类号使用数字/字母有序排列;从上到下,从总体到局部,等级分明
分类语言的缺点:
不易分类;文献分散;不能反映新概念;检索不够灵活
主题检索语言(Subjectlanguage):
以反映文献内容的主题词或关键词作为文献存储和检索的标识。
叙词法:
严格规范化、可进行概念组配、具有完善参照系统、具有范畴索引等;
关键词法:
以出现在文献的标题、摘要或全文中能表达文献实质内容的词或关键性专业名词术语作为检索标识。
主题检索语言
以语词作为检索标识来表达各种概念、并按字顺组织起来的一种检索语言。
具有专指性、直接性的特点
根据表达概念的不同分为:
标题词语言(篇名词);关键词语言;叙词语言(主题词)
单元词语言(自由词、文本词)
主题语言的特点:
直接揭示文献的内容特征;按照字顺编排,检索方便;文献集中;表达新概念;
叙词语言最具代表性
主题语言的类型:
文本词(自由词)
摘要词
关键词:
能表达文献主要内容的词汇或术语,未经过规范化处理。
标题词(篇名词)
主题词(叙词):
能表达文献的实质内容,经过规范化处理的名词术语。
Eg:
肿瘤
关键词:
cancer,carcinoma,tumor,neoplasm……
主题词:
neoplasm
叙词(主题词)的特点
词语与概念唯一对应
可组配副主题词增加专指性
采用参照系统揭示词间关系
有主题词分类索引(TreeStructure)
内容与规则构成一部主题词表(MeSH)
医学主题词表—MeSH
美国NLM出版,相当于一部医学检索词典,用于指导医学检索工具的主题标引和检索,是规范标引用词和检索用词的工具。
目前,MeSH使用的主题词约26853个,副主题词83个。
主要结构:
字顺表—把主题词、款目词、副主题词按英文字母顺序排列而成
树状结构表—按主题词的词义范畴和学科属性分类编排,解释主题词间的上下隶属关系,进而控制检索范围。
代码检索语言(Codelanguage):
用代表事物的代码作为标识系统的索引语言。
(化合物分子式索引、环状化合物环系索引、化学物质号索引等)
第四节信息检索基础
一、检索工具
检索工具的定义
根据一定的目标,将有关的文献按一定的检索语言标引在一定的载体上以一定的结构顺序组织起来,并提供一定检索方式的工具(或系统)。
是搜集报道、存贮和查找文献线索的工具。
检索工具的作用:
存储作用、检索作用、报道作用、交流作用
检索工具的特点
收录内容的有限性、报道信息的时滞性、标引深度的有限性
收摘一次文献、著录文献特征、多种检索手段
检索工具的类型(简答)
印刷型:
目录、索引、文摘
电子型:
书目型、事实型、全文型、多媒体型
按编制方式分:
目录、题录或索引、文摘、全文
检索工具的结构
印刷型:
说明、正文、辅助索引、附录
电子型:
文档、记录、字段
检索工具的要求
收录全面,标引准确,检索途径多,更新迅速,使用方便
检索工具的评价(简答):
收录范围广,文献报道量大,摘储率高
标引质量高,标引深度高,检索语言使用得当
检索途径多,著录程度详;文献时差短、使用方便
检索途径(检索入口)
是指检索文献信息的出发点和路线,是在使用不同检索语言有序存储信息的同时形成
已知项检索:
书名、刊名、作者
未知项检索:
主题词、分类号、关键词
检索标识(检索词)
是指能表达检索课题主题概念和信息需求的名词术语、分类号、名称及代码等的总称,它与检索途径相对应,是检索途径的具体化。
包括主题词、关键词、分类号、专利号等
二、检索途径与检索标识(填空)
篇名途径:
文献篇名中的名词术语
主题途径:
规范化的主题词
分类途径:
学科分类号或类目名称
关键词途径:
文献的关键词
著者途径:
著者姓名或机构名称
引文途径:
被引文献
著者地址:
著者地址或机构名称
刊名途径:
期刊全称或简称中的词汇
序号途径:
文献的各种代码,如专利号、ISSN号、化学物质登记号等
其他检索途径:
如分子式、药物名称等
三、检索步骤
分析拟检课题,明确检索要求
选择检索工具,确定检索方法
确定检索途径和检索标识
构建检索策略
修正检索策略
获取原始文献
检索效率:
检索结果的有效程度,是对检索结果好坏的评价。
指全、准、快、便、省地查阅文献(检全率、检准率、检索速度、检索方便性、检索成本与效益)。
主要是全、准。
评价指标:
查全率查准率
影响因素:
检索策略制定、检索系统和工具、检索途径和标识、检索技能等
检全率(Recallratio,R):
指系统在进行课题检索时,检出的相关文献量与系统文献库中的相关文献总量的比率。
衡量全面性。
查全率=[检出相关文献量/相关文献总量]*100%
检准率(Pertinencyratio,p):
指系统在进行课题检索时,检出的相关文献量与检出文献总量的比率。
衡量准确性。
查准率=[检出相关文献量/检出文献总量]*100%
A检准的文献C漏检的文献B误检的文献D无关的文献
R检全率=A/(A+C)O漏检率=C/(A+C)
P检准率=A/(A+B)N误检率=B/(A+B)
决定检索效率的因素:
检索语言的质量、标引质量、检索质量、检索用户的水平
影响检索效果的因素
客观:
文献的收录是否全面
文献的标引水平
检索途径的多少
检索系统功能:
逻辑组配、扩展、加权
使用方便性
主观:
专业检索人员的知识水平、认真程度和责任心
用户对检索系统的认识能力
外语水平
计算机检索的特点
检索速度快,效率高
提供多条检索途径
采用灵活的逻辑运算
范围广泛,容易查全
更新迅速,内容新颖
可拷贝获得大量信息
数据库的类型
书目数据库(Bibliographicdatabase)
数值数据库(Numericdatabase)
全文数据库(Full-textdatabase)
事实数据库(Factdatabase)
超文本数据库(Hypertextdatabase)
数据库检索途径与检索标识
词语(Text,Abstract,KeyWord,Title)
主题词(SubjectHeadings,Descrptor)
分类(Classification)
著者(Author)
机构及地址(Institution,Address)
刊名(JournalName)
其它引文,ISSN,记录号……
数据库选择依据
收录范围:
年代、学科、文献类型
检索途径:
常用途径、特殊途径、必要途径
工具质量:
标引深度、准确性、著录格式
更新速度:
更新及时、时差短、信息新
使用方便:
网络、免费、下载
计算机检索技术
计算机检索的查寻过程实际上就是将用户的检索提问与数据库的检索标识相比较决定取舍的过程,两者比较结果相一致者即为命中。
命中的中间结果可以再次与新的提问式相比较匹配。
一个检索课题通常经过如此多次的修饰匹配检索,直至最终命中检出的文献符合用户的需求。
在这个查寻过程中,主要采用以下几种基本检索技术。
布尔逻辑检索(Booleansearching)
截词检索和通配检索(Truncation&wildcard)
字段限制检索(Limitsearching)
加权检索
扩展检索与缩小检索
布尔逻辑检索(Booleansearching)
布尔逻辑符的运算顺序:
NOT>AND>OR
可用括号改变运算顺序:
如:
(利福平or异烟肼)and肺结核=利福平and肺结核or异烟肼and肺结核
截词检索(Truncationsearching)
截词检索(Truncationsearching)把检索词截断,取其中的一部分片段,再加上截词符号一起检索,计算机按照词的片段与数据库里的索引词对比匹配,凡包含有这些词的片段的文献均被检出。
在不同的检索系统里用不同的符号,有问号?
、星号*、井字符#等。
截词方式有右(后)截词、左(前)截词和中间截词(插入)截词三种。
右(后)截词是使用最多的一种截词检索方式。
Immun*ImmuneImmunifactionImmunology
Child*childrenchildhoodchildlike…
通配检索:
Wildcardsearching
对拼法稍异的词汇进行检索
如:
Wom?
nWomanWomen
用以上两种检索可以避免漏检,提高检全率,另一方面也避免了多次输入的麻烦
限定检索(Limitsearching)
是缩小或约束检索结果的方法,最常用的是对特定字段的限定检索。
限制符多为:
in、=、[]
选择限定内容:
不同字段、研究对象、文献类型、出版日期、语种、数据库子文档
使用限制符:
In(模糊限制)eg:
Heartinti(篇名)山西in地址(ad)
=(精确限制)eg:
LA=Chinese(语种)PY=2000-2004(年限)
加权检索
是针对主要主题词或篇名主题词的检索,可命中核心概念的文献,提高查准率。
CBMDisc:
□加权检索
PubMed:
□RestrictSearchtoMajorTopicheadingsonly
OVID:
□Focus
扩展检索:
将某概念及其下位概念内容的文献全部检出的技术方法。
可提高检全率。
初始设定的检索范围太小,命中文献不多,需要扩大检索范围时用。
主要有:
概念的扩大,增加同义词,年代的扩大
缩小检索:
又称二次检索,指开始的范围太大,命中文献太多,或查准率太低,需要增加查准率的一种方法。
主要有:
概念的缩小,语种的限定,特定期刊的限定等
第二章中文信息检索
中国生物医学文献服务系统(SinoMed)
SinoMed介绍
由中国医学科学院医学信息研究所/图书馆开发研制,于2009年推出。
数据库特点:
资源丰富、中西兼有;深度加工、数据规范;功能强大、方便易用。
中国生物医学文献数据库注重数据的规范化处理和知识管理,全部题录均根据美国国立医学图书馆最新版《医学主题词表》、中国中医研究院中医药信息研究所《中国中医药学主题词表》,以及《中国图书馆分类法·医学专业分类表》进行主题标引和分类标引。
覆盖数据库
中国生物医学文献数据库(CBM)
中国医学科普文献数据库
北京协和医学院博硕学位论文库
西文生物医学文献数据库(WBM)
日文生物医学文献数据库
俄文生物医学文献数据库
英文会议文摘数据库
英文文集汇编文摘数据库
中国生物医学文献数据库(CBM):
收录1978以来1600余种中国生物医学期刊,以及汇编、会议论文的文献题录530余万篇,全部题录均进行主题标引和分类标引等规范化加工处理。
学科范围覆盖基础医学、临床医学、预防医学、药学、中医学和中药学等生物医学各领域。
中国医学科普文献数据库:
收录2000年以来国内出版的医学科普期刊近百种,文献总量8万余篇,重点突显养生保健、心理健康、生殖健康、运动健身、医学美容、婚姻家庭、食品营养等与医学健康有关的内容。
每月更新。
北京协和医学院博硕学位论文库:
收录1981年以来协和医学院培养的博士、硕士研究生学位论文,学科范围涉及医学、药学各专业领域及其他相关专业,内容前沿、丰富,可在线浏览全文。
每季更新。
2.1跨库检索-简单检索
检索步骤:
①选择多个数据库;
②输入检索词或构建逻辑组配检索式;
③点击“检索”按钮,检索完成;
④选择检索结果进行浏览。
检索入口
即检索字段,用于限制检索的范围。
SinoMed根据各个数据库的特点,对常用检索字段进行组合后设置了“缺省字段”检索入口。
其中在中国生物医学文献数据库(CBM)和中国医学科普文献数据库中,缺省字段包括中文标题、摘要、作者、关键词、主题词和刊名。
在北京协和医学院硕博学位论文库中则包括中文标题、中文摘要、研究生姓名、导师、关键词、主题词
2.2单库检索:
中国生物医学文献数据库(CBM)
高级检索
常用字段:
在中国生物医学文献数据库(CBM)中,是中文标题、摘要、关键词、主题词的组合。
智能检索:
自动实现检索词及其同义词(含主题词)的同步扩展检索。
精确检索:
是检索结果等同于检索词的一种检索,适用于关键词、主题词、作者、刊名等字段
限定检索:
可以方便您限定文献的年代、文献类型、年龄组、性别、研究对象等。
CBM高级检索步骤:
1、分析课题
2、确定检索词或检索式
3、选择检索入口,输入检索词或检索式
4、根据需要,调整检索策略
CBM主题检索
主题词的概念和优点:
*利于提高查全率和查准率。
*主题检索可用中文主题词、英文主题词及同义词进行查找,可浏览主题词注释信息和树形结构,帮助您确定恰当的主题词。
*通过设置是否加权、是否扩展、选择合适的副主题词,使检索结果更符合您的需求。
主题检索的功能:
将非主题词引见到主题词形式
提供主题词的定义和注释
显示主题词之间的族性关系(上位词、下位词、同位词)
主题词的加权检索:
主题词“加权”表示主题词的重要程度,反映文章论述的主要内容。
加权主题词用“*”表示
加权检索表示仅对加星号(*)主题词(主要概念主题词)检索,非加权检索表示对加星号主题词和非加星号主题词(非主要概念主题词)均进行检索。
如何寻找合适的主题词:
1、用上位词或倒置
创伤性休克---休克,创伤性
病毒性肝炎---肝炎,病毒性
2、多用几个自由词查找
先天/髋关节/脱位---髋脱位,先天性
3、用关键词先试行检索,“抛砖引玉”找到适用的主题词。
AIDS、艾滋病---获得性免疫缺陷综合症
扩展检索
指对当前主题词及其所有下位主题词进行检索,非扩展检索则仅限于当前主题词的检索。
CBM分类检索
可通过分类号和分类名进行检索,也可通过分类导航逐级浏览。
优点:
族性检索
类名检索
类号检索
CBM期刊检索
可通过选择刊名、出版地、出版单位、期刊主题词或者ISSN等检索入口直接查找期刊。
也可通过“分类导航”或“首字母导航”逐级查找浏览期刊。
CBM作者检索
检索步骤:
输入作者姓名,勾选“第一作者”后即指定为第一作者查找;
显示命中作者的信息列表,勾选“第一作者”的用户可继续第三步,查看选中作者在系统中的单位分布;
显示选中作者在系统中的单位分布;
请用户根据实际需求对作者单位进行选择,可多选。
链接检索
作者链接:
点作者,检索该作者发表的文献。
期刊链接:
点期刊名称,检索该期刊收录的所有文献。
点期刊卷期,检索该期刊该期收录的文献。
关键词链接:
点关键词,在缺省字段检索该词。
特征词链接:
点特征词,在特征词字段检索该词命中的文献。
主题词和副主题词链接:
点主题词,对该主题词标引的所有文献进行检索。
点副主题词,仅检索该主题词与该副主题词组配的文献。
相关文献链接:
点“主题相关”,按照内置算法检出与该篇主题内容相关的文献;点“参考文献”,显示该篇文献的参考文献。
3个性化服务:
我的空间
我的检索策略——可用于定期跟踪某一课题的最新文献。
我的数据库
用于在检索过程中随时保存检索结果,供再次查阅或索取原文。
可通过“标题”、“作者”、“标签”三个字段在数据库中查找有关文献。
用户根据需要可添加“标签”或“备注信息”。
“我的数据库”最多保存500条记录,每页显示50条记录。
第四章PUBMED
什么是PubMed?
生物医学研究领域应用最广泛也最重要的数据库,由美国国立卫生研究院(NIH)下属的美国国立医学图书馆(NLM)的国家生物技术信息中心(NCBI)开发、维护。
面向全世界免费提供最新的生物医学信息。
、
一、数据库概况
收录学科内容
主要收录生物医学和健康科学以及生命科学相关领域的文献。
包括行为科学、健康专业所需要的化学、生物工艺学,基础研究和临床、护理、公共卫生、卫生政策发展或相关教育活动的内容。
2000年起增加了生物、环境科学、海洋生物、植物和动物学、生物物理学和生物化学等生命科学方面的研究内容。
PubMed的收录范围---13个子数据库
收录全世界80多个国家5200多种生物医学期刊的文摘及题录数据
绝大部分可回溯至1948年,最早回溯至1865年(1809至今)
全球80多个国家和地区;5700余种生物医学期刊;涉及40多个语种
47%为美国本土出版文献,90%为英文文献,79%的文献有著者撰写的英文文摘
部分文献可直接获取全文,包括:
PubMedCentral(PMC,收录期刊780余种):
NLM开发的免费生物医学数字化期刊全文数据库
开放获取(OpenAccess,OA)期刊
部分出版商提供的免费文献
与出版商的电子期刊文献同步发布,标注为[Epubaheadofprint](先于印刷版期刊发表的电子文献)或Epub
PubMed的记录来源
Medline:
PubMed主体部分[PubMed-indexedforMEDLINE]
In-processcitations:
尚未进行MeSH主题词标引的最新文献[PubMed-inProcess]
Publishersuppliedcitations:
出版商提供,但不被Medline收录的文献[PubMed-assuppliedbypublisher]
OLDMEDLINE:
部分1966年以前出版且未被MEDLINE收录的文献[PubMed-OLDMEDLINE]
Pubmed与Medline区别
⑴广泛的链接:
包括①其它功能链接,如帮助功能、期刊数据库、主题词表等;②检索结果显示链接,有全文、文摘、相关文献等链接;③NCBI其它数据库的链接,如PMC(Pubmed生物医学期刊)、OMIM(人类孟德尔遗传数据库)、Genome(基因组数据库)等;
⑵收录更加广泛:
Pubmed包括了Medline数据库在内的13个数据库,如AIDS、CANCER、OLDMEDLINE等,其中包括Medline未能收录的许多生命科学方面的期刊论文,如天体物理学、化学等领域的期刊中有关生命科学方面的论文。
从2003年9月30日起,Pubmed文献记录回溯至1953年,比前增加了150万条记录;
⑶更新及时:
pubmed时效性要强于medline。
出版单位以电子版形式向NLM提供已经或将要出版的文献书目数据,每周增添新的内容,比光盘版Medline数据库更加及时。
⑷Pubmed具有更强的检索功能,提供检索词自动转换功能(AutomaticTermMapping):
能获得部分期刊全文
查全率:
同一的检索课题从pubmed查的结果要