医学文献检索课件复习.docx
《医学文献检索课件复习.docx》由会员分享,可在线阅读,更多相关《医学文献检索课件复习.docx(26页珍藏版)》请在冰豆网上搜索。
医学文献检索课件复习
第一章文献检索基础本章要点
1.1文献信息的基本概念1.2文献的类型和级别1.3医学文献的分布规律
重点印刷型文献出版类型的识别方法电子文献的文件格式和主要类型文献信息的时间、地区和学科分布规律
1.1.1信息、知识、情报和文献以及相互关系信息无时无处不在,与人类发展历史须臾不可离,从结绳记事到人上月球,从日常生活到科学研究,人们都在自觉不自觉地利用信息。
信息概念首先是由C.E.香农提出来的,有关信息的确切定义,目前不下数十种。
信息(Information)是人体感官对事物存在或运动状态及其特征的反应。
客观性可识别性无限性共享性知识(Knowledge)是系统化的信息,是人类不断接受信息经过大脑加工得出的经验或总结。
知识是人类对信息加工后的结果,是信息中的精华。
据统计,近十年人类在科学技术上的新发明、新创造比过去2000年的总和还多。
每年发表的科学论文有500万篇,平均每天1.3万篇。
19世纪时,科学定律的知识数量一百年增长了一倍,到20世纪60年代中期以后,五年就增加了一倍。
医学知识属于自然科学范畴,是人们长期与疾病作斗争的反复实践中所累积起来的经验之结晶。
例如:
1862年俄国生理学家谢切诺夫发现刺激青蛙的丘脑能抑制屈肌反射以及脊髓中的其它反射这类中枢抑制现象,其后出版了《大脑反射》一书。
情报意识:
是指人们在充分认识情报信息价值的基础上,对其所具有的特殊敏感的一种自觉意识。
意识来源于对情报信息的需求。
有了这种需求,才能促进情报意识的增强。
情报(Information)钱学森说:
情报就是为了解决一特定问题所需要的知识,是激活了、活化了的知识,以及这种知识的及时性和针对性。
基本属性:
①知识性②传递性③效用性
文献(Literature)我国国家标准GB4898-85把文献定义为“记录有知识的一切载体”。
构成文献的四要素:
①记录②知识③载体④手段
医学文献记录了千万医学工作者研究人类生命过程、同疾病斗争的科学知识。
信息、知识、情报、文献之间的关系:
信息>知识>情报
第二节文献的类型和级别1.2.1按载体形式区分
印刷型文献(printedform)各种印刷品,如:
正式出版的图书、报刊及杂志等。
缩微型文献(microform)是以感光材料为载体,以光学缩微技术为记录手段而产生的一种文献形式。
视听型文献(audio-visual)又叫视听资料。
是以磁性、感光材料为载体,直接记录声音、图像而形成的一种文献。
数字化文献(electronicform)以数字的形式存贮在光盘、磁盘和U盘等介质上,并通过计算机阅读和利用。
如:
光盘、磁盘和U盘等。
1.2.2按出版形式分
图书(Book)是指论述或总结某一学科或知识领域的出版物,指一定页数的印刷品。
国际标准书号(ISBN)按照联合国教科文组织(UNESCO)和国际标准化组织(ISO)规定,49页不包括封面与扉页。
48页或少于48页的小书被称为小册子。
期刊(journal,periodica,serrial)是指有固定名称、统一出版形式和一定出版规律的定期或不定期的连续出版物。
会议文献(conferencepaper)指在国际和国内重要的学术或专业性会议上宣读发表的论文或报告。
学位论文(Dissertation)学位论文是高等院校、科研单位的研究生为申请硕士、博士学位而提交的学术论文。
政府(组织)出版物(Governmentublication):
指各国政府部门及其所属机构所颁发出版的文献专利文献(Patent)是依法公开的出版物,是发明创造的精华,囊括专利技术、法律和经济三大重要信息源。
具有新颖性创造性和实用性,是一种可靠的信息源。
专利文献指专利说明书和发明人证书。
标准文献(StandardLiterature)有标准号,通常由国别(组织)代码+顺序号+年代组成(如ISO3297-1986)。
国家标准分为强制性的国标(GB)和推荐性的国标(GB/T)。
1.2.3电子型文献的类型和区分“电子信息”是近几年报刊上频频出现的一个词,与印刷型文献一样其类型也十分繁杂。
按载体形态有:
软磁盘(FD)、只读光盘(CD-ROM)、可擦光盘(CD-RW)。
按电子格式有:
文本格式txt、doc、pdf、caj文件,图像格式gif、jpg及标记文件格式html和xml文件之分。
1.2.4文献的级次随着科学技术的发展,文献数量急剧增长,为了便于搜集、管理和利用文献,需要对文献进行加工整理。
按文献加工深度不同一次文献(primaryliterature)凡是以作者本人的工作及科研创作的原始论文均属一次文献,又称(原始文献)。
例如:
期刊论文、专著、研究报告、文学作品和学位论文。
二次文献(secondaryliterature)将分散的无组织的一次文献进行搜集、提炼、压缩、加工、整理而编辑出版的文献,称(检索工具)。
二次文献是用来查找一次文献的线索。
例如:
书目、索引、题录和文摘。
三次文献(tertiaryliterature)是在利用二次文献的基础上,对大量一次文献的内容经过综合、分析、浓缩、提炼撰写而成的文献。
(参考文献的作用)。
例如:
综述、评论、述评、年鉴和手册。
零次文献(non-printedsources)通过直接交流所获得的信息、知识、情报来源,就是未公开的最原始文献。
包括:
书信、手稿、笔记、记录和口头交流,借助于语言、手势、场面景观等取得的直接感受到的信息。
第四节医学文献的交流渠道和分布规律
1.4.1医学文献的交流渠道影响文献利用的一个主要因素是文献信息的交流方式。
文献信息交流有直接交流和间接交流两种方式。
文献信息直接交流是以个人接触为基础的信息交流方式,又称“非正式交流”。
主要方式有交流式(如访问、面谈等)、集会式(如学术会议、年会等)、观摩式(如参观实验室等)和零次文献交换式(如书信来往等)。
文献信息间接交流是以社会文献信息机构为媒介的信息交流方式,又称“正式交流”。
图书馆是信息正式交流过程中的主要渠道。
是期刊、报告、专利等科研成果的永久性贮藏中心,是索取信息资料有保证的资源。
文献的社会需要读者对医学文献的需求,归纳起来,有三大层次的需求:
①对图书、报纸和杂志的需求。
②对具体篇章和内容的需求。
③对内容中疑难查解的需求。
1.4.2.国内文献信息的系统和地区分布我国的文献信息资源,以北京地区数量很大,约占全国总文献量的一半以上。
加上上海、广州、武汉、成都、西安和沈阳占总文献量的2/3,其余占1/3。
信息系统包括:
科技信息系统、科学院文献信息系统、高校图书馆系统和公共图书馆系统。
1.4.3.印刷文献的出版时间分布规律各种印刷型文献在出版时间上是有先后的。
某作者完成了一篇手稿,他希望以最快的形式发表,除了学位论文以外,期刊成为多数论文的发表渠道。
目录、题录和文摘,取原始文献的主要内容作客观的第二次报道。
综述、图书和百科全书需要取大量原始文献的精华,作评论或汇编成册,需时间更长(第三次报道)。
从出版形式上文献周期就大致完成。
这种文献周期又称之为文献链。
以信息利用者的观点,针对不同时间,要求的文献信息应该使用不同的文献信息类型例如:
查找当前最新的信息(一、两个月之内的信息),通过互联网以及当前最新的报纸杂志、广播电视这些媒体。
两个月之前到十年之内的信息应主要通过网上图书或期刊类的数据库解决。
5~20年前的信息除了期刊之外,还可以通过印刷版的图书和手册性工具书来查找。
1.4.4医学文献的学科分布规律和核心期刊
1.文献信息的学科分布规律根据相对利用率的多少,我们把与一个学科有关的文献分成核心文献、相关文献和边缘文献三类。
核心文献通常是指与本学科发展水平、发展动向密切相关的一些文献。
相关文献和边缘文献是指所含内容与学科的关系相对疏远和关系不大的那些文献。
专业核心期刊:
指刊载该专业论文数量较大,学术水平较高的,能反映本学科最新研究成果及本学科前沿研究状况与发展趋势的,倍受该学科专业读者重视的期刊。
严格地说,按照载有与学科相关的文献的篇数的多少将学科内的期刊排成一个系列,再将这个系列分成含文献篇数大致相等的若干个区。
三个区里所含有的期刊种之间的比例具有一定的规律。
三区中所含期刊的种数比例大致为1∶a∶a2。
这就是著名的布拉德福文献分散定律。
由此定律,我们可以得出结论:
经常阅读核心期刊,确实不失为一种有效的信息获取方法。
2.核心期刊的属性核心期刊是指经过专门机构研究确定的某一学科中水平和影响力较高的期刊。
核心期刊有三个主要特性:
学科性,学术性和动态性。
学术性主要指期刊的影响因子(ImpactFactor,简称IF):
是指某一刊物在连续2年内所刊载的论文总量为X,在第3年对该刊2年内刊载论文的总引文数为Y,它的因子为Y/X,即该刊2年内所发表的论文在第3年的平均引用次数。
3.核心期刊表和实例在自然科学科学技术领域,国内普遍承认的国内核心期刊主要有北京大学出版社2004年出版的第四版《中文核心期刊要目总览》和《中文科技论文统计源期刊》收录的期刊。
国内普遍承认的国外期刊主要指《美国科学引文索引(SCI)》和《工程索引(Ei)》数据库收录期刊。
(一)参考工具书与检索工具书的区别?
古今文科工具书分为两大类:
1、参考工具书:
是广泛搜集资料,按照特定的方式进行编排为读者提供解难释疑的图书。
一般它不提供线索而是直接提供答案,属于三次文献的范畴。
包括字词典、百科全书、年鉴、图表等。
2、检索工具书:
是为读者提供文献线索的工具图书。
没有直接的学术价值只起引导作用,属于二次文献的范畴。
它一般具有一定的连续性,其发展趋势将更加专业化、标准化和电子化。
工具书的种类很多,主要有:
1、字典、词典(Dictionary)2、百科全书(Encyclopedia)3、年鉴、手册(Yearbook、Handbook)4、类书、政书()5、年表、历表(Chronologicaltable)6、舆图、图录等(Atlas)古代汉语词典《尔雅》为儒家经典之一,是我国第一部分类词典,分19篇排列,头三篇对普通字词的解释,后十六篇对百科名词的解释。
《释名》也是一部分类词典,共分27篇。
对阅读古代文献特别是汉魏以前的文献,很有参考价值。
《辞通》是与旧《辞海》、旧《辞源》鼎足的旧社会三大辞书之一,它只收双音节词目。
《联绵字典》名为字典,实为收录双音词的词典
(1)百科全书的性质与时代水平《美国百科全书》(1941-1975)给百科全书下定:
“百科全书是一切知识门类广泛的概述性著作”。
我国百科全书专家金常政说:
“百科全书是一切知识的概述汇编,包罗万象……”在我国,有人称先秦的《吕氏春秋》《吕览》为百科全书性质的著作。
但以上所提到的著作并不是本质意义上的百科全书,世界上第一部以“百科全书”命名的著作是德国学者斯卡列哲(1540-1609)遍写的《百科全书,或称神与俗知识概要》。
1、教育性和科学普及性西方学者经常把百科全书称为“没有围墙的大学”。
世界许多著名科学家都是靠阅读百科全书而著名。
2、科学性和论著性(权威性和学术性)首先,百科全书知识非常可靠。
其次,它的每个条目都可以说是一部完整的著作。
3、检索性和查考性百科全书大部分条目附有参考书目并著名引用资料的出处;条目的撰写特别注意历史源流,因此,可查得有关研究观点、史事和数据
1、继续出版大型综合性百科全书。
目前最大部头的综合性百科全书是《插图欧美大百科全书》(ESPASA)
2、将不断出现按读者对象不同而编写的百科全书。
3、为方便使用将采取多途径编排编写更详尽的索引。
百科全书的作用
(1)帮助系统求和,且十年左右修订一次以反映当代科学新发展
(2)提供各种资料。
按内容范围分综合性和专科专题性百科全书。
1、《不列颠百科全书》(EB)初版由拜尔、麦克法夸和司麦利三个苏格兰人主编。
2、《科利尔百科全书》(Collier's)(EC)由英国罗伯特.钱伯斯编辑出版。
3、《美国百科全书》(EA)由德国政治流亡者李勃在美国编辑出版。
4、《国际社会科学百科全书》是社科检索工具书的皇皇巨著,其条目侧重分析比较研究。
值得我们注意的是:
利用百科全书查当代科学及其发展水平,应当选用最新版本,同时还应注意利用一些百科全书补编及年鉴。
1、《中国大百科全书》1980年陆续出版,1993年出齐共72卷,约10万个条目,反映66个学科,是“我国第一部大型综合性百科全书”。
2、《中华百科全书》张其昀监修,台湾省“中国文化大学”、“中华学术院”编篡。
全书100卷,条目1500个。
因有政治倾向,立场和观点要注意鉴别。
3、《简明不列颠百科全书》中国大百科全书出版社和美国不列颠百科全书公司联合出版。
该《不列颠百科全书》的《百科简编》(10卷)本已编译出版,1985年到1986年出版。
该书中译本对原书作了调整,增加了有关中国的条目,这些条目由我国学者进行重写,约占20%,对于我国读者比较适用。
(1)年鉴:
是一种独立的特种类型的工具书,它是将一年内的最新时事资料及各种统计资料汇编在一起并按年度出版的连续性出版物。
年鉴可以提供政治时事、新闻人物、学术动态、研究进展、科研成果和各种统计资料。
“年鉴是知识密集、信息密集、人才密集的权威性资料性工具书”。
年鉴是传播年度最新信息的重要工具书。
它常常是百科全书的补充。
(三)参考工具书的检索方法:
1、字顺检索法是查找文献资料的一种具体方法。
例如:
根据文字的部首、笔画数、编号和音序进行查找。
它分以下几个类型一、形序法⑴笔画法⑵部首法⑶字顺法二、号码法⑴四角号码法⑵起笔笔形计码法⑶中国字庋撷法三、音序法2、类序检索法是从文献的内容特点检索。
具体方法有:
(1)分类检索法。
(2)主题检索法。
(3)时序检索法。
(4)地域检索法。
第二章文献检索原理
在电子文献日益发达的今天,印刷型文献和手工检索仍然有着不可替代的作用。
主要原因有:
一、电子文献覆盖的时间范围有限。
二、多数有价值的科技文献,尤其是原文,仍然是印刷型文献。
例如:
科技类常用学术期刊中的2/3,没有出版或没有订购电子版,而只能使用印刷版。
学习和掌握印刷型文献的手工检索方法是十分重要的。
文献检索(literatureretrieval)利用检索工具查找文献的过程。
从广义来讲,检索包括“存贮”和“查找”两个过程。
没有存贮就没有查找,存贮是为了查找,查找必须有存贮,两者缺一不可。
文献检索包括存贮和检索两个过程。
检索过程的实质是将检索提问标识与存储在检索工具中的标引标识进行比较,含有两者一致或文献标引的标识(包含检索提问标识)的文献就是检索命中的文献。
这就是文献检索原理。
2.1.2文献检索系统的内容组成实现文献检索的必备手段是文献检索系统。
手工检索系统使用书目、索引、文摘和题录等印刷书刊,计算机检索系统使用的是网络数据库。
一个完整的文献检索系统,不管是手工检索系统还是计算机检索系统,都有内容相当的基本组成部分。
2.1.3文献的内部特征和外部特征文献检索的原理与文献的外表特征和内容特征有着密切的关系。
外表特征指:
题名(书名、篇名)、作者、出版者或研究机构、出处、报告号、专利号等。
这些特征通常在文献的封面或扉页出现。
特点:
对文献来说具有唯一性。
内容特征指:
指文献中论述的主题、观点、见解和结论等。
如:
主题词、关键词、分类号、特征词等。
内容特征的检索途径:
分类途径、主题途径和标题途径。
文献的内容特征与文献是一种模糊的对应关系。
这两种对应关系,使得文献的内部特征和外部特征的用途大不相同。
利用外表特征只能检出很少的文献,只能用于已经知道某些线索。
例如:
著者、姓名等。
利用内容特征一次能检出一批文献,对研究者来说是极其有用。
2.1.4文献检索的类型按检索对象区分1)文献检索(DocumentRetrieval):
以文献检索为对象,以相关性为判断依据的文献检索。
(期刊论文信息)通过目录、索引、文摘等二次文献,提供有关原文的线索。
2)数据检索(DataRetrieval)以事实数据为对象,以事实数据获得与否为判断依据的文献检索。
如:
回答“9.11事件前美国纽约世贸大厦有多高?
”3)事实检索(FactRetrieval)以事实为对象,以确定性为判断依据的文献检索。
(新闻)如:
查“中日双方何年何月就销毁在中国遗弃的毒气武器谈判达成什么文件”按检索方式区分1)手工检索。
是用人工来处理和查找所需信息的检索方式。
例如:
利用各种文摘、索引、题录等刊物。
2)计算机检索。
利用计算机和一定的通信设备查找所需信息的检索方式。
例如:
利用各种文献信息数据库。
2.1.4检索效果评价:
检索效率利用检索系统(或工具)开展检索服务时产生的有效结果。
检索效果(retrievaleffectiveness)是指检索结果的有效程度。
在检索过程中,检索系统中参加检索的全部文献可分成“有关”、“无关”、和“查出”、“未查出”四个量,这四个量又可划分为“用户相关”和“系统相关”两类。
从系统相关性看可分
检出文献
a(命中的)
b(误检的)
a+b
未检出文献
c(漏检的)
d(应拒的)
c+d
总计
a+c
b+d
a+b+c+d
检出文献(a+b),即从系统中检索出来的文献;未检出文献(c+d),即未从系统中检索出来的文献。
从用户相关性看可分为:
相关文献(a+c),即与用户需求相符的文献;无关文献(b+d),即与用户需求不相符的文献。
任何一次检索结果都必然有这四个量检索效果评价中的主要指标:
查全率和查准率。
查全率(RecallRatio)是指检出的相关文献数与库内相关文献总数之比。
又称“检全率”、“命中率”。
查准率(Precisionratio,简写为P)是系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,可用下式表示:
C.W.Cleverdon(英)进行Granfield试验,得出查全率R与查准率P曲线。
R-P之间存在着互逆关系
A点检索词数量多,泛指性强,查全率较高但查准率却非常低。
B点检索词专指性较强,查准率就高查全率因此降低。
C,D两点两种极端的折衷。
查全率一般在60%--70%查准率一般在40%--50%。
无论怎样调整检索策略和改进系统效率,都无法使P和R同时接近100%。
第二节 文献检索工具
检索工具是搜集、报道、存贮和查找文献线索的工具,具有存贮和检索两方面的职能,是手工检索和计算机检索系统的核心和具体体现。
2.2.1检索工具书的种类1)目录是以单位文献为著录对象,以文献独自名称作为一个完整的文献单位。
如:
一册图书的书名、一套书的总书名,一种期刊的名称等,都是以独立名称作为文献单位的名称。
馆藏目录:
是揭示图书馆各自收藏书刊资料的目录。
图书馆中最常用的有分类目录、书名目录、著者目录和主题目录。
联合目录:
是汇总若干图书馆或其他收藏单位收藏的书刊资料编制的目录。
联合目录是馆际互借最常使用的检索工具,有图书联合目录、期刊联合目录等。
2)题录指检索工具所著录的篇名、著者(可有工作单位和地址)、出处(论文原刊载的刊物名,出版年,卷期页)、语种等项目,不包括文摘。
例如:
《中目》、《外目》、《美国医学索引》所著录的内容就是题录。
目录著录的对象是《口腔内科学》一书,著录结果只有一条;
题录著录的对象是15篇研究论文的每一篇,著录结果最多可达15条。
题录的著录项目一般包括:
题录号、文献题目、作者及工作单位、出处如期刊名称、出版年、卷、期、页次)、原文文种、主题词、文中所附图表数及参考文献数等。
如:
《全国报刊索引》、《中文科技资料目录》和《外文科技资料目录》。
3)文摘是在索引的基础上更深入一步,以简明扼要的文字介绍文献主要内容。
许多外文检索工具均有英文摘要。
文摘就其摘要的详略程度,可分为指示性文摘、报道性文摘、指示—报道性文摘。
①指示性文摘。
亦称简介,是对文献标题加以补充说明。
通常以简介文献的论题范围、研究目的为限,不直接摘录原文的论点和重要数据,字数一般在100---200之间。
②报道性文摘。
它以揭示原文的论点和重要数据,特别是以原文论述的主题实质为宗旨,读后可以比较确切地了解文献的主题内容。
多为400---800字。
③指示--报道性。
文摘是上述两种文摘形式的结合,即对原文的主要部分作详细报道,对次要部分作简略介绍。
4)索引将图书、期刊中的论文按内容进行分类标引或主题标引后,严密组织编排,以题录的形式注明论文出处。
索引条目通常有三个著录项:
标目(标识heading)说明语和存储地址。
索引的类型:
索引的类型很多,按使用范围可分为:
通用索引(著者、主题、分类、题名索引等);专用索引(文献序号索引、分子式索引等)。
2.2.2手工检索工具书的结构各种手工检索工具结构大同小异,基本有:
1)说明部分是检索工具的使用指南。
2)正文部分是检索工具的主体,多以索引或文摘形式提供文献的线索。
3)索引部分使用部分,获取文献线索的手段,主要有分类索引、主题索引、著者索引等。
4)附录部分是检索工具的辅助使用部分,一般包括引用期刊表、刊名缩写全称对照表等,可以帮助索取原文。
第三节 文献检索的基本步骤
科学合理的检索步骤是文献信息检索取得较好效果的保证,不同的课题需要不同的检索。
需要经过四个基本步骤。
2.3.1明确课题检索目的要明确检索要求和检索目标。
明确检索要求要搞清楚查找的课题属于什么学科,所需情报的文献类型及语种、年代、最佳篇数和允许支配的检索费用。
研究课题有三类,它们的特点和信息要求分别有:
1)前沿探索研究性课题这类课题以揭示某种事物或现象的本质,阐明某种事物的运动规律及其机理,实现研究创新为主要目标。
它回答的是“为什么”的问题。
2)调查研究性课题这类课题的目的是为了弄清问题发生、发展以至归宿状况。
它回答“水平如何”,“过去、目前或者将来怎么样”一类的问题。
3)面向应用研究性课题面向应用研究性课题适用于应用或检验理论,评价它在解决科学技术实际问题中的作用。
应用研究具有直接的实际应用价值,回答“以什么解决什么”的问题。
2.3.2分析提取检索概念1.了解课题背景知识了解课题的背景知识是进行课题检索的基础。
包括:
课题研究的对象,研究对象所属的学科,主要涉及内容,包括研究方法、主要研究单位和人员等。
获取背景知识方法,可以通过询问专业人员,也可以通过阅读一些入门的相关印刷型文献和浏览网上相关信息。
2.分析提取课题概念的方法分析课题概念的目的为了获得检索词。
分析出课题所涉及的主要概念和辅助概念,找出这些概念的若干词或词组。
1)主要概念,或称核心概念,指与课题所研究的对象有关的特指性事物名词。
2)辅助概念,又称普通概念。
指一些没有专业意义的概念。
如:
课题“胰岛素瘤的手术治疗”的主要概念是“胰岛素瘤”,辅助概念是“手术治疗”。
3)禁用词是指没有检索意义,检索过程一般不使用的介词、冠词和连词等虚词,也包括没有事物含义的普通名词、代词、动词和形容词。
如:
“关于”、“的”、“与”等等。
注意:
在分析提取课题概念的过程中,有些检索词已经含有某些概念,在概念分析中应排除。
3.分析课题背景,分析课题概念
4.制定检索策略,实施检索
1)检索途径的概念文献检索途径主要有分类途径、主题途径和著者途径、号码途径。
使用时根据课题的性质和需要,选用相应的检索途径,获得检索结果。
2)检索方法的概念常用的检索方法有直接检索法和间接检索法两种直接检索法:
从报刊杂志中,通过浏览从中获取所需信息的一种方法。
间接检索法:
通过检索工具的指引进行查找,获取所需信息的一种方法。
这种方法通常有下列三种:
(1)追溯法。
是利用文献末尾所附的参考文献。
由一变十、由十变百地进行追溯查找,此法在缺少检索工具和检索工具不全的情