检索方法.ppt

上传人:b****2 文档编号:2647254 上传时间:2022-11-05 格式:PPT 页数:76 大小:2.33MB
下载 相关 举报
检索方法.ppt_第1页
第1页 / 共76页
检索方法.ppt_第2页
第2页 / 共76页
检索方法.ppt_第3页
第3页 / 共76页
检索方法.ppt_第4页
第4页 / 共76页
检索方法.ppt_第5页
第5页 / 共76页
点击查看更多>>
下载资源
资源描述

检索方法.ppt

《检索方法.ppt》由会员分享,可在线阅读,更多相关《检索方法.ppt(76页珍藏版)》请在冰豆网上搜索。

检索方法.ppt

检索语言检索语言一、概念:

是文献检索中用来描述文献特征和表达情报提问的一种专门的人工语言,根据文献信息检索的需要而创制。

二、检索语言的分类:

描述文献外表特征的检索语言:

依据文献外表特征(题名、著者、文献序号、引用文献等)作为文献存储标识和文献检索提问的出发点而设计的索引语言描述文献内容特征的检索语言:

分类检索语言、主题检索语言、代码检索语言(一一)分类检索语言分类检索语言分类检索语言:

用分类号作为语言来表达各种概念。

按学科、专业集中文献,从知识分类的角度揭示多种不同文献在内容上的区别和联系,提供以学科分类为出发点的文献信息检索途径。

常用的分类法:

美国国会图书馆图书分类法杜威十进分类法国际十进分类法中国图书馆分类法国际疾病分类(二二)主题检索语言主题检索语言l主题检索语言:

以反映文献内容的主题词或关键词作为文献存储和检索的标识。

l常见主题检索语言:

主题词又称叙词法:

严格规范化、可进行概念组配、具有完善参照系统、具有范畴索引等关键词法:

以出现在文献的标题、摘要或全文中能表达文献实质内容的词或关键性专业名词术语作为检索标识例:

关键词(自由词):

carcinoma,tumor,cancer主题词(数据库标引用词):

neoplasms关键词:

先天性心脏病主题词:

先天性心脏病(包括:

先天性心脏病,先天性心脏缺损,心脏畸形,先天性心脏异常,异位心等)主题词相对于关键词的优势主题词相对于关键词的优势l主题词:

又称叙词,是以规范化的词汇来表达文献内容的主题。

主题词语言也叫人工受控语言l所谓规范化也就是说它经过了人工规范化处理,即对文献中的同义词、近义词、多义词等加以规范,使得同一主题概念的文献相对集中在一个主题词下,同时在主题词表中采用参照系统间接反映主题概念之间与文献内容之间的关系,从而体现了主题词的单一性l例如:

癌(非主题词)cancer,tumor,carcinoma见肿瘤(主题词)Neoplasmsl采用主题词语言进行检索,能较好地实现较高的查全率和查准率,缩短机时,节省费用,是提高检索技能的关键。

l主题词可以集中语言表达不同但是相同概念的文献l命中的文献比关键词准确代码检索语言代码检索语言l代码检索语言:

用代表事物的代码作为标识系统的索引语言。

(化合物分子式索引、环状化合物环系索引、化学物质号索引等)文献检索方式文献检索方式手工检索:

人工查找文献信息的检索方式,检索过程主要是利用各种印刷型检索工具。

计算机检索:

根据信息特定的需求,利用计算机从相关数据库中识别并提取所需要的信息过程。

网络信息检索:

通过互联网上提供的网络信息查询工具,从网上获取和享用电子信息服务。

文献检索的基本方法文献检索的基本方法l一、常用法l1.顺查法l2.倒查法l3.抽查法l二、追溯法l三、分段法l四、浏览法常用法常用法l顺查法按照时间顺序由远及近逐年查找文献的方法。

一般用于重大课题和各学科发展史以及新兴学科等方面的研究课题的全面检索,一般已知课题开始年代。

如查找“有关SARS的文献”。

查新规定检索十年或十五年的文献l倒查法按照时间顺序由近及远回溯性逐年查找文献的方法。

科研人员常用的检索方法。

适用于一些新课题或有新内容的老课题,或在确认某项成果是否有创新时,也适合采用倒查法l抽查法针对某学科或某课题研究的特点,根据文献资料发表集中的年代或时期,抽出其中一段时间进行文献检索的方法。

多用于写专题调查报告。

文献检索的基本方法文献检索的基本方法l追溯法利用参考文献查找文献的方法。

此法在没有检索工具或检索工具不齐备时常用。

l分段法应用“常用法”与“追溯法”进行交替查找的一种综合性文献检索方法。

l浏览法为及时获得最新文献,利用最新期刊目录进行浏览,查找所需文献的方法。

文献检索途径文献检索途径l主题途径l关键词途径l分类途径l著者途径l书(刊)名途径l其它途径主题途径主题途径l如果要查找专指性很强的某一方面的文献,或不了解所要查找文献的类属关系,或虽然知道其类属关系,但并非广泛收集资料,则可通过主题途径检索l由主题词、副主题词和顺序号组成。

l根据所查课题内容选准主题词,必要时应以副主题词加以限定,缩小检索范围;利用关键词查找时,应注意查全同义词、近义词,以免文献漏检主题途径主题途径lCBMDisc采用中国医学科学院医学信息研究所翻译的1999年版医学主题词注释字顺表(MeSHAAL)(电子版),中医学文献采用中国中医研究院编制的中医药学主题词表lMedline则使用美国的MeSH词表l按每篇文献的内容,选定其研究报道的主要论点标引一个或多个规范化的主题词,主题词采用倒置形式。

例:

贫血贫血,难治性贫血,再生障碍性l为了加强主题词的专指性,采用规范化的限定词即副主题词加以组配。

例:

贫血流行病学贫血,难治性病理学l主题词均按汉语拼音字顺排列l主题词前冠有英文字母,均按汉字排列,顺序排在同音主题词之前,并忽略倒装符号。

例:

淋巴细胞B淋巴细胞T淋巴细胞T淋巴细胞,辅助诱导T淋巴细胞,细胞毒性主题途径主题途径主题途径主题途径l主题词前冠有拉丁字母或希腊字母,在电脑中排在汉字主题词之前。

例:

胡萝卜素胡萝卜素l数字和英文字母,用来排列已被指定使用的外文缩写或新药,排列顺序是:

数字、英文字母、汉字。

例:

DNA、HIV、IGA、IGE、RNA等关键词途径关键词途径l也叫自由词l可输入任意的数字、字母、单词、词组或它们之间的组合l可使用截词符()、通配符(?

)等符号例:

comput*可检出computer,computers,computerized,etccolo?

r可检出color,colourl一些数据库如CBMDisc和Medline备有索引,可列出数据库中全部记录的所有可以检索的词l不熟悉主题词途径的读者可以非常容易地使用自由词途径进行检索分类途径分类途径l如果对某一课题的文献作比较全面的资料积累,或已知所需文献的类属关系,使用分类途径检索文献l利用分类途径查找文献,要求了解检索工具或数据库所采用的分类体系,熟悉欲查文献所属的学科分类,选准大类类目,再逐层深入直到查到合适的类目lCBMDisc按中国图书资料分类法第三版R类进行学科分类,一些非R类的类目,如Q5生物化学、Q6生物物理学等使用R34、R35的交替类目著者途径著者途径l根据已知著者姓名(个人和团体著者)检索文献的途径。

l检索外文著者索引时应注意以下几点:

l姓名次序欧美人姓名习惯是名在前,姓在后,一个人的姓只有一个,名可不止一个。

但检索工具中的著者索引和参考文献著录中人名表达方式与习惯相反,姓在前,用全称,名在后,用首字母,姓名之间用空格或逗号分隔。

著者途径著者途径l例:

WilliamHenryHarrison(威廉亨利哈里森)WilliamH.HarrisonW.H.HarrisonHarrison,W.HHarrison,WH著者途径著者途径l2.团体著者:

按原名著录,并加国名以示区别lFDA(Food&DrugAdministration)l3.姓名前有前缀de,des,du,la,della,von,van,den,dan,der等时,将前缀和姓作为一个整体,按字顺排列。

词间空格和大写字母不影响排列。

如vandeDonk,H.JvandenBosch,HvonWerder,K著者途径著者途径l4.有的著者有家族称呼即族姓,族姓与姓之间无空格,族姓与姓第一个字母均大写。

如:

McAda,P.CMacAdam,K.Bl5.有等级制称号的著者姓名排在无等级制称号之后,如:

Jons,W.M(琼斯,W.M)Jons,W.M.II(琼斯,W.M,二世)Jons,W.M.Jr(小琼斯,W.M)著者途径著者途径l6.复姓人名:

将复姓作为一个整体对待。

如Martin-Smith,Ml7.中国人姓名按汉语拼音著录如:

韩启德HanQDl8.同名同姓不同人的情况,则需要用其它途径给予限定书刊名途径书刊名途径l目前电子期刊数据库都可实现刊名检索l刊名检索多在“浏览法”时使用l在通过数据库查到文献出处时利用电子/印刷本期刊查找全文其它途径其它途径l组配检索途径lCNKI和CMCC等数据库可将一些检索项组配起来进行检索,使得检索结果更专指第四部分第四部分文献计算机检索计算机信息检索的含义计算机信息检索的含义l计算机信息检索:

将大量的文献资料或数据进行加工整理,按一定格式存贮在机读载体上,建成机读数据库,人们根据特定的信息需求,利用计算机对机读型数据库进行检索的信息检索方式l计算机信息检索过程:

(1)信息存储过程

(2)信息检索过程l计算机信息检索的本质是信息用户的提问标识和信息集合数据库特征标识匹配的过程。

计算机检索的原理计算机检索的原理l计算机将输入机检系统的用户提问标识(检索词)与已存储在系统中数据库内的文献特征标识(标引词)进行机械性匹配比较,凡符合给定的比较原则和逻辑运算条件即为命中信息l检索提问字符串数据库中特征标识字符串匹配匹配计算机信息检索特点计算机信息检索特点l检索速度快,效益高l检索功能强,数量大l检索途径多,手段灵活l检索范围广l服务方式多l更新速度快l文献套录方便l用户使用方便计算机信息检索系统组成计算机信息检索系统组成l硬件:

运算器、控制器、存储器、输入输出装置等l软件:

系统操作程序、数据库管理程序、联机控制程序、应用程序等l通讯线路:

电话通讯网、数据通讯网、卫星通讯网等l检索终端:

信息用户与检索系统主机进行人机对话,实现联机检索的设备。

包括上网设备、调制解调器等l数据库:

是计算机检索的对象。

是由一个或数个文档构成,并能够满足某一特定目的或某一特定数据处理系统需要的一种数据集合数据库的构成数据库的构成l文档:

若干个逻辑记录构成信息集合称为文档。

数据库的文档由顺排文档和若干倒排文档组成l记录:

由若干字段组成的文献单元,是计算机检索系统存储文献条目和标引的信息载体,每条记录记载了一篇文献的内部特征和外部特征l字段:

是构成记录的基本单元,是对实体的具体属性进行描述的结果顺排文档顺排文档按文献记录的存取号从小到大排列。

按文献记录的存取号从小到大排列。

218653(AN)NonverbalCommunicationinTeachingTI1TI2TI3TI4Smith,HowardAAUReviewsofEducationalResearch.V49n49p631-72Wtr1983JNPYLanguage:

EnglishLASchoolrelatedresearchisreviewedunderAB1AB2AB3AB4AB5AB6218654218655倒排文档倒排文档关键词索引文档表关键词索引文档表索引词索引词记录号记录号字段号字段号Article195895AB2Artifacts218653AB22Behavior218653AB17Body195895TH2195895AB10倒排文档:

从数据库全部记录的基本字段中,按照著者、主题、分倒排文档:

从数据库全部记录的基本字段中,按照著者、主题、分类等提取出所有的检索词,分别按字顺排列而重新形成的索引文档。

类等提取出所有的检索词,分别按字顺排列而重新形成的索引文档。

如下图:

如下图:

示例:

示例:

CBMDISC光盘检索数据库所用字段光盘检索数据库所用字段标识符标识符字段名称字段名称注释注释AA著者文摘著者文摘AB文摘文摘AD地址地址(第一著者地址第一著者地址)国省市名国省市名(第一著者省市名第一著者省市名)AF原文出处原文出处(译文原文出处译文原文出处)AU著者著者CA索取号索取号(医情所会议、汇编内部编码医情所会议、汇编内部编码)CN国内代码国内代码(国内期刊代码国内期刊代码)CL分类号分类号CT特征词特征词FS资助类别资助类别ID资助编号资助编号ISISSN(国际期刊代码国际期刊代码)JC内部代码内部代码(医情所期刊内部代码医情所期刊内部代码)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1