ImageVerifierCode 换一换
格式:DOCX , 页数:16 ,大小:209.78KB ,
资源ID:7018334      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7018334.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(信息检索.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

信息检索.docx

1、信息检索本章思考题1. 试述情报检索与科学研究二者间的关系。(材料第一题)2. 在个体研究阶段,最早出现的手工检索工具有哪些?(材料第二题)3. 19世纪末-20世纪初,研制并产生了哪些大型检索工具?(材料第三题)4. 二战以后,产生了哪些新的检索理论?(材料第四题)一、情报检索与科学研究关系:个体研究阶段(十九世纪初-十九世纪中叶)世界上最早出现的手工检索工具:1821年瑞士出版的物理科学进展年报和1830年德国创办的文摘杂志药学总览社会化阶段(十九世纪末-二十世纪初)研制大型检索工具:美国1884年创办了工程索引(EI) 美国1907年创办了化学文摘(CA) 美国1926年创办了生物学文摘

2、(BA) 英国1896年创办了科学文摘(SA)自动化阶段(二战后-八十年代末)产生新的检索理论: 1951年 Taube,M 提出:单元词组配法 1958年 Citron,J 提出:轮排索引 1958年 Luhn,H 提出:定题服务(SDI) 科技文献概念:记录在载体上的科技知识,包括科技事实、数据、理论方法、构思和假设等。 按文献载体形式划分:印刷型文献-指印刷术发明之后,以纸张为存储载体,通过油印、铅印、胶印、静电复印等手段,将文字固化在纸张上所形成的文献。 缩微型文献-又称为缩微复制品文献,它是以感光材料为载体,以印刷型文献为母本,采用光学摄影技术,将文献的体积浓缩而固化到载体上。机读型

3、文献-机读型文献的全称为计算机阅读型,是以磁性材料为存储载体,以穿孔、打字或光学字符识别装置为记录手段而形成的文献。声像型文献 -又称为视听型文献,它是以磁性材料或感光材料为载体,借助特定的机械设备直接记录声音信息和图像信息所形成的文献。 按文献的出版形式划分:科技图书 科学期刊 科技报告 专利文献 会议文献 学位论文(概念)标准文献 政府出版物 产品样本 技术档案按文献的产生、加工、用途划分为:一次文献 又称原始文献。以本人的研究成果为基本素材创作而成的文献。二次文献 将分散的一次文献进行选择、加工、整理之后所得到的产物,是为了便于管理和利用一次文献而编制的检索工具。三次文献 利用二次文献查

4、阅大量一次文献,并将其进行综合、分析、研究而编写出来的文献。 半衰期(Half-Life )贝纳尔(Bernal,J.D)提出半衰期:某学科现时尚在利用的全部文献中较新的一半,是在多长一段时间内(X年)发表的。 经过X年,某学科领域其一半文献的利用价值已逐渐衰减。表1. 各类科技文献使用寿命 (前一排和后一排重点记忆)文献类型使用寿命文献类型使用寿命科技图书 10-20年 科技期刊3-5年 科技报告 10年 标准文献 5年 学位论文 5-7年 产品样本 3-5年 平均使用寿命为5-6年 表2. 不同学科文献半衰期学科半衰期学科半衰期学科半衰期数 学10.5地理学16.0生物、医学3.0物理学4

5、.6化 工4.8生理学7.2化 学8.1冶金工程3.9植物学10.0天文学4.7机械工程5.2农林科学5.9地质学11.8工程技术3.2社会科学5.0情报检索(Information Retrieval)是指将信息按一定的方式组织存储起来,并根据信息用户的需要找出相关信息的过程。情报检索是由信息的存储和信息的查寻两个不可分割的过程所组成内部特征的检索语言分类检索语言:以分类号和类目名称作为标识符号,按学科、专业集中文献。典型代表:中图法主题检索语言:以名词术语为标识符号,从主题概念的角度来集中文献主题检索语言:(主题词与关键词的区别)主题词:能表达文献的实质内容,经过规范化处理的名词术语。如,

6、中国汉语主题词表、医学主题词表、农业、生物科学主题词表关键词:能表达文献主要内容的词汇或术语,未经过规范化处理。评价指标:英国情报学家克莱弗登(Cranfield)在分析用户基本要求的基础上,提出了6项系统性能的指标,它们是:收录范围、查全率、查准率、响应时间、用户负担和输出形式,其中查全率和查准率是两个最常用的重要指标。1. 查全率(Recall ratio) :指检出的相关文献量(a)与检索系统中相关文献总量(ac)的比率。例如:某课题检出相关文献49篇,而该检索工具中与课题相关的文献总量有70篇,那么,此次检索的查全率为70%。 2. 查准率(Precision ratio):指检出的相

7、关文献量(a)与检出的文献总量(ab)的比率。 例如:某课题检出文献总量为60篇,经筛选只有30篇与课题相关,那么此次检索的查准率为50%。如果提高数据库标引质量:在检索时准确地表达主题概念,合理编写检索式,应该说是可以提高查全和查准率。1. 布尔逻辑算符检索法 是当今检索理论中最成熟的理论之一,也是构造检索表达式最基本、最简单的匹配模式。布尔逻辑检索是通过布尔逻辑算符来实现的,这些运算符能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索要求。 逻辑运算符有三种:与、或、非 逻辑与(and 或 *) 是一种用于交叉概念和限定关系的组配。它可以缩小减缩范

8、围,有利于提高查准率。例如:insulin and diabetes 凡是用and的检索式,and两侧的检索词必须同时出现在同一条记录中,该记录才算命中。逻辑或(or 或 +) 是一种用于并列关系的组配。它可以扩大检索范围,防止漏检,有利于提高查全率。例如:cancer or tumor 凡是用or的检索式,or两侧的检索词只要有一个在一条记录中出现,该记录就算命中。 逻辑非(not 或 -) 是一种排斥关系的组配。用来从原来的检索范围中排除不需要的概念,有利于提高查准率。例如:solar energy not nuclear 凡是用not的检索式,not前面的检索词必须在记录中出现而后面的检

9、索词一定不能出现,该记录才算命中。在一个检索式中,可以同时使用多个逻辑运算符,构成一个复合逻辑检索式。复合逻辑检索式中,运算优先级别从高至低依次是not、and、with、or,可以使用括号改变运算次序。 如(A or B)and C 先运算(A or B),再运算 and C 位置算符检索法 又称邻接算符(adjacent operators),适用于两个检索词以指定间隔距离或者指定的顺序出现的场合。跟and运算符类似,但比and运算符功能更具体。例如:查找“细菌对染料破坏”方面的文献显然其中有些记录与课题要求毫无关系。位置运算符可以用于改进and运算符的这种不足之处,因此,它们可以看成是特

10、殊功能的and运算符。 按照两个检索词出现的顺序和距离,可以有多种位置运算符,而且对于同一功能的运算符,不同的检索系统可能有不同的表达方式,也有的检索系统不支持位置运算符,检索之前应该先看看数据库的帮助信息。常用位置运算符有(w)(n)(s)(f)(W)(词间位置算符,含义为With)词序不能颠倒,两词之间不允许插入其它词,但允许有空格。 例如:Economy(W)Mathematics (nW)(邻词位置算符,Word) 两侧检索词之间允许插入n个词,包括系统禁用词,词序不能颠倒。 如:wear (nW)materials 可检出 wear of materials (N)算符中的N含义为“

11、Near” 词序可以颠倒,两词之间不许插词,只允许出现空格或连字符号。例:cross(N)section 可检出 cross section 和 section cross(F)(字段内算符,Field)两侧检索词必须出现在文献记录的同一字段中(TI、AB、DE.),中间可加词,字段不限,词序不限。 如:electric(f)vehicles / TI 截词(Truncation)检索法截词有多种用途 词尾截断可得到该单词所提及的所有词语(单数和复数)词间切断或通配符:可找到该单词的所有变化形式或不同拼法。 ? = 一个字符 * = 一个或多个字符 例如: 检索单复数和不同拼法等词语右端截断词

12、间截断(通配符)Computer*ComputerComputers ComputerisedComputerizationOrgani *ationOrganizationOrganisation注意:截词检索时,不可截的太短,否则会检出无关概念。 如,Com*5.检索限定 字段限定包括TI、AB、DE、 AU;时间范围限定PY; 分类限定CC;语种限定LA;文献类型DT 等 字段限定也是调整检索策略的一种重要手段。多数检索系统对不指定字段的检索词通常在所有字段(all field)中进行检索。 如果想指定在文献的题目等特定字段中检索,就需要使用字段限制。字段限制适用于在已有一定数量输出记录

13、的基础上,通过指定字段的方法,减少输出篇数,提高检索的查准率。例如:Tea and Breeding /TI AU = Zhou,G Z6.布尔逻辑检索式编写 (1)逻辑运算符使用方法 布尔逻辑检索式是检索策略的逻辑表达式,其表达形式实际上是上述各步骤结果的综合体现,即使用合适的逻辑算符和位置算符,将各检索词进行组配,使之确切地表达课题的主题概念,符合检索的需求。例1:查找分别单独论述微型汽车发动机和摩托车发动机的文献,并要求排除那些同时论述这二个主题的文献”。A-微型汽车 B-摩托车 C-发动机 检索式:(A and C or B and C)not(A and B and C)(A and

14、 C or B and C)not(A and B )例2:查找论述太阳能或者风能的文献,但不要其中又论及水能的文献。 A-太阳能 B-风能 C-水能检索式:( A or B )not C例3:电视中暴力行为对儿童的影响。A-电视 B-暴力行为 C-儿童。检索式:A and B and C 例4:检索有关利用杀虫剂控制蚜虫方面的文献。 A-insecticde B-aphides C-control检索式:A and B and CA and B提问:哪个是最佳检索式?例5: 查找三氧化二砷与空气污染方面的文献。 A-三氧化二砷(As) B-空气 C-污染检索式: (Arsenic triox

15、ide or As)and air and pollution Arsenic trioxide or As and air pollutionArsenic trioxide or As提问:在上述三个检索式中,哪个为最佳或最合理检索式?为什么?7.编写逻辑检索式一般原则答:用and连接检索词,将出现频率不高的词放在and的左边。用or连接检索词,将出现频率高的词放在or 的左边。当用and和or两种算符,并且连续使用多个or算符,or应放在and的左边(or部分用括号)。8.鲍纳查尔斯(C. Bourne)检索策略答:最专指面优先策略(下位类 或同类) 积木型概念组策略(OR AND) 引

16、文珠型增长策略(单篇文献 多篇文献) 逐次分馏策略(上位类 下位类) 见示例:最专指面优先策略(提高查准率)例如:果蔬农药残留量的检测与分析(水果 or 蔬菜) and 农药残留量 and 检测 and 分析(2) (水果 or 蔬菜) and 农药?(4110)(水果 or 蔬菜) and 农药残留量 and 检测(38)(水果 or 蔬菜) and 农药?and 检测 and 分析(60) 积木型概念组策略(提高查全率)例如:检索氮磷钾对烟草产量和品质的影响 S1 (N or P or K ) S2 (Nitrogen or Phosphate or Potassium) S3 (Toba

17、cco or Nicotiana) S4 (Quality or Yield) (S1 or S2)and S3 and S4引文珠型增长策略(扩大检索范围)例如:检索分子标记在植物育种中的应用 植物 and 分子标记 and 育种相关词:抗病育种 抗病基因 遗传标记 基因工程 基因图谱 基因表达逐次分馏策略(缩小检索范围)例如,检索农作物病虫害控制方面的文献 作物 and 病虫害(998) 稻瘟病 and 控制(49) 小麦 and 锈病 and 防治(300多篇) 玉米 and 螟虫 and 防治(13)编写逻辑检索式小结:使用and算符越多,限制条件就越多,查准率较高;使用or算符越多,

18、连接的相关词就越多,查全率也就越高;使用not算符去掉不相关的概念,可提高查准率。在检索式中不要连续使用多个and算符,以免限制过严而漏检文献,甚至查不到文献。9.位置算符使用方法例如:查找聚磷酸氨的制备方法方面的文献Ammonium(S)polyphosphate and(manufasyure or preparation)152篇Ammonium(S)polyphosphate(S)(manufasyure or preparation)17篇Ammonium(S)polyphosphoric acid(S)(manufasyure or preparation)4篇Polyphosph

19、oric(L)Ammonium(S)(manufasyure or preparation)1篇Ammonium(S)polyphosph?(S)(manufasyure or preparation)38篇10.制定检索策略检索策略由检索标识和检索运算符(与、或、非、截断符、位置符、括弧等)组合而成。制定检索策略分初级检索、高级检索、专业检索三种类型。如,中国期刊全文数据库(CNKI)检索类型 1. 分析各个检索词之间的位置关系和逻辑组配关系。 2. 分析检索词应该限定在哪个字段中检索(是在所有基本索引中检索还是限定在分类、主题、自由词、文摘还是其他辅助索引字段中检索)。实例分析:(1)课题

20、分析:直接从项目名称中确定检索概念例如:检索“聚乙烯的合成”文献主要概念:聚乙烯、合成检索式:聚乙烯 and 合成 polyethylene and Synthesis(2)课题分析:找出隐含概念例如:检索“灌溉用的橡塑多孔管”文献 Rubber-Plastic Porous Pipe For Irrigation隐含概念:橡胶、塑料主要概念:橡胶、塑料、多孔管、灌溉检索式:(橡胶 or 塑料 or橡塑) and 多孔管 and 灌溉(3)课题分析:泛指概念具体化例如:检索“唐山综合防灾的研究”文献主要概念:城市、地震、洪水、火灾、决策支持系统、专家系统检索式:城市 and (地震 or 洪水

21、 or 火灾)and (决策支持系统 or 专家系统)(4)课题分析:排除重复无关的概念,避免漏检例如:检索“河豚毒素的液相色谱分析”文献主要概念:河豚毒素、液相色谱、分析 由于液相色谱本身就是一种分析方法,因此将“分析”这一概念排除。检索式:河豚毒素 and 液相色谱11.调整检索策略每一次检索之后都要对检索结果进行检查和评价,如果与需求不符就要修改和调整检索策略,重新进行检索。 (1) 输出篇数过多时,原因主要有以下几点:对检索词限制条件过宽。包括字段限制,时间限制,分类限制等。主题概念太少或具有多义性导致误检。对所选的检索词截词截得过短。(2)输出篇数过少时,原因可能有以下几点:对检索词

22、限制条件过窄。选用了不规范的主题词作为检索词,或者同义词没有充分考虑。 例如,没有使用学名“马铃薯”而使用了俗名“土豆” 会造成漏检。上位概念或下位概念没有完整运用。 例如,“燃料”是上位概念,下位概念可以有 “煤”、“油”、“煤气”、“天然气”等,这些概念在检索“燃料”时都应该加以考虑。本章思考题1. 计算机检索的基本方法有哪些? 答:(1)布尔逻辑算符检索法 逻辑与(and 或 *) 逻辑或(or 或 +) 逻辑非(not 或 -) (2)位置算符检索法 常用位置运算符有(w)(n)(s)(f)(1)(W)(词间位置算符,含义为With)(3)截词(Truncation)检索法(4)检索限

23、定2. 根据自己的专业或研究方向,拟定一个合理的布尔逻辑检索式(提问式)。第三章 中外数据库检索方法1.中国知网(CNKI)文献总量: 5656万篇,其中自然科学文献为2441万篇,社会科学文献为2540万篇,国际学术文献为344万篇。文献类型:有学术期刊、硕博学位论文、工具书、会议论文、年鉴、专著、专利文献、标准文献、科技报告和研究成果。2.库间引文链接 通过引文数据库的检索,引证文献、参考文献、同类文献成功链接,同时,实现了中国期刊全文数据库和中国优秀博硕士学位论文全文数据库之间的互引用链接,即期刊库如果引用了学位论文库的文章,期刊库检索结果中会将学位论文库的该篇文章作为参考文献提供链接,

24、并可点击链接查看文章题录,进而获取原文,构建了库间的知识网络。 本章思考题1.中国知网平台有哪些作用? 答:(1)跨库检索 中国期刊全文数据库;中国优秀博硕士论文全文数据库;中国重要会议论文全文数据库;中国重要报纸全文数据库;中国图书全文数据库;中国引文数据库等CNKI系列源数据库实现了统一跨库检索,用户能够在一个界面下完成以上所有数据库的检索。(2)库间引文链接 通过引文数据库的检索,引证文献、参考文献、同类文献成功链接,同时,实现了中国期刊全文数据库和中国优秀博硕士学位论文全文数据库之间的互引用链接,即期刊库如果引用了学位论文库的文章,期刊库检索结果中会将学位论文库的该篇文章作为参考文献提

25、供链接,并可点击链接查看文章题录,进而获取原文,构建了库间的知识网络。 (3)知识网络系统 通过文献之间、知识元之间、分类导航之间的交叉链接,构建起节点丰富、交织纵横的知识网络系统。文献之间的链接包括引证文献、参考文献、同类文献等,知识元链接包括作者、机构、刊名、关键词、相关作者群、相关研究机构、相关关键词等,同时,还可方便查看其他相关类别下的文献。 (4)知识元链接 包括作者、机构、刊名、关键词以及相关作者、相关机构、相关关键词等设置链接,通过这些链接可检索知识网络中心配制的数据库的相应字段,获取检索结果。(5)引文链接 包括引证文献和参考文献链接。引文链接成功率接近100%。引文链接功能,

26、除了可以构建相关的知识网络外,还可用于个人、机构、论文、期刊等方面的计量与评价。 (6)相似文献链接 即同类文献链接。基于相似检索技术,实时运算,提供内容相关的相似文献链接。特点:链接成功率约100%;可实现内容相似的文献间链接;还可实现跨学科关联,如不同主题,使用相似方法或技术的文献。中国知网(CNKI)检索平台作用分析:可扩检相关文献数量 掌握相关研究机构 掌握相关文献作者研究情况了解作者文献被引证情况 通过期刊导航了解期刊出版状况及选刊投稿2.检索学位论文、科技报告、专利文献等特种文献应选择哪些数据库?第五章 ISI Web of Knowledge进展与应用1. Web of Scie

27、nce 简介答:ISI (Institute for Scientific Information ) 美国科学情报研究所SCI (Science Citation Index ) 科学引文索引 JCR(JournalCitationReports ) 期刊引用报告 三大引文数据库: Science Citation Index introduced in 1963 Social Sciences Citation Index introduced in 1973 Arts & Humanities Citation Index introduced in 19782.引文(Citation)

28、概念答:在文献甲中提到或描述了文献乙,并以文后参考书目或脚注的形式列出了文献乙的出处,其目的在于指出信息的来源、提供某一观点的依据、借鉴陈述某一事件等。引文通常也称为被引文献或参考文献,引证文献通常也称为来源文献。3.H-index(h指数):答:是美国加州大学物理学家乔治赫希(JorgeE. Hirsch)提出的,h代表高引用次数(high citations),h指数已经被公认为比平均引用率更科学的指标。所谓h指数,是指一个人有n篇论文分别被引用了至少n次。 赫希认为h指数能够比较准确反映一个人的学术成就。一个人的h指数越高,则表明他的论文影响力越大,与其它统计方法不同的是,要确定一个人的

29、h指数相当容易,只要到SCI网站,查出某个人发表的所有SCI论文,让其按被引次数从高到低排列,往下核对,直到某篇论文的序号大于或等于论文被引次数,那个序号就是h指数。4.多层次的限定与精确的检索作用答:发现某研究领域的隐含的发展趋势:把握学科领域的最新动态 了解某特定课题在不同学科的分布情况获取某学科领域核心研究人员信息 5.影响因子(Impact Factor)答:指某期刊前两年发表的论文在统计当年的被引用次数与该期刊在前两年内发表的论文总数之比。又称作2年影响因子(IF2)。影响因子这一评价期刊的重要指标是SCI创始人尤金,加菲尔德(Eugene Garfield)1972年提出的,这是一

30、个国际上通行的传统期刊评价指标。通常影响因子越大,它的学术影响力和作用也越大。具体算法为: 影响因子=该刊前两年发表论文在统计当年被引用的总次数/该刊前两年发表论文总数 6.Web of Science 检索方法和途径答:(1)布尔逻辑算符检索 (2)近似检索 (3)截词检索 (4)检索途径7.近似检索(Exact Search) 词组检索如果希望精确地检索某个短语,应将其放置在引号内。范例: “stem cell”SameSame算符连接的关键词必须在同一句话内,但关键字前后顺序不限。在关键词字段检索时,利用“SAME”连接符得到的检索结果是同一个短语中的出现检索词的记录。范例: stem SAME cell本章思考题1.什么是引文?利用引文有哪些作用和意义。2.“same”运算符在数据库中如何使用?Same算符连接的关键词必须在同一句话内,但关键字前后顺序不限。在关键词字段检索时,利用“SAME”连接符得到的检索结果是同一个短语中的出现检索词的记录。第六章 硕士论文写作与选刊投稿1.学位论文基本结构答:前置部分:封面、题名页、目次页、中英文摘要、关键词 主体部分:引言、正文、结论(讨论)、致谢、参考文献中文摘要(Abstract) 传统的摘要多为一段式,在内容上大致包括引

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1