ImageVerifierCode 换一换
格式:DOCX , 页数:47 ,大小:2.31MB ,
资源ID:6065372      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/6065372.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(信息检索与利用复习资料.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

信息检索与利用复习资料.docx

1、信息检索与利用复习资料 社科信息检索与利用1974年,美国学者保罗泽考斯基对信息素质的论述:利用大量的信息工具及主要的信息源使问题得以解决的技术与技能。信息素质由信息意识、信息能力和信息道德素质三部分构成。信息意识: 是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。信息能力: 掌握一定的方法和技巧,能准确、快捷获取、接收、组织及处理所需信息的能力。第一章 信息与信息资源概述1、信息、知识、情报和文献四个概念、关系。P372、信息、情报的属性;构成文献的基本要素。 P473、一些文献类型的特征号码(ISBN组成,ISSN,CN,GB-,GB/T,GB/

2、T *,ISO,IEC)4、文献的几种划分类型:按文献的载体和记录形式划分(手写型文献、印刷型文献、缩微型文献、声像型文献、机读型文献);P910按文献的加工深度划分(零次文献、一次文献、二次文献、三次文献)、及它们之间的关系;P1718按文献的出版形式划分(11种、其中特种文献8种),常用的各类型文献的著录格式(或指具体每种类型在数据库中的字段);P10-17 重点:图书、期刊、学位论文、科技报告、专利5、图书、期刊两种文献类型的特点。P10-13第二章 信息检索基础知识与原理1、信息检索的概念(广义、狭义) p412、信息检索的类型 (依据检索对象不同P43,检索操作方式不同划分p46)。

3、3、信息检索语言含义及类型(依表述信息特征划分p33 )4、主题语言按选词方法的不同,可分为哪四种。P345、分类法检索语言、主题法检索语言的特点 p34、p376、掌握中图法体系结构、了解基本22个大类、标记符号、等级划分以及所学专业、常用学科专业的分类号等P36-37结合实习报告中我们专业的一、1、第三章 计算机检索基础知识1、计算机检索系统的构成P572、数据库的结构P58字段(不同文献类型)-检索字段-检索途径(分类、主题、著者、题名、号码等) 记录文档3、布尔逻辑算符:类型及其应用 P81834、截词检索(截词方式)用法、类型及其作用P83845、位置算符(with、near的用法)

4、P846、字段检索(与实习(具体数据库)结合)P867、检索途径的具体类型(主题、分类、著者、题名、号码等,与实习结合)P938、计算机检索策略P91101课题主题概念的分析 P9698、检索表达式的构建(结合布尔逻辑算符)P991009、 检索效果的评价指标(2个)P10110210、查全率、查准率分别指的是什么?P 10211、提高检索效果的主要措施(提高查全率与查准率的措施)P102103第四章 搜索引擎 1、网络基础知识:TCP/IP协议、IP地址、域名地址P245247本题书上没有网上查询或者翻大一的书2、搜索引擎的定义;P773、搜索引擎的种类(按数据检索机制不同划分)P774、全

5、文型搜索引擎的组成部分这题本书没有,这是我找的答案,仅供参考!1、搜索器2、检索器3、用户接口4、索引器5、搜索引擎的语法规则(逻辑算符、字段限制(intitle、site、filetype、link)、精确检索的表达方法)等(结合Google、XX检索技巧,或者结合综合实习报告)P1221276、Google、XX的特色搜索P216233第五章 专利基础知识及专利检索 P1415(详见笔记)没记笔记XX百科也有1、专利概念2、专利基本特性3、专利类型(在专利号中的数字代码)及各自的保护期限4、专利申请号及专利号(要注意到2003年前后的差异)5、我国授予专利权的条件6、可检索专利的数据库或网

6、站第六章 参考工具书(信息资源检索与利用) 本题XX一下,你就知道1、参考工具书的定义、结构(笔记)定义在P112、参考工具书按功能及用途划分,包含哪些?(笔记)3、各种参考工具的用法第七章 社会科学信息的收集、分析与利用P2923131、社会科学信息的收集渠道有哪些?292-2932、社科科学研究的选题原则?304-305实习:(详见课本第三章、第四章的内容)1、总结、掌握各种文献类型的查找方法。2、了解各个数据库的收录类型及查找方法。数据库:重庆维普数据库、清华同方公司的中国知网系列数据库(cnki)、万方公司的系列数据库、fulink数据库,馆藏书目数据库,数字图书馆(超星、北大方正、读

7、秀等),Springerlink全文数据库、Science Dierct数据库、专利检索、标准检索。掌握以上数据库(包含系列数据库的名称)、检索方法、检索字段,具体数据库的检索策略(查全与查准)的调整。3、常用搜索引擎的检索技巧。注:考试时,务必带上2B铅笔、橡皮擦。(考试中如有涉及专业选题,我们是属于社科类) 信息检索考试提纲【概念】1、信息自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互联系、相互作用等运动状态的表达。2、知识人们在改造世界的实践中所获得的认识和经验的总和,是人的大脑通过思维重新组合的系统化的信息集合。3、文献凡是记录有信息或知识的一切载

8、体。4、情报为了解决一个特定的问题所需要的激活了的、活化了的特殊知识或信息。关系:P7包含关系文献是记录有知识的载体,知识是信息的一部分情报来源于信息,信息包含了情报文献包含于信息内转化关系文献是记录有知识的载体,当文献中的知识信息传递给用户并为用户所利用时,就转化为情报。交叉关系情报虽多来自文献,但也可能来自口头和实物信息,所以情报与信息、文献存在交叉关系。例如:感觉到天气的冷暖(信息) 知道是气候的变化引起了冷和热(知识)收听天气预报得知气温变化了(文献)为了研究果树的生长规律而收集的气象资料(情报)5、文献信息检索语言用来描述文献特征和表达信息提问,沟通信息标引人员和信息检索者双方思想的

9、一种人工语言。6、检索工具用来报道、存储和查找文献线索或全文的工具。【文献类型的划分及判断】1、按文献的载体形式划分 P9手写型信息资源手写记录,包括泥板、羊皮纸、甲骨、卜辞、碑铭、竹简、绢帛以及后来的笔记。记录方式为人工抄写,包括手写稿、信件、日记、原始档案等。印刷型信息资源以纸张为载体,通过铅印、油印、胶印等手段。例如各种书刊。占据空间大,不易管理保存。缩微型信息资源以印刷型文献为母本,以感光材料为载体。包括缩微胶卷、缩微平片、缩微卡片。节省空间,保存时间长,不易损坏,但必须借助微缩阅读机,设备投资较大。声像型信息资源采用录音、录像、摄影、摄像等手段,将信息记录在光学材料、磁性材料上。例如

10、磁带、磁盘、光盘、软盘等。存储密度高、直观、真切,尤其适于记录用文字、符号难以描述的复杂信息和自然现象,但是不能直接阅读,费用高。机读型信息资源以磁性材料为载体,以磁录技术为记录方式。以数字代码方式将信息存储到磁、光、电介质上。存储信息密度高、存储速度快、读取速度快、原有记录可更改、易于实现资源共享、易于网络化和网络化程度高、高速度远距离传输信息。2、按文献的出版形式划分 P10图书内容比较成熟全面、系统可靠;但是出版周期长,传递信息速度慢分为 A.阅读型图书 a.教科书 b.专著(学术著作) c.技术书 d.文集 e.丛书 B.参考工具书 例如:字词典、类书、政书、百科全书、年鉴、手册、名录

11、、图谱、传记资料etc。期刊定期或不定期的连续出版物。报纸以刊载新闻和评论为主的定期出版物。特点:时事性、普及性、大众性、服务性、传递速度快、信息量大、保存性、便览性、集纳性 最具影响力的“第一传媒”科技报告对科学、技术研究结果的报告或研究进程的记录。大部分报告秘密发行,小部分公开。会议文献在各种科技会议上,宣读和交流的论文、报告及其他的有关资料,它是科技文献的重要组成部分。特点:A. 内容新颖,及时性强 B. 学术水平高,专业性强,可靠性强 C.数量庞大,内容丰富;出版形式多样按出版时间的先后可分为:会前文献、会中文献、会后文献专利文献由政府专利机构出版的、有创造发明的设计、制造工艺的详细说

12、明,表明在一定年限内发明所有者享有制造、使用、销售占有权的法律性文献。特点:编写格式统一、出版快、内容新颖、技术性强、实用性强、具有法律效力。 寓技术、法律、经济情报于一体。标准文献对重复性事物或概念所作的统一规定。是一种规章性的技术文献,具有一定的法律约束力。一个标准解决一个问题,标准的新陈代谢频繁。按标准化对象分为:技术标准、管理标准、工作标准按审批机构的级别和标准的使用范围,我国分为:国际标准、国家标准、部颁标准、企业标准国外分为:国际标准、区域标准、国家标准、专业(部)标准、企业标准按内容特点可分为:方法标准、术语标准“GB”我国的强制性国家标准(具有法律属性)“GB/T”我国的国家推

13、荐性标准“ZB”专业标准“NY/T”我国的一项农业推荐标准标准号每个标准的编号,由权利机构代号、顺序号、制定年份组成例如:GB 3559-2001学位论文政府出版物各国政府部门及其所属机构所出版的文献。分为行政性文件和科技性文件政府出版物大部分公开,少数保密,但若干时间后则予以公开产品资料各国厂商为了推销产品而出版发行的一种商业性宣传资料。特点:图文并茂、形象直观、出版发行快、鲜明的商业性质,较散技术档案在自然科学研究、生产技术、基本建设等活动中形成的应当归档保存的科技文件。特点:内容真实详尽具体可靠、保密性强、保存期长3、按文献的加工深度划分 P17零次文献未经出版发行或未进入社会交流的最原

14、始的文献。例如:私人笔记、工程图样、实验记录、论文草稿、发言稿、会议记录、私人信件、绝密文件、技术档案等。特点:信息量丰富、内容新颖、不成熟、难以获得一次文献(原始文献)以作者本人的生产或科研工作成果为依据所记载的例如:科学专著、独创部分的学位论文、科研报告、专利说明书、会议文献、期刊论文等。特点:“第一手资料” 内容具体详尽注!无论是否参考或引用了他人的资料,无论其载体或出版类型如何,均属于一次文献。二次文献(检索信息工具)对大量无序的一次文献的内外部特征(题名、作者、出处等)进行加工整理而成的各种书目、题录、索引、文摘等。特点:报道性、检索性、汇编性、简明性三次文献(既是信息检索和利用的对

15、象,又是检索信息的工具)在二次文献的基础上,将搜集到的一次文献进行再加工的产物特点:综合性强、系统性好、知识面广、有的还具有检索功能例如:综述、专题述评、学科年度总结、进展报告、数据手册、年鉴、百科全书、名录、图录、表谱、指南等。 【文献重要外表特征】1、国际标准书号(ISBN)P112007年以前 ISBN 7-5341-1951-0/G.362 地区或语种号0-美语、1-英语、2-法语、3-德语、4-日语、5-俄语、7-汉语等出版者号 合称“出版者前缀”,是一个出版者的标准代号。书序号计算机校验码中图法基本大类类号和种次号2007年以后 ISBN 978-7-5341-1951-0/G.3

16、62 (13位) 现有的出版机构在原ISBN号前+“978”,新成立的出版机构+“979”。2、国际标准刊号(ISSN)P13ISSN 1001-8867 由8位数字组成3、国内统一刊号 CN P13CN11-2746/G2 由地区号(2位数)+序号(4位数),分类号4、专利号ZL年代号(2位数)专利类型(1位数)流水号(5位数)计算机校验码例子:ZL 02346023.7、ZL 200420034660.3注:2004年以后,年代号使用4位数,流水号使用7位数专利类型:1发明专利、2实用新型专利、3外观设计专利【检索语言类型及判断】P33按规范化程度分为:自然语言(未规范化语言)、受控语言(

17、规范化语言)按表达信息的特征分为:描述外部特征语言、描述内部特征语言1、文献外部特征语言(较简单)以文献上客观存在显而易见的外部特征(题名、作者姓名、机构、出版地、出版社、ISBN号、ISSN号、专利号、标准号等)作为检索依据2、文献内部特征语言(较复杂)对文献的内容进行分析判断而得出的主题概念或学科类别,按一定结构和规则加以描述的人工语言。如:分类号、主题词等【常用的分类法的分类原则和分类号结构】P351、我馆书刊索书号图书:G210.7/X165期刊:F4/710.32、中国图书馆分类法 中图法(最通用)22个基本大类,逐级展开为二级、三级、四级.类目例如:I “文学” 一级类目 I2“中

18、国文学” 二级类目 I24“小说” 三级类目 I242“古代至近代作品”四级类目 I242.4“章回小说”五级类目被区分的类为上位类,区分出来的类为下位类例如:“F0经济学”、“F1世界各国经济概况、经济史、经济地理”等都是“F经济”的下位类,F0、F1为同位类分类表的类号每增加一位字母或数字代表增加一级分类“工业技术”所属的二级类目用双字母表示,如“TB、TD、TE.”分类号的三位数后,用“.”隔开,例如I242.4O17 数学分析 (按学科专业归类)特点:A、能体现学科的系统性 B、揭示事物纵向的隶属性和派生关系以及横向的平行关系 C、简单明了 D、直线型序列结构,难以适应复杂的主题概念

19、E、类目预先确定,灵活性差3、中国科学院图书馆图书分类法51.6 数学分析 (按学科专业归类)4、国际专利分类法IPC(最重要、使用最广泛的一种专利分类法)采用功能和应用结合的分类原则,按发明的技术主题设置类目,以等级形式逐级分类分类号采用英文大写字母和数字混排由部号、大类号、小类号、主组号、小组号组成,例如:A01B1/02部号用大写字母A-H表示,分部只有标题没有类号;大类号=部号+2位数字 例如:B01D01/02;小类号=大类号+1个字母,但A、E、I、O、U、X 6个字母不能用;主组号=小类号+ 1-3位数+/00,例如:F04D29/00分组号=主组号+一个除00以外的至少两位数字

20、(斜线后的2-5位数字),例如:F04D29/30 PS:斜线后的数字不表示等级关系A63B53/12 金属长柄的高尔夫球棍 (按功能和用途归类)【信息检索的类型】(根据检索对象和目的不同划分)P43检索类型文献检索数据检索事实检索检索对象原始文献的线索或原文数值数据已存在的事实利用工具检索工具或书目型数据库参考工具书或数据型数据库参考工具书或事实型数据库检索结果相关的文献确定的数据已确定的事实或有关的数据【检索工具的类型及判断和著录格式】P51(按著录文献的特征划分)1、目录(书目):以单位出版物为著录对象。如:一本书或一种期刊揭示出版物外表特征的检索工具著录包括:出版物名称、责任者(著者、

21、编者或译者)、出版项(出版地、出版社、出版时间、版次等)和稽核项(开本、ISBN号、价格等)著录格式示例:物流信息技术与应用/孟军齐编.-北京:人民交通出版社,2009.04.-26cm.-ISBN978-7-220-07784-5:¥33.00常见的目录型检索工具:国家书目、馆藏目录、联合目录、出版社目录、专题文献目录等。2、题录:以单篇文献为著录对象。如:一篇文章或一本书中的某一章节揭示文献外表特征的检索工具著录包括:题录号、文章题名、著者及其工作单位、文献出处(刊名、年、卷、期、页码)等。著录格式示例:080910413存款保险制度的比较分析及其启示/张正平(北京工商大学经济学院,100

22、037)/河北社会科学(郑州).-2008,16(3).-45-48题录与目录的区别在于著录的对象不同。目录著录的对象是单位出版物,题录著录的对象是单篇文献。题录所揭示的文献深度较目录强。3、文摘型:以单篇文献为著录对象,但在题录的基础上附有摘要。除了著录文献的外部特征外,更着重描述文献的内容著录包括:文摘号、题名、著者及其工作单位、文献出处、文献类型、语种、主题词、图表数和参考文献数等著录格式示例:09161904论城区经济发展战略=Study on urban economic development strategy刊,中/张占仓(河南省科学院,郑州450002)/经济地理.-2009,

23、29(1).-45-48索引1、主题(关键词)索引2、分类索引3、著者索引4、引文索引5、其他索引【图书、期刊论文的引文著录格式】1、图书:编者姓名.书名.书.出版地:出版社,出版年.月 例如:赵庆国著.中国农村社会养老保险问题研究M.北京:中国农业出版社,2007.62、期刊论文:作者.题名期刊论文.刊名:发表年,(期) 例如:王斌.中国社会养老保险发展演变与启示J.金融经济:下半月.2011,(6)【数据库构成、计算机检索的过程】P581、数据库构成A、字段a、存取号字段能被计算机识别的特定号码(标识符)b、基本索引字段表达文献内容特征的字段和部分外表特征字段如:题名、文摘、叙词、自由词等

24、c、辅助索引字段表达文献外表特征的字段如:作者、机构、出版年、刊名、语种、文献类型等B、记录由若干个字段组成,它是计算机可存取的基本单位每条记录均有一个存取号1条记录由标题字段、文摘字段、主题词字段、作者字段等组成全文数据库中,一条记录相当于一篇文章;书目数据库中, 一条记录相当于一篇文章的目录、题录或文摘C、文档由众多的记录或字段组织而成一个数据库往往包括一个顺排文档和多个倒排文档a、顺排文档(主文档)存取号是根据记录存入的时间先后顺序,从小到大分配。文献记录按线性顺序排列,只能按存取号顺序查找相当于手工检索工具书中的正文部分b、倒排文档(索引文档)将某一字段提取出来,按一定顺序排列,列出存

25、取号(因存取号置后被称为倒排文档)相当于手工检索工具书中的作者索引、主题索引等辅助索引 基本索引倒排文档(按基本索引字段排列)倒排文档 辅助索引倒排文档(按辅助索引字段排列)在实施检索时,倒排文档必须和顺排文档相互配合。2、计算机检索的过程计算机检索时,检索提问式只有一个主题概念:计算机根据这个主题概念,进入所对应的文献特征标识组织的倒排文档中搜索,得到相对应的文献特征标识,然后根据该特征标识后标注的存取号,从顺排文档中调出记录。检索提问式是带有逻辑运算的多个主题概念的复杂检索式:计算机先从数据库的中的各对应的倒排文档中找到这些主题概念的文献特征标识,然后根据布尔逻辑运算,把这些文献特征标识后

26、标注的存取号集中运算,运算结果得到符合要求的存取号,最后根据这些存取号从顺排文档中调出相应记录。【网络检索工具的类型及判断】P751、按检索机制划分检索型通过输入检索词、查找索引数据库如:Google、XX目录型通过浏览分层目录如:早期的Yahoo!、搜狐混合型2、按检索内容划分综合型不限制主题范围和数据类型如:Yahoo!、Google、XX、搜狐、新浪专题型某一主题范围如:英国的社会科学信息门户特殊型检索某一类型信息或数据如:检索电话号码的555-1212和Switchboard、查询地图的MapBlast、查询图像的WebSeek3、按包含的检索工具数量划分独立型通过自身机制如:搜狐、X

27、X、Google集合型(元搜索引擎)集成多个独立型检索工具,提供一个统一的检索界面如:国际瑞士军刀、Bbmao搜索引擎、万维搜索、Seekle元搜索引擎4、按检索资源类型划分Web资源检索工具以万维网资源为主要检索对象,又以WWW形式提供服务的检索工具A、目录型检索工具(也称网站目录、网页目录、专题目录、主题指南)如:Yahoo!、OpenDirectory、搜狐网站目录、Google网页目录适合三类检索:用户进行笼统的主题浏览和检索;用户尚未形成精确的检索概念;综合性、概括性主题概念的检索B、索引型网络检索工具搜索引擎(也称关键词检索工具)a、独立型搜索引擎(索引型搜索引擎)b、集合型搜索引

28、擎(元搜索引擎、多引擎同步检索系统)c、智能搜索引擎(允许采用自然语言进行信息的检索)d、桌面搜索引擎(软件式搜索引擎)C、信息门户(也称信息网关)水平信息门户 如:Sohu、Sina、Yahoo!垂直信息门户 非Web资源检索工具以非Web资源为检索对象的检索工具如:北大天网搜索、Filez、Hytelnet、DejaNews、T、Liszt【主题途径与分类途径检索的特点】1、主题途径检索:直观、灵活,适合狭窄主题的特性检索或跨学科主题的专指性检索。2、分类途径检索:适合族性检索,不利于特性检索,一般用于学科专业较单一、明确的文献主题检索或课题检索要求泛指性较强(内容范围较广)的文献查找。【

29、各种检索算符的意义及检索式的编写】P811、布尔逻辑算符(或与非)最常用、最基本“与”and、* “或”or、+ “非”not、-not优先,and次之,or最后 括号优先Ps:“not or and”用大写还是小写,还是用“* - +”,要依不同的数据库确定布尔逻辑中,* - + () 半角有效,全角无效2、位置算符(邻近检索)(W)或(nW)运算符 With(W)检索词彼此邻近,词序不可以改变,检索词之间不允许插入词或字符,但允许空格或标点符号例如:CD(W)ROM=CD-ROM CDROM control(W)system=control system(nW)检索词之间允许插入不多于n个

30、的词,但词序不可以改变例如:control(1W)system=control system,control of system,control in system(N)或(nN) 运算符 Near(N)彼此相邻,词序可改变,但检索词之间不允许插入词或字符,但允许空格或标点符号例如:robot(N)control=robot control,control robot(nN)检索词之间允许插入不多于n个的词,但词序可以改变例如:control(1N)system=control system,control of system,control in system,system of control,system without control(F)运算符 Field两侧的检索词必须出现在同一字段中,两词前后顺序

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1