《信息检索与利用》考点总结Word文档格式.docx
《《信息检索与利用》考点总结Word文档格式.docx》由会员分享,可在线阅读,更多相关《《信息检索与利用》考点总结Word文档格式.docx(15页珍藏版)》请在冰豆网上搜索。
关系:
1)包含关系:
知识包含于信息中,信息包含了情报,文献也包含于信息内。
2)转化关系:
文献是记录有信息或知识的载体,当文献中记录的信息或知识传递给用户,并为用户所利用时,就转化为情报。
例:
图书馆馆藏图书。
3)交叉关系:
情报虽大多来自文献,但也可能来自口头和实物,所以情报与文献存在交叉关系。
信息的基本特征:
客观性,时效性,价值型,传递性,共享性,开发性。
情报的属性(3种):
知识性(信息性)、传递性和效用性(被用户所利用)。
构成文献的基本要素(4个):
1)知识内容:
信息或知识
2)记录符号:
表达符号
3)物质载体:
材料
4)记录手段:
即将知识、信息固化到载体上的手段
5、一些文献类型的特征号码(ISBN,ISSN,CN,GB2763-87,GB/T,ISO,IEC)
ISBN:
国际标准书号(唯一性)。
有ISBN号的一定是图书。
ISBN号组成中不包括作者代号。
ISSN:
国际标准刊号。
CN:
国内统一刊号
GB2763-87:
国家标准
GB/T:
推荐性国家标准
ISO:
除电子电工外的国际标准
IEC:
电子电工领域国际标准
6、文献的几种划分类型,按文献的载体形式划分(手写型文献、印刷型文献、缩微型文献、声像型文献、机读型文献);
按文献的加工深度划分(零次文献、一次文献、二次文献、三次文献);
按文献的出版形式划分11种、其中特种文献8种P15-26
1)手写型
印刷型
缩微型
声像型
机读型
2)零次文献:
指未经出版发行或未进入社会交流的最原始的文献。
如私人笔记、工程图样、实验记录、论文草稿、发言稿、会议记录、私人信件、绝密文件、技术档案等。
一次文献:
是指以作者本人的生产实践、教学实践与科学研究成果为基本素材撰写并公开发表的文献。
主要包括期刊论文、科技报告、会议论文、专利说明书、技术标准以及部分学位论文等,通常也称之为原始文献、原文。
二次文献:
是对一次/三次文献进行整理、加工的产品。
即把大量的、分散的、无序的一次或三次文献按一定的方法进行加工、提炼、整理、简化,组织成为系统的便于查找的文献系统。
三次文献:
是指围绕某一领域、某一学科或某一专题,利用二次文献检索搜集的大量一次文献,对其内容进行分析、综合、提炼、重组、概括而成的文献,如各种述评、综述或进展性出版物,以及百科全书、字(辞)典等参考工具书
3)特种文献包括(8种):
科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料、技术档案。
常见类型(3种):
图书,期刊,报纸。
7、图书、期刊的类型及特点。
P18、P19
图书类型:
按其用途可分为三种类型:
1)阅读用书:
教科书、专着、文集等。
2)参考工具书:
字典、词典、百科全书等。
3)检索用书:
以图书形式刊行的书目、题录、文摘等。
图书特点:
优点:
图书的内容全面系统,基础理论性强,论点成熟可靠。
缺点:
图书的撰写、编辑、出版所需要的时间较长,传递信息速度慢,不能及时反映最新科技动态。
科研人员一般不把它列为首选的使用对象。
期刊类型:
期刊按其性质和用途不同,分为:
1)学术性与技术性期刊
2)检索性期刊:
如《社会科学文摘》
3)其他期刊:
包括快报性刊物、资料性刊物、科普性刊物等。
按出版形式,分为:
1)正式期刊:
由国家新闻出版署严格审批,既有国际标准刊号ISSN,也有国内统一刊号CN
2)非正式期刊:
一般只限行业内部交流,不公开发行,其出版必须经过行政部门审核,并领取“内部报刊准印证”。
期刊特点:
期刊反映的多是最新的科技成果,内容新颖,信息量大,品种多,通报速度快、出版周期短等特点。
是科研人员的首选信息源。
按期连续出版,便于研究者长期跟踪研究。
8、图书、期刊、报纸等8种文献在数据库中的字段及参考文献着录格式(各种类型文献的二次文献项目(即指具体每种类型在数据库中的字段)、有代表性的号码(ISBN、ISSN和CN、ISO、GB等)等 。
P15-P25
图书形式特征(即二次文献的项目)
期刊的形式特征,即参考文献着录格式:
着者.题(篇)名[J].刊名,年,卷号(期号):
引文所在的起始或起止页码。
报纸参考文献着录格式:
责任者.题名[文献类型标志/文献载体标志].报纸名,出版日期(版次)
示列:
傅刚,赵承,李佳路.大风沙过后的思考[N].北京青年报,2000-04-12(14).
科技报告着录的项目:
名称(项目名称、成果名称),完成(执行)的单位及人员,起止时间,关键词,项目简介。
科技报告的着录内容依次是:
报告者.报告题名[R].地点:
报告机构,完成年。
学位论文着录格式:
作者,题名,导师,学位授予单位所在的城市,学位授予单位,学位授予时间。
会议论文参考文献格式:
论文作者.论文标题.见(英文用in):
主编.论文集名[C].出版地:
出版者.出版年:
起止页码.
专利文献的着录格式:
专利所有者、题名[P]、专利国别、专利号。
标准文献形式特征:
中文标准名称、发布日期、发布单位、实施日期、英文标准名称等。
标准编号(标准号)是由“标准代号+顺序号+发布年号”组成。
第二章检索基础知识
1、信息检索的含义P29
广义的检索包括信息的存储和检索两个过程。
信息存储是将大量无序的信息集中起来,根据信息源的外部特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的数据库或检索系统,供人们检索和利用。
而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。
2、信息检索类型(按检索手段划分,按检索对象划分)P30-31
按检索的手段划分:
1)手工检索(Manualretrieval)
2)计算机检索(Computer—basedretrieval)
按照检索的对象(或检索结果)划分:
1)文献检索(相关性检索。
如兰思仁的期刊论文,莫言的小说,毕业论文、专利、科技报告等)
2)事实检索(确定性检索。
如IBM总部、皖南事变)
3)数据检索(确定性检索。
如08年汽车生产量、2014年GDP总量)
4)声频与视频检索(确定性检索。
如奥巴马就职演说音频等)
3、信息检索系统、计算机检索系统的构成P32、P34
信息检索系统的构成:
1)检索文档—-例:
维普的期刊,馆藏书目,我校学位论文等
2)检索设备—-电脑、服务器、网络等
3)系统规则---基本检索、高级检索、检索式检索等
4)操作人员---用户等
计算机检索系统构成:
硬件设备,软件部分,数据库。
4、数据库结构P35
数据库结构组成:
字段,记录,文档,帮助文件。
5、信息标引P37
标引的概念:
标引是指在文献信息的处理过程中,将文献的内容特征和外部特征分析转换成检索标识的过程,即对信息资源中具有检索价值的特征信息。
6、检索语言的概念,检索语言的类型(按表达信息的特征划分有哪些类型,按标识的组配方式可分为先组式语言与后组式语言)P39-P40
检索语言作用:
是标引者和检索者之间沟通的桥梁。
(常考哦~)
检索语言的类型:
a)按规范化程度分:
自然语言/非规范化语言;
受控语言/规范化语言/人工语言
b)按标识的组配方法分:
先组式语言(如分类号,标题词);
后组式语言(如关键词)
c)按表述信息的特征分:
描述外部特征语言【题名(书名、刊名等),责任者(着者、编者、译者等),号码(ISBN、报告号、专利号、标准号等),引文(参考文献)】
描述内容特征语言【分类语言,主题语言】
检索语言定义:
检索语言是根据信息检索的需要而创制的,能够唯一地表达各种概括文献信息内容的概念,能够显示概念之间的相互关系,并便于进行系统排列,便于将标引语言和检索用语进行相符性比较的人工语言。
7、主题检索语言按照选词方式不同,可分为哪3种。
P40
按选词方式不同分为:
1)标题词语言(先组式、规范化的检索语言)
2)叙词语言(后组式、规范化)
3)关键词语言(后组式、不规范)
8、主题检索语言、分类检索语言的特点p42P44
主题检索语言特点:
直观性强、专指性强、灵活性强。
分类检索语言的特点:
1)分类语言是以文献信息内容所属的学科性质来划分和集中文献,能够较好的体现学科的系统性,便于人们从某学科或专业的方面来查找文献
2)分类语言能够较好的反映各个类目间的纵向层次关系
3)分类语言是图书馆图书组织排架的依据。
9、分类法有哪些?
掌握中图法体系结构、标记符号P43-44
有代表性的分类法:
《中国图书馆分类法》(中图法)
《中国科学院图书馆图书分类法》(科图法)
《中国人民大学图书馆图书分类法》(人大法)
《杜威十进分类法》(DDC)
《国际十进分类法》(UDC)
《中国标准分类法》(CCS)
《国际标准分类法》(ICS)
《国际专利分类法》(IPC)
中图法的体系结构:
1)5个大部,22个大类(一级类目)
2)每一大类下(拼音字母表示),层层划分,逐级展开为二级、三级、四级……类目,
3)同位概念(并列关系、平行关系)P42
4)上位概念、下位概念(隶属关系、从属关系)
P42、43
《中图法》的标记符号:
1)《中图法》的分类号,采用汉语拼音字母与阿拉伯数字相结合的混合制号码
2)大类(一级类目)由拼音字母表示,二级、三级…等,由数字表示,同位类基本是十进制。
3)特例:
“工业技术”大类(T大类),所属的二级类目仍用字母表示,如TH、TP、TS…
4)分类号中,从左往右,每三位数字,用“·
”隔开,例
S435.111.1 S156.4 S718
S571.1 TS272.52
第三章计算机检索基础知识
1、布尔逻辑算符类型与用法P48
基本的布尔逻辑算符:
逻辑与、逻辑或、逻辑非。
逻辑与:
也叫逻辑乘,常用符号“and”或“*”表示。
作用:
增加限制因素,缩小检索范围,提高检索的专指性。
逻辑或:
常用符号“or”或“+”表示。
作用:
扩大检索范围,提高查全率。
逻辑非:
常用符号“not”或“—”表示。
缩小检索范围,提高查准率
2、截词检索(概念、截词方式、作用);
位置算符(with、Near的用法——(w)、(Nw)、(N)、(Nn));
字段限定检索;
短语检索算符P49-54
截词检索(Truncation):
是指用给定的词干做检索词,查找含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索。
(多用于外文数据库)
用于词干相同、词义相近,词形多样的检索词截词符常用 ?
、* 、#、$表示。
截词的类型:
1)按截词位置分4种:
前截词:
截去某个词的前部,是词的后方一致比较,也称后方一致检索(左截词)。
例如:
*magnetic
后截词:
截去某个词的尾部,是词的前方一致比较,也称前方一致检索(右截词)。
comput*
中间截词:
截去某个词的中间部分,使词的两边一致,也称两边一致检索。
输入organi?
ation可以检出organization、organisation
前后截词:
指同时在词干的前后两部分进行截词的方式。
例如:
*chemi*
2)按截词数量分2种:
有限截词:
一般用“?
”表示,表示代替0或1个字或字符,例如:
work?
、work?
?
、20?
无限截词:
一般用“*”表示,表示替代任意多个字符,即替代0~n个字符,例如:
work*
截词检索的作用:
A、截词符具有“or”运算符功能,
B、能够扩大检索范围,提高查全率
C、减少了输入检索词的时间,节约了机时
D、精简检索式
位置检索算符:
1.(W)与(nW)算符:
a)(w)是with缩写,简写(),表示此算符两侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词之间不许有其它的词或字母,但允许有一空格或标点符号。
如:
CD(w)ROM相当于CDROM或CD-ROM
b)(nW)是nwords的缩写,表示此算符两侧的检索词之间允许插入最多n个词,且词序不可变。
Wear(1W)material相当于Wearmaterial、wearofmaterial
2.(N),(nN)算符:
a)(N)是near的缩写,表示此算符两侧的检索词必须相邻,词序不限,词间不允许插入其它词或字母,但允许有一空格或标点符号。
CD(N)ROM相当于CDROM或CD-ROM或ROMCD或ROM-CD
b)②(nN)表示两词间可插入最多n个词,词序不限。
railway(2N)bridge可表示Railwaybridge、bridgeofrailway、bridgeoftherailway
字段限定算符是把检索词限定在记录中出现的某个或某些字段中。
字段有两种:
1)基本字段:
能够揭示文献的主要内容特征。
如:
字段代码:
题名(TI)、摘要(AB)、主题词(DE),分类号等。
2)辅助字段:
表示文献的外部特征。
着者(AU)、出版年(PY)、刊名(JN)、语种(LA)、文献类型(DT)、机构(CS)等。
字段检索:
对于在“基本索引字段(TI、AB、DE、ID)”中的查找,用后缀方式常用符号有“/”或“in”;
对于在“辅助索引字段(AU、BN、SN、CC等)”中的查找,用前缀方式常用符号有“=”“>
=”“<
=”“>
”“<
”等。
短语检索算符:
用双引号表示,主用于提高检索精度和准确度。
3、信息检索途径的定义,常用信息检索途径(主题、分类、着者、题名、号码等),重点掌握主题途径、分类途径的用法、优缺点、查全、查准效果比较P60
信息检索途径-检索入口(字段):
1)分类途径-分类号字段
2)主题途径-题名、关键词、题名或关键词、摘要、主题、任意字段
3)题名途径-题名(标题、篇名)、书名、刊名
4)着者途径-作者、导师、专利权人、发明人
5)号码途径-专利号、标准号、ISBN、ISSN
6)其他途径-分子式、环系结构、属种名称、机构
分类途径的优缺点:
优点:
按学科、专业集中相关文献信息,具有族性检索的功能(能够把同一学科的文献信息集中在一起检索出来),查全率较高。
以学科分类为基础,符合人们认识事物的习惯,一旦熟悉分类体系很容易被人接受和使用。
缺点:
不适用于特性检索(复杂冗长的专题信息检索),查准率比主题词低。
对全面检索边缘、交叉学科资料造成较大的困难;
分类表一般几年才修订一次,难以反映新学科和新名词术语。
主题途径的优缺点:
直观性、专指性、灵活性,适合特性检索,查准率高。
用词或词组作检索标识,表达概念灵活、准确、专指性强,能把同一主题内容的文献集中在一起同时检索出来。
“C语言-程序设计”比用分类号TP312表达更准确。
不适合族性检索(检索到的信息同属一类学科或者专业),查全率比分类号低。
由于很规范,非专业人士难以掌握。
检索“大学教材”应选择“高校”为主题词。
4、计算机检索的主要步骤(信息检索流程),主题概念的选词方法,同义词的扩展(如:
学名或俗名,上位词和下位词,简称与全称,术语与代码等)P60
信息检索步骤;
⑴分析检索需求,明确检索目标、内容和范围。
⑵选择检索字段⑶选择检索数据库和检索书刊⑷选择检索途径⑸选择检索词⑹构建检索式⑺实施检索并调整检索式⑻输出检索结果及获得原始信息。
5、检索表达式的构建P66(参照课题分析P303)
检索表达式:
又称检索式,是指将选择出的检索词,用布尔逻辑算符、截词算符、字段代码及位置算符等,按课题的需要,合理组配,形成表达具体信息需求的逻辑表达式。
表达式构建的注意事项:
主题词的选取
1、课题名称 ≠ 主题词
2、检索词与字段的配合
3、相关概念(隐性概念)的分析
4、无关概念的排除(如研究、方法、技术、作用、现状、近况、展望、发展趋势、应用、利用、建立、实施、影响、效率、结构等这些词都不要)
第四章搜索引擎(P54)
1、搜索引擎关键词语法规则(布尔逻辑算符、截词算符、字段限定检索、邻近符等)
布尔逻辑算符:
(1)逻辑“与”
逻辑“与”一般用空格、“AND”表示,有的搜索引擎还可以用“&
”表示。
使用逻辑“与”是为了要求检索结果的Web页面中同时出现所有输入的检索词,提高查准率。
(2)逻辑“或”
逻辑“或”一般用“OR”表示,有的搜索引擎还可以用“|”、“,”表示。
使用逻辑“或”是为了允许检索结果的Web页面中出现输入检索词的任何一个,提高查全率。
(3)逻辑“非”
逻辑“非”一般用“NOT”表示,有的搜索引擎还可用“!
”“-”表示。
使用逻辑“非”是为了要求检索结果的Web页面中出现NOT前的检索词,但排除含有NOT后的检索词的页面信息,以缩小检索范围。
字段限定:
①intitle:
在标题中搜索,表示限定词后接的词必须出现在网页的标题内
②site:
将搜索范围限定在某类站点或某个网站内。
③filetype:
找特定类型的文件。
文件的类型:
word、excel、pdf、powerpoint、压缩文件、文本文件等
2、常用搜索引擎选介、如XX、谷歌检索规则与技巧
3、谷歌的图书、学术搜索及XX的学术搜索、XX文库等。
第五章专利及专利文献
1、专利概念
专利的基本概念:
专利法保护的发明创造;
是指载有发明创造详细内容的专利说明书;
是指专利权。
2、专利基本特性(独占性、时间性、地域性)
专有性、时限性和地域性。
4、专利类型
专利类型:
发明专利、实用新型专利、外观设计专利
5、我国授予专利权的基本条件(新颖性、创造性、实用性)
专利三性:
新颖性、创造性、实用性
6、专利号(申请号)组成
申请号:
2003年10月起中国专利申请号扩编,9位变13位。
专利申请号:
外观设计专利。
例CN201430011757、CN97305103
专利号:
专利号与申请号,数字部分相同。
专利授权后,申请号的前缀CN,改为ZL。
如:
ZL03184563.2;
ZL200410026621.3
7、可供检索专利的数据库或网站
检索专利的数据库:
万方数据库、清华同方(CNKI)、超星读秀学术搜索、中国知识产权局、Fulink平台
第6章检索通用规则(P77)、毕业论文与学术论文集P341
1、检索平台通用规则(掌握一个检索平台(或数据库),可从哪几个方面入手)P80
1)了解数据库概况,重点掌握各数据库收录文献情况
2)了解数据库平台的资源组织方式,提供的检索方式(如快速检索、高级检索、分类检索、专业检索等)
3)掌握检索系统的具体运算符号(布尔逻辑符号、截词算符、位置算符、字段限定符等)
4)掌握检索结果的输出
5)了解个性化服务功能
2、三大中文数据库平台运算符配备情况P83
3、运算符在维普数据库平台不同检索方式中表现形式P83
4、学位论文的结构:
P347
前置部分(包括封面,摘要,关键词,目录)
主体部分(包括引言,正文,结论,致谢,参考文献)
附录部分(必要时)
结尾部分(必要时)
5、学术规范(定义、内容)P350
看书
6、学术不端论文检索系统(AMLC)P356
第7章检索效率P295
1、检索效率
2、检索效率评价指标(查全率、查准率)
查全率(Recallratio,R):
又称检全率、召回率,是指检出的相关信息数量与检索系统中全部相关信息总量的比率。
查准率(Precisionratio,P):
也称检准率、精确率,是指检出的相关信息数量与检出的全部信息总量的比率。
3、查全率、查准率的计算公式
4、影响信息检索效率的因素
1)检索词的选取存在问题
2)检索限制过于严格或宽松
3)检索关系的组配不准确
4)检索词与字段检索配合不当
5)截词使用不当
6)未能充分掌握数据库的检索特点
5、提高信息检索效果的主要措施
1)提高查全率的方法
2)提高查准率的方法
3)同时兼顾查全率和查准率的措施
实习:
数据库:
维普数据库中国知网系列数据库(cnki)、万方数据、fulink平台,馆藏书目数据库,数字图书馆(超星汇雅电子书、方正电子书等、),超星读秀学术搜索,Webofscience,ScienceDierct数据库、Springerlink全文数据库,搜索引擎使用技巧,google学术搜索、文献管理软件(国外ENDNOTE,国产NoteExpress等)。
掌握以上数据库可检索的文献类型、可检索字段及检索方法、,具体数据库的检索策略(查全与查准)的调整。