南开大学《网络信息文献检索》期末考试备战考题全集2Word文件下载.docx
《南开大学《网络信息文献检索》期末考试备战考题全集2Word文件下载.docx》由会员分享,可在线阅读,更多相关《南开大学《网络信息文献检索》期末考试备战考题全集2Word文件下载.docx(35页珍藏版)》请在冰豆网上搜索。
第5章电子图书检索与获取
第6章电子期刊检索与利用
第一节民国期刊
第二人大复印资料
第三节国家哲学社会科学学术期刊数据库
第四节数字博看中文期刊
第五节龙源期刊
第六节维普
第七节CNKI-中国学术期刊(网络版)
第八节万方
第九节论文收录引用与核心期刊查找
第7章国内外硕博士学位论文的获取
第8章专利知识、检索及获取
第9章标准文件的检索与获取
第10章会议文献的检索与获取
第11章科技报告的检索与获取
第12章政府工作报告的检索与获取
第13章事实型信息检索
一、客观部分:
(单项选择、多项选择、不定项选择、判断)
(一)、选择部分
★考核知识点:
信息、知识、文献的关系
附(考核知识点解释):
信息是物质存在的一种表现形式和物质运动规律及特点的表象。
(简单地说就是物质属性的表征)。
知识是人类在改造客观世界的过程中所获得的认识和经验的总和,是信息的一部分,是一种特定的人类信息。
(是经过人脑加工处理过的系统化了的信息。
)
文献是记录有知识的一切载体。
三者之间的关系为:
信息>知识>文献
文献的定义
附(考核知识点解释)
文献由三个要素构成,知识、载体、记录方式三位一体不可分割。
知识:
要有一定的知识内容。
载体:
要有记录知识的物质载体,如纸张、感光材料、磁性材料等。
记录方式:
要有用以保存和传递知识的记录方式,如文字、图形符号、视频、声频等技术手段。
一次文献
通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。
如期刊论文、科技报告、会议论文、专利说明书。
二次文献
也叫检索工具。
是将大量分散的无组织的一次文献经浓缩、加工、整理后形成的文献。
如目录、题录、文摘、索引等。
三次文献
是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。
如综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目
零次次文献
指口头传输或者是不正式的记录,是未经发表和有意识处理的最原始的资料。
如私人笔记,设计草图、实验记录、文章草稿、会议记录、书信文书等。
其特点是内容新颖,但不成熟,不公开交流,难以获得。
文献源的辩识
1、期刊作者.题名〔J〕.刊名,出版年,卷(期)∶起止页码
2、专著作者.书名〔M〕.版本(第一版不著录).出版地∶出版者,出版年∶起止页码
3、论文集作者.题名〔C〕.编者.论文集名,出版地∶出版者,出版年∶起止页码
4、学位论文作者.题名〔D〕.保存地点.保存单位.年份
5、专利文献题名〔P〕.国别.专利文献种类.专利号.出版日期
6、标准编号.标准名称〔S〕
7、报纸作者.题名〔N〕.报纸名.出版日期(版次)
8、报告作者.题名〔R〕.保存地点.年份
9、电子文献作者.题名〔电子文献及载体类型标识〕.文献出处,日期
信息检索语言的概念和分类
信息检索语言是人们在加工、存储及检索信息时所使用的标识符号。
把信息的存储与检索联系起来,把标引人员与用户联系起来,以便取得共同理解、实现交流的语言。
(是信息标引人员和检索用户在信息的组织、存储和检索过程中共同遵守和使用的语言。
)主要包括人工语言和自然语言。
分类检索语言的定义、常用分类法及优缺点
分类检索语言是以学科为基础,按照学科范畴及知识之间的关系列出类目,并用数字、字母符号对类目进行标识的的一种语言体系,也称分类法。
目前比较常用的分类法有《中国图书馆图书分类法》简称《中图法》;
《杜威十进分类法》;
《国际专利分类法》等。
优点:
强调知识的系统性,方便人们按学科、专业检索有关文献资料,达到族性检索,提高查全率。
便于图书馆资料排架。
但检索课题时,必须了解课题所属的学科体系,否则很难检索。
总是落后于科学技术的发展,难于及时反映新兴学科和边缘学科的发展及内容。
在将检索文献的主题内容转换成分类号的过程中,容易产生误差,造成误检。
主题检索语言的定义
主题检索语言是经人工规范化处理的最能表达文中主题概念的语词。
所谓规范化处理,就是在文献存储时,对文献中的同义词、近义词、多义词等加以严格的控制和规范,使得同一主题概念的文献相对集中在一个主题词下。
因此,主题词语言也叫人工受控语言。
代码检索语言的概念和举例
代码检索语言就事物的某一方面的特征,用某种代码系统来加以标引和排列。
分子式C3N6H6(三聚氰胺)
专利号(一次性照相机)
标准号GB/T6892-2006
自然语言的概念和举例
自然语言是从信息内容本身抽取的,主要依赖于计算机自动抽词技术完成,是非规范词(uncontrolledterm)
自然语言标识包括:
①关键词:
文献的题名、文摘甚至是正文中抽出的具有实质检索意义的词,对揭示和描述文献主题内容比较重要和关键的词语。
②题名:
信息资源的名称,如论文的篇名、图书书名、网站名称等。
③全文:
从资源的全部内容中自动抽取、查找。
构建检索式的基本规则
1、逻辑算符and、or、not
定义:
表达概念间逻辑关系的符号(与、或、非)
AandB---壳聚糖and分子筛
AorB---磁性高分子微球or磁微球
AnotB---computernotinternet
2、优先算符-嵌套符()
用()将指定检索式括起来,系统首先检索()内概念
多层逻辑组配关系,如:
(AorB)andC
3、位置算符nW、nN
表达概念间位置关系的算符。
系统里的位置算符有2个:
W(with)、N(near)
表示方法:
AnWB或AnNB
W–指明先键入的词必须先出现
N–指明两个检索词中任何一个可先于另一个出现
4、截词符*
截词符(*)可以用来代替0个或几个字符。
使用时最少要键入一个词的前3个字符和一个*号,完成同根词检索。
例如,键入econ*,将获得包括econometrics、economics、economist等的检索结果。
5、通配符#、?
当不能确信拼写是否正确时;
或当拼写可替换时;
或当仅知道某词的一部分时;
可以使用通配符
#和?
两种通配符。
#:
代表一个字符。
例如,键入wom#n,会获得包括woman和women的记录。
一个?
:
代表零个或任意个字符。
例如,用colo?
r检索,将得到包含color、colour、colonizer和colorimeter的记录。
一个?
和一个数字:
数字代表可替换的字符数。
例如,键入colo?
4r,只能获得包含colonizer的记录。
6、复数标识符+
7、禁用词
是系统不对之进行运算操作的词,即使把它们作为检索词输入也是毫无意义的。
因而应避免把它们作为检索词。
这些禁用词多为一些冠词、介词和代词。
8、固定短语或词组“”
文献检索的基本原理
检索系统将检索者的提问标识与存储在检索工具中的文献特征标识进行比较,凡是文献特征标识=检索提问标识,或者文献特征标识>
检索提问标识,那么,具有这些特征标识的文献就从检索工具中输出。
文献检索方法
文献检索的方法归纳起来有以下三种:
1、常用法
常用法是利用一般检索工具进行查找文献的方法,是最常用的一种方法。
常用法可以分为顺查法、倒查法和抽查法三种。
(1)顺查法:
从用户要求查找的起始年代或课题分析所得出的该课题研究的起始年代起,由远及近地进行逐年查找。
(2)倒查法:
与顺查法相反,由近及远地进行查找文献的方法。
(3)抽查法:
针对课题研究所处的发展高峰期的若干年中进行查找。
2、追溯法
是指利用参考文献进行深入查找相关文献的方法。
追溯检索法也叫扩展法、追踪法。
此法不是利用确定的检索工具,而是利用已知文献的某种指引,如文献附的参考文献、有关注释、辅助索引、附录等,追踪查找文献。
根据已知文献的指引,查找到一批相关文献;
再根据相关文献的有关指引,扩大并发现新的线索,去进一步查找。
如此反复追踪扩展下去,直到检索到切题的文献。
用追溯法检索文献,最好利用与研究课题相关的专著与综述,因为它们所附的参考资料既多且精。
在检索工具不全、文献线索很少的情况下,可采用此法。
3、循环法
是常用法和追溯法的结合。
即先利用检索工具查找出一些具有参考价值的相关文献,然后在利用这些文献所附的参考文献或原文中涉及到的重要线索进行追溯查找,由此获得更多的相关文献。
检索效果的评价
断信息检索效果的标准:
查全率(recallfactor)
查准率(也称适中率,Pertinencefactor)
漏检率(omissionfactor)
误检率(也叫检索噪音,noisefactor)
查全率——它是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度。
查准率——它是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统检出文献准确度的尺度。
在判断检索结果好坏时,查全率(Recallratio)与查准率(Precisionratio)是两个最常用的指标。
它们表示系统的“过滤能力”,即让相关文献“通过”,“阻止”无关文献。
查全率和查准率之间具有互逆的关系,一个IR系统可以在它们之间进行折中。
在极端情况下,一个将文档集合中所有文档返回为结果集合的系统有100%的查全率,但是查准率却很低。
另一方面,如果一个系统只能返回唯一的文档,会有很低的查全率,但却可能有100%的查准率。
通常,以查全率和查准率为指标来测定IR系统的有效性时,总是假定查全率为一个适当的值,然后按查准率的高低来衡量系统的有效性。
查全率和查准率之间存在互逆关系,如果某检索工具的查全率较高,则其查准率将相对下降,反之,查准率高,则查全率低。
查全率和查准率只能相对提高,二者永远不可能同时达到100%.
实验证明,在查全率和查准率之间存在着相反的相互依赖关系--如果提高输出的查全率,就会降低其查准率,反之亦然。
怎么提高检全率
尽可能多的同义词
进行族性检索,用检索词的上位类、上位概念进行检索,也可用检索词的下位概念进行补充检索。
将一个复杂概念分解为几个简单概念进行组配检索。
适度运用截词检索
删除不必要的时间、学科、年龄组等限定
调节检索式的网罗度,增加“+”的运算,减少“and”和“not”的运算,不要出现特点、