《网络信息文献检索》复习资料庞佳doc.docx
《《网络信息文献检索》复习资料庞佳doc.docx》由会员分享,可在线阅读,更多相关《《网络信息文献检索》复习资料庞佳doc.docx(28页珍藏版)》请在冰豆网上搜索。
《网络信息文献检索》复习资料庞佳doc
《网络信息文献检索》课程期末复习资料
一、客观部分(单项选择、多项选择、判断)
(-)选择部分
★考核知识点:
网络信息资源的类型
附:
1.1.1(考核知识点解释):
网络信息资源可以根据多种不同的标准进行划分,根据信息资源的出版形式,网络信息资源可以划分多种形式,其中包括
(1)电子图书:
正式出版的具有一定篇幅的非连续性的出版物,可以是直接在网络上以电子形式出版的,也可以是以纸质形态出版后,以数字化形式保存在互联网中供读者使用的图书。
(2)电子期刊:
期刊,又称连续出版物,是定期或不定期发行的连续出版物。
电子期刊则是电子化的期刊。
目前出版的形式有两种,一是以纸质形式出版后,将其数字化,并通过网络传播;二是直接在网络上以电子形式出版。
(3)会议论文:
会议论文是指在各种学术、专题会议上发表的论文、报告。
会议论文时效性强,可以及时反映某一领域或专题的研究动态、最新研究成果,代表着这一领域的研究水平。
会议论文一般以论文集的形式出版,有时也会发表在专业期刊上。
(4)学位论文:
学位论文是研究者旨在获得某个专业的专业学位而完成的研究型论文。
学位论文的结构完整,会对研究的背景、内容、方法、结果等方面进行系统的分析与论述。
目前数据库中较为常见的学位论文为硕士和博士学位论文。
按照信息资源中数据类型划分的标准又可以将网络信息资源分为事实型信息、数值型信息等。
而这些信息资源是进行研究特别是实证研究时必须的信息资源。
因此,电子期刊、事实数据和学位论文都是撰写论文时应该检索的重要信息资源。
★考核知识点:
网络信息资源检索技术
附:
1.1.2(考核知识点解释):
布尔逻辑检索是运用布尔逻辑算符表达检索词之间的逻辑关系,组配出完整的检索概念,实现信息检索目的的检索技术。
布尔逻辑检索采用的逻辑运算符包括“与”、“或”、“非”,以及大于、小于、等于、不等于等。
“与”、“或”、“非”是最为常用的逻辑运算符。
(1)逻辑“与”
逻辑“与”用“AND”或“*”表示,其含义为若两个或多个检索词间以“AND”或“*”相连接,则表示该两个或多个检索词需同时出现在检索字段中,则文献才被命中。
(2)逻辑“或”
逻辑“或”用“OR”或“+”表示,其含义为若两个或多个检索词间以“OR”或“”相连接,则表示该两个或多个检索词只要有一个出现在检索字段屮,
则文献被命中。
(3)逻辑“非”
逻辑“非”用“NOT”或“-”表示,其含义为若两个检索词间以“NOT”或“-”相连接,则表示只有NOT前面的检索词出现在检索字段中,而NOT后面的检索词不出现在检索字段屮,则文献被命屮,其他情况文献不被命屮。
★考核知识点:
网络信息资源检索技术
附:
1.1.3(考核知识点解释):
截词符的形式与分类
不同的系统使用的截词符不完全相同,但最常用的截词符有“*”和“?
”
等多种截词符。
按照截词符代替的字符或字符串的数量可以分为有限截词和无限截词。
有限截词,即指一个截词符只代表一个字符。
无限截词则是指一个截词符可代表多个字符或一个字符串。
因此,“*”和“?
”也代表了不同的截词含义。
“”代表0或1个字符,而“?
”代表0或多个字符或一个字符串。
(1)“*”
“*”只代表单词中任意位置的0或1个英文字符。
在出现单词的单复数、英式和美式拼写时,使用“*”可以一次将两种不同写法同时检索出来。
(2)“?
”
“?
”可以代表单词中的0或多个字符。
在检索词出现名词、现在分词、过去分词等不同形式时,可以采用“?
”代替单词的不同词根部分,一次性获得全部形式的检索结果。
★考核知识点:
网络信息资源检索技术
附:
1.1.4(考核知识点解释人
CNKT数据库跨库检索结果分组类型包括:
学科类别、中文关键词、研究层次、文献作者、作者单位、文献出版来源、研究获得资助、来源数据库、发表年度。
★考核知识点:
网络信息资源的组织方式
附:
1.1.5(考核知识点解释人
网络信息资源的组织是根据网络信息资源的内部与外部特征对信息进行的序化和表征,用以更加系统、规律地揭示信息资源及其内在与外在联系,实现信息资源查找的方便、准确。
按照不同的组织原则,信息资源被组织成不同的结构,形成不同的组织方式。
常见的信息资源组织方式有数据库方式、搜索引擎方式和主题指南方式。
(1)在数据库中,信息资源被分解为基木的存储单元一一字段,并按照相应的规则进行组织,用户可以根据需要,对不同字段进行检索,也可根据具体的要求,将多个字段内容组合检索,获得精确的检索结果。
(2)以搜索引擎方式存在的信息资源,是自动搜索程序对网络中公开的信息进行持续收集,利用索引软件对收集到的信息进行自动标引,构建成基于Web的数据库,并向用户提供关键词检索。
(3)主题指南方式是一种综合利用分类与主题相结合的信息资源组织方式,以主题词为类目划分的标识,利用超文本链接技术将网络中的信息组织成检索体系,逐层导引用户找到自己需要的网络信息资源。
★考核知识点:
截词检索的使用方法
附:
1.1.6(考核知识点解释):
截词检索主要是利用检索词的词干或者不完整的词形进行检索。
最为常见的是“”和“?
”。
“?
”可以代表单词屮的0或多个字符。
在检索词出现名词、现在分词、过去分词等不同形式吋,可以采用“?
”代替单词的不同词根部分,一次性获得全部形式的检索结果。
如:
检索“管理”这个概念,会有manage,managing.
management等多个拼写形式,那么可以将检索式写为:
manag?
则检索结果会将包含上述单词的文献全部显示。
★考核知识点:
截词检索的使用方法
附:
1.1.7(考核知识点解释人
网络信息资源的检索,可以根据不同的需求和具备的检索条件,选择不同的检索方法。
经常使用的检索方法包括常用检索法、回溯检索法和循环检索法。
★考核知识点:
数据库的分类
附:
1.1.8(考核知识点解释人
除了从数据结构的角度对数据库进行划分,数据库还可以从应用的角度划分。
按照数据库中数据的用途可将其划分为学术数据库、应试数据库、实证数据库和休闲数据库。
(1)学术数据库:
学术数据库是指包含各类学术信息,用于学术信息检索与分析的各类数据库系统,包括学术期刊数据库、电子书数据库、学位论文数据库、会议论文数据库等。
(2)应试数据库:
应试数据库是指包含各类资格考试与等级考试信息、真题、模拟题的数据库,这些数据库可以提供考试要求、历年考试真题、模拟题等数据内容,并提供在线测试、计分、答案分析等数据使用功能。
(3)实证数据库:
实证数据库是指仅包含各类统计数据、事实数据、案例、标准、专利等客观内容的数据库。
这些数据可以为研究者提供很好的客观研究依据、详实的数据,形成研究中的事实依据,也可以为研究者提供对研究内容的考证依据。
这类数据库具有极高的客观性。
(4)休闲数据库:
休闲数据库是指以娱乐休闲信息资源为主体的数据库,可以为人们提供娱乐、休闲的内容与服务功能。
比如提供歌曲、休闲讲座的音频与视频数据库,讲授健身、舞蹈、旅游等内容的多媒体数据库等都是休闲数据库。
★考核知识点:
网络信息资源的检索策略
附:
1.1.9(考核知识点解释人
在检索网络信息时,应分析检索课题的主旨内容,明确检索的目的和要求,根据要求检索相应的学科和文献信息类型。
在选题阶段对于该文题的研究综述、最新研究成果的报道以及本领域的权威信息都应该给予高度的关注,也是必须检索的信息资源。
这样才能保证所选题目具有较好的新颖性和研究价值。
★考核知识点:
信息资源的组织形式
附:
1.1.10(考核知识点解释人
网络信息资源的组织是根据网络信息资源的内部与外部特征对信息进行的序化和表征,用以更加系统、规律地揭示信息资源及其内在与外在联系,实现信息资源查找的方便、准确。
按照不同的组织原则,信息资源被组织成不同的结构,形成不同的组织方式。
常见的信息资源组织方式有数据库方式、搜索引擎方式和主题指南方式。
★考核知识点:
信息检索的基本原理
附:
1.1.11(考核知识点解释):
网络信息资源检索从狭义上讲,是对互联网或数据库中存在的信息进行查找、保存的过程。
从广义上说,则包括对信息资源进行加工存储和检索获取两个部分。
网络信息资源的加工存储是利用检索语言对信息资源进行标引、分类,形成信息资源标识并以数字化、网络化的形式存储在检索系统中,形成数据集合的过稈,是检索网络信息资源的基础。
网络信息资源的检索则是将用户的需求进行分析、标引,形成提问标识,按照一定的语法规则与信息资源标识进行匹配,当匹配结果一致或包含有检索标识时,系统以信息记录的形式输出检索结果的过程,这是网络信息资源检索的目的。
★考核知识点:
网络信息资源的概念
不同的检索系统有不同的检索原理,但总体上的规则是相通的,即信息资源标识与提问标识匹配结果一致,或包含提问标识,则命中信息资源标识,并显示检索记录。
附:
1.1.12(考核知识点解释):
网络信息资源又称为虚拟资源、因特网信息资源、电子信息资源、数字信息资源、联机信息、万维网资源。
由于网络信息资源的形式众多、特点各异,因此,目前还没有对网络信息资源的统一定义。
一般可以将网络信息资源理解为“将文字、图像、声音、视频等多种形式的信息,存储在以光、磁等非印刷介质的载体上,以超文木、数字化为组织和存在方式,以互联网为渠道,进行发布、传递、存储和利用的各种信息资源的总和”。
★考核知识点:
网络信息资源检索的效果评价
附:
1.1.13(考核知识点解释):
查准率,是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。
使用泛指性较强的检索语言,如上位类、上位主题词能提高查全率,但查准率下降。
★考核知识点:
数据库的结构布局
附:
1.1.14(考核知识点解释):
数据库的组织结构一般会按照分类、主题或分类与主题相结合的方式进行,为了方便初次使用数据库或不熟悉数据库采用的编排体系的用户,大多数数据库都会提供分类导航或主题导航。
通过导航,可以帮助使用者按照相关的主题“顺藤摸瓜”,快速了解自己的检索需求在数据库的哪些部分中,提高检索的准确率和效率。
★考核知识点:
网络信息资源的组织
附:
1.1.15(考核知识点解释):
数据库方式是网络信息资源组织中的重要方式之一。
在数据库中,信息资源被分解为基本的存储单元一一字段,并按照相应的规则进行组织,用户可以根据需要,对不同字段进行检索,也可根据具体的要求,将多个字段内容组合检索,获得精确的检索结果。
以数据库方式组织起来的信息资源,数据规范、统一,具有良好的操作界面,使用简便,检索效果好。
由于对检索范围可以准确的控制,因此,数据库组织方式下的信息检索效率较高,网络负载较低。
★考核知识点:
网络信息资源的组织
附:
1.1.16(考核知识点解释):
网络信息资源的检索可以根据信息资源木身的内外部特征,从多种不同途径检索到同一个信息资源或某一类信息资源。
目前一般依据信息资源的外部特征和内容特征将这些途径分成两大类。
信息资源的内容特征是指从信息资源所承载的具体内容中提炼出的某些内容和信息特征。
通过信息资源的内部特征,可以查找到特定主题的信息,从而获得与该主题相关的文献及其线索。
对信息资源内部特征我们一般按照分类、主题或者分类与主题相结合的方式对不同信息内容特征进行提取与归纳。
★考核知识点:
搜索引擎的类型
附:
1.1.17(考核知识点解释人
独立搜索引擎是能够对Internet网络信息资源进行收集、整理与组织,并提供检索服务的信息服务系统。
独立搜索引擎针对网页信息进行全文搜索,搜索的领域更广更深,但由于每个搜索引擎的数据资源不同、更新速度不同,标引过程屮没有人工干预,因此,使用独立搜索引擎需要进行多次检索,检出的信息存在大量重复,检索效率较差。
元搜索引擎与独立搜索引擎相对,是建立在多个搜索引擎基础上的搜索引擎,它通过统一的查询界面接收查询请求,调用若干独立搜索引擎进行搜索,对不同搜索引擎的检索结果进行统一处理后,用统一的格式反馈给用户结果。
集成搜索引擎也称为“多引擎同步检索系统”,是在一个Web页面上链接多个独立搜索引擎,用户在检索吋需要指定搜索引擎,其检索结果由各搜索引擎分别以不同页面的形式显示或者集中到一个页面分块显示。
★考核知识点:
网络信息资源的检索策略
附:
1.1.18(考核知识点解释):
课题研究的过程中应该注重所检索的信息资源的质量,从而保障研究成果的质量,因此在研究过程中不仅要关注期刊论文,还要关注论述较为系统的图书。
为了避免因出版周期过长而导致的研究迟滞,在文献类型的选择上应该包括出版周期较短的会议论文和直接在网络上出版的该主题的学术信息,同时在使用网络信息资源的同时,也应该注重对纸本信息资源的补充,以保证信息的全面和完整。
二、主观部分(名词解释、简答、论述)
(-)名词解释
★考核知识点:
网络信息资源的含义
附:
2.1.1(考核知识点解释):
网络信息资源又称为虚拟资源、因特网信息资源、电子信息资源、数字信息资源、联机信息、万维网资源。
是将文字、图像、声音、视频等多种形式的信息,存储在以光、磁等非印刷介质的载体上,以超文本、数字化为组织和存在方式,以互联网为渠道,进行发布、传递、存储和利用的各种信息资源的总和。
★考核知识点:
网络信息资源的类型
附:
2.1.2(考核知识点解释人
一次信息,也称原始信息,是指从劳动实践或者研究中产生并正式发表的信息,包括电子图书、电子期刊、电子报纸、专利信息、各种数据库等。
一次信息规范、系统,是对新知识、新发现、新技术等内容规范、详细的描述,具有很好的科学性、严谨性,是人们创造性劳动的结晶,具有参考、借鉴的价值,也是我们检索和利用信息资源的最主要来源。
★考核知识点:
网络信息资源检索的效果评价
附:
2.1.3(考核知识点解释人
查全率即召回率,是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检岀的相关文献与全部相关文献的百分比。
普遍表示为:
查全率=(检索出的相关信息量/系统中的相关信息总量)xl00%o
★考核知识点:
搜索引擎的类型
附:
2.1.4(考核知识点解释):
元搜索引擎,与独立搜索引擎相对,是建立在多个搜索引擎基础上的搜索引擎,它通过统一的查询界面接收查询请求,调用若干独立搜索引擎进行搜索,对不同搜索引擎的检索结果进行统一处理后,用统一的格式反馈给用户结果。
元搜索引擎的优点在于一次检索查找了多个搜索引擎的内容,其自身的检索结果显示机制对来源不同的结果进行了汇集、筛选、去重、合并等优化处理,降低了检索的兀余,提高了效率。
缺点在于检索质量很大程度依赖于所链接的独立搜索引擎的数据质量,受到查询语法转换能力的限制,元搜索引擎目前能提供的查询语法还不完善。
★考核知识点:
网络信息资源的类型
附:
2.1.5(考核知识点解释人
二次信息:
是对一次信息进行组织、加工、整理后,使之按照一定的规律进行编排而形成的内容,也称为检索工具。
二次信息资源主要包括电子目录、索引、摘要、导航等信息内容。
二次信息是检索一次信息的工具。
★考核知识点:
互联网信息中网络检索工具的分类
附:
2.1.6(考核知识点解释人
学科信息门户提供可检索和可浏览的因特网资源目录的联机服务系统,-•般集中于某一相关的学术领域,提供对经图书馆工作人员遴选和按学科组织的因特网资源的利用。
学科信息门户以专业用户群为服务对象,起到的是学科信息资源的导航作用。
学科信息门户按照所体现信息资源的范围,可以分为综合性的学科信息门户、单一学科信息门户等。
★考核知识点:
搜索引擎的分类与含义
附:
2.1.7(考核知识点解释人
集成搜索引擎(All-in-oneSearchPage),也称为"多引擎同步检索系统”,是在一个Web页面上链接多个独立搜索引擎,用户在检索时需要指定搜索引擎,其检索结果由各搜索引擎分别以不同页面的形式显示或者集中到一个页面分块显刀£O
★考核知识点:
网络信息资源的类型
附:
2.1.8(考核知识点解释人
零次信息指未形成正式出版物或未进入社会进行交流的信息,是人们撰写文章、设计草图、统计数据的原始资料,是形成一次信息的基础。
包括各种书信、私人笔记,以及Blog.微博、BBS上的帖子、QQ、MSN上交流的信息等。
零次信息内容新颖,但不规范,分布的非常分散,其内容有时具有非常高的价值,但不公开交流,难以获得。
★考核知识点:
网络信息资源的类型
附:
2.1.9(考核知识点解释人
与查全率和查准率相对应,我们把检索吋检索系统与检索需求不匹配,但实际上信息内容与检索需求相关的信息遗漏的概率称为漏检率。
也就是说检索相关文献数量与系统中相关文献总量相除的百分比即为漏检率。
如果以完整的与检索需求相关的文献作为整体1的话,那么漏检率就等于1-查全率。
★考核知识点:
网络信息资源的类型
附:
2.1.10(考核知识点解释):
搜索引擎是指定期遍历各类网站来发现、收集并标引网页,建立索引数据库,并通过WEB形式的检索界而接受用户的查询请求。
搜索引擎针对网页信息进行全文搜索。
更新速度快,可直接输入关键词检索,不需要确定检索的范围。
但检索结果的准确性差。
其类型包括:
独立搜索引擎、元搜索引擎和集成搜索引擎。
★考核知识点:
网络信息资源检索的方法
附:
2.1.11(考核知识点解释人
直接检索法,是在检索系统屮根据检索系统的设置直接按照不同的字段进行检索的方法。
如按照题目、著者、关键词、出版时•间、文献类型等不同内容进行检索。
通过直接检索法,可以检索到确定的知识、信息、文献等内容,获取信息的效率也较高。
★考核知识点:
网络信息资源检索技术
附:
2.1.12(考核知识点解释):
截词是指在检索词的合理位置截断检索词,然后使用截词符进行替代。
截词检索是利用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的信息,都为命中的信息。
不同的系统使用的截词符不完全相同,但最常用的截词符有“*”和“?
”
等多种截词符。
按照截词符代替的字符或字符串的数量可以分为有限截词和无限截词。
有限截词,即指一个截词符只代表一个字符。
无限截词则是指一个截词符可代表多个字符或一个字符串。
因此,“*”和“?
”也代表了不同的截词含义。
“”代表0或1个字符,而“?
”代表0或多个字符或一个字符串。
★考核知识点:
网络信息资源检索的效果评价
附:
2.1.13(考核知识点解释):
网络信息资源检索的效果是一个综合性的指标,应该从多个角度共同进行考量,寻找一个最佳的平衡点,以达到信息资源检索的最优效果,查准率即是其屮的指标之一。
查准率,即精度,是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。
普遍表示为:
查准率二(检索出的相关信息量/检索出的信息总量)xlOO%。
使用泛指性较强的检索语言(如上位类、上位主题词)能提高查全率,但查准率下降。
★考核知识点:
开放获取
附:
2.1.14(考核知识点解释):
开放存取,也称开放获取(OpenAccess),即把同行评议过的科学论文或学术文献放到互联网上,使用户可以免费获得,而不需考虑版权或注册的限制。
开放获取运动旨在打破学术研究的人为壁垒。
★考核知识点:
网络信息资源检索技术
附:
2.1.15(考核知识点解释)
布尔逻辑检索是运用布尔逻辑算符表达检索词Z间的逻辑关系,组配出完整的检索概念,实现信息检索目的的检索技术。
布尔逻辑检索采用的逻辑运算符包括“与”、“或”、“非”,以及大于、小于、等于、不等于等。
“与”、“或”、“非”是最为常用的逻辑运算符。
(1)逻辑“与”
逻辑“与”用“AND”或“*”表示,其含义为若两个或多个检索词间以“AND”或“*”相连接,则表示该两个或多个检索词需同时出现在检索字段中,则文献才被命中。
(2)逻辑“或”
逻辑“或”用“OR”或“+”表示,其含义为若两个或多个检索词间以“OR”或“+”相连接,则表示该两个或多个检索词只要有一个出现在检索字段中,则文献被命中。
(3)逻辑“非”
逻辑“非”用“NOT”或“-”表示,其含义为若两个检索词间以“NOT”或“-”相连接,则表示只有NOT前面的检索词出现在检索字段屮,而NOT后面的检索词不出现在检索字段中,则文献被命中,其他情况文献不被命中。
★考核知识点:
搜索引擎分类
附:
2.1.16(考核知识点解释)
独立搜索引擎是能够对Internet网络信息资源进行收集、整理与组织,并提供检索服务的信息服务系统。
独立搜索引擎针对网页信息进行全文搜索,搜索的领域更广更深,但由于每个搜索引擎的数据资源不同、更新速度不同,标引过程中没有人工干预,因此,使用独立搜索引擎需要进行多次检索,检出的信息存在大量重复,检索效率较差
(二)简答
★考核知识点:
网络信息资源的类型
附:
2.2.1(考核知识点解释人
按照信息的加工程度,网络信息资源可以划分为零次信息、一次信息、二次信息、三次信息。
零次信息指未形成正式出版物或未进入社会进行交流的信息,是人们撰写文章、设计草图、统计数据的原始资料,是形成一次信息的基础。
一次信息,也称原始信息,是指从劳动实践或者研究中产生并正式发表的信息。
二次信息是指是对一次信息进行组织、加工、整理后,使之按照一定的规律进行编排而形成的内容,也称为检索工具。
是对一次信息、二次信息进行分析、评述等深加工后形成的信息。
★考核知识点:
网络信息资源检索的含义
附:
2.2.2(考核知识点解释人
网络信息资源检索从狭义上讲,是对互联网或数据库中存在的信息进行查找、保存的过程。
从广义上说,则包括对信息资源进行加工存储和检索获取两个部分。
网络信息资源的加工存储是利用检索语言对信息资源进行标引、分类,形成信息资源标识并以数字化、网络化的形式存储在检索系统中,形成数据集合的过程,是检索网络信息资源的基础。
网络信息资源的检索则是将用户的需求进行分析、标引,形成提问标识,按照一定的语法规则与信息资源标识进行兀配,当匹配结果一致或包含有检索标识时,系统以信息记录的形式输出检索结果的过程,这是网络信息资源检索的目的。
不同的检索系统有不同的检索原理,但总体上的规则是相通的,即信息资源标识与提问标识匹配结果一致,或包含提问标识,则命屮信息资源标识,并显示检索记录。
★考核知识点:
网络信息资源的检索途径
附:
2.2.3(考核知识点解释人
(1)按信息资源外部特征检索可以划分为题名途径、责任者途径和号码途径。
题名途径是指以书名、刊名、文章名、新闻标题、CD名、视频名、音频名等为检索入口的途径称为题名途径。
通过题名途径可以查找到具体的某一个图书、期刊或文章,查准率极高。
但在题名检索中应注意不同系统对题名规范的程度不同,采用适合本系统的检索技巧。
责任者途径是以信息资源屮的责任者为检索入口的途径称为责任者途径。
常用的责任者包括著者、编者、译者、演唱者、出版者、发明者等。
责任者又根据其属性区分为个人责任者和团体责任者。
通过责任者途径可以查找到具体的某一作者或某一机构出版或发表的成果与信息,可以很好的了解某一个作者的研究兴趣、研究领域、研究的动态与研究焦点的变化。
也可以通过对机构作者的检索了解一个机构的研究概貌,系统的掌握机构研究的整