信息检索复习资料.docx
《信息检索复习资料.docx》由会员分享,可在线阅读,更多相关《信息检索复习资料.docx(9页珍藏版)》请在冰豆网上搜索。
信息检索复习资料
文献的定义
最简明的定义:
记录有知识的一切载体。
定义:
记录知识的一切载体,即用文字、图形、符号或声频等技术手段记录知识的物质载体,或固化在物质载体上的知识。
二次文献
将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。
特种文献
会议文献、学位论文、专利文献、标准文献、科技报告、政府出版物、产品资料、档案8种类型文献是一种介于图书与期刊之间的文献类型,通常在出版发行方面或获取途径方面比较特殊,因而也被称为特种文献或灰色文献。
文献检索式
或:
AorB或A+B;用于扩大检索范围,增加命中文献数量,有利于提高检索结果的查全率。
与:
AandB或A*B;用于对检索词进行限定,从而缩小检索范围,有利于提高检索结果的查全率。
非:
AnotB或A–B;表示检索记录中凡含有A不含B的记录被检出。
能够缩小命中文献的范围,增强检索的准确性。
网上的文献格式
期刊、专著、论文集、学位论文、报告、专利论文、[国际、国家标准]、报纸文章、电子文献。
文献信息源
用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。
文献信息源是信息源的主体部分,是信息搜集、存储、检索和利用的主要对象。
CA美国化学文摘数据库收录文献
期刊论文、会议论文、图书、学位论文、专利、技术报告。
什么数据库能检索会议文献
国外:
ISI会议录数据库、会议论文索引数据库、OCLCPapersFirst与ProceedingsFirst、STN联机系统中的CONF会议论文数据库、美国物理所电子会议录数据库、美国光学工程师学会会议文献数据库、美国航空航天协会电子图书馆。
国内:
中国重要会议论文全文数据库、万方数据知识服务平台会议论文数据库、中国国家科技图书文献中心会议论文数据库、中国学术会议文献通报、上海图书馆会议资料数据库。
图书馆系统主要分为什么
采访子、编目子系统、期刊子系统、公共检索子系统、典藏子系统、子系统以及子系统
专利号每一位含义
申请号:
CN200420034660.3
申请号是专利局受理专利申请的同时给与的编号。
前4位数字代表申请的年代,第5位数字代表不同的专利类型(1发明专利、2实用新型专利、3外观设计专利),后几位数字是当年各项专利申请的流水号,最后是小数点和以为计算机校验码。
专利号:
ZL2004214062.7
专利号是指获得授权的专利的编号。
专利号与申请号相同,仅在前面加ZL。
信息、知识、情报和文献之间的关系
信息是物质存在的方式、形态和运动规律的表征,人脑对物质属性的感知形成信息;各种信息经过组织、系统化地加工处理、提高深化形成知识;知识包含情报,知识被用来解决特定问题和具有使用价值时转化为情报。
信息、知识、情报可以相互转化。
信息、知识和情报的内容记录在物质载体上构成文献;文献经过传递、应用于理论和实践又会产生新信息。
计算机信息检索数据库的结构和主要类型
结构:
字段(基本字段和辅助字段)、记录(逻辑记录和物理记录)、文档(顺排文档和倒排文档)。
主要类型:
参考数据库:
书目数据库、文摘数据库和索引数据库。
源数据库:
数值型数据库、事实型数据库、全文型数据库。
计算机信息检索技术的种类和应用方法
种类:
传统的信息检索技术:
布尔逻辑检索、截词检索、位置检索、限制检索、加权检索。
新型的网络信息检索技术:
全文检索、多媒体信息检索、智能信息检索、数据挖掘、自然语言检索、模糊检索、相关检索。
方法:
常规法(包括顺查法、倒查法、抽查法)、回溯法、综合法。
计算机信息检索的主要途径和策略的制定过程
途径:
内容特征检索途径:
分类途径、主题途径。
外部特征检索途径:
题名途径、作者途径、号码途径、引文途径。
策略的制定过程:
分析检索课题、选择检索系统和数据库、确定检索词、构造检索提问表达式、试验性检索和修改检索策略、实施检索。
文献的不同划分标准和分类的语言
文献信息源:
按文献信息源存在的载体形式划分:
印刷型、缩微型、声像型、电子型
按信息源的加工程度划分:
零次文献、一次文献、二次文献、三次文献
信息检索语言:
按照结构原理:
分类语言、主题语言、代码语言
按照组配方式:
先组式语言、后组式语言
按照规范化程度:
自然语言、人工语言
国际标准连续出版物的编号
利用..可以实现同名作者的检索
维普中文科技期刊数据库
维普中文期刊科技数据库提供几个检索途径
快速检索、高级检索、传统检索、分类检索、期刊导航5种检索方式。
EI数据库提供了哪几个检索方式
快速检索、简单检索、专家检索、叙词检索。
WebofScience包含哪几个数据库
SCIE、SSCI、A&HCI、科技会议录引文索引、社会科学会议录索引、化学反应索引、化合物索引。
信息资源检索的主要方法
常规法(包括顺查法、倒查法、抽查法)、回溯法、综合法。
网络信息资源检索工具的构成
信息采集子系统、数据库、检索代理软件。
网络信息资源检索工具的工作原理
通过自动索引程序(或人工)来广泛搜集网络信息资源,经过一系列的判断、选择、标引、加工、分类、组织等处理后形成供检索用的数据库,创建目录索引,并大多以Web页面的形式向用户提供有关的资源导航、目录索引及检索界面。
用户根据自己的检索要求,按照该检索工具的语法要求构造检索提问,并通过检索界面输入检索提问,代理用户在数据库中检索,并对检索结果进行评估,比较和按相关度排序后提供给用户。
查全率=召回率查准率=准确率
查全率:
被检出相关文献量/系统中相关文献总量
查准率:
被检出相关文献量/被检出文献总量
10000个人中有1000个坏人,找出5000个人,其中有500个坏人。
查全率=(500/1000)*100%;查准率=(500/5000)*100%.
评价网络信息资源检索工具方面
收录范围、检索功能、检索效率、用户界面设计、检索结果处理和显示。
网络信息资源的特点
(1)信息量大,传播广泛;
(2)信息内容丰富,形式多样;(3)信息时效性强,具有动态性和不稳定性;(4)存在状态分散无序,但关联程度高;(5)信息价值差异大,难于管理。
什么数据库是以人文和社科为主的
人大复印资料
文献类型每个字母意思
根据GB3469-83《文献类型与文献载体代码》规定,以单字母标识:
M——专著(含古籍中的史、志论著)
C——论文集
N——报纸文章
J——期刊文章
D——学位论文
R——研究报告
S——标准
P——专利
A——专著、论文集中的析出文献
Z——其他未说明的文献类型
电子文献类型以双字母作为标识:
DB——数据库
CP——计算机程序
EB——电子公告
非纸张型载体电子文献,在参考文献标识中同时标明其载体类型:
DB/OL——联机网上的数据库
DB/MT——磁带数据库
M/CD——光盘图书
CP/DK——磁盘软件
J/OL——网上期刊
EB/OL——网上电子公告
连续出版物
具有统一题名、印有编号或年月顺序号、定期或不定期在无限期内连续出版、发行的出版物。
包括期刊、报纸、年鉴、年刊、指南、学会报告丛刊和会刊、连续出版的专著丛书和会议录等,但不包括在一个预定有限期内以连续分册形式出版的著作。
信息检索的不同分类
按检索对象的内容划分:
文献检索、数据检索、事实检索;
按检索方式划分:
手工信息检索、计算机信息检索;
按检索要求划分:
特性检索、族性检索;
按检索的时间跨度划分:
定题检索、回溯检索;
按检索对象的信息表现形式划分:
文本检索、多媒体检索、超文本检索和超媒体检索。
中图分类法有哪些(大类)
《中国图书馆分类法》22大类:
A马克思列宁主义、毛泽东思想、邓小平理论
B哲学、宗教
C社会科学总论
D政治、法律
E军事
F经济
G文化、科学、教育、体育
H语言、文字
I文学
J艺术
K历史、地理
N自然科学总论
O数理科学和化学
P天文学、地球科学
Q生物科学
R医药、卫生
S农业科学
T工业技术
U交通运输
V航空、航天
X环境科学、安全科学
Z综合性图书
文献的检索方法
常规法[顺查法(时间顺序,按照检索课题涉及的起始年代,由远及近)、倒查法、抽查法]、回溯法(费时、盲目性大)、综合法(综合常规法和回溯法)
国际标准化组织(ISO)标准多少年修订
5年
专利具体几层含义
三层含义:
专利权、专利发明、专利文献。
期刊论文的文献出处包括什么
刊名、年卷期、起止页码
超星收录的文献类型
超星数字图书馆文献资源收录类型:
全文;
电子图书学科范围:
综合
我们国家的标准
国家标准编号、行业标准编号、地方标准编号、企业标准编号