信息计量学复习.docx
《信息计量学复习.docx》由会员分享,可在线阅读,更多相关《信息计量学复习.docx(21页珍藏版)》请在冰豆网上搜索。
![信息计量学复习.docx](https://file1.bdocx.com/fileroot1/2022-11/17/fc61e5f0-ecd7-40b9-a80d-5487f9c4b7d2/fc61e5f0-ecd7-40b9-a80d-5487f9c4b7d21.gif)
信息计量学复习
第一章绪论
1.信息计量学
(1)定义:
采用定量的方法来描述和研究情报(信息)的现象、过程和规律的一门学科。
它是数学和统计学与情报学广发结合而形成的情报学的一个新兴的定量性分支学科。
广义信
息计量学主要探讨以广义信息论为基础的广义信息的计量问题。
狭义信息计量学主要研究情
报信息(或文献情报)的计量问题。
(2)产生
-信息计量学是在传统文献计量学及科学计量学的基础上扩展和演变而成的。
情报的数量
远远大于文献的数量,其计量方法也远远大于文献的计量方法。
(文献激增一一产生矛
盾一一促使对文献的管理和使用;缓解矛盾一一产生情报学一一产生情报(信息)计
量学)
-信息计量学是情报学发展的需要和必然产物。
定量化研究是情报学发展的重要方向和必
然趋势之一。
这是因为情报学必然要从定性阶段向定量阶段发展;只有加强情报学的定
量化研究,才能不断提高其科学性和精确性,从而有助于确立和提高它在整个科学体系
中的学科地位。
■一批接触的学科带头人和骨干力量推动了信息计量学的发展。
(3)发展
丄萌芽时期(1917~1933)文献计量研究比较分散,规模不大;
■发展时期(1934~1978)
机全面发展时期(1978至今)
■发展趋势:
从文献向信息计量发展;向自动化方向发展;向网络计量学方向发展
2.信息计量学与文献计量学
(1)文献计量学是以文献信息体系为研究对象,采用数学、统计学定量方法来研究文献信
息的分布结构、数量关系和变化规律,并进而探讨科学技术的发展规律的一门新兴的分支学科。
(2)从信息计量学的概念和内容体系来看,信息计量学与文献计量学彼此交叉渗透,既有着许多共同的研究内容,又有着不尽相同的地方。
-信息计量学着眼于信息本身的计量问题,文献计量学主要以作为情报载体的文献为计量
对象。
-信息计量学较之文献计量学来说,其研究范围更广泛一些。
除文献信息之外,还存在着其他形式的信息。
但是,文献信息是整个科学情报的主题。
-再次,从任务和方法上来看,信息计量学研究的任务更为艰巨,更难找到恰当的定量方
法及途径。
3.信息计量学与科学计量学
(1)科学计量学是用定量方法研究科学学的一门学科,用以用户研究科学发展过程的各种定量方法的总和。
(2)信息计量学与科学计量学有联系也有区别。
联系表现为:
-从研究目的来看,两者都是要探讨学科活动之间的内在联系,都把科学发展的特性和规
律作为自己研究的基本任务之一。
(科学计量学主要是从定量的角度来探讨学科发展的
内在规律,最终促进科学技术的进步。
而信息计量学的研究目的也在于探明科学文献本
身的规律提高信息管理的科学性,通过信息规律的探讨进而解释科学技术的规律性。
)
-从研究对象和方法来看,两者极为类似。
科学计量学研究的科学文献及其数量,也是信
息计量学的研究对象之一。
在方法上,两者都要用数学和统计学的定量方法,对科学文
献等信息进行定量的分析研究。
在研究内容上,二者在很大范围内都是彼此交叉的。
(3)但是应该指出信息计量学和科学计量学有很大的区别
-信息计量学的范围比科学计量学的范围广得多。
科学计量学仍然局限在科学文献及其数
量和非正式科学交流的消息、事件、实物等,而“狭义信息计量学”除了科学计量学的
内容外还包括正式交流的事物信息。
■研究目的不同。
信息计量学研究目的是“服务信息科学的研究需求”,而科学计量学研
究的目的是“研究并验证科学的产生、传播、利用的量的规律性”。
前者目的广泛,后
者目的比较单一。
-应用领域不同。
信息计量学在文献、人才、学科、单位、数据评价方面发挥了很大的作用、可以涉及的面非常广泛;而科学计量学在科学机制和科技政策的制定方面发挥了非常重要和独特的作用。
(4)由上面可知科学计量学必然向信息计量学方向发展,这和它研究内容和目的比较单一有关。
信息计量学的研究目的和内容包含了科学计量学的研究目的和内容。
4•网络信息计量学
*Webometrics和cybermetrics可以直译为“网络计量学”和“赛博计量学”。
由于计量的
对象是网上的信息或计算机控制的信息,而非“网络”或“电脑”本身,因此直译为网络信息计量学或者网上信息计量学。
-网络信息计量学是采用数学、统计学等各种定量方法,对网上信息的组织、存储、分布、
传递、相互引证和开发利用等进行定量描述和统计分析,以便揭示其数量特征和内在规
律的一门新兴分支学科。
主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科,也是信息计量学的一个新的发展方
向和重要的研究领域,具有广阔的应用前景。
5•我国信息计量学的进展(7条)
(1)每年发表的文献量增长较快,并逐步形成了本学科的核心情报源;
(2)确立并提高学科的地位;
(3)主要分支领域的研究取得了重要成果;
(4)文献计量工具和手段的现代化取得了重要进展;
(5)专业教育起步快,发展迅速;
(6)形成了一支骨干队伍(核心研究队伍已经基本形成);
(7)国际交流与合作发展势头良好。
6•信息计量学的研究内容和研究方法(论述题)
(1)信息计量学的内容体系
*信息计量学若干基本问题的探讨
■信息的基本测度
'几个基本定律的研究
'信息流模型的研究
'信息及量化方法的探讨
'信息计量方法和工具的自动化实现方面的研究
'在图书情报工作、信息资源管理、信息检索、信息分析与预测、科学学与科学评价
等领域的应用
(2)信息计量的方法体系
信息计量的方法体系主要有统计分析法、数学模型分析法、引文分析发、词频分析法、共现分析法、聚类分析法、计算机辅助信息计量分析法。
'统计分析法:
主要包括两个部分,一是信息计量的一些专业统计术语,二是数理统计。
数理统计的研究主要是两个方面:
一是研究如何从总体中抽取样本,抽多少,怎样抽的问题,即抽样方法的问题。
二是研究如何对抽样的结果(样本数据)进行合理的分析,做出科学的推断,即统计推断问题。
.数学模型分析法:
用某种数学语言描述系统的结构和行为而构造出来的,除了从宏观的角度模拟出系统的结构和运动规律外,主要是从微观上、定量的方向描述出系统的结构、联系以及运动规律。
I引文分析法:
引文分析就是用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以揭示其数量特征和内在规律的一种计量分析方法。
E计算机辅助信息计量分析法:
研究在理论分析的基础上,着重进行了计算机辅助信息计量软件的设计与开发工作,实现了套录资料重组建库以及多种资料统计分析的功能。
该方法的建立标志着我国信息计量研究的方法体系已基本形成并日趋完善
兀口O
第二章文献信息增长规律
1•文献信息流
在信息计量学中,通常把文献所含信息的汇流成为文献信息流。
由于文献是信息的最基本的载体形式,文献信息流是一系列主题特征的科学文献的集合,所以有时将文献信息流简
称为文献流。
2•文献信息流的特性(动态特性和静态特性)
主要有两个方面:
文献信息流的静态特性和动态特性
(1)静态特性一一在一定时间内科学文献在空间的分布性质,如集中----离散分布、文献按著者分布、词汇在文献中的分布、引文分布、主题相关分布等的规律性。
(2)动态特性一一指科学文献随时间的延续而增长和老化的性质。
科学文献既增长又老化,在增长中不断老化,在老化之中又不断增长;增长是文献信息流的主要趋势。
第三章文献信息老化规律
1•文献信息老化
一般而言,“老化”问题包括文献老化和情报(信息)老化。
情报的老化是相对于情报对象而言,而文献的老化则是相对于情报用户而言的。
科学文献老化一一指科学文献随其“年龄”的增长,其内容日益变得陈旧过时,作为情
报源的价值不断减小,甚至完全丧失其利用价值。
既是一种客观的社会现象,又是一个复杂的动态过程。
2.文献信息老化的度量指标
(1)半衰期一一指某学科(专业)现实尚在利用的全部文献中较新的一半是在多长一段时间内发表的(共时半衰期)。
这与该学科一半文献时效所经历的时间(历时半衰期)大体相当。
半衰期适用性:
共时半衰期通常是评价某一学科领域或专业文献的老化趋势,而不是指
个别文献;而历时半衰期,可以是某一学科文献老化的半衰期,也可以是一种期刊,甚至一篇文献老化的半衰期。
半衰期的计算:
1作图法将统计数据制成引文分布表,以引文累积量或引文百分累积量为纵坐标,以
被引文出版的年龄为横坐标作图,在图中找出与纵坐标上引文累积量或百分累积量一半处的
对应点的横坐标,即为所求结果。
2定量模型计算法对统计数据建立文献老化模型,再根据定义找出半衰期的计算公式,
将相应数据代入求得结果。
(2)普赖斯指数一一在几个知识领域内,把对年限不超过5年的文献的引文数量与引
出版年限不超过5年的被引文献数量
普赖斯指数=
文总量之比当作指数,用以量度文献的老化速度和程度。
计算公式为:
被引文献总量
普赖斯指数和半衰期比较:
一般说来,某一学科或领域文献的“普赖斯指数”越大,半衰期就越短,说明文献的老化速度就越快。
它们都是从文献被利用的角度出发,但是以不同的方式来反映文献老化的情况。
文献的半衰期只能笼统地衡量某一学科领域全部文献的老化情况,而“普赖斯指数”既
可用于某一学科领域的全部文献,也可用于评价某种期刊、某一机构,甚至某一作者或某篇
文章的老化特点。
半衰期概念可以适用于一般的情报老化,而普赖斯指数只适用于文献情报。
(3)剩余有益性指标
期刊有益性一一某一年份某一期刊被用户所利用的文献数。
剩余有益性一一经过若干年后,期刊还保留的有益性。
只是对与满足一定类型和内容的情报需求的几种期刊来说,才是有用的。
(4)中值引文年龄
第四章文献信息集中与离散分布规律一一布拉德夫定律1•布拉德夫定律的基本内容(图像、文字描述)
一般认为,布拉德福定律的基本原理是由其区域描述和图像描述两个部分组成的。
(1)区域描述
如果将一定时间内(通常一年)的按某学科载文量等级排列的期刊划分为三个区,使每
一个区所包含的相关论文数量相等,即恰好等于全部期刊发表的该学科文章总数的三分之一,
便可发现:
第一区(核心区)所涉及的文章来自数量不多但效率很高的n1中期刊;第二区
(相关区)包括数量较大、效率中等的n2中期刊;第三区(外围区)包括数量最大而效率
很低的n3中期刊。
那么这三个区中的期刊数量成下列关系:
n1:
n2:
n3=1:
a:
a2(a>0)
(1)
式中:
a即布拉德福常数,或称比例系数。
就布拉德福所分析过的数据而言,a值大约
为5.0。
上式即为布拉德福定量的区域表述形式,经过维克利的研究,可以把三个区讨论的文献离散规律推广到任意多个区的情况。
各区的期刊的载文量是逐区下降,而各区期刊数量则是逐区上升的。
核心区情报密度最
高,相关区次之,外围区情报密度最低。
(2)图像描述(书107和111)
如果取上述等级排列的期刊数量的对数(lgn)为横坐标,以相应的论文累计数R(n)为纵坐
标进行图像描述,便可得到一条曲线一一布拉德福分散曲线。
分散曲线AB由两部分组成:
对应核心区的上升的一段曲线AC和对于相继各区的直线
CB,后来研究表明,拐点C点为核心区的分界点。
布拉德福在研究时发现,从图像出发还可以得到另一个结论,即:
n1:
(n1+n2):
(n1+n2+n3)=1:
b:
b2记n1-2=n1+n2,n1-3=n1+n2+n3,则可将上式改为:
n1:
n1-2