hindex调研报告.docx
《hindex调研报告.docx》由会员分享,可在线阅读,更多相关《hindex调研报告.docx(11页珍藏版)》请在冰豆网上搜索。
hindex调研报告
H指数优于其他评价指标。
H指数将论文发文数量与引文数量紧紧联系在一起,具有将论文的定量评价与定性评价相结合的特点,比较全面,具有一定的科学性;H指数需要一段时间的积累,很难通过自引达到膨胀;概念简单,易于计算;H指数“质”与“量”兼顾,将论文数及其引文影响力相结合,用于评价研究者的绩效更趋合理;H指数应用领域广泛,不仅可用于评价一位科研人员,还可以用于评价科研群体、学术期刊和学科领域等等;H指数方法能提高评价结果的客观公正性。
和传统文献计量学指标相比,H指数具有以下优点:
1、和传统的引文分析法相比,H指数兼顾个人科研产出的质量和数量,得出的影响力评价更为合理。
2、H指数是动态的,不是静态不变的,单个人院的HZH指数总是不断上升的:
一方面随着时间推移,科研人员会产出更多的成果;另一方面科研人员的以往成果在未来的岁月中引用次数只会增不减。
这对科研人员也是一个极好的激励。
2、3、数学上,在正常情况下,排在引文高端的论文可能获得新的被引频次,引文数小于H值的论文有可能再数量上增加,而某个科学家的H指数不会随着这部分引文和论文的增加而增加,这种特性使得H指数在具有动态性的同时又具有一定的稳定性;另一方面,H指数的数值仍然取决于作者论文的引文分布形式。
3、4、H指数很难通过自引达到膨胀,正如Hirsch所说:
”你无法伪造它,因为它依赖的运作机制需要有个时间的跨度。
“
4、在做出最终选择或形成判断之前,个体极少能获得所有有用的信息。
而H指数只需得到所有有效的文献计量信息中的一个子集,就可以通过计量进行判断,因此在提供精确结果的同时,大大节省了认知耗费和信息检索的努力。
5、长期以来,人们利用期刊影响因子作为期刊评价的重要指标,现在H指数也可成为期刊影响因子的有益补充。
首先,它是钝感的,某些意外的,无引用的文章,一篇或者少数几篇引用次数奇高的论文对它的影响极小;其次,它综合考虑数量和质量,减少对一些小期刊明显过高的评价【28】
但是H指数也是不完美的,尚存下列缺点:
1、现实中,我们经常把以某位科学家为作者(或合作作者)的论文成为“他/她”的论文。
但是一个不容忽视的事实是,在科学领域,研究工作往往是需要协作的,是由一个研究团队共同完成的,这个团队往往由资深的研究者管理或指导。
一个研究人员发表(或合作发表)的论文,往往包含多人的参与及贡献。
如果把一个科学家的研究论文作为其项目组全部论文中的一部分,那么就项目组的论文而言,其引文在该项目组所产生的全部论文中不是平局分配的。
相反地,那些被引特别多的论文成了研究项目的代表性论文或者“标志性”论文。
在某种程度上这些“标志性”论文“诱捕”了其他论文的引文数。
一些研究小组的引文影响可能几种在为数不多的高被引标志性论文(也许只集中在一篇论文K)上,而另外一些研究小组或许有一系列的标志性论文,因而他们的引文影响相对集中。
而后者往往会获得比以前更高的H指数但这种H指数的差异一定能反映研究绩效或者研究质量的差异么?
2、H指数对于那些刚开始从事科学研究的人员而言是不利的,因为他们的论文产出和引文率相对较低。
但是这项指标却有可能造成科学家驻足并满足于已有成就,因为科学家们即使没有新的论文产生,以往的论文仍然有可能获得被引数量,进而引起H指数的增加。
3、这项指标是基于长期的观察。
因此,由于上述同样的原因有可能导致我们看不到科学家研究活力的衰退情况。
4、H指数在微观层面上是比较适合的。
但是在更高的集总水平上,会有更多不同的指标。
只有利用多种合适的指标集而不是单一指标进行测度,才能够提供一幅充分反映现实情况的多维度画面。
5、根据H指数的定义,它不能超越论文数量的界限,因此,因此它不利于那些论文数量少而被引频次高的科学家。
6、
被引频次 指数 科研人员 科学家 论文数量 文献计量学 同行评议 科研绩效评价
2、影响因子
正因为SCI收录的数千种学术期刊良莠不齐,片面强调SCI论文数是不合理的,因此国内一些大学、研究所开始同时看重发表论文的学术期刊的档次,也就是所谓“影响因子”。
SCI的开发者每年都会发布SCI收录期刊的“影响因子”,即把某种期刊在前两年发表的论文在该年被引用的总次数,除以该期刊在这两年内发表的论文总数而得的数据。
一个期刊的“影响因子”高,表明它发表的论文被引用的平均次数多,也就表明该期刊的影响力大,档次也就高。
但是,影响因子是否能够完全反映期刊的档次,并不是没有争议的。
即使能够如此反映,也不能把期刊的影响力和具体一篇论文的影响力等同起来。
统计表明,论文引用次数的分布是不对称的,存在所谓“80/20现象”,即80%的引用次数来自于20%的论文。
因此,一篇发表在影响因子高的期刊上的论文可能很少被人引用,而一篇发表在影响因子低的期刊上的论文则有可能反过来。
但是国内不少科研人员却把发表其论文的期刊的影响因子等同于其论文的影响因子,甚至把各个期刊的影响因子加起来作为自己的论文的影响因子的和。
所以要评价一个科研人员的学术成就,光是看其发表的论文总数并不妥,还要看这些论文的质量,但是把期刊的影响力视为论文的质量指标也是不妥的,必须具体地看其论文的情况,总体地衡量其论文的被引用情况。
有趣的是,原本人为规定的H指数居然被一些学者数学推导得出:
H指数与原有的评价指标之间存在着微妙的联系。
而且数据也一定程度上证实了这些联系。
随着H指数应用领域的不断扩展,H指数在学术期刊评价中得到越来越多的重视,运用H指数对期刊的影响力和影响因素进行研究引起越来越多的学者们关注。
当前不同国家(地区)、不同机构之间的合作现象越来越多,学者之间的交流频繁。
中国国内学者和机构虽然均有所参与,但力度不够;
所以这种算法其实不是很科学的,还是应该将第一作者、通讯作者等主要贡献论文与其它合作论文分开计算,包括计算h因子和引用次数,呵呵。
像前几年炒得火热的全球百大化学家,前十名里面有好几个年轻人都是靠博士阶段跟老板挂名论文将总引用和篇均引用提上去了。
世界著名的科学引文索引(ScienceCitationIndex,简称SCI)数据库,随后又建立了社会科学引文索引(SocialSciencesCitationIndex,简称SSCI)和艺术与人文引文索引(Arts&HumanitiesCitationIndex,简称A&HCI)。
h代表“高引用次数”(highcitations)。
一个人的h指数是指他至多有h篇论文分别被引用了至少h次。
例如,h指数发明人赫希本人的h指数是49,这表示他已发表的论文中,每篇被引用了至少49次的论文总共有49篇。
与其他统计方法不同的是,要确定一个人的h指数非常容易,用赫希的话说,只需要“花30秒钟”。
到SCI网站,查出某个人发表的所有SCI论文,让其按被引次数从高到低排列,往下核对,直到某篇论文的序号大于该论文被引次数,那个序号减去1就是h指数。
赫希认为h指数能够比较准确地反映一个人的学术成就。
一个人的h指数越高,则表明他的论文影响力越大。
在当代物理学家当中,h指数最高的是普林斯顿大学的理论物理学家爱德华·维腾(EdwardWitten),达110。
维腾被普遍认为是当代最有影响的理论物理学家。
中国读者较为熟悉的霍金的h指数也比较高,为62。
生物学家当中h指数最高的为沃尔夫医学奖获得者、约翰斯·霍普金斯大学神经生物学家施奈德(SolomonH.Snyder),高达191,其次为诺贝尔生理学或医学奖获得者、加州理工学院生物学家巴尔的摩(DavidBaltimore),为160。
生物学家的h指数都偏高,表明h指数就像其他指标一样,不适合用于跨学科的比较。
赫希还计算了在最近20年获得诺贝尔物理学奖的物理学家的h指数,平均值为41。
美国科学院物理学与天文学部2005年新科院士的h指数平均为44,而生物医学部新科院士的h指数平均高达57。
很显然,h指数的高低与从事科研的时间长短有关。
对于年轻科学家来说,由于发表论文数量太少,论文的数目成了其h指数的上限,计算其h指数没有多大的意义。
h指数比较适合用于衡量已从事科研多年的资深科学家的总体成就。
一个人的h指数不会随着时间的推移而减少,只会增加或保持不变。
通过研究许多位物理学家的h指数,赫希认为如果一个人在从事科研20年后(从发表第一篇论文算起),h指数能达到20,就算是一名成功的科学家;能达到40,则是一名杰出的科学家,很可能只能在名牌大学或研究所才能见到;能达到60(或30年后达到90),则是首屈一指的大科学家了。
赫希同时提出,美国研究型大学的物理学家要获得永久教职(副教授),h指数一般为10到12,晋升为正教授则大约为18。
成为美国物理学会会士的h指数一般在15到20,而成为美国科学院院士则一般在45或更高。
h指数也有漏洞可钻
h指数有其局限,除了不适合用于评价年轻科学家外,也不适合用于评价历史上科学大师的成就。
比如,根据SCI的收录计算,大物理学家费曼的h指数仅为21,按赫希提出的标准只能算是一名“成功科学家”。
SCI未收录1955年之前的物理论文,费曼在那之前发表过17篇论文,即使把这17篇论文全部算进去,费曼的h指数最多也就38,也还没达到“杰出科学家”的标准。
老一辈科学家并不像当代科学家那样频繁发表论文,而且他们的重大贡献很快成为专业常识,人们在提及时不再引用其论文,这两方面的原因使得他们在h指数方面大大吃亏。
论文引用包括作者本人在后来的论文中自我引用(自引)和他人的引用(他引)两种,SCI在统计时并不对二者做出区分。
显然,自引次数的多少与论文的影响力毫无关系,但是有些科研人员却故意频繁自引,制造论文被引次数高的假象。
赫希认为h指数的一个优势是很难通过自引来拔高,“无法伪造它”,因为它衡量的是一个人的全部学术成果能否经受长时间的考验。
波士顿大学物理学家悉尼·莱德纳(SidneyRedner)接受《自然》的采访时对此也表示同意:
“想要假造全部的科研生涯是非常困难的。
”
赫希和莱德纳都低估了中国科研人员在这方面的创造能力。
以郑岳青为例,他迄今共发表了134篇SCI论文,其h指数是14,这算是相当高的了,按赫希的标准,可以在美国研究型大学获得永久教职。
但是仔细核查这些论文的被引用情况,会发现绝大多数都是没有价值的自引,有的论文被引用了24次,而其中郑岳青自己就引用了20次!
如果把自引次数去除掉,郑岳青的h指数就降到了不值一提的6。
再好的评价体系,也无法避免被别有用心者钻空子。
在中国,一个人想要假造全部的科研生涯是非常容易的。
H指数作为科研评价的应用和局限性分析,何建芳、李少贞,广东农工商职业技术学院学报第26卷第4期2010年11月
长期以来,如何科学、合理、公正、公平地评价科学家是一个没有很好解决的的难题。
目前,对科学家的绩效评价,科研管理者通常采用同行评议、文献计量或两者结合的方式。
但是,同行评议带有大量的主观看法;文献计量也具有很大风险,容易造成学术造假等负面影响。
总之,当前科研评价主要考虑的因素有发表论文次数、论文被引用次数(包括被引用总次数和篇均被引次数)、高影响力论文的篇数以及载文期刊的影响因子等。
2005年,美国物理学家JorgeEHiesch教授提出了一种全新的评价指标——H指数,它将数量因素(论文数)和质量因素(被引频次)有机地结合起来。
因此,h指数一经报道,就引起了学者们的广泛关注。
Nature发表了一篇题为“indexaimsfor
Fairrankingofscientist”的报道文章,肯定指出h指数将在科学家科研评价中起到重要作用。
H指数的定义Hirsch教授指出,如果一位科学家发表的Np篇论文中有H篇论文被引次数至少为h,其他(Np-h)篇论文中每一篇的被引次数都小于等于h,呢么这位科学家的h指数就是h。
例如,某科学家的h指数是20,则表示该科学家至少发表了20篇被引频次至少在20次的论文。
H指数的上述定义还不够清晰。
Rousseau又给出了离散h指数的定义:
将科学家S发表的论文按照引文数从高到低的顺序排列,相同引文数的论文具有不同的序号(对此并没有严格限制,最好按照时间倒序排列),当且仅当排序前h篇论文每篇论文的引文数至少为h,同时排序第h+1篇论文的引文数严格小于h+1时。
那么科学家S的h指数才为h。
从h指数的定义可以看出,对于论文数量很多,但论文被引频次数不高的科学家,其h指数一定不高;对于被引频次数很高,但论文数量不多的作者,其h指数受论文数量限制也不会很高;只有当论文数量多,而且多数论文具有高的被引频次数时,才能获得高h指数。
H指数的意义:
Hirsch认为,当人们把科学成就作为重要评价标准对科学家进行评价时,h指数应该是一个有用而且公正的标尺。
同时,他还认为h指数可以用来测度科学家的终身成就,对于这一点Nature的文章做了进一步论证。
Nature的文章认为,h指数的吸引力在于它能将那些做出持久而重大贡献却未获得与其声望相称奖励的研究者凸现出来。
表一给出了物理学领域h指数最高的一些物理学家。
表一种,7位物理学家有4位获得了诺贝尔奖,这也从一个侧面说明了h指数与科研评价的强相关性。
Incident中国学者叶鹰认为,h指数具有发展成为下一代核心评价参数的可能,对h指数进行系统研究具有重大现实意义和学术价值。
Bornmann和Daniel比较了同行评议和h指数评价方法。
研究结果显示,h指数的评价结果与同行评价的判断基本一致。
VanRaan比较了h指数与标准文献计量指标及同行评议之间的关系。
通过比较分析发现,h指数和标准文献计量学指标“两者与同行评议的相关性程度相当”,“由于h指数揭示了‘引证数的强大力量’因此我们完全可以认为它与同行评议之间存在显著的相关关系”。
H指数的局限性:
1、个人评价方面的局限性
国内外不同领域的专家学者通过实证研究,切实发现h指数在评价个人学术成就具有许多独特的优势,它从质量和数量两个方面对科学者个人进行评价,而且能在一定程度上消除自引对评价结果的影响,但随着国内外相关学者研究的深入,赫希本人及相关学者也逐渐发现h指数有着不可避免的局限性,h指数会随着科研时间增长而增长,所以h指数不适合用于评价年轻科学家,因为他们的论文产出和引文率相对较低,h指数不适合用于评价历史上科学大师的成就,费曼。
。
。
。
。
。
也不适合跨学科之间科学家的比较,即便在相同学科领域进行比较都很难找到一个适当的h指数的参考标准;另外,h指数不能超越论文数量的界限,它不利于那些论文数量少而被引频次高的科学家;h指数缺乏区分度,对于评价极少数的顶尖学者具有较高的区分度,而对于h值相同但论文被引频次相差悬殊的情况尚不能区分,h指数缺乏区分度还表现在它对于高被引率文献的也很迟钝,在h指数屏蔽了那些低被引文献的同时,它也极大地降低了高被引文献的作用;而且,h指数是一个只上升、不下降的指标,在时间序列上没有波动,可能会使一些科学家躺在已有成就上睡觉。
2、期刊评价方面的局限性
期刊h指数的提出,不但丰富了文献计量学指标,也为评价期刊学术影响力、优化遴选核心期刊的指标体系提供了有力支持。
H指数可以比较客观、公正地反映学术期刊的价值及其在本学科领域的地位,也可以使用户在了解期刊收录论文数量的基础上结合期刊的被引篇次对学术期刊进行合理、科学地评价,以确定期刊的利用价值,为投稿提供一个明确的方向,。
但是,h指数在期刊评价方面也有局限性,它不能超越载文数量的界限,因此它不利于那些载文数量少而被引频次高的期刊,学术质量高但载文量底的期刊,h指数相对较小;h指数随着时间的推移总是不断上升的,它对创刊时间短的期刊不利;h指数也不适合用于跨学科领域期刊间的比较;h指数的计算依赖于引文数据库的选择,同时,还受到所用数据库所收录文献的种类,数量,以及期刊的学科结构、期刊自引等影响。
因此,只有将期刊h指数和影响因子等传统计量指标相结合,才能从不同的角度对学术期刊重要性和影响力做出全面评价。
3、科研机构评价方面的局限性:
科研机构h指数的高低与其论文总量、总被引频次密切相关,也与机构的规模大小、方向任务密切相关。
机构的规模越大、历史越悠久、学科越全,其积累的学术产出就越多,所产生的学术影响就越大,机构的h指数也就越高;因此,h指数能够较好地反映科研机构学术产出和学术影响力,一定程度上可以降低误差,提高准确度。
但是由于科研机构的研究方向涵盖多个学科,与国内外机构间的合作会进一步提高机构的h指数,国际合作度越高的单位,相应地h指数也越高,而国际合作度低的单位,相应地h指数也就越低,这样一定程度下会使机构h指数概念变得模糊。
4、出版社学术影响力方面的局限性
出版社h指数是出版社所有图书被引频次的总和,它消除了学科大小的差别和图书品种的差异。
虽然出版社的界限相对比较清楚,但是由于各出版社的级别、出版社出版的图书品种数、成立的时间、市场定位和出版物的优势特色等特征存在明显的差异,不同类型出版社之间比较缺乏可比性。
H指数应用于出版社学术影响力评价方面的局限性表明,在利用h指数进行评价时,应根据出版社定位,遵循同类相聚,,同级相比的原则,或者标准化后进行分类比较,才能更客观地反映出版社的学术影响力。
针对h指数存在的缺陷和不足,国内外许多专家学者进行了系列的相关研究,不断探索h指数的科学性、实用性,并尝试找出解决h指数一个或者多个缺点的各种辅助指标,对h指数进行修正,以促进h指数及h型指数的完善,提出了众多的h指数变体。
如赫希本人提出的M指数,金壁辉等提出的A指数、R指数、AR指数,安静等提出的K指数,吴强提出的W指数,比利时著名计量学家埃格赫提出的G指数等类H指数,从而扩大了h指数的外延,对h指数做了很好的补充和改进。
总的来说,h指数和类h指数有发展成为下一代核心评价参数的可能。
因此我们再应用h指数的过程中,应充分认识到h指数既不可能是万能指标,也不可能是唯一指标,从多方面、多因素的衡量远比仅仅使用一个指标更为有效。
将h指数以及其衍生的相关指数等与其他传统的计量指标结合使用,可以从不同视觉共同对评价对象做出更全面的衡量评价,有利于提高科研评价结果的客观公正性。
要评价一个科研人员的学术成就,最基本的方法是同行评议。
但这种方法有一定的局限性,比如比较花时间,与具体评价人的水平有关,外行不容易理解,容易受主观因素的影响等等。
因此人们一直在试图找一种简易明了、客观的定量评价方法。
上世纪80年代末,南京大学将SCI论文数作为一种评价体系引入中国大陆。
SCI是“科学引文索引”(ScienceCitationIndex)的缩写,是美国科学家尤金加菲德尔在1961年创建的一个科学论文资料数据库,收录发表在较重要的学术期刊上的论文的相互引用情况。
该数据库不断扩大,到现在收录了约9000中自然科学和社会科学的学术期刊上的论文,在国内简称为“SCI论文”
赫希将这种方法称为h指数(h-index)h代表“高引用次数”(highcitations)
与其他统计方法不同的是,要确定一个人的h指数非常容易,用赫希的话说,只需要化0秒。
到SCI网站,查出某个人发表的所有SCI论文,让其按被引次数从高到低排列,往下核对,知道某篇论文的序号大于该论文被引次数,那这个序号减去1就是h指数。
赫希认为h指数能够比较准确的反映一个人的学术成就。
一根人的h指数越高,则表明他的论文影响力越大。
在当代物理学家中,h指数最高的是普林斯顿大学的理论物理学家爱德华.维腾,达110.维腾被普遍认为是当代最有影响力的理论物理学家。
中国读者较为熟悉的霍金的h指数也比较高,为62.生物学家当中h指数最高的为沃尔夫医学奖获得者、约翰斯.霍普金斯大学神经生物学家施奈德,高达191,其次为诺贝尔生理学或医学奖获得者、加州理工学院生物学家巴尔的摩,为160。
生物学家的h指数都偏高,表明h指数就像其他指标一样,不适合用于跨科学的比较。
赫希还计算了再最近20年获得诺贝尔物理学奖的物理学家h指数,平均值为41.美国科学院物理学与天文学部2005年新科院士的h指数平均为44,而生物医学部新科院士的h指数平均高达57。
很显然,h指数的高低与从事科研的时间长短有关。
对于年轻科学家来说,由于发表论文数量太少,论文的数目成了其h指数的上限,计算其h指数没有多大意义。
H指数比较适合用于衡量已从事科研多年的资深科学家的总体成就。
一个人的h指数是不会随着时间的推移而减少,只会增加或保持不变。
通过研究血多为物理学家的h指数,赫希认为如果一个人再从事科研20年后(从发表第一篇论文算起),h指数能达到20,就算是一名成功的科学家;能达到40,则是一名接触的科学家,很可能只能在名牌大学或研究所才能见到;能达到60(或30年后达到90),则是首屈一指的大科学家了。
赫希同时指出,美国研究型大学的物理学家要获得有就教职(副教授),h指数一般为10到20,而成为美国科学院院士则一般在45或更高。
H指数也有漏洞可钻
H指数有其局限,除了不适合用于评价年轻科学家外,也不适合用于评价历史上科学大师的成就。
比如根据SCI的收录计算,大物理学家费曼的h指数仅为21,按赫希提出的标准只能算是一名“成功科学家”。
SCI未未收录1955年之前的物理论文,费曼在之前发表过17篇论文,即使把这17篇论文全部算进去,费曼的h指数最多也就38,也没达到“接触科学家”的标准。
老一辈科学家并不像当代科学家那样频繁发表论文,而且他们的重大贡献很快成为专业常识,人们在提及时不再引用其论文,这两方面的原因使得他们在h指数方面大大吃亏。
论文引用包括作者本人在后来的论文中自我引用(自引)和他人的引用(他引)两种,SCI在统计时并不对二者做出区分。
显然,自引次数的多少与论文的影响力毫无关系,但是有些科研人员却故意频繁自引,制造论文被引次数高的假象,赫希认为h指数的一个优势是一个很难通过自引来拔高,“无法伪造它”因为它衡量的是一个人的全部学术成果能否经受长时间的考验。
波士顿大学物理学家悉尼.莱德纳接受《自然》的采访时对此也表示同意:
“想要假造全部的科研生涯是非常困难的。
”
赫希和莱德纳都低估了中国科研人员在这方面的创造能力。
以郑岳青为例,他迄今为止共发了134篇SCI论文,其h指数是14,这算相当高的了,按赫希的标准,可以在美国研究型大学获得永久教职。
但是仔细核查这些论文的被引用情况,会发现绝大多数都是没有价值的自引,有的论文被引用了24次,而其中郑岳青自己就引用了20次!
如果把自引的次数去除掉,郑岳青的h指数就降到了不值一提的6.再好的评价体系,也无法被别有用心者钻空子。
在中国,一个人要想假造全部的科研生涯是非常容易的。