英语原文共 4 页,剩余内容已隐藏,支付完成后下载完整资料
H指数,g指数,e指数之间的关系
物理系,天津大学,天津300072,中国,邮箱:ctzhang@tju.edu.cn
在目前所使用的h型指数中,g指数不仅能体现h指数的优势而且可以从高引用文章中引用计数。然而它有这样一个缺点,在一些重要的情况下,它需要增加虚拟的零引用文章来计算指数。如果要求不引入虚拟文章为条件,则可以提出一个分析方法,以h指数和e指数为基础来大约估算其g指数。如果一个科学家的引用是根据幂次法则得出的,那就表明g指数是可以准确地通过h指数,e指数和幂次参数来计算的。这里出现的h,g和e指数的关系表明g指数包含了来自于h指数,e指数和一些超出范围的论文的引用信息。
1介绍
H指数作为一个评价指标来衡量一个科学家的输出,Hirsch(2005)提出后便得到了广泛的关注。虽然h指数的优点是结合两项数据(出版物和引用)成一个整数,而且极其简单,尽管它也有一些缺点。为了克服这些缺点,许多科学家提出了更多的h型指数。可以在(Bornmann,Mutz,amp;Daniel,2008)提出的8种 h型指数中进行参考与比较。最近, (张,2009)提出了一个新的h指数和e指数。它是一个在其他h型指数中起到关键作用的指数,例如(金,2006)提出的a指数和(金、梁、卢梭、amp;Egghe 2007)提出的r指数,它们都可以通过h指数和e指数来唯一确定。在这些可采用的h型指数中,g指数是一个较重要的指数,它不仅可以凸显出和指数的优势,而且可以从高被引文献中创造出有价值的指数。另一方面,其中的一个e指数的优势则是它会估量多余的引用特别是那些用于计算h指数来自于高被引论文的多余引用。因此,g指数和e指数之间必然存在关系。
g指数有一个较明显的缺点:在一些重要的情况下,需要添加虚拟的零被引文章来计算这个指数。因此,如果只有g指数,对于一个要测量的科学家来说,他们时常也会抱有疑问,哪些是真实的论文本身而存在的而哪些优又是后期虚拟添加的。因此,基于这种没有任何虚拟论文的定义,所以需要继续研究h,g和e指数。并且得出了一个基于h指数和e指数来计算g指数的分析方法。
2 g指数的替代定义
2006年, Egghe(2006a)提出了g指数,并且将它定义为:论文按被引次数排序后相对排前的累积被引至少g2次的最大论文序次g,亦即第(g 1)序次论文对应的累积引文数将小于(g 1)2。这个g指数作为h指数的补充与提高,不仅有效利用了h指数而且可以从高被引文献中创造出价值的指数。但是,g指数仍然存在一个缺点,事实上,当
(1)
Citj 表示为被第j篇论文引用,n是论文的总数,没有定义g指数。为了解决这个问题,egghe(2006b)介绍了零被引文章中虚构的概念,通过增加足够多的这类文章,像很多情况所需求的那样,比如新文章的数量,包括虚构的,无效的方程。但似乎这不是一个理想的解决方案,之前也在简介中已经提到过。
为了解决这个问题,我们重新定义g-index。以递减的顺序安排(i,e, cit1ge;cit2ge;hellip;hellip;ge;)。为了避免失去普遍性,我们假设citj,j=1,2hellip;N,可以被光滑函数cit(t)=C(t), t isin;[1,N]表示,当C(j)= j =1, 2, ...N. 则公式,
S(x)= (2)
我们定义
2= (3)
第一个公式方程3的定义类似于真正的g-index(Guns amp; Rousseau, 2009).通过方程3,-index总是有一个定值的实数不添加任何虚构的文章。将它标记为
g=[] (4)
g是Egghe的指数而且[x]表示一个实数x的整数部分。
3以h指数和e指数为基础的计算
e指数是被用于计算h指数的过度引用平方根。(张,2009)表示为:
e2=S(h)-h2 (5)
S(h)是通过研究者研究h论文所得出的总引用,假设其h指数是h,将这个h论文集合称之为h-core,(Rousseau,2006)。e指数为其提供了一个必要的h指数补充,特别是在评估高度引用科学家或精确比较一组科学家h指数相同的情况下。e指数可以通过只使用h指数来描述忽略引文信息。例如,研究员一篇论文被引用100次将h指数为1,在这个情况下,h-core只包含了一篇文献,那么这个e指数可通过公式得出e===9.95
h指数等于1严重低估了这个研究的学术影响而e = 9.95 h指数表明忽视引用信息。这个对于那些有少许出版的年轻研究人员尤其重要,但是,极可能可能是高度引用。为寻求普遍性,我们现在研究的年代S(N)lt; N2。我们扩展函数S(x)在泰勒级数在x = h,并且保持线性项,我们得出
S(X) S(h) Srsquo;(h)(x-h), h (6)
指出S(h)= h2 e2,Srsquo;(h)= C(h)= h,zhang定义了这样一个e指数,我们可以发现
2h2 e2 h() (7)
解出这个代数方程(7),我们发现:
(1)= (8)
(1)表示的近似-index的第一批订单。同样,只保留泰勒的线性和广度上的扩张,我们用这样一个式子表示:
2 S(h) Srsquo;(h)(x minus; h) S(h)(x minus; h)2,h le; x le; N. (9)
为了计算S(h),我们首先需要知道函数的具体形式C(x),我们假设一个简单的模型C(x)(Zhang,2009)
C(x)=,C1=C(1)gt;0,X (10)
利用方程9,我们得出
2h2 e2 h()-lambda;()2 (11)
解出这个代数方程,我们发现
(2)= (12)
在tilde;g(2)的近似表示tilde;g-index二阶。重复前面的过程,一般情况下,我们发现
(2)=e2 h h2( (13)
用f来表示和h的比率:
f= (14)
我们可以进一步的发现:
f2=)2 f ( (15)
方程15意味着tilde;g / h比值可以唯一地由e / h比值和幂指数lambda;决定。基于方程13,我们可以推出tilde;g(3),tilde;g(4),等等。但如果涉及的公式更加复杂地话,我们就不能更进一步使用了。
接下来,我们将给出的近似tilde;g-index,tilde;g(1)和tilde;g(2),一个几何解释。根据方程3:
2=S(h) (16)
TABLE 1. The h-index, e-index, g-index, and the calculated tilde; g(1)and tilde; g(2)for each of the 14 still-active Price medalists (in the g-index decreasing order).
Name |
h |
e |
g |
[(1)] |
[(2)] |
(%) |
(%) |
Garfield |
27 |
48.16 |
59 |
63 |
58 |
6.78 |
1.69 |
Narin |
27 |
26.02 |
40 |
42 |
41 |
4.76 |
2.50 |
Small |
18 |
33.30 |
39 |
43 |
39 |
10.26 |
0.00 |
Braun |
25 |
23.30 |
38 |
38 |
38 |
0.00 |
0.00 |
Schubert |
18 |
20.66 |
30 |
31 |
30 |
3.33 |
0.00 |
Glanzel |
18 |
16.43 |
27 |
27 |
27 |
0.00 |
0.00 |
Martin |
16 |
19.44 |
27 |
29 |
27 |
7.41 |
0.00 |
Moed |
18 |
18.11 |
27 |
29 |
28 |
7.41 |
3.70 |
Van Raan |
19 |
15.81 |
27 |
27 |
27 |
0.00 |
0.00 |
Ingwersen |
13 |
21.19 |
26 |
28 |
26 |
7.69 |
0.00 |
White |
12 |
20.22 |
25 |
27 |
25 |
8.00 |
0.00 |
Egghe |
13 |
11.75 |
19 |
19 |
19 |
0.00 |
0.00 |
Leydesdorff 剩余内容已隐藏,支付完成后下载完整资料
资料编号:[29084],资料为PDF文档或Word文档,PDF文档可免费转换为Word |
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。