英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料
结合个人履历和文献计量学分析:流动性,性别和研究表现
本文展示了结合履历研究与先进文献计量学的好处。基于来自广泛的医学学科领域的326个履历的数据,我们进行了履历数据的聚类分析。数据缩减产生四个不同的科学家群体:1)流动的,2)固定的,3)优秀的和4)创业的。虽然清楚的是,流动性最强和流动性最弱的研究人员在引用表现方面也有着对立现象,但我们应该承认,大多数中低流动性的研究人员的表现并不具有线性模式。本论文指向一个双重过程,一方面是大学选拔“赢家”的过程,另一方面是研究人员通过流动提升自己的自我选择过程。
窗体顶端
最近几年,履历已经被认为是一个用不同的方法进行科学和技术的研究的有趣来源。通过研究价值绘图程序(Dietz等,al,2000),开拓性工作已经完成,履历作为研究数据在研究方面具有很大的潜力,但是有一些必须解决的方法问题。这包括履历的可用性以及履历的准确性和编码等问题。一些履历研究已经提出了这些问题(Dietz和Bozeman,2005;Gaughan和Robin,2004;Gaughan和Bozeman,2002;lee和Bozeman,2005),也有其他一些团体加入了这个研究议程(例如Mangematin,2000,2001;Cantilde;ibano,2008)。
本文讨论了履历数据与文献学数据的结合。第一次尝试使用Lee和Bozeman(2005)发表在他们的重要论文中的关于研究合作的理论。合作和生产率之间有密切的关系,但由于一些方法论的注意事项,弄清之间的确切关系很难:
1.合作的认定有几种方式,例如正常计数法(所有公开计数均为整数)和部分计数法(除以合作者的数量)。
2.研究者的身份(如教授或非教授)是重要的。
3.必须考虑到领域差异。
Lee和Bozeman(2005)在使用分数计数法过程中,发现合作与生产率之间并没有关系,但在部分计数法过程中,合作是一个强有力的预测。即使合作和生产率之间的“简单问题”已经被集中讨论,仍然有一些方面可以添加。本文的第一个目的是把引用带入分析,寻找其它的方法去了解合作、等级、年龄和生产率等多方面问题。第二个目的是作为数据删减方法检验聚类分析。第三个目的是关注流动性,并且把这个因素与引文分析和聚类技术结合起来。最后,在分析中考虑性别方面(Cole和Zuckerman,1984;Prpic,2002)是非常有趣的。
数据和方法问题
在这个分析中使用的主要数据来自于由所有资深科学家组成的群体的履历,在所有的326位研究人员中,这些科学家在2005年6月被认定为瑞典研究基金会的资助人。在医疗方面,研究领域可以被描述为临床前和临床上以及研究中。其中人数中包括主要调查员。这些主要调查员在2002 - 2004年获得赠款;正常的赠款持续三年。平均赠款额约为每年6万欧元。
履历收集在2005年9月 - 10月进行,其具体目标是执行一个文献计量学人口研究。手工编码使用互联网上可用的模板lt;www.forskningspolitik.se/cvgt;,这是特别为这个数据集开发的。
虽然领域差异是一个研究如何使用来自多个领域和科学学科数据的问题,但是在这个研究中,有更多的共同点进行对照。然而,即使在医疗研究必须考虑临床和非临床研究之间差异(Narin和Hamilton,1996年)的情况下,仍可能有关于输出变量如出版物数量和引用次数的分歧。所以我们在我们的引文分析中采用领域标准化方法(Glauml;nzel,1996; Van Raan,2004年),本文的主要贡献是证明了履历分析使用这种方法比直接的论文或引文计数更好。
方法问题1:履历的质量
和许多其他履历研究(Dietz et al,2000)一样,本调查存在的问题也是信息质量的转移。许多履历都被浓缩或者简化了。履历的收集是为了启用文献计量学研究,这需要任用和出版物。因此,并非所有的人都提供了所有的个人信息。
但是,如果和其他信息的来源(互联网,来自其它机构的信息等)一起使用,即使是一个简短的简历或履历也可以被用来搜罗重要的数据(见表1)。本文的数据集包含大约80个变量,其中26个被认为是有趣的。不足三分之一的简历给出了关于家庭状况和孩子数量的信息。很遗憾,育婴假(月数)是我们不知道数据完整性的信息类型。
表1:描述性统计变量列表
变量 |
数量 |
最小值 |
最大值 |
平均值 |
标准差 |
年龄(2005年) |
326 |
33 |
76 |
49.48 |
8.697 |
婚姻状况 |
326 |
0 |
3 |
0.92 |
1.360 |
孩子数量 |
106 |
1 |
5 |
2.43 |
0.805 |
育婴假(月) |
20 |
0 |
36 |
17.7 |
11.921 |
性别 |
326 |
0 |
1 |
0.77 |
0.420 |
国籍 |
326 |
1 |
3 |
1.15 |
0.533 |
章节和评论 |
116 |
1 |
64 |
8.17 |
8.554 |
文章总数 |
326 |
0 |
760 |
106.50 |
115.70 |
专利总数 |
326 |
0 |
25 |
0.55 |
2.118 |
博士生总数 |
209 |
1 |
40 |
7.49 |
6.923 |
博士生1998-2005 |
180 |
1 |
40 |
4.48 |
4.070 |
博士后监督 |
324 |
0 |
50 |
1.86 |
4.764 |
博士后1998-2005 |
88 |
1 |
50 |
5.60 |
6.373 |
基本赠款 |
103 |
1 |
10 |
2.83 |
1.953 |
战略拨款 |
35 |
1 |
5 |
2.06 |
0.873 |
申请赠款数 |
46 |
1 |
7 |
2.07 |
1.162 |
创业成就 |
326 |
0 |
13 |
0.50 |
1.452 |
社论任用 |
326 |
0 |
16 |
0.77 |
2.059 |
信托委员会 |
110 |
1 |
10 |
4.13 |
2.362 |
委员会 |
104 |
1 |
20 |
4.84 |
3.184 |
荣誉和奖励 |
94 |
1 |
28 |
2.48 |
3.155 |
访问教授 |
18 |
1 |
5 |
1.94 |
1.349 |
博士学位 |
325 |
1958 |
2003 |
1987 |
8.6 |
成为助理(合伙人) |
262 |
1961 |
2005 |
1992 |
9.9 |
成为教授 |
167 |
1968 |
2005 |
1996 |
7.352 |
流动性 |
321 |
0 |
3 |
0.470 |
0.632 |
注:N=326,大部分变量被记为数值
瑞典的简历通常不会汇报所有收到的补助金,尽管这对年轻人来说似乎很重要。大约三分之一的履历掌握着研究收入的相关数据。当然,也包含有关大学,学科背景,研究领域,以及所有的任用,以及任用年份的信息。后面的数据将被用在下面的部分,展示如何使用这个信息。
方法问题2:编码实践
材料由作者编码。对前25份履历进行了检查,学习过程也随之展开。一段时间后,发现了大部分的问题,提出了一个策略来处理这些问题。
不是对每个专利,创业活动,社论任用,委员会都进行编码。而是决定使用一个更省时的模式。随着并行的文献计量学过程,我们发现收集每一个出版物的所有信息是没有必要的。
方法问题3:数据缩减
聚类分析是基于多元数据分析的数据缩减的通用术语(Tjissen和de Leuuw,1988)。相似类型的对象分类是通过SPSS(病房的方法)中的分级聚类技术来完成的。十三个变量包括或多或少的完整数据(年龄,文章总数,专利,博士监督,博士后监督,创业成就,社论任用,博士学位和流动性),下面的分析都是基于这些变量的。共确定了四个不同的群集(见表2)
深入了解聚类分析的结果,我们发现共有四个不同的组。在很大程度上,前两个组 - 组1和组2 - 是相同的。他们有相同的年龄,相同的文章数量等。但是,在流动性这一方面它们的差异很大。在建立事业的过程中,第1组似乎一直在寻找新的职位和新的可能性。值得注意的是,这种流动性类型在正常的承认(奖励等)类型中没有得到回报。第1组可以被称为流动科学家。
第2组可能被用作参照值来对
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[23783],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。