2022年 09月 19日

基本科学指标数据库ESI及论文的被引用次数

Wordvice China

论文和专著的被引用次数是非常重要的学术影响力指标。各论文数据库通常都会给出每篇论文的被引用次数。

如果一个学者在SCI上发表的论著经多年后仍然没有被他人引用,这个学者的学术影响力就会令人怀疑。

但是,被引用多少次算正常次数或较高次数?论著的被引用次数究竟与哪些因素有关?除了发表论文的数量和期刊影响因子外,如果高校使用论文被引用次数作为研究生毕业的硬性要求,是否合理?被引用次数如何影响投稿选刊和科研方向选题?广大青年学子非常关心这些问题。

基本科学指标(Essential Science Indicators,简称ESI)数据库是一个基于Web of Science(WoS)数据库的深度分析型研究工具,通常由科研管理人员使用,主要查找机构或国家的论文发表情况的统计数据。Web of Science是科睿韦安(Clarivate Analytics)公司(原汤森路透知识产权与科技事业部)的数据库。著名的SCI就是WoS的一个子数据库。

ESI根据Web of Science核心收录(Core Collection)数据库中的12000多个SCIE和SSCI期刊的论文,提供最近10年内的论文发表数量和被引用次数数据,每隔2个月更新一次。ESI针对22个学科领域,对机构、国家和期刊的科研绩效进行统计,并发布排名。因此,ESI可以确定在某个研究领域有很高影响力的个人、机构、论文、期刊和国家,以及可能影响科研人员工作的研究前沿方向。具体来讲,ESI通过论文数、论文被引频次、论文篇均被引频次、高被引论文、热点论文、前沿论文等六大指标,从各个角度对国家科研水平、机构学术声誉、学者学术影响力、期刊学术水平进行全面衡量,按照论文被引用次数的多少确定衡量研究绩效的阈值,并给出居于世界前1%的研究机构、作者、论文的排名等,作为衡量研究机构科研水平的重要指标。

高被引论文(Highly Cited Papers)是指在过去10年内被引用次数位于该学科世界前1%的论文,是国内外公认的具有较高影响力的高水平研究成果。热点论文(Hot Papers)是指近两年内发表的论文且在近两个月内被引用次数排在相应学科领域全世界前0.1%以内的论文。如果在某学科,一所机构的被引用次数位于全球所有机构的前1%,则称该机构的某学科为全球前1%学科

并非任何作者、机构或国家的论文数据都会被ESI数据库收录。对于论文作者、机构和高被引论文来讲,只有满足全球前1%的排名,才会被ESI收录和统计。对于热点论文,只有满足全球前0.1%的排名,才会被ESI收录和统计。对于国家和期刊,只有满足全球前50%的排名,才会被ESI收录和统计。

科研管理人员能够通过ESI对科研绩效和发展趋势进行长期的定量分析,包括了解:

  • 机构有哪些进入全球被引用次数前1%的ESI学科?
  • 机构在ESI学科中的全球影响力排名如何?
  • 机构在各ESI学科中有哪些高被引论文和热点论文?
  • 每个ESI学科的居于世界前1%被引次数的作者(即高被引论文作者)有哪些人?
  • 每个ESI学科的居于前0.1%的热点论文有哪些?
  • 某ESI学科中有哪些新兴的研究前沿方向?
  • 某ESI学科中有哪些期刊的被引用次数排名靠前?

ESI针对每个期刊按照22个ESI学科进行分类标引,提供国家、机构、论文和期刊排名,以及规范化的机构英文名称。不同于Web of Science中的251个学科分类,ESI将学科划分为以下22个(括号内的英文为ESI学科代码):

  1. Agricultural Sciences(AGS,农业科学);
  2. Biology & Biochemistry(BBI,生物学与生物化学);
  3. Chemistry(CHE,化学);
  4. Clinical Medicine(CLM,临床医学);
  5. Computer Science(CPS,计算机科学);
  6. Economics & Business(ECB,经济和商业);
  7. Engineering(ENG,工程);
  8. Environment/Ecology(ENE,环境/生态);
  9. Geosciences(GSC,地球科学);
  10. Immunology(IMU,免疫学);
  11. Materials Science(MTS,材料科学);
  12. Mathematics(MAT,数学);
  13. Microbiology (MIC,微生物学);
  14. Molecular Biology & Genetics(MOL,分子生物学与遗传学);
  15. Multidisciplinary(多学科);
  16. Neuroscience & Behavior(NEB,神经系统科学和行为);
  17. Pharmacology & Toxicology(PHT,药理学和毒理学);
  18. Physics(PHY,物理);
  19. Plant & Animal Science(PLA,植物与动物科学);
  20. Psychiatry/Psychology(PSS,精神病学和心理学);
  21. Social Sciences-general(SSS,社会科学);
  22. Space Science(SPA,空间科学)。

对于Multidisciplinary中的48个期刊,每篇论文按照其参考文献分类到其余21个学科中。对于无法分类的,划归于Multidisciplinary。

由于论文在发表后需要经过一段时间才能被读者发现、引用和流传,因此论文发表的时间越早,几年后的累积被引用次数就越多。另外,不同的学科具有不同规模的论文发表数量,以及不同的10年期篇均被引用次数。从表1可见,分子生物学与遗传学的SCI论文具有最高的篇均被引用次数,大约为10年内年均25次。数学具有最低的篇均被引用次数,大约为10年内年均5次。

表1 ESI篇均年均被引用次数的学科排名(摘自ESI数据库统计页面)

表2显示,在2022年发表的工程学论文在当年如果被引用次数能够达到4次,就能够进入所有工程学论文的全球前1%排名。如果能够达到16次,就能够进入前0.1%。如果能够达到85次,就能够进入凤毛麟角的前0.01%(即万分之一)。而对于在2012年发表的工程学论文,在2022年如果被引用次数能够达到151次,就能够进入所有工程学论文的全球前1%排名。如果能够达到399次,就能够进入前0.1%。如果能够达到1255次,就能够进入前0.01%。用表2的数据作图,得到图1,可见论文发表年份越早,累积到当前年份(2022年)的被引用次数就越高。

表2 工程学科SCI论文的历年被引用次数的百分比排名阈值(摘自ESI数据库统计页面)

 20122013201420152016201720182019202020212022
0.01%125511208821034120982160141525111985
0.1%3993983673403272852521751145516
1%151145136131120112977249214
图1 SCI论文的被引用次数趋势

表3给出了截止到2022年所有ESI学科的论文篇均被引用次数。对于工程学SCI论文,从2012年到2022年,在发表后10年内的篇均被引用次数是19.10次。从2017年到2022年,在发表后5年内的篇均被引用次数是15次。从2021年到2022年,在发表后1年内的篇均被引用次数是2.04次。由此可见,如果大学根据发表论文的被引用次数作为博士研究生的毕业要求,无疑是非常荒谬的。这是由于如果博士生在毕业前1年发表论文,那么在毕业的年份平均来看将只有2次被引用次数,而这种次数少到了在学术影响力方面并不能体现出什么真实有效的实际意义。

表3 截止到2022年所有学科的论文篇均被引用次数(摘自ESI数据库统计页面)

从表4可见,美国和中国是发表WoS(含SCI)论文最多的国家,远多于其他国家。美国发表的WoS论文的10年期篇均被引用次数是20.5次,中国是14.05次。美国拥有1777篇热点论文,中国拥有1634篇热点论文,数量均远超其他国家。

表4 WoS论文篇数、论文的篇均被引用次数和热点论文数量的国家排名

(摘自ESI数据库统计页面)

除了按照国家进行统计和排名外,ESI还按照作者进行排名。从表5可见,论文被引用次数最多的作者是M. Bernstein,他的1篇论文的10年期被引用次数高达7166次。实际上,这个作者排行榜不容易用来分辨作者的姓名,因为很多外国作者具有相同的姓和名的首字母。对于中国作者来讲,这个英文姓名无法区分的问题更加严重。如果ESI能够使用ORCID(学者代码)来准确区分每个作者进行排名,这种统计表就很有用了。

表5 十年期篇均论文被引用次数的全球作者排名(摘自ESI数据库统计页面)

需要指出的是,ESI在统计中对同一篇论文的所有署名作者均统一计算贡献度,而且不区分自引和他引。这两个缺陷一直被学术界所诟病。一些高校为了角逐名次,采用相互合作署名发文与过度自引的方式。消极的自引现象不仅使得总被引次数丧失指标价值,也有悖于科学研究的初衷。所以,在评价高水平作者时,非常有必要辨识所发论文是第一作者、通讯作者或其他位次的作者,并须提供论文的他引次数。这样才能准确、客观、公正地反映论文作者的贡献度和影响力。