文献[10]的“研制说明”中对CI 的计算方法及意义有详细的介绍说明。但因为是新指数,也为后文叙述方便,在此做简要介绍。
定义影响力指数[10]
其中,
校正系数
对于大部分期刊
由式(1)可知,CI主要由影响因子和总被引频次两个指标确定,并且受发文量的制约。可以认为CI由两个半指标完全确定,其它不相关的文献计量学指标不对CI产生任何影响。忽略次要指标可以简化处理,使CI的意义简单明了;选取两个主要指标,避免单指标评价过于偏颇;对它们进行归一化处理,是为二维可视化做前期准备。数据可视化处理是现今数据处理潮流的一大特点。它直观,且有明确的几何意义。与以往的线性加权综合指数不同,CI对两个指标的综合是非线性的。后文将从数学形式上讨论非线性与线性加权的差别。
假设某期刊现处于图1中
当然,最高效提升CI的策略是沿着
线性加权的数学形式不具备这样的引导方向。不论期刊现在指标的状态如何,所有期刊最高效的提升线性加权综合指数的方式都是一样的:努力提高权重最大的指标,即使次要指标降低也影响不大。所谓“一好遮百丑”。唯影响因子论[13]的数学根源即在于此。CI则具有类似“水桶效应”的效果:两个指标有一个短板,CI就不会很高。极端的情况是(
为避免枯燥的数学证明,并凸显CI与一般线性加权指标的差异,下面给出一个虚构的简明示例加以说明。
设甲、乙、丙3个期刊的(
从众多指标中选取影响因子和总被引频次来综合出CI是经过多方面深入讨论的。但我认为还有提高的空间。上一节对CI的分析结论基于两个理想条件:①两个指标相互独立;②指标提高难度相同。经过处理后的影响因子和总被引频次并不完全满足理想条件。
在数学上,
选出线性独立的两个指标并不困难,比如:年载文量和影响因子。但是如果考虑到可比性等其他问题,想选出一组理想的相互独立的指标则相当困难。能否使用一些数学技巧来削弱指标之间的相关性是值得研究的。
从提高难度来看,
用上面的方法计算出提高各指标的难度,然后将难度作为修正因子乘以对应指标得到修正指标。各修正指标的提高难度相当,即可解决此问题。比如,令新指标
CI定义式(1)中隐含了“由最高影响因子和最大总被引频次组合而成的(1,1)是理想的期刊发展目标”的假设。这个假定更多的是考虑到数学上的可行性,对期刊均衡健康发展方面的考虑较少。即使最好的期刊,也应该有未来发展的理想目标。从文献[10]“研制说明”的图1(第III页)可以看出(1,1)点附近的高影响力期刊十分稀疏。如果取消一家最高影响力的期刊,新(1,1)点对应的最大影响因子或总被引频次的改变量很大。这对期刊发展引导方向的改变也是巨大的。由此可知此这种假设具有相当大的随意性,不一定是好的期刊发展方向,对广大期刊来说往往可行性较差。
这里给出3种解决以上问题的方法。方法一:由专家研究给出最为理想的期刊组合状态设为(1,1)点。此方法虽然充分考虑了期刊均衡健康发展方面的因素,但较为主观,容易引起争议。方法二:根据指标提高的难易度来得到新的(1,1)点。例如用上小节的新指标
最后,讨论一下起校正作用的量效指数JMI。一个影响因子接近0的期刊短期快速提高CI的最好途径就是无限增加发文量,为了抑制这种盲目行为,引入JMI,用它衡量“产生单位影响因子所需要的发文量”。若该刊影响因子保持不变,由式(3)可知JMI正比于发文量。在数学上该定义没有问题,但是它和期刊规律不完全相符。多数期刊中都存在很大比例的“零被引”文章[14,15],而且在录用前编辑大概可以估计出某些文章的被引概率很低。在其他条件不变的情况下,期刊通过减少发文量来提高影响因子是比较容易的,相反在增加发文量的同时能保持原有的影响因子都很困难。举个比较特殊的例子:所有指标都相同且没有互引的两份期刊合并为一份期刊后,影响因子保持不变,但JMI却提高了一倍,似乎预示着期刊质量下降了。好在文献[10]给定的
学术期刊影响力指数CI是非传统的非线性综合指标。与传统的线性组合指标相比,在数学形式上有新的引导功能。但是其选择的两个指标归一化的影响因子和总被引频次的组合不能充分体现出这种新的引导功能。如果CI仅发布一次,来评价各期刊的影响力。这种评价指标无可厚非。但如果要周期性更新发布,实际选取的指标就要能充分发挥其数学形式上应有的引导功能。
选取的指标相关性强、提高难度差别大会削弱非线性综合指标的新引导功能。而引导期刊的目标点(1,1)的设定上要更多地考虑期刊发展的实际因素,而不应该仅为方便数学处理而简单设定。
限于作者水平,以上改进方式还有很大的可探讨空间。比如“大部分期刊的状态是健康的假设是否成立?”“众多期刊向同一方向发展的状态是否健康?”等问题都是有待研究的。希望本文可以起到抛砖引玉的作用,促进期刊评价的进步。
(致谢:我刊编辑部部分同事对CI的讨论给予我很大启发。在此表示感谢!)