国内外顶尖细胞生物学期刊比较研究*
——基于WOS、PUBMED和MICROSOFT ACADEMIC的大数据分析
关键词:
本文引用格式
郝宁, 罗丽丰, 张晓雪.
1 引言
科技期刊是传播科技成果和促进学术交流的重要载体,是一国科技竞争力与文化软实力的重要体现。2013年起,中国科协联合六部委组织实施“中国科技期刊国际影响力提升计划”。2018年11月,习近平总书记在中央全面深化改革委员会第五次会议上明确了建设世界一流科技期刊的发展目标。2019年8月16日,中国科协、中宣部、教育部、科技部联合印发《关于深化改革 培育世界一流科技期刊的意见》(以下简称“《意见》”),《意见》明确了我国科技期刊的发展目标,提出实现一流期刊建设目标的措施和途径,要以中国科技期刊卓越行动计划为统领,提升科技期刊专业管理能力、科技期刊出版市场运营能力、科技期刊国际竞争能力,推进数字化、专业化、集团化、国际化进程,构建开放创新、协同融合、世界一流的中国科技期刊体系。[1]
本文基于Web of Science、PUBMED、Microsoft Academic数据库,多角度解读期刊信息数据,客观呈现生命科学领域国内外5本具有代表性的细胞生物学期刊的面貌特征,为提升我国科技期刊的发展和影响力提供参考。
2 研究方法和数据来源
本文选取的研究对象是5本国内外细胞生物学领域代表性期刊,分别是:CELL,MOLECULAR CELL(MOL CELL),NATURE CELL BIOLOGY(NAT CELL BIOL),CELL RESEARCH(CELL RES)和PROTEIN & CELL(PROTEIN CELL)。本文的研究方法主要是数量研究法,通过对上述研究对象的发文量、发文领域、发文主题、发文机构等数据进行分析对比和研究,来展示国内外顶尖生命科学期刊的变化规律和发展趋势。研究数据主要来源于Web of Science(WOS)核心合集、PUBMED、Microsoft Academic等,统计时间跨度为2010—2020年,统计时间截至2020年8月6日。数据主要获取路径为:以“期刊名称”+“[journal]”为组合关键词在PUBMED中检索全部文章,记录所有检索结果文章的DOI、发文主题关键词、发文机构等内容,然后根据DOI在Microsoft Academic中检索文章所属的领域,最后根据DOI在WOS中检索该刊的影响因子和文献类型,将上述所有数据进行汇总、整理和分析。国内外科技论文发文量数据源自WOS核心合集数据库(检索时间为2020年9月9日),以出版年为检索关键词进行检索,人工筛查国内SCI期刊名列,使用Excel进行数据统计整理。期刊引用数据来自Journal Citation Report(JCR)报告。
3 参数设置与数据解析
针对本文的研究对象,利用简单的Python语言、数据库语言和前端echarts知识,主要做了以下数据处理和分析:
3.1 发文概况处理
分别将5本期刊近10年的发文总数据导入MySQL,然后按照年份(2010—2019年)分别统计每年的发文情况,再按照文献类型可以得到每个类型的发文量:将所有数据汇总提取,进行发文概况的比较和分析。
3.2 发文领域处理
使用上文的数据,同时将从Microsoft Academic获取的每篇文章所属的学科领域也导入作为field列,统计出现频率最高的10个领域,然后计算5本期刊在这10个领域中的发文量分布,进行各刊发文领域的比较与分析。
3.3 发文主题处理
单独统计每本期刊的发文主题,利用Python对近似的发文主题进行归一化处理,将任意两个在同一篇文章中同时出现的主题记作一次“关联”,将所有关联数据导入MySQL,提取每本期刊的关联数据,进行发文主题的比较和分析。
3.4 发文机构处理
单独统计每本期刊的发文机构,对期刊出现的发文机构进行如上相同的归一化处理,然后将所有机构数据导入MySQL,查询每个机构的发文贡献占比,提取每本期刊的关联数据,进行发文机构的比较和分析。
4 结果和分析
4.1 JCR排名情况
根据JCR学科分类,5本期刊都属于CELL BIOLOGY(细胞生物学)分类。对比5本期刊近5年的排名和总引用情况,我们发现CELL、NAT CELL BIOL和MOL CELL的排名、总引用量和影响因子都表现稳定。国内期刊CELL RES和PROTEIN CELL近5年来均处于上升发展状态,影响因子排名和总引用量都逐年大幅提升。其中国内期刊PROTEIN & CELL发展非常迅速,总体排名从2015年的73名快速升至2019年的19名;影响因子和总引用量也进步很快,分别提升了145%和166%。
4.2 发文概况比较
对比5本期刊近10年来的发文基本情况,我们发现:从发文总量来看,国外期刊发文量均大于国内期刊,依次为CELL>MOL CELL>NAT CELL BIOL>CELL RES>PROTEIN CELL。从发文趋势来看,CELL和MOL CELL发文量整体趋增,但CELL在2017年发文量出现低谷,仅543篇;Nat Cell Biol发文量基本持平,国内两刊都在趋减;从文献类型来看,CELL、MOL CELL和NCB发文量前三位的文献类型都是ARTICLE、EDITORIAL和REVIEW;CELL RES发文前三位的是ARTICLE、EDITORIAL和LETTER;国内两刊的LETTER发文量均远大于国外期刊,高达17%左右,而国外刊均未超过0.5%。从CORRECTION发文量来看,CELL最低,其年均CORRECTION比率仅0.4%;Nat Cell Biol最高,勘误比率高达9.6%;国内两刊和MOL CELL勘误率差不多,处于3%左右。可见国内期刊发文量跟国外期刊比还有很大的差距,应提升发文量以扩大影响力;发文类型也还有很大的优化空间,比如顶尖期刊均有大量的EDITORIAL文献,这是他们国际影响力大的一个侧面体现,国内期刊可以适当邀约一些EDITORIAL文章以扩大影响力;另外,国内期刊应进一步降低CORRECTION比率,以提升期刊形象和出版质量。
对比5本期刊近10年的发文领域情况,我们发现CELL RES和CELL的发文领域分布基本一致,发文量前三的分别是遗传学、分子生物学和细胞生物学;MOL CELL与CELL和CELL RES类似,只是发文领域前三的排序稍有不同,分别是分子生物学、遗传学和细胞生物学;PROTEIN CELL和NAT CELL BIOL发文领域分布基本一致,发文量最多的细胞生物学和分子生物学,分别为88%和65%。可见细胞生物学分类中顶尖期刊所发文章除了细胞生物学本领域研究外,还都涉及大量的遗传学和分子生物学的研究工作,这也从侧面体现了大体量的完善的科学研究工作需要更多跨学科融合与协作。
4.3 发文主题比较
笔者对Microsoft Academic数据库中5刊的主题进行知识图谱分析,以反映各期刊载文所涉及的重点研究主题,展示该刊载文所包含的主题的关联程度,以及所涵盖的领域是否丰富且有紧密联系。结果发现CELL的发文主题主要为基因表达调控、DNA甲基化、核小体、天然免疫系统和核糖体等;MOL CELL的为DNA修复、基因表达调控、泛素连接酶、核小体和核糖体等;NAT CELL BIOL的为祖细胞、着丝粒、自噬、细胞周期和诱导多能干细胞;CELL RES的为诱导多能干细胞、程序性细胞死亡、泛素连接酶、DNA甲基化和癌变;PROTEIN CELL的是诱导多能干细胞、癌变、自噬和基因编辑;可见5大期刊均有主题词的重叠。另外,从5本期刊主题共现分析图谱可以看出,CELL和NAT CELL BIOL的主题词图谱相似,都是由几个主节点发散出其他节点,各节点分散均匀且大小差异不大,说明两刊的发文领域涉及面广、跨领域交叉度高,学科综合性较高;MOL CELL和CELL RES的图谱比较类似,有几个生根的大节点,然后发散其他小节点,各节点联系紧密,形成中间的密集团块,说明这三个刊的发文领域相对较窄、专业性比较强;PROTEIN CELL的图谱最简单,只有诱导多能干细胞一个大的关键性节点,且与其他节点之间的联系程度不高,说明其发文领域单一且发文量未成规模,对比另一本国内期刊CELL RES都还有较大差距。值得一提的是,虽然目前CELL RES尚未达到与CELL和NAT CELL BIOL那样的规模和格局,但从其发文主题词和图谱均可见已初具CELL之形。
4.4 发文机构比较
统计5本期刊的发文机构排序与发文量占比,我们发现国内两刊的发文机构比较局限,主要分布于国内几大研究机构和高校,其中PROTEIN CELL的机构集中性更为严重,15%的机构发表了其40%的文章,CELL RES虽然主要机构来源于国内,但其集中性不高,其15%的机构发文28%;而其他3本国际刊的发文机构都很分散,属于全球性分布,15%的机构发文约20%。从各刊机构的比对结果来看,3本国际刊的前10机构都是欧美发达国家,而国内期刊除CELL RES的第6位和第7位机构来自西班牙和美国外;PROTEIN CELL前10机构都来自中国,且还有9家都是中国科学院下属院所。这也从一方面说明了我国的高水平科研产出量还是与英美等发达国家尚存在较大差距。
对Microsoft Academic、PUBMED和WOS数据库中5本期刊的发文机构进行知识图谱分析,以反映各期刊发文机构的关联程度及合作发表情况,发掘期刊发文机构的地域分散情况及国际合作程度。结果发现,CELL、MOL CELL、NAT CELL BIOL和CELL RES的机构节点分散且密布均匀,且这些机构的地域分布范围非常广;CELL、MOL CELL和NAT CELL BIOL多存在来自不同国家的作者合作发文,国际化程度非常高;而CELL RES的机构国际化程度虽然比不上三个国际刊,但其机构来源也比较广,存在国内多个高校或科研院所间合作发文的现象。国内刊PROTEIN CELL的图谱中有两个大的关键节点IBP(Institute of Biophysics,CAS)和UCAS(University of Chinese Academy of Sciences)及其组合联结其他机构形成的一个大团块,节点分散不均且稀疏,表示其发文单位集中在这两家机构,且其周围小节点都是与这两家单位相关的一些机构,说明其载文的国际合作化和国内合作化程度均不高。可见国内期刊PROTEIN CELL在发文机构国际覆盖率和分散性上与其他国际刊尚有较大差距。而另一国产期刊CELL RES的发文机构分散性虽然与其他国际刊差距不大,但其国际机构来源比例较低,国际机构中只有UCLA比较成规模,其他都是零星散在的国际机构来源,说明国内期刊的瓶颈还是国际影响力远远不够。
5 讨论
5.1 细胞生物学领域国内代表期刊现状
我国细胞生物学领域代表性期刊CELL RES和PROTEIN CELL,在发文规模和质量、国际稿源和影响力等方面与国际顶尖期刊都存在着较大差距;但在栏目设置、出版质量、发文领域优化、稿源发掘等方面与国际大刊的差距在逐步缩小,尤其是CELL RES。另外值得一提的是,我国细胞生物学领域的另外一本2015年创办的CELL RES姊妹刊CELL DISCOVERY,2017年即获得首个影响因子4.462,现已稳步提升至10.849,进入Q1区,影响力也在进一步提升。但总体来说,我国英文科技期刊还有非常大的成长空间。
5.2 改善措施和建议
为了改善目前的状况,缩小我国英文科技期刊与国际顶尖期刊的差距,提升我国在国际科学研究领域中的学术话语权,决策层已经制定相关政策以加强我国科技期刊建设、促进世界一流科技期刊培育,助力我国由世界科技期刊大国迈向世界科技期刊强国。但我国科技期刊的未来发展有赖于决策层、编辑出版界和科学界的共同努力,在此,我们从出版者的角度提供以下几点意见:(1)对标国际高水平期刊,把好生产质量关,提高出版品质,做精良的优秀出版物。(2)国内优秀期刊要做到行稳致远。即逐步增加发稿量,以实现规模化发展;或者进一步通过创办/培育梯队/姊妹期刊或者合作办刊的方式,以逐步实现集群化、集团化发展。比如,由CELL RES主编李党生博士发起创办的CELL DISCOVERY就是一本非常好的梯队期刊,这本期刊很好地保留住了部分未能被CELL RES录用的梯队稿件。但是,目前国内生命科学领域各层次科研成果的不断增加与国内相匹配期刊发布平台的缺少或断层这一供需矛盾仍然非常明显。国内期刊界同仁应该抓住机遇,合力打造与国内科学研究繁荣发展相匹配的科研成果发布或展示的话语权系统,即以期刊为中心的科学传播展示平台,以期最终摆脱国际出版集团的垄断以实现造船出海。(3)国内稿源是国内期刊的生存根本,而国际稿源又能扩大期刊的国际影响力。因此,期刊团队应该辩证处理国内外稿源,积极拓展海外优质稿源,留住国内高水平稿源,重视国内外合作稿件,果断舍弃国外低质量稿件。(4)延伸作者读者服务,借助大数据分析、人工智能技术开发期刊平台及周边产品如相关检索工具和阅读工具等,为作者和读者提供优质服务,从而实现双赢。比如,作者通过查询这些大数据分析结果就能够看到其所研究的领域与其他哪些领域相关联,从而触发新的研究点,也可以为其将来发表文章、选择目标期刊提供参考。期刊则可以积攒用户黏性,提高期刊吸引力,做大做强期刊品牌。目前,PROTEIN CELL已经在尝试做这方面的工作,此文中的大数据分析结果就来自该工作中的一部分研究成果。期刊不能仅仅停留在发表出版展示阶段,应该积极融入科技繁荣大发展的背景中,不断运用新技术新方法去拓展其外延,做大做强其中心桥梁作用,积极为围绕其周围的各个科学社群做好服务工作,以期最终为其行稳致远的发展提供源源不断的动力与支撑。
6 结语
最后,笔者提出一点思考:国内英文期刊一直在追求的国际化和国际稿源高比例是否理性。关于这一点,我们是否应该停下来重新考虑一下,为什么CELL那些期刊大部分稿源也是来自其本土国家却被誉为国际化期刊且受全球科学家的认可?我们认为,国内期刊只要一心一意、坚定不移地做好自己,把握住根本,不一味追求指标而本末倒置,那么未来受到国际科学圈的认可和吸引越来越多的国际稿源也就是水到渠成之事,从而真正意义上实现我国科技期刊的文化自信。
参考文献
/
| 〈 |
|
〉 |
