研究者科学数据共享与出版意识提升路径研究——基于中医药领域160位研究者的一项横断面调查
Path to Enhancing Researchers' Awareness of Scientific Data Sharing and Publishing: A Cross-Sectional Study of 160 Researchers in the Field of Traditional Chinese Medicine
| 基金资助: |
|
Based on a cross-sectional survey of 160 researchers in the field of traditional Chinese medicine, this paper investigates the status quo of researchers' awareness regarding scientific data sharing and publishing, as well as pathways for improvement. It elucidates the extent of understanding to the concepts related to scientific data at the present stage for the Chinese researchers in the traditional Chinese medicine field, clarifies their awareness level, and examines the means and approaches through which researchers acquire relevant knowledge. The results indicate that the respondents’ cognition of scientific data is relatively superficial. The storage and regulation of scientific data are relatively simple and primitive. The respondents exhibit caution regarding sharing and publishing of scientific data. The knowledge accumulation and awareness of scientific data sharing and publishing primarily stem from practical experience. To enhance openness in scientific data sharing and publishing, three strategies are proposed in this paper. First, it is important to leverage the leading role of editors in the scientific, technological, and medical (STM) journals to foster researchers' understanding of scientific data and optimize their data management practices. Close communication between editors and researchers in daily work can provide researchers with relevant knowledge of scientific data, while editors' requirements for scientific data management can encourage researchers to upgrade their data management models. Second, various forms of training for researchers should be implemented to gradually improve researchers' cautious attitude towards open data, and expand data-sharing and publishing practices. The sharing and publishing of scientific data rely on the understanding and recognition of frontline researchers. Increasing the frequency of training and enriching the training topics can enhance researchers' engagement and ultimately influence publishing practices. Third, it is essential to address the interests that researchers prioritize, strengthen practical experience from specific case to applications in the whole area, thereby enabling individuals to continuously accumulate relevant knowledge, fostering the awakening of open consciousness, and promoting the sharing of scientific data. Scientific research has entered the era of big data, and the fourth-generation data-intensive scientific research paradigm, centered on data, has emerged. The sharing and publishing of scientific data has become an inevitable trend to promote global multilateral cooperation and build Community of Shared Future for Mankind. Through this cross-sectional survey, the Chinese researchers’ understanding to the concepts related to scientific data is clarified; their awareness of scientific data sharing and publishing is assessed; and the pathways for researchers to acquire relevant knowledge and improve their corresponding awareness are proposed, so as to provide data-driven support for the further expansion of scientific data sharing and publishing practices. Moreover, the survey process itself serves as a measure to publicize scientific data knowledge and promote the development of open science. Besides, editors of STM journals will help advance the growth of scientific data initiatives in China in the era of open science and contribute to promoting the progress of open science in China.
Keywords:
本文引用格式
郭盛楠, 郝洋, 王芳.
GUO Shengnan, HAO Yang, WANG Fang.
开放科学大势如火如荼,是国际科学界科研范式和科技治理的重大革命,开放获取、开放科学数据、开放平台等都是其重要内容。科学数据指的是在科技活动中或通过其他方式所获取的反映客观世界本质、特征、变化、规律等的基本原始数据。[1]作为所有科研成果与创新的基础性支撑,科学数据的共享与出版在数据密集型科研范式的科研活动中越来越被科学界重视。[2]在全球开放科学浪潮中,我国积极参与全球科研治理,政府部门高度重视科学数据管理,科学数据开放共享法律法规日臻完善。2018年国务院办公厅颁布的《科学数据管理办法》是我国首个科学数据管理办法,推动了科学数据在国家层面的整体部署,具有划时代意义。我国政府部门已采取多种方式,有效促进了中国科学数据管理的发展 [3],推动科学数据共享与出版的实践。2015年,我国首本科学数据期刊《中国科学数据》面世;2019年,中国科学院印发《中国科学院科学数据管理与开放共享办法(试行)》;2020年,中国科协开发建设科技论文关联数据仓储及应用服务平台,并在2022年立项开展科学数据开放共享标准、数据仓储服务支撑能力建设等。[4]
随着全球学术交流开放访问数据量急剧上升,一个大规模的开放学术生态系统正在形成。STM协会发布的2026国际科技出版趋势主题正是“大规模开放之美”。[5]然而,与大规模开放要求与趋势不相匹配的是现阶段研究者与公众对科学数据相关知识的欠缺和科学数据共享与出版意识的淡薄。根据STM协会对国际研究人员的一项调查,即使是对开放科学领域中认知度相对较高的开放获取,竟有62%的研究者不了解或几乎不了解其出版模式类型,68%的研究者不了解或几乎不了解版权许可选项 [4],更遑论近几年才开展实践活动的开放科学数据。此外,在与学者一线交流的过程中,科技期刊编辑切身感受到相当比例的一般研究者不完全了解开放科学,更少听到过科学数据共享与出版等。
在政府部门完善法律框架,持续推进政策落地与实践的过程中,迫切需要调研研究者科学数据共享与出版意识。只有明晰现阶段我国研究者对科学数据相关概念的认知程度,明确研究者对科学数据共享与出版的意识水平与层次,了解研究者获取相关知识、提高相应意识的方式与途径,方能扩大科学数据共享与出版的实践规模,加快我国开放科学进程,为我国深度参与全球科研治理提供助益。
1 研究对象与方法
1.1 研究对象
以中医药领域研究者为问卷调查对象,包括科研院所的研究人员、各级医院的临床医生、高等院校教师、相关产业人员等。
1.2 研究方法
本研究采用横断面调查研究的方式,围绕开放科学数据共享与出版领域的关键问题对中医药领域一线科研工作者开展问卷调查。研究工作组以结构式电子版问卷的形式对目标调查对象进行问卷调查。研究工作组在阅读相关文献并结合既往工作经验的基础上,形成调查问卷初稿。之后邀请了5名科技期刊出版领域专家、研究方法学专家和一线科研工作者,优化问卷,经过研究者试填,最终形成正式的调查问卷。
根据横断面调查研究样本量计算通则,即样本量计算依据自变量数目的5~10倍。本研究除研究对象基本信息,共设有14个问题,即14个自变量,以高值10倍来计算,本次调查纳入140份问卷即可充分达到信息饱和。在问卷的设计阶段,研究工作组为保证收集到认真填写、符合实际情况的问卷,专门在问卷的问题5和问题7设计了关联逻辑问题以检查研究者填写是否符合逻辑。若此两题填写答案逻辑矛盾,则被视为不合格问卷进而被剔除。本研究使用问卷星网站制作电子版调查问卷,于2024年2月进行问卷发放,研究工作组共收到208份问卷。通过内部逻辑检查,共剔除48份不合格问卷,合格问卷为160份,问卷合格率为76.9%(160/208)。故而本次横断面调查研究是基于中医药领域160位研究者的科学数据共享与出版意识现状与提升路径调查。
1.3 研究问题设置
研究问题的设置是一项横断面调查研究能否达到调研效能的关键要素。研究工作组在调研开始前,充分考虑目标核心问题,构建了“事实—意识—路径”的问题框架。本问卷设计了14个问题。其中,问题1至问题4考察研究者对科学数据相关概念与规则的认知了解现状,属于概念认知层面的事实;问题5至问题10考察研究者科学数据共享与出版的实践现状,属于实际操作层面的事实;问题11至问题13考察研究者科学数据共享与出版的意识水平,属于观点意识层面的事实;问题14收集研究者获取相关知识的具体途径。这14个问题从收集概念认知层面的事实到实际操作层面事实,再到收集观点意识,最后了解研究者获得相关知识的途径,构成了完整的“事实—意识—路径”链条。
2 调查结果
2.1 参与问卷调查的中医药领域研究者一般资料
问卷调查了研究者的人口学资料、专业技术水平、受教育情况、发文情况及科学数据收集经历等一般资料,共有160位研究者填写了合格问卷,具体情况如表 1所示。本次调查覆盖面较广,可在一定程度上反映出中医药领域研究人员对科学数据的认识。
表 1 参与问卷调查的中医药领域研究者一般资料一览表
| 项目 | 参与调研者[例(%)] | 项目 | 参与调研者[例(%)] |
| 性别 | 已取得学位 | ||
| 男 | 66(41.25) | 学士 | 45(28.13) |
| 女 | 94(58.75) | 硕士 | 45(28.13) |
| 年龄(岁) | 博士 | 70(43.74) | |
| mean±SD | 36.98±9.19 | 发表科技论文情况 | |
| 最小值 | 23 | 从未发表过论文 | 38(23.75) |
| 最大值 | 60 | 发表过论文,自认为发文较少 | 58(36.25) |
| 工作与否 | 发表过论文,自认为发文量中等 | 33(20.63) | |
| 未参加工作 | 50(31.25) | 发表过论文,自认为发文较为活跃 | 22(13.74) |
| 已参加工作 | 110(68.75) | 发表过论文,自认为发文活跃,成果丰沛 | 9(5.63) |
| 职称 | 是否参加过含有数据收集的科研项目 | ||
| 未定级 | 51(31.87) | 没有参加过 | 46(28.75) |
| 初级 | 14(8.75) | 参加过 | 114(71.25) |
| 中级 | 33(20.63) | 是否担任过研究项目的主要研究者(PI) | |
| 副高 | 26(16.25) | 没有担任过 | 96(60.00) |
| 正高 | 36(22.50) | 担任过 | 64(40.00) |
2.2 研究者对科学数据相关概念与规则的认知现状
研究设置了“1是否听说过‘科学数据’这个概念”“2是否听说过《科学数据管理办法》”“3是否听说过数据使用许可协议”“4是否知道科学数据可以在科学数据期刊上发表”4个单选题,以了解研究者对科学数据相关概念与规则了解的客观事实。其中,问题1至问题4的选项采用李克特五级分类形式进行表述,调查结果如图 1所示。问题4的选项采用二分类变量形式进行表述,有74.38%(119/160)的研究者不知道科学数据可以在科学数据期刊上发表,25.62%(41/160)的研究者知道科学数据可以在科学数据期刊上发表。
图 1
图 1
研究者对科学数据相关概念与规则的认知了解现状
注:研究工作组对问题回答选项的设计遵循李克特五级分类,但对每一个问题选项的具体设置并不完全相同,并对选项里什么是“基本了解”“完全了解”进行了部分说明,便于被调查者选择,避免错分偏倚。例如,问题3,询问研究者是否听说过数据使用许可协议,研究工作组在设置问题时便对什么是数据使用许可协议进行了举例,而且规定基本了解指的是了解CC、BY、NC、ND等的具体含义,完全了解指的是了解不同数据使用许可协议之间开放程度的区别等。
2.3 研究者科学数据共享与出版的实践现状
研究设置了“5是否被要求过进行数据可用性声明”“6要求提供数据可用性声明的期刊语种”“7在什么阶段提供数据可用性声明”“8最常用的数据存储方式”“9存储和保管科学数据是否采取了保密措施”“10是否被要求过提供论文关联数据”6个单选题,以了解研究者科学数据共享与出版的实践状态、实际操作与实际履行情况,调查结果如表 2所示。其中,问题6是在问题5回答“是”的前提下填写的。问题5与问题7考察研究者提供数据可用性声明的实践情况,如果研究者在回答问题5时选择“未提供过数据可用性声明”,而在回答问题7关于在什么阶段提供数据可用性声明时却表示在撰写/投稿/修稿/修稿后提供数据可用性声明,则视为研究者未充分理解问题原意,回答不符合逻辑进而被剔除。
表 2 研究者科学数据共享与出版的实践现状
| 序号及问题 | 问题选项 | 例(%) |
| 5是否被要求过进行数据可用性声明 | 是 | 81(50.62) |
| 否 | 79(49.38) | |
| 6要求提供数据可用性声明的期刊语种 | 中文期刊 | 11(13.93) |
| 英文期刊 | 50(63.29) | |
| 均有 | 18(22.78) | |
| 7在什么阶段提供数据可用性声明 | 从未进行过 | 81(50.62) |
| 撰写手稿时 | 20(12.50) | |
| 投稿时 | 41(25.62) | |
| 修稿过程中 | 11(6.88) | |
| 稿件发表后 | 7(4.38) | |
| 8最常用的数据存储方式 | 自备数据存储介质 | 123(76.88) |
| 各类云存储 | 20(12.50) | |
| 各类数据发布服务平台 | 10(6.24) | |
| 未考虑过系统存储 | 7(4.38) | |
| 9存储和保管科学数据是否采取了保密措施 | 未曾设置保密措施 | 100(62.50) |
| 设置了保密措施 | 60(37.50) | |
| 10是否被要求过提供论文关联数据 | 从未被要求过 | 81(50.62) |
| 被要求上传到投审稿系统 | 63(39.38) | |
| 被要求上传到各类数据发布服务平台 | 10(6.25) | |
| 其他 | 6(3.75) |
注:为使内容展现得简洁清楚,本表将问题题干和选项的语言表达都进行了精炼。在实际调研过程中,为调查出真实的信息,研究工作组对问题的具体问法和选项设计都经过仔细考量,故而问卷中的具体问题和选项呈现方式与本表中的表达不完全相同。
2.4 研究者科学数据共享与出版的意识水平
研究设置了“11您认为科研工作者是否有责任共享科学数据”“12您是否愿意共享科学数据”“13您认为不愿共享科学数据的最主要原因”3个单选题,以了解研究者对科学数据共享与出版的意识水平如何。调查研究者认为科研工作者有无责任共享科学数据,是从道德规范和法律法规层面考察研究者认为共享的“合规性”;调查研究者是否愿意共享科学数据,是从伦理情感层面考察研究者认为共享的“合理性”。同时,收集研究者不愿意共享科学数据的原因,了解其内心想法,调查结果如表 3所示。
表 3 研究者科学数据共享与出版意识水平
| 序号及问题 | 问题选项 | 例(%) |
| 11是否有责任共享科学数据 | 无责任共享 | 25(15.62) |
| 有责任共享 | 59(36.88) | |
| 若研究被公共资金支持则有责任共享 | 69(43.12) | |
| 其他 | 7(4.38) | |
| 12是否愿意共享科学数据 | 不愿意 | 29(18.12) |
| 愿意 | 48(30.00) | |
| 具体情况具体分析 | 83(51.88) | |
| 13不愿共享科学数据的最主要原因 | 怕数据有错误被追责 | 25(15.62) |
| 共享数据过程繁琐费时 | 20(12.50) | |
| 担心研究成果被他人盗用 | 91(56.88) | |
| 不理解数据共享的意义 | 11(6.88) | |
| 不知道科学数据可以而且应该被共享 | 9(5.62) | |
| 其他 | 4(2.50) |
注:为使内容展现得简洁清楚,本表将问题题干和选项的语言表达都进行了精炼。在实际调研过程中,为调查出真实的信息,研究工作组对问题的具体问法和选项设计都经过仔细考量,故而问卷中的具体问题和选项呈现方式与本表中的表达不完全相同。
2.5 研究者获取科学数据相关知识的方式途径
研究设置了1道排序题,调查研究者获取科技论文编辑出版的相关知识与资讯(如科学数据存储、数据集共享、科技论文常规处理流程、开放获取类型)的主要途径。途径共设置6个选项,包括①编辑部/出版商来源,如实际投稿与发表过程中,稿件的处理过程或编辑的实际要求,与编辑进行邮件、电话或面对面沟通;②媒体来源,如学术类微信公众号、ResearchGate等国内外各类媒体;③会议/培训/课程来源,如各类线上/线下学术会议、培训班、研究生课程;④学术论文来源,如专门阅读相关文献;⑤社交圈来源,如与师长、同门、同事等交流;⑥其他。调查结果如表 4所示。
表 4 研究者获取科学数据相关知识方式途径排序一览表
| 途径 | 第1位[例(%)] | 第2位[例(%)] | 第3位[例(%)] | 第4位[例(%)] | 第5位[例(%)] | 综合得分 |
| 编辑部/出版商来源 | 91(65.94) | 13(9.42) | 8(5.8) | 12(8.7) | 14(10.14) | 3.56 |
| 媒体来源 | 24(21.62) | 48(43.24) | 18(16.22) | 10(9.01) | 11(9.91) | 2.48 |
| 会议/培训/课程来源 | 8(8.33) | 25(26.04) | 42(43.75) | 14(14.58) | 7(7.29) | 1.88 |
| 学术论文来源 | 26(27.08) | 16(16.67) | 16(16.67) | 17(17.71) | 21(21.88) | 1.86 |
| 社交圈来源 | 7(7.53) | 13(13.98) | 17(18.28) | 33(35.48) | 23(24.73) | 1.42 |
| 其他 | 4(80) | 0(0) | 0(0) | 0(0) | 1(20) | 0.16 |
注:表中的综合得分反映了选项的综合排名情况,得分越高表示综合排名越靠前。计算方法为:选项平均综合得分=(Σ频数×权值)/总填写人次。权值由选项被排列的位置决定。例如,本题设置为5个选项参与排序,编辑部/出版商来源排在第1个位置的权值为5,第2个位置权值为4,第3个位置权值为3,第4个位置权值为2,第5个位置权值为1,所以编辑部/出版商来源的综合得分为(91×5+13×4+8×3+12×2+14×1)÷160,即3.56。
2.6 科学数据相关概念与规则掌握程度的相关性因素
本次调研把研究者的科研实践情况与科学数据相关概念与规则的掌握情况做了相关性分析,因数据资料为等级资料,故采用Spearman相关方法。发现研究者发表论文的多寡及是否担任过研究项目的主要责任者,与科学数据共享与出版的知识积累具有中等程度相关或强相关。相关系数介于-1与1之间,相关系数为正表示正相关,为负表示负相关。相关系数的绝对值0.6~0.8表示强相关,0.4~0.6表示中等程度相关,0.2~0.4表示弱相关,调查结果如表 5所示。
表 5 研究者对RCT常用质量评价工具/报告规范了解程度的Spearman相关系数
| 否听说过“科学数据”概念 | 是否听说过《科学数据管理办法》 | 是否听说过数据使用许可协议 | 是否知道科学数据可以在科学数据期刊上发表 | |
| 发表科技论文的情况 | 0.582** | 0.578** | 0.610** | 0.184 |
| 是否以第一作者或通信作者身份发表过SCI源刊论文 | 0.318** | 0.296** | 0.381** | 0.182 |
| 是否参加过含有数据收集的科研项目 | 0.367** | 0.188 | 0.287** | 0.066 |
| 是否担任过研究项目PI | 0.436** | 0.429** | 0.464** | 0.057 |
注:*P < 0.05,**P < 0.01。
3 我国研究者科学数据共享与出版意识现状
3.1 对科学数据的认知停留在表面,认识较为浅表
本次调查结果显示,我国很多研究者对科学数据的认知仅停留在字面意思的浅表层面,认识程度有限,相关知识积累普遍不足。科学数据出版是将科学数据实体文件及相关描述信息通过网络方式公开发布,使科学数据得以开放共享的行为与实践,伴随着科学数据的产生而存在。[6]科学数据出版与科技论文出版一样,是一种正式的出版行为,应被广大研究者知晓。通过本次调查,我们发现研究者对科学数据相关的一些概念、名词的认知停留在表面,缺乏对相关内容的实质性了解,认识较为浅表。对于“科学数据”这个概念,从未听说和仅限于对字面意思的了解的研究者就占到了整体的61.25%(98/160)。对于我国首个国家层面的科学数据管理办法,对科学数据管理具有划时代意义的《科学数据管理办法》,从未听说过的研究者占到了整体的51.25%(82/160),同时58.13%(93/160)的研究者从未听说过对于保障科学数据安全、合法合规使用至关重要的数据使用许可协议。对数据论文出版这种科学数据中重要的出版模式,74.38%(119/160)的研究者完全不知晓。低于5%的研究者认为自己充分全面深度了解“科学数据”的概念和《科学数据管理办法》,仅有2.5%的研究者认为自己了解不同数据使用许可协议,如CC-BY 4.0、CC-BY-NC-ND 4.0之间开放程度的区别。
3.2 对科学数据的存储和保管较为朴素原始
本次调查结果显示,我国多数研究者对科学数据的存储和保管方式较为朴素和原始,运用开放数据平台管理科学数据的可谓凤毛麟角。科学数据被世界各国公认为是战略性、基础性资源,同时科学数据的安全得到了世界各国的高度重视。[7]科学数据的存储和保管对于确保数据的安全性、完整性和可溯源性具有重要价值。开放科学环境下网络通信、云存储等技术的发展为可信数据存储、数据共享和数据重用研究开辟了新机遇,科学数据可供公众访问和使用的最佳方式是在存储库中公布和保存科学数据。目前已经有越来越多的机构建立体量不同、类型多样的科学数据存储库 [8],这些数据存储库已经成为科学数据共享和存储的重要方式。然而,本次调查结果显示,有76.88%(123/160)的研究者仍然采用自备数据存储介质,如手机、U盘、笔记本电脑、固态硬盘,保管科学数据;有12.50%(20/160)的研究者采用坚果云、百度网盘这类的云存储方式;而从未系统考虑过数据存储相关问题的研究者占到了整体的3.75%(6/160)。此外,有62.50%(100/160)的研究者从未在存储和保管科学数据的过程中采取必要的保密措施。仅有6.25%(10/160)的研究者在各类开放存取的数据发布平台(包括各类数据存储库、数据中心、数据服务网站)存储和保管科学数据。九成左右的研究者采取相对较为朴素和原始的科学数据存储和保管方式,缺乏必要的数据安全意识,他们几乎完全不了解国际国内数据存储库的建设情况。研究工作组对选择了在数据发布服务平台上的研究者进行了访谈,发现之所以这些研究者在数据存储库保存数据,并非自发行为,而是因为参研了诸如科技部重大专项等课题项目。科技部明确要求财政支持的科技项目产生的数据向国家科学数据中心进行汇交和共享,即这些国家重大项目对研究成果的数据管理有在数据存储库分享和保管的硬性要求。总之,大多数研究者对科学数据的存储和保管依旧较为朴素和原始,有重大课题参研经历的研究者已经进入采用数据存储库保管科学数据的大门,建立起在存储库中分享和保管科学数据的意识。
3.3 对科学数据共享与出版抱有谨慎的开放态度
本次调查结果显示,有小部分研究者认为研究者无需共享科学数据,更多的研究者则认为可以进行有条件的共享,研究者对科学数据共享和出版的认可程度仍有很大的进步空间。数据显示:无条件认为科学数据有责任共享于公有领域的研究者只有36.88%(59/160),而更多的研究者认为若研究被公共资金支持则有责任共享科学数据,如果不是公有资金资助则没有共享责任,还有15.63%(25/160)的研究者选择了无责任共享科学数据。研究者对数据共享与出版的“合规性”认识不够,对数据共享与出版的“合理性”认识更加不充分。无条件愿意共享数据的研究者仅占到30%(48/160),不愿意共享数据的研究者数量甚至多于认为无责任共享数据的研究者。而一半以上的研究者对于是否愿意共享数据选择了“具体情况具体分析”,他们认为含有隐私或者可识别为个人信息的数据就不应该共享,含有专利或者技术保密部分的数据可以不共享等。不愿共享数据的最主要原因是担心研究成果被他人盗用,选择这个原因的研究者数量比选择其他所有原因的总和还多。此外,怕数据有错被追责、共享数据过程烦琐费时、不理解数据共享的意义,都可能使研究者不愿共享自己研究的科学数据。总体来看,研究者对科学数据共享与出版持谨慎态度。
3.4 对科学数据共享与出版的知识积累与意识觉醒源于实践
本次调查结果显示,参与科研活动越多、科研成果越丰厚的研究者对科学数据共享与出版的知识积累越丰富,意识越超前,研究者对科学数据共享与出版的知识累积源于实践活动。研究者发表论文的多寡与科学数据共享与出版知识的积累相关程度最高,普遍呈中等程度相关和强相关。此外,研究者是否有研究项目主要责任者的经历,也影响着相关知识的积累与掌握。研究者是否发表过SCI源刊论文以及是否参加过含有数据收集的科研项目,也与科学数据共享与出版的知识积累呈正相关。研究工作组在分析数据时还发现,是否提供过数据可用性声明与研究者认为自己是否有责任共享科学数据的Spearman相关系数为0.261(P < 0.01),虽然二者之间呈弱相关,但我们发现研究者对科学数据共享与出版的意识与研究者在科技论文撰写与发表过程中的实际经历呈现出隐隐的相关态势。正如同前文所述,有重大课题参研经历的研究者,被硬性要求将科学数据分享和存储在专门的数据存储库,故而他们拥有更规范更被推崇的数据保管意识。所以,我们认为研究者具体参与过的科研活动实际触发了研究者相关知识的积累与意识的觉醒。
4 提升我国研究者科学数据共享与出版意识的建议
4.1 充分发挥科技期刊编辑的领路作用,促进研究者对科学数据的了解和认识,优化其对科学数据的管理模式
科技期刊编辑在提升我国研究者科学数据共享与出版意识方面起着重要的引导作用,编辑在日常工作中与研究者的近距离沟通能够给研究者提供科学数据的相关知识,编辑对科学数据管理的要求能够触发研究者对科学数据管理模式的升级。科技期刊承担着记录科学技术知识成果、传播先进科技理念、促进成果转化和培养科技人才的重任,而科技期刊编辑是完成这项重任的具体执行者。[9]科技期刊编辑是整个科技期刊出版全流程的把关人 [10],科研伦理道德的守护者和学术成果的鉴赏家,在整个科研工作中发挥着串联、整合、链接的重要作用。本次调研发现,研究者关于科技论文编辑出版的相关知识与资讯,包括对科学数据的存储和保管模式等知识,最主要的来源是编辑部和出版商。研究者在实际投稿与发表的过程中,完成科技期刊编辑的具体要求,编辑与研究者通过邮件、电话甚至面对面沟通等行为都是以编辑驱动为主,带动研究者设身处地、身临其境地完成科研成果的发布、出版与传播。科技期刊编辑水平的提升将不断推动我国开放科学进程,有关部门已经意识到这一点,如中国科协成立开放科学促进联合体提升科技文献和科学数据开放共享水平 [11],并已于2023年初完成对其主管的500余种科技期刊一线编辑关于期刊论文关联数据汇交工作的培训,部分期刊已经建立并落实个性化的科学数据共享政策。高水平高素养的科技期刊编辑能够充当研究者在科研道路上的领路人,所以科技期刊编辑更应当注重自身科学素养的提升、新鲜资讯的获取、新知识的学习与应用,校正和规范科技传播行为,提升传播效能,充分发挥科技期刊编辑在推进科学数据共享与出版中的引领作用。
4.2 对研究者开展多种形式的培训,改善研究者对开放数据的谨慎态度,扩大数据共享与出版实践
改善研究者对开放数据的谨慎态度、扩大数据共享与出版实践需要开展多种形式的培训活动,因为科学数据的共享与出版离不开一线研究者的理解与认可,增加培训频次,丰富培训主题,方能够引起研究者的重视,进而推动出版实践。故而,在国家层面已经制定相关政策和标准的基础上,有必要增加科学数据的相关培训。2022年中科院举办了面向研究者的专项培训课程,以提升其科学数据共享意识,增强其科学数据管理能力。这些课程让研究者了解到科学数据管理的益处及最佳实践方式。除了大规模集中培训,科技期刊编辑也可以在实际工作的点滴之间对作者进行宣介。例如,在期刊官网上公示本刊的关联数据汇交政策,笔者所在的《世界针灸杂志》就在作者投稿之初设置了一份自检报告,里面涉及原始数据的提供方式,并建议作者将原始数据上载至科学数据银行。在修稿过程中向作者要求提供数据可用性声明时,强调这个行为的意义和作用。本次横断面调查特意在问卷尾部增加了关于科学数据的知识,包含科学数据的定义、出版形式和相关政策等内容,相信参与过问卷调查的208位研究者在填写问卷后,多少都会看到相关知识。水滴虽微,渐盈大器,知识的积累和意识的萌发正是源于一点一滴的切实体验与实践。科技期刊编辑作为科技出版新知识的传播者,如此这般“不留空隙”地进行宣教,加强培训,定能助力数据共享与出版实践。此外,据科学数据银行统计,自2022年至今,中国的科学数据共享者数量是上一年的21倍,其中中科院学者数量的同比增长率为29倍。这极有可能是由于2019年2月中科院办公厅印发《中国科学院科学数据管理与开放共享办法(试行)》,中科院下属过半的研究所制定了各自的科学数据管理政策并积极开展了相关培训,告知大家“开放为常态,不开放为例外”。由此可见,政策的持续落实和相关培训的普及,能推动更多的研究者关注科学数据共享管理 [3,12]。
4.3 抓住研究者的核心关切,以点带面增强实践,使之不断积累相关知识,促进开放意识觉醒,推动科学数据共享
抓住研究者对科研成果绩效的核心关切,以点带面增强相关开放活动实践,有利于使之相关知识不断积累,促进其开放意识觉醒,便于开放科学实践。科研工作者的主责主业是推动科技创新,解决重大科学问题,为实现科技强国贡献力量。尽管他们本身是科研活动的核心,但可能对科技出版活动的了解并不深入,难以及时掌握科技期刊出版界的新变革、新态势并立即付诸实践。这就需要贯穿整个科技出版活动的科技期刊编辑发挥串联引领作用,给他们指引和方向。编辑要做好推动开放科学开放进程的工作,则需切实抓住研究者的核心关切。什么是与研究者息息相关的利益问题?能够助力研究者在现行的科研评价体系中向上晋升的条件必然是他们的核心诉求,对科研绩效的评价是他们的核心关切。科研评价体系是对研究者科研能力做出合理公正量化评价的系统,对激发研究者的科研斗志,推动我国整体科研实力的提升有着至关重要的作用。[13]科研论文的产出是科研评价体系中的重要考核内容,也是研究者能力的直接体现。笔者在实际工作中发现,跟研究者交流为什么要汇交关联数据,为什么要提供数据可用性声明,他们可能只是听听而已,或机械般地根据编辑指令照做。但是,一旦得知科学数据本身也可以数据论文的形式发表在专门的数据期刊上,特别是一些数据期刊属于晋升认可的期刊,研究者就会精神抖擞,饶有兴致地询问这样的数据论文如何发表。所以,科技期刊编辑可以以发表数据论文这个点,以点带面带动科学数据共享与出版全过程的普及推广。在发表数据论文的过程中,研究者必然会按照数据政策和相关标准,进行论文关联数据的汇交等系列工作,吸引研究者主动了解科学数据共享与出版的相关知识,积极完成相关实践,带动他们深入了解科学数据发展大势,进而以数据论文为杠杆,推动整个开放科学进程。
5 结语
科学研究已经迈入大数据时代,以数据为中心的第四代数据密集型科学研究范式已经到来。[14]科学数据的共享与出版是促进全球多边合作,构建人类命运共同体的必然趋势。现阶段我国研究者对科学数据的认知多停留在表面,参与的开放科学共享实践并不充分,对于科学数据出版与贡献的意识尚有较大的进步空间,科技期刊编辑应充分发挥在科技期刊出版与传播全流程中的引领作用,带动研究者顺应巨量科学数据时代的到来。虽然研究工作组切实深入研究者中间进行调研,问卷经过周密设计,但本研究仍有一定的局限性。受限于所在学科,研究工作组进行的调研是基于中医药领域的研究者。中医药学科是我国传统的优势特色学科,自成体系,具有相对保守的特点,所以中医药领域研究者的科学数据共享与出版意识并不能够反映全学科研究者的现状。然而,管中窥豹,可见一斑。我们明晰了现阶段我国研究者对科学数据相关概念的认知程度,明确研究者的科学数据共享与出版的意识水平与层次,了解研究者获取相关知识、提高相应意识的方式与途径,为今后进一步扩大科学数据共享与出版实践规模提供资料支撑。而且,本次调研过程本身也成为宣传科学数据知识、推动开放科学发展的一个举措。凡福充满,从纤纤积,开放科学时代,科技期刊编辑将持续助力我国科学数据共享与出版的蓬勃发展,为推进我国开放科学进程贡献自己的力量。
参考文献
/
| 〈 |
|
〉 |
