工程科学期刊论文相关科学数据出版的特点、原则与流程
Characteristics, Principles and Processes for Publishing of Scientific Data Related to Journal Papers in Engineering Sciences
| 基金资助: |
|
Scientific data has become both foundational materials and outcomes of scientific research with important value. However, among 2358 engineering science journals indexed in CNKI, only 64 journals have published scientific data on ScienceDB. To address the discrepancy between the publication of scientific data and that of academic papers in engineering science journals, a comprehensive analysis was conducted to investigate the characteristics of the aforementioned scientific data. This analysis led to the formulation of publishing principles for scientific data and the establishment of a scientific data publishing process integrated with the submission and peer review system. The scientific data associated with engineering science journal papers are characterized as the data that documents the state of scientific research objects, while cannot be fully presented in printed or digital journal formats. These data must be preserved, processed, and transmitted using digital means. An analysis of the evolving trends in engineering science research activities and outputs reveals a progressive shift in the role of scientific data relative to journal papers. Such data are increasingly recognized as a crucial supplementary material, characterized by broad scope, diverse formats, and the involvement of third parties in intellectual property protection. The current status of scientific data publishing in engineering science journals was presented, revealing that only 2.71% of these journals indexed in CNKI publish scientific data, with an average of 12.33 datasets published per issue. To foster scientific data sharing, a set of publishing principles that benefit data producers (authors), users (readers), and disseminators (journals) was proposed. First, authors retain control over what scientific data is shared, how it is shared, and when to share it. Second, scientific data is treated as a citable publications, and are disseminated for the benefit of the public. Finally, the maintenance of data confidentiality is imperative. The publication system of scientific data related to engineering science journal papers was designed, outlining the responsibilities and workflows across major stages, such as preliminary review, secondary review, final review, and external review. This system aligns the proposed publication principles with the three-tier peer review system currently used for the publication of papers. Furthermore, the scientific data publishing process was adapted to the submission and peer review system, and the workflow diagrams of scientific data publishing, correction, and updates were demonstrated. The items of formatting forms, for the scientific data detail sheet and the expert review sheet, were specified to improve the efficiency and standardization of scientific data publishing.
Keywords:
本文引用格式
张洋, 陈勇, 王旻玥.
ZHANG Yang, CHEN Yong, WANG Minyue.
目前,国内主要采用两种形式出版数据:①数据论文(在数据期刊上发表)[6],如《中国科学数据(中英文网络版)》与《数据分析与知识发现》;②作为期刊论文的辅助资料(通过科学数据存储与发布平台发布)[6],如Nuclear Science and Techniques(《核技术(英文版)》)、Zoological Research(《动物学研究》)等期刊出版论文的相关数据由科学数据银行(Science Data Bank,ScienceDB)出版。中国知网收录的2358种工程科学(含工程科技Ⅰ、工程科技Ⅱ)期刊 [7]中,在ScienceDB上发布数据的期刊仅有64种 [8],相差巨大的数据表明工程科技期刊目前未将发表数据作为日常的编辑工作。
1 工程科学期刊论文相关科学数据的定义及特点
1.1 科学数据的定义
虽然纸质期刊中的论文含有数据(论文关联数据),但其与科学数据有显著区别。它们的区别主要体现在三个方面:①是否具有重用价值。论文关联数据的主要功能是作为论文的支撑材料,一般不会在论文作者之外的其他学者研究中重用。科学数据除了作为论文的支撑材料,还可以作为研究的材料,用于其他学者的科研工作。②论文关联数据类型少。纸质期刊及其文本文档(.pdf文件等)只能呈现文字、符号、表格、图片等数据。除了这些数据,科学数据的类型还包括纯文本文件(.txt)、电子数据表(.csv)、图片(.jpg,.jpeg,.svg等)、音频文件(.flac等)、论文作者编写的应用程序与代码,以及采用SolidWorks、Ansys等各种专业软件制作的模型和获得的仿真结果。③数据规模不同。受纸质文本版面的限制,论文关联数据规模小,单个图表一般不会超过一页。科学数据一般储存于专用的存储与发布平台或服务器,对数据文件的大小没有限制,甚至可以超过1GB。
工程科技期刊的科学数据与数据论文(科学数据期刊)中的数据在数据类型与规模上基本没有差别,二者的区别主要有两点:①数据与文字的作用不同。科学数据是工程科技期刊论文的辅助资料,二者一起才能完整呈现研究活动与成果,缺一不可。数据论文中的数据具有独立性,脱离文字的数据论文一般不会影响数据的单独使用。②数据产生的时间不同。科学数据产生于科研活动的全流程。科研活动早期获取的原始数据是科研的“原料”,原始数据初步处理所得结果是“半成品”,原始数据的最终处理结果以及相关的代码等材料是科研的“成品”。数据论文中的数据是作者的研究成果,即科研的“成品”。
1.2 科学数据的特点
工程技术领域的科研进展与成果作为工程科技期刊的报道对象,决定了科学数据具有如下特点。
(1)规模大。信号测量与数据保存和传输设备的出现使得数据的自动采集与记录成为可能。获取研究对象整个变化过程中的状态信息使得科研方式从分析研究对象特定时间的状态向分析研究对象整个变化过程中的状态转变。上述两个因素共同作用的结果是获取的科学数据规模显著增大。例如,论文3D spatial distribution of tumor responses in PDT-treated mouse from HE,TUNEL and CD31-stained coronal slices对应数据集的数据量为188.10GB [14]。
(2)类型多。工程科技期刊报道的学科多,不同学科的科研活动与成果需要记录的研究材料也不尽相同,这导致科学数据不但包含数值、文字、图像、视频、音频等常见类型的数据,还包含软件、代码、仿真模型、算法等新类型的数据。例如,论文《贴片式圆盘定子多自由度超声电机的设计与实验》用图片展现了有限元分析的相关内容、实验设备的图片、根据实验结果数据绘制的图片等研究成果 [15],但研究获取的仿真模型等数据因不能在纸质期刊及其电子版展示而无法分享。
(3)涉及第三方的知识产权保护。科学数据中的数据集与多媒体一般由信号采集设备及配套的软件获取,代码、仿真模型均需在特定的专业软件中完成。软件的使用有明确的许可范围,如Ansys软件允许学术用户(根据Ansys学术产品许可证授权使用Ansys产品的任何人,可能包括学生和教师)可在其发表的作品(包括但不限于项目报告、会议海报、论文、研究报告、教科书、教育指南、视频演示、网页和社交媒体)中合理使用Ansys软件产品的截图,但所有包含Ansys产品截图的材料必须注明“图片由Ansys公司提供”[16]。因此,在提交科学数据时,作者须证明获取科学数据的软件具有使用许可且没有超过许可范围使用。
2 工程科技期刊的科学数据出版原则
2.1 科学数据出版现状
当前,国内学者向国内工程科技期刊提供科学数据的意愿不高。产生这一现象的原因有两个。一方面,国内外工程科技期刊对作者共享科学数据的要求不同。Springer Nature [17]、Elsevier [4]、Wiley [18]等出版机构明确要求或鼓励论文作者共享支撑结论与分析的数据,而国内工程科技期刊一般没有提出相同要求并制定相关政策。另一方面,科学数据作者的付出与收益不成正比。获取科学数据是耗费时间与精力的辛苦活,而共享科学数据合理模式的缺失使得共享科学数据无益于作者在同行竞争(申请项目、科研成果商业化)中获取优势,甚至获得劣势。ScienceDB [8]平台国内科技期刊(按照中国知网的学科分类)的数量及发表科技数据的数量如表 1所示。工程科技期刊的总数约是基础科学期刊的3倍,但发表科学数据的工程科技期刊的占比仅为2.71%,不到基础科学期刊占比8.51%的1/3。同时,工程科技期刊在发表科技数据的期刊数量、已发表科技数据的总数与平均数上均小于基础科学期刊。
表 1 ScienceDB平台国内科技期刊发表的科技数据统计表
| 专辑名称 | 发表数据的期刊数量/种 | 期刊总量/种 | 期刊占比/% | 发表数据的论文数量/篇 | |||||
| 单学科 | 双学科 | 合计 | 单学科 | 双学科 | 合计 | 平均数 | |||
| 工程科技 | 54 | 10 | 64 | 2358 | 2.71 | 768 | 30 | 783.00 | 12.23 |
| 基础科学 | 59 | 14 | 73 | 858 | 8.51 | 1487 | 131 | 1457.50 | 19.97 |
| 经济与管理科学 | 2 | 1 | 3 | 1364 | 0.22 | 46 | 1 | 46.50 | 15.50 |
| 农业科技 | 12 | 1 | 13 | 623 | 2.09 | 112 | 37 | 130.50 | 10.04 |
| 信息科技 | 31 | 8 | 39 | 690 | 5.65 | 567 | 50 | 592.00 | 15.18 |
| 医药卫生科技 | 15 | 2 | 17 | 1339 | 1.27 | 53 | 4 | 55.00 | 3.24 |
| 哲学与人文科学 | 3 | 2 | 5 | 1417 | 0.35 | 98 | 12 | 104.00 | 20.80 |
| 社会科学 | 0 | 2 | 2 | 3369 | 0.06 | 0 | 2 | 1.00 | 0.50 |
注:①学科(专辑名称)工程科技Ⅰ与工程科技Ⅱ合并为工程科技,社会科学Ⅰ与社会科学Ⅱ合并为社会科学。
②单学科指期刊论文涵盖一个学科,双学科指期刊论文涵盖两个学科。
③双学科期刊发表的数据数量的一半计入对应学科的统计数据。
2.2 科学数据出版原则
科学数据的出版现状是确定科学数据出版原则、建立合理的科学数据出版制度与科学的科学数据出版流程的基础。因此,笔者在考虑工程科技期刊的科学数据出版现状的基础上,以促进科学数据分享为出发点,提出有益于科学数据的生产者(作者)、使用者(读者)、传播者(科技期刊)的出版原则,具体如下。
(1)作者决定共享科学数据的内容、形式与时间。与基础科学领域学者相比,工程科技领域学者的同行竞争压力更大,共享科学数据的意愿不高。工程科技期刊应充分理解作者的顾虑,允许作者选择合适的科学数据共享方式,如开放获取、限制性获取、保护中(暂不能获取),以及科学数据共享的内容、时间。
(2)科学数据是可被引用的正式出版物。当前,工程科技期刊发表的科技论文数量和科学数据数量的差异源于二者的“身份”差异。论文是正式出版物,可被引用,在被引量常作为衡量研究成果价值的重要指标的情况下,发表科技论文有益于扩大作者的学术声望。若想吸引作者共享科学数据,则必须使科学数据成为可被引用的正式出版物,以有益于扩大作者的学术声望,进而推动科学数据的共享,实现作者与读者的双赢。
(3)专注科学数据的公益传播。工程科学的研究成果易于转化为商业应用,因此,工程科技期刊的科学数据不仅具有教学和科研的价值,还具有潜在的商业价值。出版科学数据的目的是促进科学数据的广泛使用,而不是获利,因此,工程科技期刊专注科学数据的公益传播,即不谋求获取数据的所有权,而是在不亏损的情况下只承担科学数据的宣传推广工作。从长远看,科学数据运营的趋势是专业化和市场化。科学数据运营的专业化是指将科学数据交给ScienceDB这类通用型平台,以及期刊所属学科的学会,由它们存储与发布科学数据。科学数据运营的市场化是指科学数据采用付费(作者付费与读者/使用者付费)方式获取。对于教学和科研使用,可参考Nature等国外期刊、《中国科学数据(中英文网络版)》等国内科学数据期刊,采用开放获取(作者承担必要的推广费用)模式运营。对于商业使用,可采用使用者直接与作者协商的方式。如此既能满足教学与科研对科学数据的需求,又能使科学数据的商业价值最大化。工程科技期刊实现了科学数据共享的目标,也避免了缺乏科学数据商业运营人才导致的影响日常出版工作的问题。
(4)数据保密。科技期刊有义务在投稿阶段为科学数据保密,并在出版后不以违背作者意愿的方式泄露数据。工程科学领域的科学数据具有学术价值和潜在的商业价值,学者之间的竞争十分激烈,数据泄露会给作者带来损失。例如,科技期刊审稿人在未获得稿件作者允许的情况下,将所评审论文的部分内容放入自己的项目申请材料。因此,科技期刊应在科学数据出版过程中采取措施保证数据不泄露。
3 建立科学数据的出版流程
3.1 制定科学数据的出版制度
科学、规范、高效、公开的出版制度是科学数据出版的基础与保证,也是科学数据出版原则的制度化体现。西方的学术期刊普遍采用同行评议审稿制度评审论文 [20]。对于科学数据,Springer Nature、Elsevier、Wiley等出版机构虽然没有单独的审核把关机制,但要求作者在投稿论文时提供稿件的支撑数据,以便编辑与同行评价论文 [20]。国内的学术期刊一般采用具有同行评议性质的三审制,但一般不要求作者提供论文的支撑数据。《中国科学数据(中英文网络版)》以数据论文的形式出版数据,而工程科技期刊发表的科学数据是论文的辅助资料。两种数据的差异使得工程科技期刊不能直接借用《中国科学数据(中英文网络版)》的评审流程与出版制度 [21],而只能参考成熟的科技论文出版制度,并根据科学数据的特点和出版原则建立科学数据的出版制度。
三审制是出版的根本制度,科学数据出版自然必须坚持三审制,但科技论文与科学数据的差异导致二者在每个审稿阶段的工作内容有差别。科技论文的初审、复审和终审围绕论文的创新性、实用性等特性展开,科学数据的初审、复审和终审围绕数据的真实性、有效性等特性展开。以下分别从科学数据初审、复审、终审、外审的工作内容与处理人员来介绍工程科学期刊的科学数据出版流程。
(1)初审。科学数据初审的完成人是责任编辑,主要工作内容是核对作者提交的科学数据及相关资料是否完整,整理科学数据的相关资料,撰写初审意见。首先,责编核对仿真模型等科学数据所使用软件的版本信息、合法授权信息是否完整,确定科学数据的获取没有侵犯第三方知识产权。然后,打开或运行数据集、仿真模型、代码等科学数据,确定它们能正常使用。若作者提交的科学数据及相关资料完整,且能正常打开或运行,则责编将数据提交给评审人进行外审。若作者提交的科学数据及相关资料不完整,或不能正常运行,责编需要将问题反馈给作者并请作者更正。作者更正后,责编二次核对科学数据及相关资料,若存在的问题已解决,则提交给评审人进行外审,否则,对科学数据做退稿处理并告知作者退稿的原因。
(2)复审。复审的完成人是编辑部主任,主要工作是根据责编提交的初审意见和评审人提交的外审意见,判断科学数据是否符合发表条件。若外审意见较好,则编辑部主任撰写复审意见并提交主编终审。若评审人要求作者进一步完善科学数据,编辑部主任需要让责编将外审意见转发给作者并请作者处理。作者修改返回后,责编根据作者的修改情况撰写审稿意见并提交给编辑部主任。若作者通过修改解决了评审人提出的问题,则编辑部主任撰写复审意见并提交主编终审;反之,则根据修改情况让作者继续修改,或对科学数据做退稿处理并告知作者退稿的原因。
(3)终审。科学数据终审的完成人是主编,主要工作是根据科学数据的相关资料、初审意见、外审意见、复审意见、作者的修改说明给出是否录用的结论。若主编认为修改后的科学数据达到发表要求,则给出录用的结论。若主编认为科学数据及其相关资料还有不完善的地方,则提出具体的修改意见,并让责编转发给作者处理。作者修改返回后,责编根据作者的修改情况撰写审稿意见并提交主编终审。若修改解决了主编提出的问题,则录用;反之,则根据修改情况决定让作者继续修改,或对科学数据做退稿处理并告知作者退稿的原因。
作为判断创新性、实用性等学术价值的重要环节,外审在科技论文的编辑过程中不可或缺。作为判断真实性、有效性等应用价值的重要环节,外审在科学数据的编辑过程中同样不可或缺。对于数据集,外审专家根据相关资料介绍的设备、方法和流程判断数据及其相关资料是否完整、有无错误。对于代码、仿真模型,外审专家需要运行它们来处理原始数据,并通过比较原始数据的处理结果与科学数据作者提供的结果数据来判断代码、仿真模型的有效性。对于多媒体,外审专家根据自己的经验判断其真实性。
科学数据的发表(发行)工作相对简单。若工程科学期刊自行发布科学数据,则首先为待发表的科学数据申请DOI,然后整理最终修改的科学数据及其相关资料,并核对其是否完整,最后上传科学数据及其相关资料到服务器供读者通过互联网下载。若工程科学期刊委托专业平台发布科学数据,则按照平台要求上传数据到平台即可。
科研工作的局限性会导致科学数据有疏漏,因此科学数据在发布后应可以更新和更正。科学数据发布后,若作者发现问题,可提交正确的数据和更正说明,请期刊做更新处理。科学数据发布后,若读者发现问题,则将读者的反馈转发作者处理。对于作者不能处理且不严重的问题,科技期刊须更新数据介绍,说明数据存在的问题,提醒读者有选择的使用。对于作者不能处理且严重的问题,科技期刊须停止问题数据的发布,并更新数据介绍,说明数据存在的问题。对于具有学术不端问题的科学数据,科技期刊必须停止发布并做撤稿处理。特别需要注意的是,上述所有处理都必须经主编批准。
3.2 建立适配采编系统的科学数据出版流程
上述科学数据出版制度只适合人工操作。采编系统已成为作者、评审人、编辑处理稿件的工具。编辑工作制度化、编辑制度流程化、编辑流程表单化是科学数据顺利出版的基础。因此,科技期刊必须根据科学数据的出版制度,在采编系统中建立科学数据的出版流程,并撰写出版流程每个处理步骤所需的表单。
根据上述科学数据出版制度确定科学数据的出版流程、更正流程和更新流程。图 1所示为简化的科学数据出版工作流程,图中彩色框对应步骤的处理人为科学数据的作者。根据流程确定每个步骤对应的处理人、处理时长和对应的表单,并赋予处理人在对应处理步骤的权限。
图 1
科学数据出版过程中,责编与作者、评审人的交流一般都是通过表单在采编系统中完成的,撰写格式化的表单可提高科学数据出版工作的效率与标准化。所有表单中,最重要的是科学数据详情单和专家审稿单。责编核对科学数据是否完整,评审人在评价科学数据的真实性与有效性时需要用到科学数据的相关信息。科学数据中,采集设备(含名称、厂家、型号等)、采集方法(步骤)、采集对象(实验材料)是必须提供的原始数据相关信息,仿真模型对应的仿真软件名称及版本、智能(优化)算法和代码对应的编程软件的名称及版本是必需提供的处理方案信息。上述信息多且杂,如果让作者自由填写,很容易漏掉某些重要内容。科学数据详情单可提示作者需要填写的信息,避免遗漏;可使评审人知晓需要评审的数据情况,便于评审人判断自己是否适合评审;还便于责编对科学数据及相关信息进行整理与存档。
科研经历的差异及同行评议的自由裁量使得评审人之间,以及评审人与科技期刊在科学数据的评价项目及其标准上难以达成共识。格式化的专家审稿单能使评审人聚焦于科技期刊关注的数据特征并给出评价结果,避免遗漏需要评审的项目。专家审稿单中评审项目的评审标准(优劣等级)由科技期刊确定。评审人在有限的优劣等级中进行选择,可避免评审人评判尺度差异和对评审项目优劣等级的自由表述导致的外审意见采纳困境。
4 结语
工程科学的飞速发展及其与信息技术的融合使数据集、代码、多媒体等科学数据成为工程科学期刊论文的辅助资料。科学数据除了用做论文的支撑材料,还可以被其他学者用于科研活动,具有共享价值。本文首先阐述了工程科学期刊科学数据的定义与特点,然后在工程科学期刊科学数据出版现状的基础上提出了出版原则,最后建立了工程科学期刊科学数据的出版制度以及适配采编系统的出版流程。上述工作只是搭建了工程科学期刊科学数据出版的框架,后续还有很多需要研究的课题,如将科学数据的出版如何从与论文发表同步变成与科研工作同步,全程跟踪报道科研活动等。
参考文献
理念革新与技术驱动:2023年海外科技期刊出版的挑战与新思路
[J].DOI:10.16510/j.cnki.kjycb.2024.03.012 [本文引用: 1]
学术期刊审稿理念及中西比较
[J].
/
| 〈 |
|
〉 |
