科技与出版, 2025, 44(10): 50-63 doi:

融媒之光

适用于学术出版机构的科学数据出版伦理原则的核心概念与实践要素研究

张家烁, 金帆, 张小凡, 黄国彬

北京大学信息管理系,北京大学出版研究院,100871,北京

Conceptual Connotation and Practical Elements of Ethical Principles for Scientific Data Publishing Applicable to Academic Publishing Institutions

ZHANG Jiashuo, JIN Fan, ZHANG Xiaofan, HUANG Guobin

Department of Information Management, Peking University; Publishing Research Institute, Peking University, 100871, Beijing, China

通讯作者: 黄国彬

基金资助: 国家社科基金重点项目“开放科学视野下新型学术出版物的著作权保护与共享机制研究”.  22ATQ003

Abstract

The ethical principles governing scientific data publishing within academic publishing institutions are investigated, aiming to clarify their conceptual foundations and practical elements while offering guidance for future normative construction in China. Ten leading international publishing institutions with extensive experience in scientific data publishing were selected, and a total of ten representative policies were collected and analyzed. The policies were retrieved through systematic web-based investigation, and content analysis was utilized to code and interpret the ethical elements embedded in the policy texts. Using the scientific data publishing workflow—encompassing submission, review, storage, publication, and citation—as the analytical framework, this study identified both overarching and specific ethical principles and further distilled their operational implications. The analysis revealed a two-tiered framework comprising two basic principles and seven specific principles. The basic principles—value co-creation and security—function as the overarching value orientation and risk-control baseline across the entire publishing process. The seven specific principles correspond to distinct workflow stages: transparency, data ownership protection, and privacy protection (submission); quality control (review); optimal matching (storage); open licensing (publication); and standardized citation (citation). Each principle was carefully examined through qualitative coding of policy statements, supplemented by comparative analysis across institutions, enabling the clarification of conceptual boundaries and the extraction of actionable elements. For instance, the principle of transparency is implemented primarily through mandatory data availability statements; privacy protection relies on obtaining informed consent and applying data anonymization techniques; quality control necessitates collaborative efforts among authors, editors, and reviewers to safeguard data integrity; and the principle of optimal matching emphasizes disciplinary alignment and the selection of high-quality repositories. Similarly, the principle of open licensing is enforced by encouraging authors to adopt Creative Commons agreements such as CC0 or CC-BY, thereby lowering barriers to reuse; the principle of standardized citation obliges authors to include complete dataset information and persistent identifiers (e.g., DOIs) in reference lists to ensure traceability and proper recognition of scholarly contributions. This study determines that leading international academic publishing institutions have accumulated mature experience regarding scientific data publishing ethics, establishing ethical principles that cover the entire data publishing process. Given that scientific data publishing in China remains in its early developmental stages and lacks systematic experience in building ethical norms, this paper proposes four feasible pathways: (1) strengthening publicity and institutional guidance to increase researcher participation; (2) formulating operable ethical guidelines and embedding them into the data publishing workflow; (3) strictly adhering to security boundaries by constructing a “self-check plus external review” mechanism for data security governance; and (4) leveraging the functions of multiple stakeholders to promote effective implementation of data review mechanisms. By systematically analyzing policy texts and integrating insights into an ethics framework, this study contributes both theoretically and practically to understanding scientific data publishing ethics. It provides academic publishing institutions in China with a concrete reference for constructing localized, operable ethical norms that balance openness with protection, thus facilitating the healthy development of scientific data publishing.

Keywords: scientific data publishing ; scientific data publishing ethics ; academic publishing institutions ; content analysis

PDF (14205KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

张家烁, 金帆, 张小凡, 黄国彬. 适用于学术出版机构的科学数据出版伦理原则的核心概念与实践要素研究. 科技与出版[J], 2025, 44(10): 50-63 doi:

ZHANG Jiashuo, JIN Fan, ZHANG Xiaofan, HUANG Guobin. Conceptual Connotation and Practical Elements of Ethical Principles for Scientific Data Publishing Applicable to Academic Publishing Institutions. Science-Technology & Publication[J], 2025, 44(10): 50-63 doi:

科学数据指在科学研究活动中使用或产生的原始数据及其衍生数据,是支撑科技创新的重要基础。国家数据局等十七部门联合印发的《“数据要素×”三年行动计划(2024—2026年)》指出,数据作为关键生产要素的价值日益凸显,应当推动科学数据有序开放共享,发挥数据价值。[1]科学数据出版作为一种新兴的科学数据共享模式,是充分开发、利用数据价值的重要途径,其属于学术出版的范畴,具有规范的数据提交、审核、存储、发布、引用流程和严格的质量控制机制 [2],旨在实现科学数据的可发现性(findable)、可访问性(accessible)、可互操作性(interoperable)与可重用性(reusable)[3],即FAIR原则。

伦理(ethics)通常强调人遵守规则、规范的道德倾向 [4],而伦理原则(ethical principle)则指相关主体为贯彻道德倾向而遵循的行为准则 [5]。科学数据出版伦理原则指的是在科学数据出版流程中,作者、审稿人、编辑等相关主体为保证科学数据出版的科学严谨、公正透明而应共同遵循的基本伦理准则。在法律法规等外部监督机制尚不完备的情况下,科学数据出版伦理原则能够作为一种道德层面的规范体系,发挥内部约束与规范引导作用,引导相关主体采取最佳实践,有效规避伦理风险、化解利益冲突,从而充分释放科学数据出版的价值,推动科学事业的健康发展。[6-7]

学术出版机构是科学数据出版的关键推动者与核心平台,科学数据出版的两种主要形式——作为传统论文附件出版和作为数据导引(Data paper)出版 [8]——都围绕学术出版机构展开。作者在投稿时向学术出版机构旗下期刊提交数据,期刊编辑与审稿人审核数据、把控数据质量,随后将数据存入数据仓储,供其他科研人员查询、浏览、下载与重用。学术出版机构具有制定和推行科学数据出版政策的职能。以Elsevier、Springer为代表的国际学术出版巨头参与科学数据出版的实践时间较长、经验丰富,其科学数据出版政策已比较完备,其中蕴含丰富的科学数据出版伦理原则,具有较大的参考价值;国内科学数据出版起步较晚,尽管有少量期刊出台了科学数据出版政策,但内容完备性仍有不足,且较少涉及伦理原则方面的内容。

本文运用网络调研法与内容分析法,选取有代表性和影响力的科学数据出版相关政策规范和实践指南,对其中有关科学数据出版伦理的内容开展质性分析,梳理科学数据出版伦理原则的核心概念与实践要素,为我国学术出版机构进行科学数据出版伦理规范化建设提供借鉴。

1 国内外相关研究

当前,科学数据出版的发展方兴未艾,学界和业界对其伦理问题的研究尚未成熟,直接聚焦于“科学数据出版伦理原则”的系统研究相对较少。科学数据出版伦理原则并非孤立出现,而是在数据伦理原则与科学数据共享伦理原则的基础上逐步衍生而来。前者关注研究者在数据全生命周期中的行为规范,后者则聚焦于其在科学数据开放共享过程中的伦理准则,二者在概念内涵与价值导向等方面为科学数据出版伦理原则提供了理论基础和经验借鉴。因此,回顾相关领域的已有研究,总结其在出版语境中的适用局限,可为后续研究奠定基础。

1.1 数据伦理原则研究进展

数据伦理原则是指在数据生成、记录、管理、加工、传播、共享和使用等各个环节中,为实现数据利用价值的最大化、避免一系列风险而针对政策制定者和数据从业者制定的价值判断指南和具体行为准则。[9]多个国家和地区已构建了系统的伦理原则框架,对各利益主体的数据行为进行指导。例如,英国政府中央数字和数据办公室(Government Digital Service,GDS)发布的《数据伦理框架》明确了透明度、问责制和公平性三大伦理原则 [10];美国联邦总务署(General Services Administration,GSA)发布的《数据伦理框架》提出了7条数据伦理基本原则:遵守法律法规和行业道德准则,诚实并正直行事,实行问责制,保持透明度,跟踪并掌握数据科学领域新技术,尊重隐私并遵循数据使用限制,尊重公众、个人和社区 [11];英国统计局(UK Statistics Authority)发布的《使用地理空间数据进行研究和统计时的伦理考虑》针对地理数据提出了6点数据伦理基本原则,包括公益事业,保密与数据安全,方法与质量,合法合规,公众参与度,透明度 [12]。我国发布的《科学数据管理办法》中也明确提出,任何单位和个人不得利用科学数据从事危害国家安全、社会公共利益和他人合法权益的活动 [13],为科学数据的合规使用提供了方向性指引。

综上可见,数据伦理原则通常具有宏观性和政策导向性的特点,主要应用于数据伦理治理的宏观制度建设中,在以科学数据为主要治理对象的学术场景下,其适配性和可操作性存在不足。因此,学者针对科学数据开放共享中的伦理问题,提出了一系列伦理原则,为平衡数据开放和保护之间的关系提供伦理保障。

1.2 科学数据共享伦理原则研究进展

科学数据共享伦理原则的提出,主要是为了解决数据开放共享过程中暴露出的伦理挑战。当前研究普遍关注的伦理挑战集中于两个方面:一是隐私泄露引发的侵权风险,二是涉人数据的处理方式对研究参与者主体性的潜在伤害。[14]在医学、生物学和社会科学等包含大量涉人数据的领域 [15],这两个问题尤为突出,成为伦理原则的核心议题。针对隐私泄露引发的侵权风险,学者普遍认同应遵循隐私保护原则,并提出采用数据匿名化 [16]、中介访问 [17]、为数据赋标识符和保障研究参与者对数据控制权 [18]等方式,维护数据安全和公民隐私权。针对涉人数据的处理方式损害研究参与者主体性的潜在风险,《贝尔蒙报告》提出的尊重、善行、公正三项经典伦理原则,至今仍为处理涉人数据的基本伦理准则 [19];此外,John McMillan等针对种族数据共享提出了数据公平、多样性和包容性原则 [20];Lin等提出了CARE原则(collective benefit,authority to control,responsibility,ethics),强调通过集体利益、控制权、责任和伦理考量,应对社区数据处理中的伦理难题 [21];赵丽梅等提出人本主义思想和公正伦理原则,强调科学数据开放应处理好个人利益与公共利益之间的关系 [22]

1.3 科学数据出版伦理原则研究进展

随着科学数据出版的不断发展,数据共享程度持续加深,不但加剧了既有的伦理风险(如隐私泄露),同时也引发了诸如数据剽窃、数据操纵、署名争议等全新的伦理风险。[23]现有的数据伦理原则与数据共享伦理原则已难以全面适应科学数据出版的复杂需求,亟须从数据出版流程和利益相关者的角度出发,构建更具针对性的伦理原则。然而,当前关于科学数据出版伦理的研究仍多停留在具体问题分析的层面,尚未从伦理原则视角进行系统梳理和理论提炼,如王丹丹 [24]、屈宝强 [25]探讨通过同行评议进行数据质量控制的实践与标准;邱玉红等分析科研人员的数据引用情况,提出科研人员应加强引用意识、遵守引用规范 [26];FORCE11和国际出版伦理委员会(Committee on Publication Ethics,COPE)联合发布的《关于处理与发表研究数据有关的伦理问题的建议》则从作者身份和贡献冲突、法律和监管限制、严谨性和风险四个角度提出了伦理建议 [27]

综上所述,科学数据出版伦理原则对于科学数据出版的健康发展具有重要意义,当前对于科学数据出版伦理原则的研究已取得一定成果,但仍存在两方面不足之处:一是多数成果仍集中于数据伦理原则与科学数据共享伦理原则,其适用范围广,但聚焦性不足,难以完全回应科学数据出版复杂场景的伦理需求;二是对于科学数据出版伦理原则的系统研究薄弱,尤其对于伦理政策的研究相对匮乏,缺乏对学术出版机构伦理规范的深入剖析。因此,本研究对学术出版机构发布的科学数据出版伦理政策进行内容分析,重点关注讨论伦理问题、涉及伦理原则的政策内容,从全流程、多主体角度剖析科学数据出版伦理原则的概念内涵,并基于现有政策文本,提出具备可操作性的实践指南,以期为我国科学数据出版伦理的规范化建设提供理论支撑和实践参考。

2 研究方法

本研究采用网络调研法收集科学数据出版政策文本数据。在样本选择上,参考《2024全球出版50强》榜单以及国际科学技术与医学出版商协会(International Association of Scientific,Technical and Medical Publishers,STM)成员名单,并结合Candela [28]、刘凤红 [29]、许玮 [30]等学者对学术出版机构数据期刊出版情况的调研成果,筛选出10家出版规模大、行业影响力强的学术出版机构。10家机构均为开放获取的早期倡导者和主要推动者,发布有详细的科学数据出版政策,并至少创办有一本数据期刊,拥有丰富的科学数据出版经验,其政策文本能够充分反映科学数据出版领域的前沿实践、伦理风险与相应规范,具有较高的研究价值。

选定学术出版机构后,使用Google搜索引擎检索学术出版机构名称,访问出版机构官网,在顶部导航栏中选择“policy”部分,浏览全部学术出版政策,从中提取与科学数据出版相关的政策文本。经调研,共得到政策文本15922字,10家学术出版机构科学数据出版政策的基本信息如表 1所示。

表 1   10款科学数据出版政策基本信息

政策编号制定机构政策名称有效链接
1Springer NatureResearch data policyhttps://www.springernature.com/gp/authors/research-data-policy
2PensoftPensoft Data Publishing Policies and Guidelines for Biodiversity Datahttps://bdj.pensoft.net/i/Pensoft_Data_Publishing_Policies_and_Guidelines.pdf
3ElsevierResearch datahttps://www.elsevier.com/about/policies-and-standards/research-data#2-our-policy
4WileyWiley's Data Sharing Policieshttps://authorservices.wiley.com/author-resources/Journal-Authors/open-access/data-sharing-citation/data-sharing-policy.html
5Taylor&FrancisResearch Data at Taylor & Francishttps://taylorandfrancis.com/openresearch/researchdata/
6Oxford University PressResearch datahttps://academic.oup.com/pages/open-research/research-data
7Cambridge University PressResearch transparency with Cambridgehttps://www.cambridge.org/core/services/authors/research-transparency
8PLOSPLOS Data Availabilityhttps://journals.plos.org/plosone/s/data-availability#loc-introduction
9SAGEResearch Data Sharing FAQshttps://us.sagepub.com/en-us/nam/research-data-sharing-faqs
10ACS PublicationsACS Research Data Policyhttps://publish.acs.org/publish/data_policy

新窗口打开| 下载CSV


本研究收集的科学数据出版政策全部为文本数据,其内容量大、蕴含信息复杂,因此宜采用内容分析法 [31],采用质性数据分析工具Nvivo11进行文本编码,提取政策文本中有关伦理规范的相关表述,在此基础上提取各政策中的科学数据出版伦理原则内容,对各政策中的伦理原则进行横向比较分析,从而明确伦理原则的概念边界,并对伦理原则进行深度阐释,提出具备可操作性的具体实践要素。

经预调研,发现10项科学数据出版政策均从出版流程的角度展开,涵盖科学数据提交、审核、存储、发布、引用5个环节。因此,本研究以数据出版流程作为编码的一级类目;以一级类目为基础,结合相关文献调研,并反复研读政策文本,明确各伦理原则所对应的具体环节,从而提取科学数据出版伦理原则,制定二级类目。编码框架如表 2所示。

表 2   编码框架

伦理原则政策编号
一级类目二级类目12345678910
全流程G1.价值共创原则
G2.安全原则
数据提交A1.透明性原则
A2.数据权属保护原则
A3.隐私保护原则
数据审核B1.质量控制原则
数据存储C1.最优匹配原则
数据发布D1.开放许可原则
数据引用E1.规范引用原则

新窗口打开| 下载CSV


3 科学数据出版伦理原则的核心概念与实践要素

在内容编码的基础上,本研究构建了科学数据出版伦理原则体系(见图 1)。伦理原则体系由两项基本原则与七项具体原则构成,其中,两项基本原则贯穿于科学数据出版全流程,为具体原则的制定与实施提供价值指引与根本遵循;七项具体原则面向特定环节的伦理挑战,对相关主体的行为加以规范,引导其采取最佳实践方式,以保障数据出版的顺利实施。基于学术出版机构发布的政策文本,本研究将依次阐述各项伦理原则的核心概念,并归纳其实践要素。

图 1

图 1   科学数据出版伦理原则体系


3.1 基本原则

科学数据出版伦理基本原则包括价值共创原则与安全原则,两者分别为数据出版的核心价值导向与风险防控底线,对具体伦理原则的制定与实施起到统摄与指导作用。

3.1.1 价值共创原则

(1)核心概念。价值共创原则是科学数据出版的核心价值导向,其要求科研人员充分认识到科学数据的公共价值属性,积极参与科学数据出版,形成共创共建共享的良好学术生态,促进科学数据的价值发挥。该原则不仅从价值观层面为科研人员参与科学数据出版提供了根本遵循,也促使科研人员在数据提交、审核、存储、发布、引用等各个具体环节自觉履行应当遵循的伦理原则,是推动各项伦理原则贯彻落实的先决条件。

(2)实践要素。政策主要通过“价值激励”与“制度保障”相结合的方式贯彻落实价值共创原则。

价值激励方面,政策通过强调数据出版对个人学术发展和学术界的重要价值,以提高科研人员参与的积极性。首先,突出数据出版为论文作者带来的学术收益。如政策5指出,数据共享可使论文引用量增加高达25%;政策2提出,开放数据供他人检查、分析和验证,不仅体现了作者的学术自信与科研诚信,也有助于提升学术声誉。其次,强调科学数据对学术界的长远价值。政策普遍指出,经过严格质量控制的科学数据具有重复利用和持续开发的潜力,且重用成本较低,对学术界有重要意义。如政策9强调,数据的可重用有助于构建更加公平、稳健和负责任的研究环境;政策2、3提出,数据出版可提高研究透明度,降低数据收集与管理成本,推动学术资源的高效利用。

制度保障方面,部分出版机构旗下期刊采取强制性的数据出版政策,将数据出版作为论文发表的必要条件,以制度化方式保障数据的开放共享,使科研人员认识到数据出版的价值所在,推动其由“被动参与”转向“主动融入”,逐步建立互惠互利的良好氛围。

3.1.2 安全原则

(1)核心概念。安全原则是科学数据出版的风险防控底线,要求在数据出版各环节严防数据引发安全风险,保障数据出版的有序开展。贯彻安全原则不仅是法律法规和行业规范的基本要求,也是防范与化解各类安全风险隐患的关键屏障。作为基本原则,安全原则为数据权属保护、隐私保护、透明性等具体原则的制定与实施提供了根本遵循。

(2)实践要素。当前政策定义的数据安全风险主要包括个人安全风险、生物安全风险、文物安全风险、军事安全风险以及国家安全风险,并明确规定对包含上述风险的数据不得直接共享。其中,个人安全风险主要源于人类数据引发的隐私泄露问题,该问题在隐私保护原则中被单独讨论,出版机构对其制定了相关规范。除个人安全风险外,其余安全风险多源自非人类敏感数据,如濒危物种地点数据、考古地区数据、军事敏感数据以及政府数据等,公开此类敏感数据可能会给生物安全、文物安全乃至国家安全造成威胁。

鉴于此类数据所引发的安全风险可能造成严重后果,现有政策普遍对敏感数据实施严格限制,将法律法规和行业指南作为首要遵循,明确禁止未加处理地提交任何可能出现安全风险的数据,并特别制定数据权属保护原则和隐私保护原则,以防止数据出版侵犯个人合法权益。同时,政策还要求论文作者遵循透明性原则,对因执行安全原则而无法共享的数据予以披露,在确保安全底线的同时保持必要的透明度。

3.2 具体原则

在基本原则的统摄与指导下,七项具体原则分布在科学数据提交、审核、存储、发布、引用五个环节,其中,数据提交环节对应三项伦理原则,其余环节各对应一项伦理原则。具体原则旨在引导相关责任主体采取最佳实践方式,确保各环节职能的有效发挥,在应对伦理挑战的同时最大限度释放数据价值。

3.2.1 数据提交环节:透明性、数据权属保护与隐私保护原则

数据提交环节是科学数据出版流程的起点,也是政策制定伦理原则的重点,通过透明性原则、数据权属保护原则和隐私保护原则的约束,可促使论文作者在出版流程前端开展数据自查,从源头上防范潜在的伦理风险,并保障数据的透明性,为后续环节开展奠定坚实的基础。

3.2.1.1 透明性原则

(1)核心概念。透明性原则指论文作者应保证科学数据的清晰、公开、可获取,维护数据出版流程的诚信可靠。贯彻透明性原则既是审稿人和编辑进行数据审核的前提,也是其他科研人员获取和重用科学数据的必要条件。

(2)实践要素。当前政策主要通过要求作者提交数据可用性声明来落实透明性原则。声明中首先需要说明数据是否可共享、哪些数据可共享,并分别针对可共享和不可共享的数据进行不同程度的披露。

对于可共享的数据,数据可用性声明的内容通常涵盖3个部分:①哪些数据是可用的;②数据的存储位置;③数据的访问条款,即在何种条件下可访问数据。作者需在声明中提供详尽的访问链接与使用指引,便于其他科研人员、审稿人和编辑获取数据。政策1、5、10特别要求提供数据的持久标识符,如数字对象标识符(Digital Object Identifier,DOI)或数据库分配的登录号;若数据未存储在数据库中,论文作者应声明“数据可向作者索取”,以为有需要的科研人员提供获取途径。

对于不可共享的数据,论文作者应声明具体原因,并提供可行的替代方案。政策中列举的常见原因包括:①数据由第三方提供,受到道德、商业、法律等因素限制;②期刊采用双盲评审机制,数据中不应包含可识别作者身份的信息;③数据涉及研究参与者隐私。以上数据通常可免于公开共享,若访问者仍希望获取,部分政策允许其与论文作者进行单独联系,商讨数据获取条件。

部分政策提供了撰写可用性声明时的格式模板。模板以表格的形式呈现,分为数据状态和声明用语示例两部分。数据状态主要包括“可公开获取”“受第三方限制”“未产生新数据”三种,针对每一种数据状态,应使用对应的声明用语规范。以“受第三方限制”状态为例,声明的用语模板为“支持本研究结果的数据可从[第三方]获得。数据的可用性受到限制,数据在本研究许可下使用。经[第三方]许可,数据可从[作者]/[URL]处获得”。格式模板大大减轻了论文作者撰写数据可用性声明时的负担,也提升了声明的规范性和可读性,对于透明性原则的贯彻具有积极作用。

3.2.1.2 数据权属保护原则

(1)概念界定。数据权属保护原则指当提交的科学数据涉及其他作者的数据时,论文作者应保护其他数据作者在道德、法律和经济方面的利益。数据权属保护原则秉持着尊重知识创新和商业版权的理念,旨在从源头上防止因数据权属矛盾引发的道德、法律风险和经济纠纷。

(2)实践要素。在科学研究过程中,数据的采集、清洗和分析往往需要投入大量人力和物质资源,因此,许多论文作者选择与其他数据作者(如其他研究者、研究机构或商业组织)合作以获取数据,部分论文作者则直接向第三方数据作者申请或购买数据。数据作者参与了数据的生产过程,作出了创新贡献,独立拥有或与论文作者共同拥有数据的所有权;若数据涉及商业活动,数据作者还可能享有数据的商业权利(如版权)。数据权属保护原则要求论文作者在提交数据时识别数据是否关联第三方利益,若存在利益关联,则可不提交该部分数据,并提供相应的替代方案。如政策3规定,论文作者在共享数据前应重点考虑版权和数据所有权问题,确认已获得数据作者许可并拥有发布权。政策5规定,若科学数据是在与商业组织合作时产生的,该部分数据可能涉及商业利益,受法律或市场监管保护,论文作者应在提交数据之前获取许可。

针对关联第三方数据作者利益的数据,政策主要采取了两种替代解决方案:①贯彻透明性原则,要求论文作者详细披露数据集基本情况和数据作者来源,并提供联系方式,确保其他研究者能够以与论文作者相同的方式访问数据;②针对商业数据设置保护、禁止期限,通常为自数据发布起6个月内,在保护期满后方可自由获取。

3.2.1.3 隐私保护原则

(1)核心概念。隐私保护原则指当提交的科学数据存在侵犯研究参与者个人隐私的风险时,论文作者应尊重和保护他人的隐私权。隐私保护原则为处理包含个人信息的科学数据提供了指导,可以有效防范处理隐私数据时的道德和法律风险。

(2)实践要素。政策普遍规定,不允许论文作者不加限制地共享可识别个人信息的隐私数据。政策8列举了可能侵犯隐私权的数据内容:①姓名,实际地址;②互联网协议(IP)地址;③具体日期(出生日期、死亡日期等);④联系信息,如电话号码或电子邮件地址;⑤位置数据;⑥组合起来可能识别身份的内容,如弱势群体或其他小范围群体的性别、种族、地点数据。

为在隐私保护的前提下充分发挥数据价值,部分政策也提出了两类替代方案。①征求知情同意,论文作者应与研究参与者取得联系,告知其数据内容、共享方式与时间等具体信息,并征得明确同意。政策5特别强调,必须保证研究参与者查看了征求知情同意的相关信件,且共享方案不得违背研究初期和参与者签署的同意条款。②数据匿名化,通过替换、删除或隐藏等去识别操作,消除从数据中识别或推测个人身份的可能性。常用措施包括:去除精确信息(如使用年龄替代出生日期)、概括精确信息(如使用“企业工作人员”替代“程序员”)、使用化名替代真实姓名等。相比于征求知情同意,匿名化方式可以更好地规避侵犯隐私权的风险,被多数出版机构采纳。

3.2.2 数据审核环节:质量控制原则

数据审核环节是把关数据质量的核心阶段,也是数据出版区别于一般数据共享的重要特征,在这一环节,作者需配合期刊编辑和审稿人对数据进行系统审查。政策针对该环节制定了质量控制原则,以规范审核流程、确保数据的科学严谨,从而保障存储、发布和引用环节的顺利开展。

(1)核心概念。质量控制原则要求论文作者、审稿人和编辑在数据审核过程中各司其职,共同确保数据的真实性、完整性和可靠性。论文作者应提供完整的数据及必要的访问条件,以支持数据的透明审核;审稿人和编辑则应履行职责,对数据的收集、处理和呈现过程进行严格、系统的评估。质量控制原则是确保数据审核公平性和有效性的关键机制,对于保障数据质量、增强研究透明度具有重要作用。

(2)实践要素。首先,论文作者应向审稿人和编辑提交在撰写论文时生成或使用的所有数据,对于无法共享的数据,论文作者也应提供私人访问渠道以备审查。政策1提到,在论文评审过程中,审稿人有权访问底层数据,对于未公开的数据,审稿人和编辑可以在论文提交前进行私人访问。学术出版机构赋予了审稿人和编辑进行数据访问的最高权限,究其原因,一是为确保科学数据得到全面审查,以保证科研诚信、论文质量和数据质量;二是由于审稿人和编辑的评审行为处于出版流程之中,可被记录、追溯,并受到严格的保密规范约束。作为从业人员,审稿人和编辑普遍具有较高的道德伦理素养,不易出现泄露他人隐私、损害第三方利益、危害国家安全等问题,若出现问题也能迅速溯源和解决。

对于审稿人和编辑来说,质量控制原则是权利和义务的结合,学术出版机构既赋予了审稿人和编辑访问数据的最高权限,也针对其数据审核行为制定了一系列规范。政策2、4从三个方面发布了科学数据审核的详细规范。

(1)审核论文质量。审稿人和编辑需审核论文中的数据内容。对于传统论文,应重点审核数学符号、缩写使用是否准确,以列表、表格等形式列举的数据能否支持论文结论;对于数据导引,应重点审核标题、摘要和关键词是否准确概括导引的正文内容,数据引用是否规范,并确认对元数据的描述是否准确。

(2)审核数据质量。审稿人和编辑需审核数据文件,确保其可发现性、可访问性、可互操作性和可重用性。政策2、4要求重点审核:①数据完整性,即数据是否被完整、一致地记录在数据集中;②数据价值,即数据是否涵盖足够大的学科范围、时间跨度或分类群(taxon),具有单独出版的价值;③数据出版伦理,数据是否符合数据权属保护原则、隐私保护原则、安全原则、最优匹配原则等要求。

(3)审核数据导引与数据的一致性。审稿人和编辑需审核数据导引与数据的一致性。审核内容包括:①数据导引是否提供了对数据来源、数据类型、数据获取和分析方法的准确描述;②数据导引中使用的样例是否与基础数据一致;③数据导引中的所有内容是否都有基础数据作为依据。

3.2.3 数据存储环节:最优匹配原则

数据审核完成后即进入数据存储环节,论文作者需在编辑的辅助下将数据存入数据仓储,实现数据的长期保存。良好的数据存储条件不仅关系到数据安全,也是后续数据获取和重用的重要保障。因此,政策通过制定最优匹配原则,为论文作者选择数据仓储提供指导。

(1)核心概念。最优匹配原则指论文作者应根据科学数据的数据类型和其所属学科领域,选择匹配程度高、认可程度高、本身质量过硬的数据仓储进行数据存储,以实现数据的永久保存。

(2)实践要素。为保证论文作者选择最优匹配的数据仓储,学术出版机构通常会为论文作者提供数据仓储选择建议,并辅以具体指导。

在提供选择建议时,政策通常要求数据仓储在适配程度和仓储质量两个方面表现优异。适配程度即科学数据和数据仓储在数据类型和学科领域上的一致性,针对某些特定的学科门类,学术出版机构指定专门的数据仓储,要求论文作者按照数据类型将数据进行分类存储。如政策2要求,生命科学领域的数据应根据数据类型分别存储到特定数据库,物种出现记录应存入GBIF IPT数据库,基因组数据应存入GenBank数据库,系统发育数据应存入TreeBASE数据库,所有其他生物数据应存入Dryad数据仓储。适配程度高的科学数据对于服务于特定学科或数据类型的数据仓储具有重要价值,数据仓储可以更有针对性地进行数据存储和发布,有效降低数据存储成本、提高存储效率,通过分析科学数据的共性或差异能够激发科研人员的研究灵感,产生创新思路。

除适配程度外,仓储本身的质量也关系到数据存储的效率、安全性和发布效果。多数政策要求论文作者选择可发布持久标识符(如DOI)、具有稳妥存储方案且获学术共同体普遍认可的数据仓储,以确保数据能够永久保存。部分政策也提出论文作者应选择支持匿名功能的数据仓储,以满足期刊双盲评审的需要。

政策还对论文作者如何选择数据仓储进行了具体指导,如建议使用FAIRsharing、re3data、DataCite Repository Finder等检索工具满足FAIR原则的数据仓储。除自行检索外,政策还鼓励论文作者与机构图书馆、资助者、同事或其他学者交流,以获取选择数据仓储的专业建议。在缺乏专用仓储时,政策也推荐了Figshare、Zenodo和Dryad等数据存储量大、存储安全性强、使用方便快捷的通用数据仓储作为替代方案(见表 3)。

表 3   科学数据出版政策推荐使用的通用数据仓储

政策编号推荐使用的通用数据仓储
3Mendeley Data,Science Direct
4Dryad,Figshare,Zenodo
6Code Ocean,Dryad Digital Repository,
Figshare,Harvard Dataverse,Open Science Framework,Zenodo
7Dataverse,Dryad
8Figshare
9Figshare,Zenodo,OSF

新窗口打开| 下载CSV


3.2.4 数据发布环节:开放许可原则

数据发布环节是科学数据由内部存储转向公开共享的重要节点,为确保在合法合规的前提下实现数据的充分开放,政策在该环节制定了开放许可原则,引导论文作者选择适当的开放内容许可协议,促进数据的自由获取和重用。

(1)核心概念。开放许可原则指论文作者在发布数据时应自觉遵守开放内容许可协议,在保留必要精神权利的同时,向社会公众让渡部分经济性权利,以促进科学数据的自由获取与重用。

(2)实践要素。开放内容许可协议是建立在著作权法基础上,针对内容创作者和内容使用者制定的一系列权利和义务规范,旨在避免开放内容重用过程中因权责不清造成的种种矛盾。[32]当前,知识共享协议(Creative Commons License,简称CC协议)是使用最广泛的许可协议之一。政策普遍采用CC协议,且鼓励作者选择开放程度较高的版本,如CC0、CC-BY,以放宽数据使用限制,降低数据重用门槛。

除CC协议外,部分政策也引入了更加契合数据出版特性的许可协议。如政策2采用了Open data commons发布的系列协议ODbL、ODC-BY、PDDL,以应对因科学数据的数据类型多样、版权归属模糊而造成的复杂场景,并将CC0协议作为替代选项。Open data commons系列协议允许其他科研人员自由修改、使用和共享数据,并要求以引用、致谢等方式承认数据发布者的贡献,可操作性强,更加适合科学数据出版场景,具有广阔的应用前景。

3.2.5 数据引用环节:规范引用原则

数据引用环节是数据出版流程的终点,也是数据作者的学术贡献获得认可与激励的重要途径。政策在该环节制定了规范引用原则,引导论文作者遵守数据引用规范,促进科学数据的持续传播与充分利用。

(1)核心概念。规范引用原则指论文作者应遵守学术诚信,在参考文献列表中引用研究中生成或使用的数据,引用格式应符合学术出版机构制定或指定的科学数据引用标准,以表达对数据作者学术贡献和知识产权的尊重。

(2)实践要素。落实规范引用原则的关键在于制定统一、权威的引用标准。各政策普遍要求论文作者在参考文献部分完整引用科学数据,遵循规定的格式,并提供数据的持久标识符,确保引文的可访问性、可持续性和可互操作性,以更好地支持数据重用。在制定引用标准时,各政策多以国际通行的科学数据引用规范为依据,主要参照的框架包括由DataCite与FORCE11分别发布的相关引用原则与规范。

DataCite提供了在参考文献中引用数据的基本格式,且能够为数据分配持久标识符(DOI),为标准化、规范化的数据引用奠定了基础。政策1、2、8、9均参考DataCite规范,建议论文作者在引用时标明:数据集创建者、数据集标题、仓储名称、出版年份及持久标识符(如DOI、Handle或ARK)。除分配DOI和提供格式参考外,DataCite还开发了引文生成工具DOI Citation Formatter,其可按多种标准格式生成引文。

FORCE11发布的《数据引用原则联合声明》(以下简称《声明》)涵盖了数据引用的目的、功能和属性,提出重要性、荣誉、署名、证据、唯一标识、可获取、持久性、具体性、可验证性、互通性和灵活性8项原则。[33]在引用原则的指导下,各学术出版机构制定了引用的具体规范。例如,政策6表明其赞同《声明》,科学数据是合法的、可引用的研究成果,科研人员应在参考文献列表中进行完整的引用,引用应至少包含:数据创建者、日期、数据名称、数据发布位置(如数据仓储名称)、持久标识符(如DOI)。

4 我国科学数据出版伦理规范化建设的可行路径

结合前文分析,国外有代表性的学术出版机构在科学数据出版伦理方面已积累了较为成熟的经验,构建了覆盖数据出版全流程的伦理原则体系。鉴于我国科学数据出版仍处于起步与发展阶段,在伦理规范化建设方面尚缺乏系统经验,本研究基于前文分析结果,并结合我国科学数据出版的发展现状与面临的伦理困境,提出若干可行路径,以期为我国学术出版机构开展数据出版伦理的规范化建设提供参考。

4.1 加强宣传普及与制度引导,提升科研人员参与意愿

我国科学数据出版的整体参与度仍不够理想,科研人员普遍存在对其价值认知不足、参与意愿不高等问题,尚未形成共建共享的良好氛围。[34]作为科学数据出版实施的核心平台,学术出版机构应主动承担宣传普及责任,通过学术会议、媒体宣传、专家讲座等多渠道普及数据出版的重要价值,提升数据出版在学术共同体中的知名度与认可度。同时,应加强制度引导,适当将数据公开、规范引用等纳入学术成果评价体系,努力使数据成果与论文等传统成果获得同等认可,从而激发科研人员参与数据出版的积极性。

4.2 制定具备可操作性的伦理规范细则,并嵌入数据出版流程

科学数据出版伦理原则的落实不能仅依赖责任主体的自觉性,而应以制度化方式嵌入工作流程,充分发挥其指导作用。以我国数据期刊《中国科学数据》为例,其在期刊官网“投稿指南”栏目中详细列举了作者、审稿人和编辑应遵循的出版伦理规范 [35],为伦理原则的落地提供了可操作的明确指引,值得其他期刊借鉴和推广。学术出版机构可结合旗下期刊的学科特点与发展定位,制定细化的伦理规范细则,如数据风险自查指导、数据审核标准、数据仓储推荐名单、开放许可协议模板以及数据引用标准等,并将其集成在期刊官网或投审稿系统中,便于作者、审稿人和编辑查阅和遵守,从而高效地贯彻落实透明性、隐私保护、质量控制、规范引用等各项伦理原则。

4.3 严守安全底线,构建“自查+外审”的数据安全治理机制

学术出版机构应强化风险意识,在科学数据出版流程中构建数据安全治理机制,严守数据安全底线。数据安全是关系到国家安全、公共利益安全与学术生态健康的红线,一旦数据安全治理不到位,涉及个人隐私、数据权属、生物安全、国家安全等敏感信息的数据便可能泄露从而造成严重后果。为此,学术出版机构可在数据提交与审核两个环节建立“自查+外审”的数据安全治理机制:在数据提交环节敦促作者自查数据风险,引导作者在提交前完成敏感数据筛查和去标识化处理;在数据审核环节践行质量控制原则,由编辑和审稿人对数据风险进行系统评估,识别数据安全风险,确保敏感数据得到有效保护。通过“自查+外审”的双重保障,能够有效防范敏感数据可能引发的安全问题,在实现数据价值与防范安全风险之间达到最佳平衡。

4.4 发挥多主体职能,推动数据审核制度切实可行

高质量的数据出版依赖科学、合理的审核机制,而数据审核不能简单沿用传统论文评审模式,否则易出现数据获取难、评审标准模糊、审稿人知识储备和投入时间不足 [25, 36]等问题。因此,学术出版机构应充分引导作者、编辑和审稿人各司其职、通力合作,推动数据审核制度的切实可行。在此过程中,编辑应承担核心职责:一方面,结合数据学科属性,遴选熟悉数据内容和格式的“小同行”审稿人,保证评审效率和质量;另一方面,要求作者在提交数据时详细披露数据格式、元数据项、数据浏览工具等信息,以减轻审稿人的评审负担。此外,编辑还应作为审稿人和作者间的沟通桥梁,及时联系作者回应审稿人的问题,补充所需数据及相关材料或工具。通过各主体的协作配合,使数据审核制度能够以较低的成本有效运转,及时发现数据问题、提升数据质量,为数据出版提供坚实保障。

5 结论与展望

本研究选择10家在科学数据出版领域有影响力的学术出版机构,对其10款科学数据出版政策进行内容分析,构建了科学数据出版伦理原则体系,并分别剖析各项原则的核心概念和实践要素,在此基础上,为我国学术出版机构进行科学数据出版伦理规范化建设提出了可行路径。我国科学数据出版伦理建设仍任重道远。在政策层面制定伦理规范后,伦理的贯彻执行也需要耗费较大的人力物力,尤其对期刊编辑和审稿人的时间、精力和学术能力提出了较高要求。科学数据出版伦理的建设既需要学术出版机构的自我革新,也需要有关部门制定相关政策法规加强外部力量的约束,建立科学数据出版的奖惩机制,例如将数据引用纳入学者荣誉评定标准,将数据引用不规范、数据侵犯他人隐私的行为视作学术不端行为进行处理,为科学数据出版的健康发展提供保障。

参考文献

十七部门关于印发《“数据要素×”三年行动计划(2024—2026年)》的通知[EB/OL].(2024-01-05)[2024-09-22]. https://www.cac.gov.cn/2024-01/05/c_1706119078060945.htm.

[本文引用: 1]

陈铭.

开放科学背景下的数据出版:功能、困境与治理进路

[J]. 科技与出版, 2024 (10): 80- 88.

DOI:10.16510/j.cnki.kjycb.20241014.005      [本文引用: 1]

邢文明, 郭安琪, 秦顺, .

科学数据管理与共享的FAIR原则:背景、内容与实施

[J]. 信息资源管理学报, 2021, 11 (2): 60- 68.

[本文引用: 1]

尧新瑜.

“伦理”与“道德”概念的三重比较义

[J]. 伦理学研究, 2006 (4): 21- 25.

[本文引用: 1]

胡良霖, 朱艳华, 李坤, .

科学数据伦理关键问题研究

[J]. 中国科技资源导刊, 2022, 54 (1): 11- 20.

[本文引用: 1]

张小强, 李欣.

数据出版理论与实践关键问题

[J]. 中国科技期刊研究, 2015, 26 (8): 813- 821.

[本文引用: 1]

黄国彬, 郑霞, 付映宏.

数据导引:Data Paper的概念辨析与译名修正

[J]. 现代情报, 2020, 40 (1): 24- 34.

[本文引用: 1]

Draft of the Data Ethics Framework[EB/OL].(2019-06-19)[2025-02-25]. http://www.meritalk.com/articles/gsa-drafts-fed-data-ethics-framework/.

[本文引用: 1]

UK Statistics Authority. Ethical considerations in the use of geospatial data for research and statistics[EB/OL].(2021-06-19)[2025-02-25]. https://uksa.statisticsauthority.gov.uk/publication/ethical-considerations-in-the-use-of-geospatial-data-for-research-and-statistics/pages/1/.

[本文引用: 1]

科学数据管理办法[EB/OL].(2018-03-17)[2025-02-25]. https://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htm.

[本文引用: 1]

温亮明, 张丽丽, 黎建辉.

大数据时代科学数据共享伦理问题研究

[J]. 情报资料工作, 2019, 40 (2): 38- 44.

[本文引用: 1]

ROSS M W , IGUCHI M Y , PANICKER S .

Ethical aspects of data sharing and research participant Protections

[J]. American Psychologist, 2018, 73 (2): 138- 145.

DOI:10.1037/amp0000240      [本文引用: 1]

MEYER M N .

Practical tips for ethical data sharing

[J]. Advances in Methods and Practices in Psychological Science, 2018, 1 (1): 131- 144.

DOI:10.1177/2515245917747656      [本文引用: 1]

ARTHUR P L , HEARN L .

Toward open research:A narrative review of the challenges and opportunities for open humanities

[J]. Journal of Communication, 2021, 71 (5): 827- 853.

[本文引用: 1]

DAHABIYEH L,TAHA N. Open research data and privacy violations[EB/OL]. [2025-07-16]. https://journals.sagepub.com/doi/10.1177/01655515241297399.

[本文引用: 1]

夏汇川.

我国社会科学涉人研究伦理规范构建刍议

[J]. 科技管理研究, 2023, 43 (13): 236- 242.

[本文引用: 1]

MCMILLAN J , EARP B D , KONG W M , et al.

The wrong word for the job? The ethics of collecting data on‘race’in academic publishing

[J]. Journal of Medical Ethics, 2024, 50 (3): 149- 151.

DOI:10.1136/jme-2024-109915      [本文引用: 1]

LIN D , MCAULIFFE M , PRUITT K D , et al.

Biomedical data repository concepts and management principles

[J]. Scientific Data, 2024, 11 (1): 622.

DOI:10.1038/s41597-024-03449-z      [本文引用: 1]

赵丽梅, 徐壮申.

科学数据开放的伦理价值探析

[J]. 图书馆研究, 2023, 53 (4): 1- 9.

[本文引用: 1]

黄国彬, 解贺嘉.

国际科技期刊出版伦理建设主题与启示

[J]. 出版广角, 2024 (23): 36- 42.

[本文引用: 1]

王丹丹.

科学数据出版过程中的数据质量控制

[J]. 图书情报工作, 2015, 59 (23): 124- 129.

[本文引用: 1]

屈宝强, 王凯.

数据出版视角下的科学数据同行评议

[J]. 图书馆杂志, 2017, 36 (10): 71- 77.

[本文引用: 2]

邱玉红, 焦红, 杨波.

多元数据出版模式下生物医学领域科研人员数据引用行为研究

[J]. 图书情报工作, 2022, 66 (16): 92- 104.

[本文引用: 1]

CANDELA L , CASTELLI D , MANGHI P , et al.

Data journals:A survey

[J]. Journal of the Association for Information Science and Technology, 66 (9): 1747- 1762.

DOI:10.1002/asi.23358      [本文引用: 1]

刘凤红, 彭琳.

国际数据期刊的发展现状调查与分析

[J]. 中国科技期刊研究, 2019, 30 (11): 1129- 1134.

[本文引用: 1]

许玮, 王鹏涛.

作者服务视角下数据论文出版流程的再优化

[J]. 科技与出版, 2021 (10): 71- 78.

DOI:10.16510/j.cnki.kjycb.2021.10.002      [本文引用: 1]

邱均平, 邹菲.

关于内容分析法的研究

[J]. 中国图书馆学报, 2004 (2): 14- 19.

[本文引用: 1]

傅蓉.

开放内容许可协议及其应用研究

[J]. 情报理论与实践, 2012, 35 (12): 37- 41.

[本文引用: 1]

Joint declaration of data citation principles[EB/OL]. [2025-02-25]. https://force11.org/info/joint-declaration-of-data-citation-principles-final.

[本文引用: 1]

郭盛楠, 郝洋, 王芳.

研究者科学数据共享与出版意识提升路径研究:基于中医药领域160位研究者的一项横断面调查

[J]. 科技与出版, 2025 (2): 59- 69.

URL     [本文引用: 1]

出版伦理与学术不端[EB/OL]. [2025-02-25]. http://csdata.org/p/static/1327/.

[本文引用: 1]

涂志芳, 刘兹恒.

国外数据知识库模式的数据出版质量控制实践研究

[J]. 图书馆建设, 2018 (3): 5- 13.

[本文引用: 1]

/