关于生成式人工智能的应用规范研究与启示
——基于国际学术出版界的相关规范政策视角
通讯作者:
关键词:
本文引用格式
刘倩, 王京山, 詹洪春.
学术出版是学术知识进行传播的重要载体,对于推动学术进步和科技创新具有重要意义。人工智能的发展带来了学术出版领域的革新,通过增强替代文献计量学和简化工作流程,人工智能在学术出版中的应用已经十分频繁。[1]人工智能对学术出版的内容发布、元数据创建、知识发现[2]以及提高同行评审的效率[3]都发挥了重要的作用。相关研究发现在医学期刊出版领域,人工智能的采用正变得越来越普遍。[4]生成式人工智能的出现使得人工智能不再仅仅是辅助工具,而成为学术内容的生产者,生成式人工智能已经被科研人员用来协助论文修改、文献综述撰写和实验设计。[5]目前已出现了以GPT(生成式预训练模型)为作者身份的学术出版著作,例如施普林格·自然授权作者使用GPT创作的学术出版书籍《GPT在财务、合规和审计中的应用》(Einsatzmöglichkeiten von GPT in Finance、Compliance und Audit)。
然而,当前学术出版领域对生成式人工智能的规定并没有形成共识,不同学术出版载体以及相关方对生成式人工智能的规定存在一定的差异[9],这对学术出版界应对生成式人工智能的发展造成了挑战。因此,本文对国际知名的学术出版商、学术出版组织、学术研究准则以及预印本平台发布的有关生成式人工智能的政策/规范进行系统性研究,分析其中的主要内容,从而为我国学术出版界应用生成式人工智能提供借鉴与启示。
1 研究设计
以国际学术出版界利益相关方对生成式人工智能的相关规定为研究文本,采用文献调查法和内容分析法相结合的方式进行系统性研究,以期全方位展现各主体对生成式人工智能的态度和使用规范。
1.1 研究对象
本研究以国际学术出版领域不同主体关于生成式人工智能的应用规范作为研究对象,主要选择了国际知名的学术出版商、学术出版组织、学术出版准则和预印本平台四种不同的学术出版的相关方,调研搜集了其关于生成式人工智能的相关规定和政策声明。筛选发现,共有19家学术出版商、7家学术出版组织、2个学术出版准则和3个预印本平台明确提出了有关使用生成式人工智能的相关规定,具体情况见表1。
表1 研究对象列表
| 学术出版组织类型 | 具体研究对象 |
| 学术出版商 | Cambridge University Press(剑桥大学出版社)、MIT Press(麻省理工学院出版社)、Edward Elgar(爱德华·埃尔加出版社)、Elsevier(爱思唯尔)、Palgrave MacMillan(帕尔格雷夫·麦克米兰)、Taylor and Francis(泰勒和弗朗西斯出版集团)、SAGE Publications(赛奇出版社)、Wiley(约翰·威立国际出版集团)、Springer(施普林格)、De Gruyter(德古意特出版社)、Frontiers(前言)、Thieme(德国蒂墨出版集团)、Medknow出版社、Emerald出版社、BioMed Central(生物医学中心开放获取机构)、World Scientific(世界科学出版社)、IOP Publishing(英国物理学会出版社)、John Benjamins(约翰·本杰明出版社)、Dovepress(德孚出版社) |
| 学术出版组织 | COPE(出版道德委员会)、WAME(世界医学编辑学会)、ICMJE(国际医学期刊编辑委员会)、CSE(科学编辑协会)、ENAI(欧洲学术诚信网络)、IEEE(美国电气和电子工程师协会)、APA(美国心理学会) |
| 学术出版准则 | Living guidelines on the responsible use of generative AI in research(关于在研究中负责任地使用生成式人工智能的生活指南)、The European Code of Conduct for Research Integrity(欧洲研究诚信行为准则) |
| 预印本平台 | SSRN、F1000、Arxiv |
1.2 研究方法
首先,采用文献调查的方法将具有代表性的国际学术出版相关方有关生成式人工智能的政策/声明进行摘录,翻译成中文后最终获得了18 066字的文献,包括四种不同的学术出版主体,以求能够更全面、细致地展现当前国际学术出版界对生成式人工智能的处理方式。其次,采用内容分析法对政策声明中所包括的具体要素进行分析,从不同方面归纳国际学术出版领域对生成式人工智能的规范措施。
2 生成式人工智能在国际学术出版领域的应用规范分析
对获取的资料进行分析发现,当前国际学术出版界关于生成式人工智能的应用规范主要分为工具本身的界定、作者身份限定、使用方式、版权处理以及编辑和同行评审使用规定五个方面,但并不是所有的规范政策/声明中都包含这五个方面,具体情况如表2所示。
表2 国际学术出版界关于生成式人工智能规范内容分类
| 学术出版相关方 | 规范内容分类 | ||||
| 工具本身的界定 | 作者身份限定 | 使用方式 | 版权处理 | 编辑和同行评审使用规定 | |
| Cambridge University Press(剑桥大学出版社) | — | √ | √ | — | — |
| MIT Press(麻省理工学院出版社) | √ | √ | √ | — | — |
| Edward Elgar(爱德华·埃尔加出版社) | √ | √ | √ | — | — |
| Elsevier(爱思唯尔) | √ | √ | √ | √ | — |
| Palgrave MacMillan(帕尔格雷夫·麦克米兰) | — | √ | √ | — | √ |
| Taylor & Francis(泰勒-弗朗西斯出版集团) | √ | √ | √ | — | — |
| SAGE Publications(赛奇出版社) | — | √ | √ | — | √ |
| Wiley(约翰威立国际出版集团) | √ | √ | √ | — | √ |
| Springer(施普林格) | — | √ | √ | — | √ |
| De Gruyter(德古意特出版社) | — | √ | √ | — | — |
| Frontiers(前言) | — | √ | √ | — | — |
| Thieme(德国蒂墨出版集团) | — | √ | — | — | — |
| Medknow(梅德诺出版社) | — | √ | — | — | — |
| Emerald(埃莫拉尔德出版社) | — | √ | √ | — | — |
| BioMed Central(生物医学中心开放获取机构) | — | √ | √ | — | √ |
| World Scientific(世界科学出版社) | √ | √ | √ | — | — |
| IOP Publishing(英国物理学会出版社) | — | √ | √ | — | — |
| John Benjamins(约翰·本杰明出版社) | — | √ | — | — | √ |
| Dovepress(德孚出版社) | — | √ | — | — | — |
| COPE(出版道德委员会) | — | √ | √ | — | — |
| WAME(世界医学编辑学会) | — | √ | √ | — | √ |
| ICMJE(国际医学期刊编辑委员会) | — | √ | √ | — | — |
| CSE(科学编辑协会) | √ | — | √ | — | — |
| ENA(欧洲学术诚信网络) | — | √ | √ | — | — |
| IEEE(美国电气和电子工程师协会) | — | — | √ | — | — |
| APA(美国心理学会) | √ | √ | √ | — | — |
| Living guidelines on the responsible use of generative AI in research(关于在研究中负责任地使用生成人工智能的生活指南) | — | — | √ | — | — |
| The European Code of Conduct for Research Integrity(欧洲研究诚信行为准则) | — | — | √ | — | — |
| SSRN | — | √ | √ | — | — |
| F1000 | — | √ | √ | — | — |
| Arxiv | — | √ | √ | — | — |
2.1 生成式人工智能的界定
国际学术出版界允许在学术内容的生产过程中使用一些辅助工具,例如参考文献整理工具、语法检查工具等。为了避免限定对象的混乱,有些政策声明对生成式人工智能进行了限定。爱思唯尔就明确提出,政策中所说的生成式人工智能指的是能够生成可用于创建原始内容以供出版的输出工具[10],例如大语言模型,不阻止在正式的研究设计或研究方法中使用人工智能和人工智能辅助工具。鉴于生成式人工智能的不断发展,泰勒-弗朗西斯出版集团直接将其定义为一种不断发展的实践,包括但不限于大型语言模型(例如LLM)、生成式人工智能和聊天机器人(例如ChatGPT)[11]。美国心理学会的相关政策中也明确指出政策中所限定的对象指的是生成式LLM人工智能工具,不包括语法检查软件、引文软件或抄袭检测器。[12]
从当前的规定来看,国际学术出版界对生成式人工智能的界定与技术本身的发展保持一致,目前主要包括大语言模型和聊天机器人两者,但与此同时也明确了不仅仅局限于这两种。随着生成式人工智能的不断发展,相关政策的指向对象将会不断拓展。对生成式人工智能的明确界定是学术界对生成式人工智能形成共识的基础,但并不是所有的学术出版相关方都对其进行了界定,大多数相关政策都是直接以生成式人工智能一词进行概括,默认学术生产者可以理解这一名词的技术指代范围。
2.2 生成式人工智能的身份认定
本研究所涉及的四类学术出版相关方都不认可生成式人工智能的作者身份,这代表了国际学术出版界对生成式人工智能身份认定的态度。针对这一规定,国际学术出版界给出的理由可以概括为以下三个方面:首先,生成式人工智能并不是法人实体,不具有主体地位,无法处理利益冲突和作品版权归属问题。其次,生成式人工智能自身不能开启原创研究,因为其始终是一个技术工具,研究的开展必须借助人类的指导。最后,由于建立在已有数据基础之上的生成式人工智能会存在数据偏差、道德偏见和版权争议等问题,所以无法对学术作品的准确性、完整性和科学性负责,且不能承担道德和法律责任。
COPE、WAME和JAMA Network等组织提出了学术作品的作者身份需要符合四个标准,分别是对作品构思做出重大贡献、起草作品或对作品做出重大修改、批准发布版本、对作品的各个方面负责。[13]这四个标准为国际学术出版相关方判断生成式人工智能的作者身份提供了参考,由于其无法满足这些标准,自然不能被赋予作者身份。因此,所有的政策声明中都明确地提到,生成式人工智能不能被列为所提交作品的作者,这也从根本上阻止了生成式人工智能代替人类作者进入学术出版领域。
2.3 生成式人工智能的使用方式
目前国际学术出版界对于生成式人工智能使用方式的规定主要包括使用范围以及使用披露两个方面,但不同学术出版方对这两个方面的规定不尽相同。从使用范围来看,学术生产者可以使用生成式人工智能进行语法的修改和文章可读性的提升,但是不允许被用来生成实质性内容,例如进行文章的论证、实验结果的得出、研究数据的创建或者修改等。尤其是在涉及图形、图像和艺术作品的创作时,爱思唯尔和施普林格都明确规定不得使用生成式人工智能进行创建或修改。有两种情况是排除在外的:其一是生成式人工智能使用作为研究设计或研究方法的一部分,其二是专门关于人工智能的文章中直接引用的图像和视频。但是这两种额外的情况也需要经过编辑的审查,从而确保图像的准确性。如果利用生成式人工智能进行辅助性内容生产,作者需要对这些内容负责,若出现不正确或误导性内容,作者需要承担相应的责任。
在使用披露方面,一些规定明确指出,使用生成式人工智能进行辅助内容创作时,必须在提交作品时进行声明。这包括具体说明使用生成式人工智能所生成的内容、使用的原因、方式和程度,以及有关生成式人工智能技术本身的详细信息。编辑和出版商会根据披露的这些内容决定生成式人工智能的使用是否妥当,这关系到学术作品的最终出版。在学术出版物中隐瞒对生成式人工智能的使用被视为违反科研诚信的行为,但具体的披露内容、位置等并没有一个统一的规定。不同的规定对于披露生成式人工智能的使用方式有不同的要求,甚至一些政策中并没有提到使用披露的相关内容。这就需要学术内容的生产者在提交学术作品时自觉遵守学术伦理和学术道德规范,以维护学术出版的公平公正和健康发展。
2.4 应用生成式人工智能的版权处理
利用生成式人工智能生成的内容一直存在多方面的版权争议,涉及内容创作者、模型开发者和模型使用者三方主体的版权利益。运用生成式人工智能生成的学术出版内容也同样存在版权争议,因此有些学术出版方会在政策中明确规定此类内容的版权。在处理生成式人工智能生成的辅助性内容时按照以往的版权协议进行,作者将写作文章的部分版权转让给学术出版商,并保留部分版权。在其他涉及版权的方面,作者对一切版权问题负责,包括文章的版权归属和版权转让等问题。值得注意的是,在讨论生成式人工智能的版权问题时,是在确保符合相关使用规定的前提下进行的。也就是说,考虑的是不利用生成式人工智能生成实质性学术内容的情况。
国际学术出版界对生成式人工智能所生成内容的版权问题并没有太多详细的规定,这一方面是因为所有的学术出版方都不认可其在学术出版中的主体地位和作者身份,生成式人工智能所生成的内容自然也不具备独有的版权,因此都按照以往的版权协议进行处理。另一方面,当前关于生成式人工智能所生成内容的版权问题在法律层面没有形成共识,这就造成了所生成的辅助性学术内容没有明确的法律规定进行版权归属。在这种情况下,采用作者负责的方法更为直接且有效。
2.5 编辑和同行评审使用生成式人工智能的规定
生成式人工智能的出现不仅为学术生产者提供了协助工具,也为编辑和同行评审提供了更为便利的工作方式。为了规范编辑和同行评审对生成式人工智能的使用,相关政策规范中提到了具体的规范方式。首先,编辑和审稿人不允许将处于评审环节的学术作品上传到生成式人工智能中,因为这会破坏科研成果的机密性和审稿过程的保密性。审稿人不允许利用生成式人工智能自动生成审稿报告,审稿人应该承担全部的审稿工作,而不是将其转移给智能工具。编辑也不允许利用生成式人工智能进行稿件和审稿报告的共享,以免侵犯到作者和审稿人的隐私。
其次,编辑和审稿人也并非完全不可以利用生成式人工智能,但必须保证其始终是辅助性的使用,例如编辑和审稿人可以利用生成式人工智能对审稿报告进行优化、回复学术研究者信息等。与对学术生产者的要求一样,编辑和审稿人需要对生成式人工智能生成的内容负责,并且向作者披露具体的使用情况和生成的内容。从已有的规范来看,对于编辑和审稿人的使用规定并不多,这主要是因为编辑和审稿人不直接参与学术内容的生产,较少涉及学术内容的版权问题。
3 对我国学术出版应用生成式人工智能的借鉴与启示
通过分析已有的规范政策可以发现,当前国际学术出版界已经关注到了学术内容创作过程中生成式人工智能的使用问题,并从各个方面对其进行了规定,这为我国学术出版界完善应用生成式人工智能的相关规定提供了借鉴和启示。此外,国际学术出版界对生成式人工智能的规范并没有达到体系化、成熟化的状态,还依然存在一些问题,例如没有形成统一的共识、规定措施不尽相同、在如何使用生成式人工智能方面存在差异等。这些问题会造成学术不规范、不公平的现象出现,我国学术出版界在制定生成式人工智能的应用规范时要尽量避免这些问题。
3.1 明确生成式人工智能使用规范
借鉴国际学术出版界对生成式人工智能的规定,我国学术出版界在制定相关规范时需要包括以下两个方面。首先,明确生成式人工智能的指代范围,不能直接以技术名称进行指代,这会使得规范对象难以形成共识,从而产生一定的争议。同时要考虑到生成式人工智能的发展趋势,不仅仅限定为当前具体的技术应用,而是要提出一个统筹性的概念范围,例如生成式人工智能指的是基于大语言模型能够生成内容的智能技术工具。
其次,要明确具体的使用方式和使用范围,从科研的整体思路设计、实验进行、数据采集、数据分析到文章写作、修改,每个环节都给出明确的使用指南和细则规定。解决好学术作品利用生成式人工智能进行辅助内容生产的版权归属问题,例如将作者规定为第一责任人,要求作者要对学术出版物中的一切内容负责。此外,需要考虑到生成式人工智能在不同学科中介入程度的差异,以确保技术的介入不会突破学术伦理和道德底线。
3.2 多方联动形成生成式人工智能的应用共识
各个学术出版主体独立制定有关生成式人工智能应用的规范,可以根据自身的实际情况灵活应对,但也带来了规则混乱和缺乏一致性的问题。举例来说,国际学术出版界针对使用生成式人工智能的披露内容、披露位置等规定存在较大差异,这导致学术研究者难以获得标准化的指导。甚至各个学术出版方的规范政策中存在矛盾之处,这不仅使得学术研究者无法获知正确的使用方式,而且会削弱规范政策本身的影响力和权威性。[14]
学术出版界对生成式人工智能的应用问题形成共识是其规范发展的前提,这就需要多方共同参与,制定并执行符合学术出版的应用规范政策。权威政策文件的发布是形成共识的基础条件,因此需要相关管理部门如中宣部、教育部在充分调研的基础上,结合我国生成式人工智能和学术出版的实际情况,发布具有广泛影响力且跨学科的政策规范。学术出版方和科研基金资助方应严格执行这些政策规范,采用适当的工具检测人工智能生成或修改的内容,以确保政策的贯彻执行。此外,学术界需要加强宣传教育,开展生成式人工智能使用技能和道德培训,以确保学术研究者正确使用AI工具。
3.3 以积极开放态度利用AIGC赋能学术出版发展
2023年,我国颁布《生成式人工智能服务管理暂行办法》,采用鼓励式的规定促进生成式人工智能的发展,[15]这符合国家整体的发展趋势。在当前形势下,学术出版界也要积极迎接生成式人工智能带来的机遇,利用新技术对整个行业进行赋能。发展专用于学术出版的大语言模型,可以在确保研究数据不泄露的情况下,用于论文质量检测,以确保发表的论文不存在版权问题。同时,利用生成式人工智能进行同行评审和编辑工作,可以提高出版工作的效率。此外,还可以延伸学术出版知识服务链条,简化投稿流程,开展学术研究者培训等,从而更好地支持学术研究和学术出版工作的进行。
学术出版界利用生成式人工智能进行赋能要结合好人类智能和机器智能两个方面,人类智能的优势是可以根据不同环境的变化灵活处理问题,机器智能的优势是可以按照预先设计好的程序快速分析和生成内容。人类智能是知识创新的源泉和根本,学术出版直接关系到知识的创新和科学技术的发展,在运用智能技术的过程中,需要坚持人类智能的主体地位,以确保学术知识的创新能够满足人类社会发展的需求。与此同时,我们也应当承认机器智能的辅助功能,充分挖掘其在学术出版领域的应用潜能,以提升出版工作的效率和质量。
4 结语
2023年,习近平在《全球人工智能治理倡议》中阐述了人工智能治理的“中国方案”,指出要“建立并完善人工智能伦理准则、规范和问责机制”[16]。面对生成式人工智能不可逆转的发展趋势,学术出版界需要采取两方面的举措:一方面,必须及时制定使用准则,以确保规范发展,并且为学术研究者提供清晰的指导,避免滥用或误用;另一方面,也需要以积极开放的心态接受AI技术在学术出版界的介入,充分认识到生成式人工智能带来的潜在益处,包括提升出版效率、改善内容质量等,从而更好地适应和应对技术的发展。
参考文献
Scholarly publishing in the wake of COVID-19
[J].
Artificial intelligence-assisted tools for redefining the communication landscape of the scholarly world
[J].
Recent issues in medical journal publishing and editing policies:adoption of artificial intelligence,preprints,open peer review,model text recycling policies,best practice in scholarly publishing 4th version,and country names in titles
[J].
ChatGPT:five priorities for research
[J].
ChatGPT and a new academic reality:Artificial Intelligence‐written research papers and the ethics of the large language models in scholarly publishing
[J].
Chatbots,generative AI,and scholarly manuscripts:WAME recommendations on chatbots and generative artificial intelligence in relation to scholarly publications
[J].
The use of generative AI and AI-assisted technologies in writing for Elsevier
[EB/OL]. (
Taylor & Francis Clarifies the Responsible use of AI Tools in Academic Content Creation
[EB/OL].(
Publishers′and journals′instructions to authors on use of generative artificial intelligence in academic and scientific publishing:bibliometric analysis
[J].
生成式人工智能服务管理暂行办法
[EB/OL]. (
/
| 〈 |
|
〉 |
