数字技术创新日新月异,生成式AI加速人工智能从传统的“基础辅助工具”向“创造辅助工具”突破,人工智能生成文本(Artificial Intelligence Generated Content,简称AIGC)是其身份转变的重要表征。2022年3月,OpenAI发布生成式人工智能ChatGPT,成为AI发展历程中的重要里程碑,引领全球生成式AI风发泉涌。我国对生成式AI的监管提议也应运而生,2023年8月,我国正式施行《生成式人工智能服务管理暂行办法》,为生成式AI的健康发展和规范应用提供法律保障。技术与社会相因相生,社会保障生成式AI的发展,而生成式AI也渗透多元领域,尤其是出版领域。据权威学术出版机构Nature 统计,已有4篇以人工智能为作者的生成文本出版,[1 ] AI生成文本的出版似乎是大势所趋。然而,AI生成文本的出版却使出版者面临版权侵权的现实风险。早在2020年,我国人工智能写作第一案的落槌,就已经为我国出版业敲响警钟。更让人担忧的是,学术界热衷于研究AIGC引发的出版变革、出版融合模式等主题,却忽视了AI生成文本对出版者注意义务的潜在威胁。基于AI生成文本能够出版的前提要件,AI生成文本出版很可能导致出版者注意义务履行不能,从而失去合法来源抗辩的基础。由此,传统的出版者注意义务是否需要调适或重构,亟须得到必要的关注。本文将深度剖析AI生成文本影响出版者注意义务的因由,参考AI生成文本对出版者注意义务影响的具体表征,以利益平衡原则为基础理论,探讨AI技术革新下出版者注意义务构建的因应之策。
1 AI生成文本对出版者注意义务影响的现实因由
数字技术重塑传统产业新模式,生成式AI技术不仅推动出版业的成熟化发展,而且提高知识生产效率,优化出版链条。然则,AI生成文本对出版者注意义务的影响绝非凭空捏造,而是早有显现并且由浅及深。基于此,AI生成文本冲击出版者注意义务的现实因由,理应追本溯源。
1.1 文本生产机制:从人类创作到机器生成
从20世纪90年代起至今,文本生产模式经历了专业生成文本(PGC)、用户生成文本(UGC)与人工智能生成文本(AIGC)三个阶段的多维变革,AI已逐步接近创作领域。
第一,AI加入文本生产创作群体。在PGC时代,为保证PGC运营模式汇聚经济价值,创作主体集中于专业人士;发展至UGC时代,互联网用户拥有平台文本使用者和创作者的双重身份。直到AIGC时代,人类担任创作主体的局限被AI打破,AI从人类创作的辅助工具转变为创作工具。
第二,创作质量参差不齐。PGC要求生成文本的制作水平到达高度创新的专业水准;在UGC时代,用户包含专业与非专业人士,创作产品的质量门槛降低至“原创性”;在AIGC时代,由ChatGPT为代表的生成式AI,拥有庞大的训练数据集和自主学习技能,实现虚拟世界与现实世界的交叉共存,其创作作品的质量也以其技术高低为依托呈现正相关。
第三,AI使文本生产实现从“一般逻辑”到“辩证逻辑”的重要突破。AI最初通过“算法模板+数据”的创作模式,2014年Automated Insights公司开发的人工智能写作机器利用固定模板与搜索数据形成商业新闻,[2 ] 但这种写作方式尚未进入出版领域。AI的设计者一直试图将创作类人化,2017年,Google提出Transformer架构,试图在语言建模方面得以突破,直至2022年,ChatGPT历经多代强大算力系统的更迭达到“辩证思维”。虽基于类人化的辩证思维之下,实际上是设计者将有着“苏格拉底助产法”之称的辩论术形成算法逻辑,ChatGPT生成文本的框架即是辩证算法逻辑运行的结果。[3 ] AI生成文本的类人化逻辑的凸显,使其生成文本在一定程度上具备与出版的人类作品近乎一致的水平,出版者也不得不重视生成文本的漏洞,积极履行注意义务,防止无意间出版AI生成文本诱发版权侵权风险,AI生成文本进入出版领域终究并非永久禁止。
1.2 出版方式革新:从传统出版到融合出版
文本生成与演进的三个阶段,分别对应Web1.0时代、Web2.0时代与Web3.0时代。[4 ] 出版者在三个阶段里,承担着不同的出版义务。Web1.0时代,即1990年代中期到2004年左右,出版领域的文本创作者依旧是具有专业水平的撰稿人,出版文本专业化。出版者尚且依据2002年最高人民法院《关于审理著作权民事纠纷案件适用法律若干问题的解释》(以下简称《若干解释》)第20条的规定,承担出版行为授权、稿件来源和署名、出版物内容等审核义务,并且规定了尽到合理注意义务的证明条件。[5 ] 由于这一时期以传统出版为主导,出版文本不泛化,编辑审查能力较强,出版者履行注意义务就能够较多避免侵权之可能。
进入Web2.0时代,即2004年至今,网络成为用户生成文本的主要渠道,用户从消费者转向文本创造者身份,网络文章随处可见,纸媒受到了巨大的冲击。自我国提出“媒体融合”概念起,出版社就开始创建自己的网站、公众号等网络发表平台,量出文本使编辑审查如牛负重。2020年,最高院对《若干解释》进行修订,将原本的“尽到合理注意义务”条款删除,减轻著作权人的举证压力,将“尽到合理注意义务”的举证责任归于出版者。笔者在威科先行法律信息库进行检索发现,自2019年1月到2023年6月,关于出版者著作权侵权的一审案件共计692件,其中仅1.3%的案件被驳回诉求。① 由此可见,法院对于出版者注意义务的认定标准较高,出版者举证难以获得法院认可。
Web3.0时代,是一种人工智能技术结合下的去中心化互联网时代。在人工智能的依托下,出版者在选题、收稿、审稿、出版等阶段实现了信息集中化、审稿便捷化、效率最大化、交互深入化。技术总是一分两面,AI生成文本意味着创作者不再局限于人类,主体更加复杂多元,创作文本在技术的助力下呈现爆发趋势,导致创作文本的审核极具难度,出版者本在法院认定标准高的困境之下已经亟须应对,此时更是处在两难境地。除此以外,我国自2020年修改关于出版者注意义务的司法解释、《著作权法》(2020修订)、《出版管理条例》(2020修订)之后,关于出版者合理注意义务并未出台更加具体的认定标准,依然停留于传统的三大义务,显然不符合当前技术发展下出版业的实际需求。质言之,AI生成文本将持续增强对出版者注意义务的冲击,亟须应对。
1.3 生成文本属性:从实践否认到实践认可
AI生成文本能力随着深度学习技术优化显著提高,由短文本升级为逻辑性长文本,逐渐符合出版水平,此时出版者各持己见。第一种观点,完全接受出版和AI作者身份。2022年6月,国外某期刊发表由GPT-3为作者的一篇学术论文,不仅完全接受AI生成文本,而且承认其作者身份。[6 ] 第二种观点,完全禁止出版,且否定AI作者身份。2023年1月,Science 期刊更新编辑政策,明确禁止在作品中附带任何AI生成文本,并否认AI作者身份。[7 ] 第三种观点,要求说明AI生成部分并否认AI作者身份。以Nature 为首的部分学术期刊发布政策,禁止或遏制人工智能成为论文作者,如在论文创作中用过相关工具,作者应在“方法”或“致谢”或适当的部分明确说明。[8 ] 我国部分期刊亦采取中和的态度,例如《暨南学报》和《天津师范大学学报》(基础教育版),等等。由此,AI生成文本已纳入出版者的管理范围并逐步被认可。
AI生成文本属性在司法实践中亦经过否认到认可的过程。例如,在2019年4月的北京菲林诉北京百度网讯著作权侵权纠纷案中,法院从自然人作者的角度出发,否定了计算机软件威科先行库生成文本的作品属性,即便计算机软件生成文本趋近自然人创作的作品。① 本案是AI生成文本著作权侵权第一案,表明司法实践中尚不认可人工智能为作者,同时亦否认AI生成文本符合作品构成要件。然则,广东省深圳市南山区人民法院在同年12月突破上述判决,在腾讯公司诉上海乾衡著作权及不正当竞争纠纷案中,法院指出涉案体育比赛报道文章是由腾讯自主研发的智能写作辅助系统Dreamwriter生成,技术上的“生成”过程满足文字作品要件,并进一步指出,由使用者腾讯公司对外承责。② 综上,司法实践中逐渐承认AI生成文本的独创性,印证AI生成文本能够作为作品发表。同时鉴于上述AI生成文本出版于期刊的现实情形,倘若构成上述版权侵权,出版者又岂能独善其身。
2 AI生成文本对出版者注意义务影响的具体表征
AI生成文本具有近似自然人创作作品的技术水平,其进入出版领域初现苗头,未来更是一种必然结果。当庞大算法生成的文本获得出版机遇,AI生成文本的独有特征将使出版者履行注意义务不堪重负,随时面临版权侵权后的承责风险。
2.1 出版授权:授权审查过程日益复杂
出版授权行为的审查是对“作品提供者”拥有复制权和发行权两项权利的合法性审查。[9 ] 主要通过两层审查,一是出版者依据创作过程的确认审查作品提供者身份。二是若并非原作者,则通过授权合同或其他合同的审查,判断作品提供者授权的合法性。AI生成文本将导致出版者履行授权审查义务步履维艰。
第一层审查主要以“创作过程”为审核作品提供者身份的依据,然则创作过程由于AI介入导致审核难度增大。审查作品提供者身份,创作过程的审核是一个必经程序。作品提供者身份有作者与非作者之分,AI介入后呈现自然人、自然人和AI、AI自主的三种类型。出版者无法围绕自然人提供的创作材料等资料明确作品的创作过程,甚至作品的具体类型。国外一项研究曾验证AI生成文本是否会被专业人士识别,实验结果显示,摒弃AI的生成身份,AI生成文本不仅通过了技术检测,甚至人工审核完毕仍留存14%的AI生成文本被错认为自然人创作。[10 ] 事实证明,AI生成文本具备混淆人工智能的能力,出版者无疑需花费巨大的人工审核成本。出版者在审核中将遭遇作品类型无法判定与无法审核作品授权合同的难题,极易被法院认定为合理注意义务的履行失职,寻求破题之策极为重要。
第二层审查基于“授权合同”判定作品出版的授权合法性,但AI生成文本使授权合同链条庞杂,出版者稍有不慎则落入侵权陷阱。以人工智能写作第一案为例,法院认为AI生成文本符合法人作品要件,将案件文本归属于AI提供者。当AI生成文本使用者与制造者并非同一主体,将导致单一制度适用移位。因此,出版者以AI提供者与使用者之间的版权协议为AI生成文本的版权归属依据具有实际可操作性。不同的AI提供者与使用者之间版权协议规定不一。OpenAI公司发布的AI使用条款中规定,用户可拥有所有AI输入与输出的所有权利,用于任何销售或出版等商业目的。[11 ] 与此不同,智能画图工具Midjourney使用协议中说明,图像版权取决于是否是付费用户。[12 ] 因此,在版权协议缺失或者特殊情形下版权归属的难以证成,以及未约定情形的规则疏漏,都将无法实现出版者对作品提供者授权行为的有效判断,难以避免侵权陷阱。
2.2 来源署名:作者署名无法精准识别
稿件来源与署名的审核包含审查稿件来源和稿件署名的准确性。[13 ] 在此审核标准下,出版者对AI参与生成的稿件,首先需要判断的就是在不同的作品类型下,如何确认AI与自然人的创作关系,以此确认署名的“作者”是否是真正的作者。
以合作作品为例,出版社需判断稿件是否构成著作权法意义上的合作作品。ChatGPT等生成式AI能够通过数据训练模仿用户的写作风格,并且与用户的作品在表现形式上呈现近似性。[14 ] 在传统的合作作品中,出版者通常困于多位作者共同授权的高成本之中,且出版者对合作作品的知情程度也深浅不一。[15 ] 在合作作品中,合作作品是由自然人与AI共同创作而成,出版社需要判断AI生成文本的版权归属问题。在当下学界和出版界,人工智能不被赋予作者身份几乎达成共识,合作作品的署名问题似乎不在出版者考量范畴。事实并非如此,倘若按照AI提供者与AI使用者的版权授权协议,AI生成文本是由AI提供者享有版权,缺少AI提供者署名的合作作品出版后,出版者将面临未尽合理注意义务的侵权赔偿责任。此时,在生成式AI提供者与使用者未曾签署版权协议的情况下,出版业缺乏判断的专业性,更难对合作作品的署名进行认定。
当作品的作者隐瞒作品中具有生成式AI创作文本的事实,虽有被认定为学术不端的风险,但出版者的审核技术目前还未能准确检测,容易给有心之人留有可乘之机。以汇编作品为例,人工智能生成文本属于对现有数据资料的编排,其文本已经达到或接近汇编作品的标准。[16 ] 当某汇编作品的作者是利用生成式AI数据抓取技术生成汇编作品,转而作为作者署名进行投稿,出版社无法依据其提供的创作材料判断AI贡献率。换言之,无法判断稿件上的现有“作者”是否属于假冒,是否属于未参与而不应当署名的情形,以及原作品著作权人的署名是否正确或者有无遗漏。如此一来,AI生成文本实际上加剧了出版者在稿件来源与署名上的专业审核难度,出版者难以脱离未尽合理注意义务的困境。
2.3 文本合法:现有文本审核方式失效
作品文本审核是出版作品合法性的关键,主要审核作品文本是否涉嫌剽窃与抄袭。现有的期刊内置技术,可以达到迅速检测剽窃和抄袭的结果。[17 ] 但是以ChatGPT为代表的生成式AI,却在文本领域展现新的特性,使出版者避无可避。
AI生成文本能够绕过抄袭或剽窃检测点。绕过检测点的方式有两种,一种是人工智能在生成文本过程中自行绕过检测点。据研究,美国某院校的学生能使用GPT-J完成入门级编程作业,并且可以避免一种广泛使用的抄袭检测工具MOSS的抄袭检测。[18 ] 不仅如此,AI依靠的密集型“数据喂养”,经过深度合成、改编等方式生成的高质量文本,从源头起便深陷合理使用的版权争议中,且这些文本却能够轻而易举通过抄袭检测工具的测试,不禁让出版者不寒而栗。另一种方式是通过人为修改AI生成文本绕过抄袭检测。自然人可以通过AI生成基础文本,在此基础上进行置换数据、修改表述、删除或更换引注、改变引用比例等方式,去除AI生成的印记转换为自然人创作文本,致使被纳入训练系统的版权作品被隐形抄袭或剽窃。出版者更难履行审查义务,因为无法从技术和人工的角度双向识别。
人工智能擅长“伪造”文本。AIGC擅长依照逻辑思维将数据库中的资料进行拼接,由于论证系统模板的缺乏,往往形成某一领域的虚假信息,此类作品一经出版,将造成严重的欺骗性后果。纽约健康科学大学曾做过“伪造”实验,研究人员使用ChatGPT撰写关于类风湿关节药物制作的摘要,得到了专业会议的认可,然而,报告中2020年数据是ChatGPT编造的。[19 ] 研究证明生成式AI可以制造虚假数据来伪造结果,也可以逃避人工检测与人工智能技术检测。不仅如此,生成式AI能够伪造虚假的参考文献,[20 ] 而我国司法实践中将参考文献列入了出版者注意义务的审查范围。在郝永红与化学工业出版社著作权侵权纠纷案中,法院认为出版者并没有对附录中参考文献的使用情况进行必要的审查,故其未尽到出版者应尽的审查义务。① 由此,出版者对出版文本中的数据、结果以及参考文献都有审查义务,而这些要素均在人工智能“伪造”的范围之内。总之,生成式AI使传统检测工具失效,不仅加重了出版者人工审核的负担,而且使出版者落入不实信息的圈套,若以出版者未尽合理注意义务为由使其承担赔偿责任,显失公平。
3 AI生成文本影响下出版者注意义务的重新构建
AI生成文本对出版者注意义务的挑战代表着AI提供者或使用者与出版者利益诉求的冲突,若因此提高出版者注意义务标准实属牵强。基于利益平衡的正当理由,出版者的注意义务应当以其现有能力为基础,于合理限度之内重新构建。
3.1 出版授权:技术水印与权属合同的适用
依据AI生成式文本中的技术水印识别作品类型。在上文诸多期刊的声明中,要求作者明确说明AI生成文本的使用程度。2023年6月欧洲议会通过的《人工智能法案》授权草案第52条,要求AI提供者告知自然人正在使用AI系统,且AI系统的用户应当披露文本是人为生成或操作。① 我国《生成式人工智能服务管理暂行办法》第17条规定了AI提供者的相关披露义务。② 由此,出版社可以要求作者说明使用系统的主体、使用的时间、文本的具体部分和因AI产生的扩展思路,等等。除此以外,出版者需主动对稿件文本的创作过程进行审查。由于AI生成文本不易识别的特性,只能依靠AI提供者对AI生成文本的水印技术识别具体文本,如果出版者主动审查创作材料,并通过识别水印的方式判断AI生成文本,应当视为已经尽到合理注意义务。一旦超出创作材料的部分审查作品性质,出版者则处于技术不能或事实不能的现实困境。目前,AI提供者已经试图将“水印”技术融入生成式AI的系统当中,Getty Images甚至能够在扩散的输出中识别其水印修改版本的复制品。③
依据AI提供者和使用者版权权属合同为主判断版权归属。出版者以版权权属合同判断作品提供者授权出版的合法性,而AI生成文本部分的版权归属依据普通人视角无法判别,此时,AI提供者与AI使用者签订的版权授权合同成为出版者确保版权归属的重要依据。据上文所述,OpenAI及Midjourney采用不同的版权授权要件,这就要求出版者必须精确每一份版权权属合同。此时,出版者可以主动询问稿件提供者是否提供AI生成文本的版权授权合同,若稿件提供者拒绝提供,出版者仍将作品出版,视为未尽到合理注意义务;倘若出版者以谨慎态度对AI生成文本的版权权属合同进行审查仍旧侵权,司法实践也不应过分苛责,使出版者承担较重赔偿责任。着眼于AI生成文本不存在版权权属合同,出版者应主动判断作者对AI生成文本的使用是否超出合理使用的限度。如果缺少确切授权的客观依据,为避免侵权风险,出版者可将AI生成文本视为作者的引用文本,并以引注予以表示。综上所述,出版者的注意义务应当与其审查能力相一致,应当在“合理限度”内承担注意义务,不可过分苛责。
3.2 来源署名:明确来源署名审核主要因素
署名审查义务是要求出版者审查作品署名是否真实、是否完整。稿件来源审查是出版者确保署名准确性的关键。AI生成文本的署名以权属合同为重点考量,面对审查不能,出版者可主动问询作品提供者是否存在权属合同。倘若存在权属合同,出版者应主动审查,借此判断具体署名者;反之,则可依据合理使用制度进一步推断。一方面,超出合理使用范围的视为过度引用,不予出版。在沈岳明、广东旅游出版社有限公司等著作权侵权纠纷一案中,法院认为作品使用目的显然已超出“适当引用”的范畴,出版者未能证明对出版行为的授权尽到合理审查和注意义务,忽略沈岳明署名的行为侵犯了沈岳明对涉案作品享有的署名权。① 由此,超出合理使用范围且未添加作者署名,则视为侵权。另一方面,未超出合理范围的,添加引注置于文章之中,由作者署名即可。
出版者审核义务因作品类型不同而有所差异。第一类合作作品,出版者需审查是否存在未参与创作的人署名、假冒署名等情形以及署名顺序是否与全体作者共同意志一致。若稿件以自然人与AI提供者共同署名,出版者需按照合作作品进行审核,询问AI提供者的意思表示,则视为尽到合理注意义务;若稿件中存在AI生成文本,出版者应当审核其覆盖范围,核查其他部分是否同为AI生成文本,防止假冒署名或漏署名的情形。第二类法人作品,出版者应审查作者署名是“法人或其他组织”而非“个人”,若自然人利用AI创作作品,但是“法人或其他组织”与“AI提供者”非同一主体,那么出版者仍需进一步推断署名主体。第三类职务作品,出版者应当审查作者署名是否是自然人,若AI提供者的员工利用AI创作职务作品,那么出版者依据职务作品的归属判断即可,普通人员则需进一步审核相关合同关于版权权属的约定。第四类汇编作品,出版者首先审查原作品署名是否正确,其次需要结合创作过程判断自然人与AI在汇编作品创作中的贡献,最后结合自然人与AI提供者的相关协议进行判断。综上所述,面对人工智能参与创作的各类作品,版权权属约定是出版者审核署名的核心。这并非意味着出版者注意义务的提高,而仅是对出版者原有审核流程的精细化,未超出出版者注意义务的既定范围。
3.3 文本审核:技术与人工分级分类审核制
出版者文本审核义务是审查文本合法性。AI生成文本躲避抄袭和剽窃检测、伪造文本等问题,使出版者在现有的“三审三校”制度中难以负荷,其本质是先进技术演进的副作用,因此,以“技术”监督“技术”是最佳应对之策。
引入AI技术检测系统作为行业通用检测工具。现有的AI生成文本的检测工具种类繁多,例如Writer、CopyLesks、SapLing,等等。2023年3月,由我国多个单位合作研发的AIGC—X正式全网公测,可以区分AI生成文本与人工生成文本,并且准确率超过90%,能够检测文本版权、虚假文本等等问题。[21 ] 倘若AIGC—X公测顺利,出版行业可以正式引进该技术,作为一种行业通用检测工具,不仅能够提供出版保障,而且能够有效预防出版文本抄袭、剽窃、伪造等侵权风险。在通用检测工具引入之前,出版者可以选择已经正式使用,并且涵盖网络领域较广的检测工具辅助检测。一方面避免出版者落入技术盲区,承担未尽合理注意义务的赔偿责任;另一方面,能够督促作品提供者正向投稿,避免被检测问题而落入学术不端的黑名单之中。
采用分级分类方式实施技术和人工的多层审核。基于AI生成文本的比例,将稿件分为三个等级,实行不同的审核流程和标准。采用人工智能检测技术辅助人工审核的方式,将稿件分为以下三个部分:完全自然人创作的稿件、AI辅助自然人创作稿件及完全AI生成的稿件。在初审阶段进行AI检测技术,是将不合格的稿件实行基础筛选,可以节省复审与终审的人力成本。针对第一种稿件,由专业人士对稿件进行复审,提出文本存疑部分和修改意见,经作者提交证明材料与修改部分后进入三审。针对AI辅助自然人创作稿件,通过初审核对AI生成文本的贡献比例,人工审核AI生成文本的数据、结果及参考文献是否错误,再提交复审及终审环节。最后,针对完全由AI生成的文本,基础技术审核与人工审核尚有不足,另需特定领域的专业人士检测文本的道德性、政治性以及专业性,确保文本合法、合理,具有高度贡献价值才可选择。由此,针对不同级别的稿件,实行不同层次的审稿流程,不仅做到节省人力成本,而且能够保障出版者在合理范围内尽到文本合法性的注意义务。如此,作品提供者的发表权、发行权利益与出版者的出版利益得到双向保障,符合利益平衡原则。
4 结语
以ChatGPT为代表的生成式AI打破出版领域的平衡,出版业在汲取AI带来的技术红利的同时,必将承担技术附带的风险。即便AI生成文本在部分出版者中遭受抵制,也只局限于此,AI生成文本不能出版仍需商榷。伴随生成式AI技术的持续迭代升级,AI生成文本与自然人创作作品将实现出版领域的兼容并存。我国应以出版者现有能力为考量,结合理论基础与客观实践,注意认定标准的边界与限度,重塑出版者注意义务,促进出版行业的稳定发展。
* 基金项目:高等学校学科创新引智计划(B156058)资助;建立科学高效的专利无效抗辩制度研究(22JJD820028);中南财经政法大学研究生科研创新项目(202311504)。
① 依据关键词“著作权侵权”“出版者”“注意义务”,在威科先行法律信息网检索,一审案件692件,9件驳回诉求。
① (2018)京0491民初239号民事判决书。
② (2019)粤0305民初14004号民事判决书。
① (2005)朝民初字第14878号民事判决书。
① 《欧盟人工智能法案》第52条:某些AI系统的透明性义务1.提供者应确保以与自然人互动的方式设计和开发AI系统,以使自然人被告知他们正在与AI系统互动,除非从情况和使用语境中显而易见。……3.生成或操作图像、音频或视频内容的AI系统的用户,该图像、音频或视频内容非常类似于现有的人、物体、地方或其他实体或事件,并且会使人错误地认为是真实的或真实的“深度伪造”,应披露内容是人为生成或操作的。
② 《生成式人工智能服务管理暂行办法》第17条:提供者应当根据国家网信部门和有关主管部门的要求,提供可以影响用户信任、选择的必要信息,包括预训练和优化训练数据的来源、规模、类型、质量等描述,人工标注规则,人工标注数据的规模和类型,基础算法和技术体系等。
③ Getty Images(US)Inc v.Stability AI Inc,District Court for the District of Delaware, No. 1:23-cv-00135.
① (2022)浙8601民初31号民事判决书。
参考文献
View Option
[1]
STOKEL-WALKER C . ChatGPT listed as author on research papers:many scientists disapprove
[J]. Nature ,613 (2023 ):620 -621 .
[本文引用: 1]
[2]
许向东 ,郭萌萌 . 智媒时代的新闻生产:自动化新闻的实践与思考
[J]. 国际新闻界 ,2017 ,39 (5 ):29 -41 .
[本文引用: 1]
[3]
张生 . ChatGPT:褶子、词典、逻辑与意识形态功能
[J]. 传媒观察 ,2023 (3 ):42 -47 .
[本文引用: 1]
[4]
史惠斌 ,郭泽德 . 迈向智能:AIGC内容生成模式引发的出版变革
[J]. 数字出版研究 ,2023 ,2 (2 ):34 -42 .
[本文引用: 1]
[5]
施小雪 . 论出版者的合理注意义务
[J]. 中国出版 ,2018 (11 ):45 -48 .
[本文引用: 1]
[6]
Transformer GGP , ALMIRA O T , STEINN S .Can GPT-3 write an academic paper on itself,with minimal human input?
[J]. user-60f947d94c775efc5de23468 ,2021 .
[本文引用: 1]
[7]
THORP H H . ChatGPT is fun,but not an author
[J]. Science ,2023 ,379 (6630 ):313 .
[本文引用: 1]
[8]
HU G . Challenges for enforcing editorial policies on AI-generated papers
[J]. Accountability in Research ,2023 :1 -3 .
[本文引用: 1]
[9]
刘明江 . 论出版者的合理注意义务
[J]. 科技与出版 ,2004 (5 ):34 -37 .
[本文引用: 1]
[10]
GAO C A , Howard F M , Markov N S , et al . Comparing scientific abstracts generated by ChatGPT to original abstracts using an artificial intelligence output detector,plagiarism detector,and blinded human reviewers
[J]. bioRxiv ,2022 :2022.12.23.521610 .
[本文引用: 1]
[11]
Open AI . Terms of use
.[EB/OL].(2023-03-14 )[2023-06-06 ]. .
URL
[本文引用: 1]
[12]
Midjourney . Terms of Service
.[EB/OL].(2023-02-10 )[2023-06-06 ]. .
URL
[本文引用: 1]
[13]
王润贵 . 出版者的合理注意义务
[J]. 科技与出版 ,2008 (8 ):6 -9 .
[本文引用: 1]
[14]
丛立先 ,起海霞 . 生成式AI对出版业的影响及其应对:ChatGPT应用场景的视角
[J]. 新疆师范大学学报(哲学社会科学版) ,2023 ,44 (6 ):113 -122 .
[本文引用: 1]
[15]
李青文 . 论合法来源抗辩中出版者的合理注意义务
[J]. 科技与出版 ,2023 (1 ):108 -114 .
[本文引用: 1]
[16]
易继明 . 人工智能创作物是作品吗?
[J]. 法律科学(西北政法大学学报) ,2017 ,35 (5 ):137 -147 .
[本文引用: 1]
[17]
MASIC I , BEGIC E , DOBRACA A . Plagiarism detection by online solutions
[C]//ICIMTH . 2017 :227 -230 .
[本文引用: 1]
[18]
BIDERMAN S , RAFF E . Fooling moss detection with pretrain language models
[C]//Proceedings of the 31th ACM International Conference on Information & Knowledge Management ,2022 :2933 -2943 .
[本文引用: 1]
[19]
ELALI F R , RACHID L N . AI-generated research paper fabrication and plagiarism in the scientific community
[J]. Patterns ,2023 ,4 (3 ).
[本文引用: 1]
[20]
MA Y , LIU J , YI F , et al . AI vs. Human--Differentiation Analysis of Scientific Content Generation
[J]. [2023-02-22 ]. .
URL
[本文引用: 1]
[21]
深度合成内容检测平台AIGC-X发布
[EB/OL].(2023-04-23 )[2023-06-08 ]. .
URL
[本文引用: 1]
ChatGPT listed as author on research papers:many scientists disapprove
1
2023
... 数字技术创新日新月异,生成式AI加速人工智能从传统的“基础辅助工具”向“创造辅助工具”突破,人工智能生成文本(Artificial Intelligence Generated Content,简称AIGC)是其身份转变的重要表征.2022年3月,OpenAI发布生成式人工智能ChatGPT,成为AI发展历程中的重要里程碑,引领全球生成式AI风发泉涌.我国对生成式AI的监管提议也应运而生,2023年8月,我国正式施行《生成式人工智能服务管理暂行办法》,为生成式AI的健康发展和规范应用提供法律保障.技术与社会相因相生,社会保障生成式AI的发展,而生成式AI也渗透多元领域,尤其是出版领域.据权威学术出版机构Nature 统计,已有4篇以人工智能为作者的生成文本出版,[1 ] AI生成文本的出版似乎是大势所趋.然而,AI生成文本的出版却使出版者面临版权侵权的现实风险.早在2020年,我国人工智能写作第一案的落槌,就已经为我国出版业敲响警钟.更让人担忧的是,学术界热衷于研究AIGC引发的出版变革、出版融合模式等主题,却忽视了AI生成文本对出版者注意义务的潜在威胁.基于AI生成文本能够出版的前提要件,AI生成文本出版很可能导致出版者注意义务履行不能,从而失去合法来源抗辩的基础.由此,传统的出版者注意义务是否需要调适或重构,亟须得到必要的关注.本文将深度剖析AI生成文本影响出版者注意义务的因由,参考AI生成文本对出版者注意义务影响的具体表征,以利益平衡原则为基础理论,探讨AI技术革新下出版者注意义务构建的因应之策. ...
智媒时代的新闻生产:自动化新闻的实践与思考
1
2017
... 第三,AI使文本生产实现从“一般逻辑”到“辩证逻辑”的重要突破.AI最初通过“算法模板+数据”的创作模式,2014年Automated Insights公司开发的人工智能写作机器利用固定模板与搜索数据形成商业新闻,[2 ] 但这种写作方式尚未进入出版领域.AI的设计者一直试图将创作类人化,2017年,Google提出Transformer架构,试图在语言建模方面得以突破,直至2022年,ChatGPT历经多代强大算力系统的更迭达到“辩证思维”.虽基于类人化的辩证思维之下,实际上是设计者将有着“苏格拉底助产法”之称的辩论术形成算法逻辑,ChatGPT生成文本的框架即是辩证算法逻辑运行的结果.[3 ] AI生成文本的类人化逻辑的凸显,使其生成文本在一定程度上具备与出版的人类作品近乎一致的水平,出版者也不得不重视生成文本的漏洞,积极履行注意义务,防止无意间出版AI生成文本诱发版权侵权风险,AI生成文本进入出版领域终究并非永久禁止. ...
ChatGPT:褶子、词典、逻辑与意识形态功能
1
2023
... 第三,AI使文本生产实现从“一般逻辑”到“辩证逻辑”的重要突破.AI最初通过“算法模板+数据”的创作模式,2014年Automated Insights公司开发的人工智能写作机器利用固定模板与搜索数据形成商业新闻,[2 ] 但这种写作方式尚未进入出版领域.AI的设计者一直试图将创作类人化,2017年,Google提出Transformer架构,试图在语言建模方面得以突破,直至2022年,ChatGPT历经多代强大算力系统的更迭达到“辩证思维”.虽基于类人化的辩证思维之下,实际上是设计者将有着“苏格拉底助产法”之称的辩论术形成算法逻辑,ChatGPT生成文本的框架即是辩证算法逻辑运行的结果.[3 ] AI生成文本的类人化逻辑的凸显,使其生成文本在一定程度上具备与出版的人类作品近乎一致的水平,出版者也不得不重视生成文本的漏洞,积极履行注意义务,防止无意间出版AI生成文本诱发版权侵权风险,AI生成文本进入出版领域终究并非永久禁止. ...
迈向智能:AIGC内容生成模式引发的出版变革
1
2023
... 文本生成与演进的三个阶段,分别对应Web1.0时代、Web2.0时代与Web3.0时代.[4 ] 出版者在三个阶段里,承担着不同的出版义务.Web1.0时代,即1990年代中期到2004年左右,出版领域的文本创作者依旧是具有专业水平的撰稿人,出版文本专业化.出版者尚且依据2002年最高人民法院《关于审理著作权民事纠纷案件适用法律若干问题的解释》(以下简称《若干解释》)第20条的规定,承担出版行为授权、稿件来源和署名、出版物内容等审核义务,并且规定了尽到合理注意义务的证明条件.[5 ] 由于这一时期以传统出版为主导,出版文本不泛化,编辑审查能力较强,出版者履行注意义务就能够较多避免侵权之可能. ...
论出版者的合理注意义务
1
2018
... 文本生成与演进的三个阶段,分别对应Web1.0时代、Web2.0时代与Web3.0时代.[4 ] 出版者在三个阶段里,承担着不同的出版义务.Web1.0时代,即1990年代中期到2004年左右,出版领域的文本创作者依旧是具有专业水平的撰稿人,出版文本专业化.出版者尚且依据2002年最高人民法院《关于审理著作权民事纠纷案件适用法律若干问题的解释》(以下简称《若干解释》)第20条的规定,承担出版行为授权、稿件来源和署名、出版物内容等审核义务,并且规定了尽到合理注意义务的证明条件.[5 ] 由于这一时期以传统出版为主导,出版文本不泛化,编辑审查能力较强,出版者履行注意义务就能够较多避免侵权之可能. ...
Can GPT-3 write an academic paper on itself,with minimal human input?
1
2021
... AI生成文本能力随着深度学习技术优化显著提高,由短文本升级为逻辑性长文本,逐渐符合出版水平,此时出版者各持己见.第一种观点,完全接受出版和AI作者身份.2022年6月,国外某期刊发表由GPT-3为作者的一篇学术论文,不仅完全接受AI生成文本,而且承认其作者身份.[6 ] 第二种观点,完全禁止出版,且否定AI作者身份.2023年1月,Science 期刊更新编辑政策,明确禁止在作品中附带任何AI生成文本,并否认AI作者身份.[7 ] 第三种观点,要求说明AI生成部分并否认AI作者身份.以Nature 为首的部分学术期刊发布政策,禁止或遏制人工智能成为论文作者,如在论文创作中用过相关工具,作者应在“方法”或“致谢”或适当的部分明确说明.[8 ] 我国部分期刊亦采取中和的态度,例如《暨南学报》和《天津师范大学学报》(基础教育版),等等.由此,AI生成文本已纳入出版者的管理范围并逐步被认可. ...
ChatGPT is fun,but not an author
1
2023
... AI生成文本能力随着深度学习技术优化显著提高,由短文本升级为逻辑性长文本,逐渐符合出版水平,此时出版者各持己见.第一种观点,完全接受出版和AI作者身份.2022年6月,国外某期刊发表由GPT-3为作者的一篇学术论文,不仅完全接受AI生成文本,而且承认其作者身份.[6 ] 第二种观点,完全禁止出版,且否定AI作者身份.2023年1月,Science 期刊更新编辑政策,明确禁止在作品中附带任何AI生成文本,并否认AI作者身份.[7 ] 第三种观点,要求说明AI生成部分并否认AI作者身份.以Nature 为首的部分学术期刊发布政策,禁止或遏制人工智能成为论文作者,如在论文创作中用过相关工具,作者应在“方法”或“致谢”或适当的部分明确说明.[8 ] 我国部分期刊亦采取中和的态度,例如《暨南学报》和《天津师范大学学报》(基础教育版),等等.由此,AI生成文本已纳入出版者的管理范围并逐步被认可. ...
Challenges for enforcing editorial policies on AI-generated papers
1
2023
... AI生成文本能力随着深度学习技术优化显著提高,由短文本升级为逻辑性长文本,逐渐符合出版水平,此时出版者各持己见.第一种观点,完全接受出版和AI作者身份.2022年6月,国外某期刊发表由GPT-3为作者的一篇学术论文,不仅完全接受AI生成文本,而且承认其作者身份.[6 ] 第二种观点,完全禁止出版,且否定AI作者身份.2023年1月,Science 期刊更新编辑政策,明确禁止在作品中附带任何AI生成文本,并否认AI作者身份.[7 ] 第三种观点,要求说明AI生成部分并否认AI作者身份.以Nature 为首的部分学术期刊发布政策,禁止或遏制人工智能成为论文作者,如在论文创作中用过相关工具,作者应在“方法”或“致谢”或适当的部分明确说明.[8 ] 我国部分期刊亦采取中和的态度,例如《暨南学报》和《天津师范大学学报》(基础教育版),等等.由此,AI生成文本已纳入出版者的管理范围并逐步被认可. ...
论出版者的合理注意义务
1
2004
... 出版授权行为的审查是对“作品提供者”拥有复制权和发行权两项权利的合法性审查.[9 ] 主要通过两层审查,一是出版者依据创作过程的确认审查作品提供者身份.二是若并非原作者,则通过授权合同或其他合同的审查,判断作品提供者授权的合法性.AI生成文本将导致出版者履行授权审查义务步履维艰. ...
Comparing scientific abstracts generated by ChatGPT to original abstracts using an artificial intelligence output detector,plagiarism detector,and blinded human reviewers
1
2022
... 第一层审查主要以“创作过程”为审核作品提供者身份的依据,然则创作过程由于AI介入导致审核难度增大.审查作品提供者身份,创作过程的审核是一个必经程序.作品提供者身份有作者与非作者之分,AI介入后呈现自然人、自然人和AI、AI自主的三种类型.出版者无法围绕自然人提供的创作材料等资料明确作品的创作过程,甚至作品的具体类型.国外一项研究曾验证AI生成文本是否会被专业人士识别,实验结果显示,摒弃AI的生成身份,AI生成文本不仅通过了技术检测,甚至人工审核完毕仍留存14%的AI生成文本被错认为自然人创作.[10 ] 事实证明,AI生成文本具备混淆人工智能的能力,出版者无疑需花费巨大的人工审核成本.出版者在审核中将遭遇作品类型无法判定与无法审核作品授权合同的难题,极易被法院认定为合理注意义务的履行失职,寻求破题之策极为重要. ...
Terms of use
1
... 第二层审查基于“授权合同”判定作品出版的授权合法性,但AI生成文本使授权合同链条庞杂,出版者稍有不慎则落入侵权陷阱.以人工智能写作第一案为例,法院认为AI生成文本符合法人作品要件,将案件文本归属于AI提供者.当AI生成文本使用者与制造者并非同一主体,将导致单一制度适用移位.因此,出版者以AI提供者与使用者之间的版权协议为AI生成文本的版权归属依据具有实际可操作性.不同的AI提供者与使用者之间版权协议规定不一.OpenAI公司发布的AI使用条款中规定,用户可拥有所有AI输入与输出的所有权利,用于任何销售或出版等商业目的.[11 ] 与此不同,智能画图工具Midjourney使用协议中说明,图像版权取决于是否是付费用户.[12 ] 因此,在版权协议缺失或者特殊情形下版权归属的难以证成,以及未约定情形的规则疏漏,都将无法实现出版者对作品提供者授权行为的有效判断,难以避免侵权陷阱. ...
Terms of Service
1
... 第二层审查基于“授权合同”判定作品出版的授权合法性,但AI生成文本使授权合同链条庞杂,出版者稍有不慎则落入侵权陷阱.以人工智能写作第一案为例,法院认为AI生成文本符合法人作品要件,将案件文本归属于AI提供者.当AI生成文本使用者与制造者并非同一主体,将导致单一制度适用移位.因此,出版者以AI提供者与使用者之间的版权协议为AI生成文本的版权归属依据具有实际可操作性.不同的AI提供者与使用者之间版权协议规定不一.OpenAI公司发布的AI使用条款中规定,用户可拥有所有AI输入与输出的所有权利,用于任何销售或出版等商业目的.[11 ] 与此不同,智能画图工具Midjourney使用协议中说明,图像版权取决于是否是付费用户.[12 ] 因此,在版权协议缺失或者特殊情形下版权归属的难以证成,以及未约定情形的规则疏漏,都将无法实现出版者对作品提供者授权行为的有效判断,难以避免侵权陷阱. ...
出版者的合理注意义务
1
2008
... 稿件来源与署名的审核包含审查稿件来源和稿件署名的准确性.[13 ] 在此审核标准下,出版者对AI参与生成的稿件,首先需要判断的就是在不同的作品类型下,如何确认AI与自然人的创作关系,以此确认署名的“作者”是否是真正的作者. ...
生成式AI对出版业的影响及其应对:ChatGPT应用场景的视角
1
2023
... 以合作作品为例,出版社需判断稿件是否构成著作权法意义上的合作作品.ChatGPT等生成式AI能够通过数据训练模仿用户的写作风格,并且与用户的作品在表现形式上呈现近似性.[14 ] 在传统的合作作品中,出版者通常困于多位作者共同授权的高成本之中,且出版者对合作作品的知情程度也深浅不一.[15 ] 在合作作品中,合作作品是由自然人与AI共同创作而成,出版社需要判断AI生成文本的版权归属问题.在当下学界和出版界,人工智能不被赋予作者身份几乎达成共识,合作作品的署名问题似乎不在出版者考量范畴.事实并非如此,倘若按照AI提供者与AI使用者的版权授权协议,AI生成文本是由AI提供者享有版权,缺少AI提供者署名的合作作品出版后,出版者将面临未尽合理注意义务的侵权赔偿责任.此时,在生成式AI提供者与使用者未曾签署版权协议的情况下,出版业缺乏判断的专业性,更难对合作作品的署名进行认定. ...
论合法来源抗辩中出版者的合理注意义务
1
2023
... 以合作作品为例,出版社需判断稿件是否构成著作权法意义上的合作作品.ChatGPT等生成式AI能够通过数据训练模仿用户的写作风格,并且与用户的作品在表现形式上呈现近似性.[14 ] 在传统的合作作品中,出版者通常困于多位作者共同授权的高成本之中,且出版者对合作作品的知情程度也深浅不一.[15 ] 在合作作品中,合作作品是由自然人与AI共同创作而成,出版社需要判断AI生成文本的版权归属问题.在当下学界和出版界,人工智能不被赋予作者身份几乎达成共识,合作作品的署名问题似乎不在出版者考量范畴.事实并非如此,倘若按照AI提供者与AI使用者的版权授权协议,AI生成文本是由AI提供者享有版权,缺少AI提供者署名的合作作品出版后,出版者将面临未尽合理注意义务的侵权赔偿责任.此时,在生成式AI提供者与使用者未曾签署版权协议的情况下,出版业缺乏判断的专业性,更难对合作作品的署名进行认定. ...
人工智能创作物是作品吗?
1
2017
... 当作品的作者隐瞒作品中具有生成式AI创作文本的事实,虽有被认定为学术不端的风险,但出版者的审核技术目前还未能准确检测,容易给有心之人留有可乘之机.以汇编作品为例,人工智能生成文本属于对现有数据资料的编排,其文本已经达到或接近汇编作品的标准.[16 ] 当某汇编作品的作者是利用生成式AI数据抓取技术生成汇编作品,转而作为作者署名进行投稿,出版社无法依据其提供的创作材料判断AI贡献率.换言之,无法判断稿件上的现有“作者”是否属于假冒,是否属于未参与而不应当署名的情形,以及原作品著作权人的署名是否正确或者有无遗漏.如此一来,AI生成文本实际上加剧了出版者在稿件来源与署名上的专业审核难度,出版者难以脱离未尽合理注意义务的困境. ...
Plagiarism detection by online solutions
1
2017
... 作品文本审核是出版作品合法性的关键,主要审核作品文本是否涉嫌剽窃与抄袭.现有的期刊内置技术,可以达到迅速检测剽窃和抄袭的结果.[17 ] 但是以ChatGPT为代表的生成式AI,却在文本领域展现新的特性,使出版者避无可避. ...
Fooling moss detection with pretrain language models
1
2022
... AI生成文本能够绕过抄袭或剽窃检测点.绕过检测点的方式有两种,一种是人工智能在生成文本过程中自行绕过检测点.据研究,美国某院校的学生能使用GPT-J完成入门级编程作业,并且可以避免一种广泛使用的抄袭检测工具MOSS的抄袭检测.[18 ] 不仅如此,AI依靠的密集型“数据喂养”,经过深度合成、改编等方式生成的高质量文本,从源头起便深陷合理使用的版权争议中,且这些文本却能够轻而易举通过抄袭检测工具的测试,不禁让出版者不寒而栗.另一种方式是通过人为修改AI生成文本绕过抄袭检测.自然人可以通过AI生成基础文本,在此基础上进行置换数据、修改表述、删除或更换引注、改变引用比例等方式,去除AI生成的印记转换为自然人创作文本,致使被纳入训练系统的版权作品被隐形抄袭或剽窃.出版者更难履行审查义务,因为无法从技术和人工的角度双向识别. ...
AI-generated research paper fabrication and plagiarism in the scientific community
1
2023
... 人工智能擅长“伪造”文本.AIGC擅长依照逻辑思维将数据库中的资料进行拼接,由于论证系统模板的缺乏,往往形成某一领域的虚假信息,此类作品一经出版,将造成严重的欺骗性后果.纽约健康科学大学曾做过“伪造”实验,研究人员使用ChatGPT撰写关于类风湿关节药物制作的摘要,得到了专业会议的认可,然而,报告中2020年数据是ChatGPT编造的.[19 ] 研究证明生成式AI可以制造虚假数据来伪造结果,也可以逃避人工检测与人工智能技术检测.不仅如此,生成式AI能够伪造虚假的参考文献,[20 ] 而我国司法实践中将参考文献列入了出版者注意义务的审查范围.在郝永红与化学工业出版社著作权侵权纠纷案中,法院认为出版者并没有对附录中参考文献的使用情况进行必要的审查,故其未尽到出版者应尽的审查义务.① 由此,出版者对出版文本中的数据、结果以及参考文献都有审查义务,而这些要素均在人工智能“伪造”的范围之内.总之,生成式AI使传统检测工具失效,不仅加重了出版者人工审核的负担,而且使出版者落入不实信息的圈套,若以出版者未尽合理注意义务为由使其承担赔偿责任,显失公平. ...
AI vs. Human--Differentiation Analysis of Scientific Content Generation
1
... 人工智能擅长“伪造”文本.AIGC擅长依照逻辑思维将数据库中的资料进行拼接,由于论证系统模板的缺乏,往往形成某一领域的虚假信息,此类作品一经出版,将造成严重的欺骗性后果.纽约健康科学大学曾做过“伪造”实验,研究人员使用ChatGPT撰写关于类风湿关节药物制作的摘要,得到了专业会议的认可,然而,报告中2020年数据是ChatGPT编造的.[19 ] 研究证明生成式AI可以制造虚假数据来伪造结果,也可以逃避人工检测与人工智能技术检测.不仅如此,生成式AI能够伪造虚假的参考文献,[20 ] 而我国司法实践中将参考文献列入了出版者注意义务的审查范围.在郝永红与化学工业出版社著作权侵权纠纷案中,法院认为出版者并没有对附录中参考文献的使用情况进行必要的审查,故其未尽到出版者应尽的审查义务.① 由此,出版者对出版文本中的数据、结果以及参考文献都有审查义务,而这些要素均在人工智能“伪造”的范围之内.总之,生成式AI使传统检测工具失效,不仅加重了出版者人工审核的负担,而且使出版者落入不实信息的圈套,若以出版者未尽合理注意义务为由使其承担赔偿责任,显失公平. ...
深度合成内容检测平台AIGC-X发布
1
... 引入AI技术检测系统作为行业通用检测工具.现有的AI生成文本的检测工具种类繁多,例如Writer、CopyLesks、SapLing,等等.2023年3月,由我国多个单位合作研发的AIGC—X正式全网公测,可以区分AI生成文本与人工生成文本,并且准确率超过90%,能够检测文本版权、虚假文本等等问题.[21 ] 倘若AIGC—X公测顺利,出版行业可以正式引进该技术,作为一种行业通用检测工具,不仅能够提供出版保障,而且能够有效预防出版文本抄袭、剽窃、伪造等侵权风险.在通用检测工具引入之前,出版者可以选择已经正式使用,并且涵盖网络领域较广的检测工具辅助检测.一方面避免出版者落入技术盲区,承担未尽合理注意义务的赔偿责任;另一方面,能够督促作品提供者正向投稿,避免被检测问题而落入学术不端的黑名单之中. ...