玫瑰荆棘:生成式AI赋能数字出版内容生产的逻辑、机遇与隐忧
关键词:
本文引用格式
揭其涛, 王奕诺.
近年来,在数字技术的推动下,越来越多的传统产业开始拥抱“数字浪潮”,出版业由此进入数字化时代,并不断以智能化的媒介技术赋能内容生产。数字化从出版业内容生产的辅助因素上升为主导因素,引发了出版业内容生产的范式革命。在这场席卷全球的数字化浪潮中,“数字出版开始依托平台等互联网数字基础设施,在包括如网络文学平台、短视频平台、数字音乐平台和知识付费平台中进行内容价值生产与传播”[1]。由于数字出版内容生产与智能技术紧密相连并深刻影响其内容生产的全过程,因而新兴智能技术在数字出版内容生产中的应用尤为引人关注。
2022年底,OpenAI公司开发的生成式人工智能(Artificial Intelligence,AI)应用ChatGPT火爆全球,随之在各个行业引发热议。2024年初,OpenAI公司推出视频生成模型Sora,其可根据文本指令创建现实且富有想象力的场景,生成多种风格、不同画幅、最长为一分钟的高清视频,它能够将人们的想象力转化为生动的动态画面,将文字的魔力转化为视觉的盛宴。在生成式AI浪潮奔涌而来的背景下,如何正确认识生成式AI对数字出版内容生产引发的变革,分析其特征并反思技术作用下数字内容生产的精神内核,成为推动数字出版新发展的必由之路。由于生成式AI技术侧重于对技术理性的追求,缺乏人本主义的想象力,人类社会因对智能技术理解的不足而担忧个体自我生存是否被挤压,阻碍了数字技术与人类主体性之间的融合进程,因而需要形成客观的认识论,并复归本源意义的技术观。本文以生成式AI逐渐走进公众的生活场景和媒介实践为背景,讨论生成式AI以怎样的逻辑赋能数字出版内容生产,带来了哪些变革、机遇和问题,以此推动人们对技术的习惯性反思,从而更加全面地认识生成式AI和数字平台内容生产之间的联结。
1 生成式AI赋能数字出版内容生产的逻辑
生成式AI的底层逻辑是以对话式(人—机共创)的内容生成方式,构造一个聚合公私领域无限数据资源的语义训练模型。这种逻辑深度变革着数字出版的内容生产,一方面聚合了人类既有的知识,另一方面在数字出版内容生产中形成了自身特有的技术性逻辑、生产性逻辑和内容性逻辑。
1.1 技术性逻辑:个性化的技术定制与拟真性的共情交流
从技术性逻辑来看,生成式AI的代表ChatGPT的技术基础是大型语言模型(Large Language Model,LLM),是通过海量数据的输入并进行预训练后诞生的新型生成式AI。虽然ChatGPT以聊天机器人的形式出现,但却拥有一定的语言理解能力,能够自动完成视频脚本、文案、代码、音视频等内容的创作任务。生成式AI的内容生产之所以如此受人青睐,在一定程度上与其“千人千面”的个性化内容定制紧密相关。对于经典的文学及艺术作品而言,“一千个读者就有一千个哈姆雷特”,生成式AI的内容生产则因为用户自有数据库接入的不同、文化圈层的不同,以及提问方式和用户目标需求的不同,实现了完全个性化的内容生产。目前生成式AI和其他AIGC应用已经能够为数字出版平台创作大量的诗歌、论文、专著、绘画、音乐作品,可以预见未来在用户参与下的个性化内容将进一步丰富这种内容生产。
基于这种技术性逻辑下个性化的内容定制,生成式预训练转译器(generative pre-trained translator)模仿人类的对话模型,在深层次上介入了人类的精神情感,实现了拟真化的共情交流,“最终创造出一个一加一大于二的新的更强大的心智系统,即延伸的心灵”[2]。拟真度(Verisimilitude)是对人的认知、偏好、情感、行为等维度的模拟相似度,依赖于技术维度的触感体验与真实交流。在人们接触生成式AI的过程中,已将其转化为一种虚构的个体化想象,依赖于一种虚构形态,如同在我们面前进行对话的个体一样。[3]正因如此,在具体内容生产时,生成式AI展现出强大的语言理解和生成能力,可以根据用户的输入和上下文,生成自然和流畅的回复,模拟人类的对话方式和风格。在技术逻辑的主导下,生成式AI通过识别用户的情绪及意图,给予合适的反馈建议,以增强对话的亲密度和信任感。
1.2 生产性逻辑:交互性的内容生产与主体性的思维联结
生成式AI的生产性逻辑涉及两个层面。第一是数据语料的来源,生成式AI通过大量语料库和数据库的积累,建立起一个庞大且复杂的数据语料库。第二是生成模型,基于图片、文字、视频等多种类的语料库,生成式AI最终形成一个建立在基本“语言逻辑”基础上的通用模型生成内容。生成式AI将与用户持续对话,不断对用户需求进行识别、学习和反馈,并进行结构化处理以最终实现更优质内容的生产。生产性逻辑下的交互性区别于人类固有的思考习惯,带有随意性和突发性,虽然生成式AI所有的语料库都源自人类世界,但是不同语料之间的交互、组合、搭配却能产生完全不一样的效果。尽管这种交互性的内容生成饱受争议,例如语言学家乔姆斯基就明确提出,ChatGPT只是一种高级剽窃的工具,“它从海量数据中发现规律,并且把这些数据串联在一起,使它看起来或多或少像是人写的关于某个主题的内容”[4]。
生产性逻辑使生成式AI在数字出版平台的内容生产中打破了以往内容创作时主体性的思维局限,通过人机协作实现了个体思维与数据语料的联结。从以往的数字出版内容生产来看,内容创作之初必须通过主体的思辨与考量,虽然可以通过选题预测、大数据分析等方式确定创作主题及内容,但此时个体间的思维依然是独立存在的,思想之间的交流存在壁垒。而生成式AI则打破了交往的阻隔,实现了人类思维的互通共融。在海量数据库中,生成式AI使用了Transformer的神经网络结构,它由多个编码器层和解码器层组成,每一层都使用了注意力机制来捕捉输入和输出之间的关系。Transformer结构使得模型能够处理长序列的文本,并且具有极强的联结能力。从目前的实践来看,AIGC算法中蕴藏的归纳、总结、推理等思维能力甚至已经超出了大部分人类的水平。[5]生产性逻辑下,生成式AI思维的联结同时还包含文字、图片、音频、视频等多模态的数字出版内容,甚至可以向出版物提供虚拟数字人、3D模型等,真正做到思维的无限延伸。这种联结也意味着个体在内容创作时可以穿透社会网络的层层壁垒与沟壑,实现公私域数据资源的连接整合和协同利用。
1.3 内容性逻辑:开放式的内容创作与超链接的无限循环
生成式AI的内容性逻辑在于其开放式的内容创作与超链接的无限循环。作为一种“向外寻求”的高效生产工具,生成式AI以开放式的姿态强调利用外部资源,即数据语料库中的知识、想法和渠道,与用户对数字出版内容的能力、需求、目标和价值相结合,实现高效、优质、多样化的创新内容生产。这种开放式的特质使得生成式AI在内容生产时能够具备更广阔的想象空间,可以实现广泛、深入、持续的内容创新。例如,ChatGPT已经能够适配多种文本交互的编辑需求,从体育、财经类新闻稿的编写,到文化娱乐、编程办公的信息处理,都能以开放式的内容生产创作出具备个性化气质的内容。
与此同时,在内容性逻辑主导下,开放式的内容创作呈现出超链接无限循环的特质,意味着即便是同一个问题,生成式AI也能够生成无穷无尽的答案,因为不同语料数据的结合会产生截然不同的效果。从技术角度来看,生成式AI的核心技术之一在于预训练语言模型训练,即使用无监督学习算法对大规模文本数据集进行训练,以学习、理解和生成自然语言。因此,在内容的生成过程中,算法会以超级链接的形式抓取语料信息进行内容生产,而这一过程又始终在其已有的数据语料库中完成,引起“海量数据语料库—内容生产—海量数据语料库”的无限循环。也就是说,生成式AI所生产的内容同时也是其数据语料库的来源,这样就形成了一个莫比乌斯环,“一个只有一个表面,只有一个表面不能被翻过来,如果你把它翻过来,它仍然会和自己一样”[6]。正因如此,许多出版机构禁止ChatGPT成为合著者,毕竟其没有真正实现创新性的知识生产,只是在数据语料的循环链接中重新组合内容。
2 生成式AI赋能数字出版内容生产的机遇
相较于当前简单用于新闻稿撰写、数字内容创作、辅助审校等工作的人工智能,以ChatGPT为代表的生成式AI已然开始走向强人工智能,预示着新一代生成式AI将激发一系列连锁反应,给数字出版内容生产带来新的机遇。
2.1 大规模精细化语言模型与内容生产数据库的建构
数据是ChatGPT、Sora等生成式AI的技术基底和源头活水,对于数字出版而言,数据同样是最重要的生产要素和能源动力,生成式AI的大规模精细化语言模型能够“在个体需求指令的基础上展开合理的推理想象,实现更加细腻和精准的连接”[7],为数字出版内容生产提供源源不断的微粒化数据资源。
生成式AI的代表ChatGPT使用了GPT-3.5系列的语言模型作为基础,在上线4个月后更新了GPT-4.0版本。ChatGPT旨在利用大量的文本数据来训练AI模型,并通过人类反馈和对话数据进一步提升其性能和质量,从而为用户提供一个开放、智能、创造性的平台。用户在数字平台中的浏览历史、搜索痕迹、消费行为均可以被识别、分类并处理为数据源供算法学习。这种极大参数量的模型聚合了海量数据,完全区别于以往的粗放式信息资源,能够精准匹配用户的认知习惯、价值追求和微妙情趣,从而为数字出版内容生产建构庞大的数据库。用户可以通过查询、过滤、排序等方式检索并使用这些内容。内容生产数据库也可以帮助用户找到他们需要的信息,激发他们的创造力,进而实现智能化信息处理、数据整合、创作等任务。未来,这种内容生产数据库的建构还将进一步贴合国家文化战略与意识形态安全,如筹建中华优秀传统文化数据语料库、中国特色社会主义数据语料库等,需要对数字出版内容生产的特定语料进行训练,确保内容生产进一步契合主流价值观。
内容生产数据库的建构主要有三个步骤。第一是数据采集与整理,从广泛且多样化的来源收集数据,包括但不限于公开网络资源、专业文献库、知识库和专门领域的数据库,并在此基础上对原始数据进行清洗处理、标签与标注。第二是在对接内容生产数据库需求的基础上,设计数据库架构、将整理好的数据有效载入数据库系统,以便快速检索和分析。针对内容生产数据库设立严格的审查流程,避免违规信息和不实信息的流入。对于非原创内容,需遵循相应的版权法律和使用协议,确保合法合规地使用和存储。第三是模型训练,利用上述构造的数据集对大规模语言模型进行预训练,使其能够学习通用的语言模式和上下文理解能力。随着数据库的不断扩展和更新,内容数据库需要持续更新与迭代,定期对模型进行微调或增量训练,保持模型对最新内容趋势的捕捉能力。
2.2 “人—机共创”的内容生产模式打造超高效率生产
生成式AI以“用户提问”为驱动,自主生成满足用户知识需求的内容生产。这种“人—机共创”的内容生产有着超高效率,一方面体现在其能够在极短的时间内迅速实现数字出版内容的生成,生成式AI利用最先进的语言模型技术,可以理解并生成自然语言,也可以根据不同的任务和领域进行微调和适应。另一方面,这种超高效率能够通过与用户的交互和反馈提升其性能和质量,这为用户提供了多种方式控制和指导内容的生成,如设置主题、风格、长度、关键词等。人类和AI之间协作创造的过程强调双方的互补性和协同性,共同参与内容的生成、修改、评估和应用以达到更好的效果和价值。
这种超高效率生产模式有三个特点。第一是AI可以根据内容的需求和目标,不断地调整其角色和贡献,实现最佳的协作方式。AI通过对话、反馈、建议等方式,与用户进行有效的沟通和交流,提高内容的质量和适应性,并且不断借助人类的想象力与AI的数据库,生成新颖和有意义的内容,增加内容的多样性和丰富性。第二是针对用户的多元化、个性化需求,生成式AI突破了搜索引擎对检索结果相关性排序的模式,在线实时对话能够精准满足用户需求,千亿级的预训练积累使得ChatGPT能为用户提供更高质量的信息。[8]例如,通过自动生成视频脚本提升短视频的拍摄效率、生成文稿激发创作者的灵感,并且在汇编类出版物、翻译类出版物的实践中进一步提高生产效率,甚至于翻译一本20万字的图书仅需花费数十秒的时间。第三是这种高效率的内容生产将极大地推动数字出版平台中的消费更新,重构视听化、多样态的数字出版内容,促进全功能、多场景、交互性出版物的发展,进一步对互联网经济、文化、艺术等产生正向积极的影响。
2.3 技术对个体能力的赋权促进内容生产边界的消融
通用大模型在数字出版的内容生产中具有明显的个体赋权效应。生成式AI逐渐成为下一代的网络入口,数字出版内容生产的绝大部分任务都将由AI完成,这意味着生成式AI将突破社会资源整理利用的局限,将传播权下沉至更为广泛的个体。Web 3.0时代,生成式AI对内容进行再赋能,驱动平权结构的涌现,人类要素与非人类要素逐渐占据平等地位。[9]传统意义上的内容生产面临多重“知沟”的阻碍,接入沟、能力沟和使用沟限制个体实践。而生成式AI则强力弥合了“知沟”,极大降低了个体在数字出版平台中的自我表达门槛,理论上每个人都可以进行内容生产与传播对话,以此获得更多的信息、知识、能力、机会和权利,个体进而获得更加广泛意义上的社会链接与深度化赋能。
生成式AI对个体的数字出版内容生产进行重大赋能赋权不仅推动了社会的智能化启蒙,同时消融了以往内容生产的边界。在传统内容生产时代,内容生产者通常是专业的媒体机构或个人,他们拥有专业的设备、技术、资金和渠道,可以制作和发布各种类型的内容,如短视频、新闻、广告、电影、音乐等。内容消费者则是普通的大众,他们只能被动地接受和消费生产者提供的内容。这样就形成了一个由上而下、由少数到多数、由中心到边缘的内容生产模式。它使人类实现了从有限性经验生产到无限性数据生产的跨越,并且极大延伸了人类的各项能力,全面消融了以往的内容生产环节。
3 生成式AI赋能数字出版内容生产的隐忧
以ChatGPT为代表的生成式AI应用于数字出版与信息生产领域,在一定程度上代表了技术乐观主义与技术功利主义的胜利,因此有学者在一定程度上将之等同于“超人类主义”(transhumanism),即意味着“利用科学进步对当前人类的体能、智力、情感和道德等方方面面进行改善的浩大工程”[10]。但更值得反思的还有AI技术背后所内含的风险与隐忧,同时要清醒地认识到生成式AI在数字出版平台进行内容生产时的局限性。
3.1 内容生产的互文性导致灵韵消逝
互文性(intertextualité)是指在一个文本的空间里,取自其他文本的各种陈述相互交叉,相互中和,这恰恰是生成式AI在数字出版内容生产时的核心姿态。本质上而言,生成式AI内容生产中的任何文本构成都是一些引文的拼接,任何文本都是对另一个文本的吸收和转换。这种援引性和编织性的生产模式使得生成式AI的内容生产面临前所未有的风险,尤其是一些有本可依的引用、套用、影射、抄袭、重写等关系,都在这种风险之下变得难以辨别。正如前文所言,生成式AI的内容生产不是封闭、同质、统一的,而是开放、异质、破碎、多声部的犹如马赛克一样的拼贴。
在本雅明看来,人类的机械复制技术摧毁了艺术品的灵韵,即萦绕伟大的艺术作品的光晕,以及在特定空间中人与作品构成的某种氛围。[11]这种灵韵具有独一无二的本真性,是其起源时就流传部分的总和,以物质上的存有达到历史的见证性。艺术作品的灵韵源自艺术家独一无二的创造,但是生成式AI则是固化地、有限地、静止地进行内容生产,难以糅合历史、地方、习俗、生活等微妙的特质,因此导致了灵韵的消逝。在某种程度上,真正富有创造价值的数字出版内容生产总是能够包含个体生命情感,虽然在出版物中是微小的、纤细的、不易被察觉的甚至不可见的,但正是这种不可见的细微感知,在生产与传播的过程中,会产生意想不到的力量,构成出版物对个体、社会特殊的作用与想象。
面对灵韵消逝,一方面要通过混合智能创新,例如倡导人机协同的创作模式,将生成式AI作为辅助工具,用于内容素材挖掘、创意启发或初稿生成,而人类作者则负责深度加工、个性化润色及注入人文精神,确保作品具有丰富的互文性和独特性。另一方面,要通过算法优化与约束,改进生成式AI模型,例如在训练过程中注重对人类历史文化遗产的理解和传承,设置规则让生成式AI在创作时能够识别并尊重互文性,避免单纯模仿和复制已有文本,鼓励算法结合特定的文化习惯和受众偏向进行创造性内容生产。
3.2 理解偏差的误导性催生内容异化
理解偏差是指生成式AI并不真正理解它所生成文本的含义、背景和目的,而只是根据数据中的统计规律和概率模式来生成文本。这意味着生成式AI可能会忽略或错误地处理一些重要的信息,例如事实、证据、逻辑、价值观等。由此所产生的误导性回答会使生成式AI所生成的文本给用户传递错误、不准确或有偏见的信息,从而影响用户的判断和决策。这些信息可能来自于生成式AI训练数据中存在的错误、偏见或虚假内容,也可能来自于生成式AI自身在生成过程中的随机性、不一致性或编造性。因其学习和训练的语料主要以英语等西方语言文化为基础,所以不可避免地含有意识形态的成分,将导致输出内容存在偏见、偏差。并且生成式AI训练数据的不确定性和不透明性,导致其可能承接训练数据的偏见,或者遭遇对抗性的恶意输入,这些都是比较致命的局限。[12]这种现象可能会对科学研究、教育、医疗、心理等领域带来负面影响,因此使用生成式AI进行内容生产时需要谨慎和批判地检查并验证其输出,并保持人类对科学实践和知识传播的责任与透明度。
解决理解偏差所导致的误导性问题,首先,需要对数据质量进行控制,使数据经过严格的质量审核和清洗,去除不准确、过时或有明显倾向性的信息。其次,采用先进的深度学习模型,并结合监督学习策略,让模型在训练过程中不断接受人工标注的真实案例指导,提高其输出内容的准确性和客观性。最后,结合偏差检测与修正机制,建立有效的偏差检测系统,在AI生成内容后进行实时监测,及时发现并纠正可能存在的误解或误导性内容。与此同时,可以设立多层审核流程,包括机器自动筛查和人工复核,例如,OpenAI承诺在产品中使用Sora前将采取安全措施,包括由“错误信息、仇恨内容和偏见等领域的专家”对模型进行对抗性测试以评估危害或风险;核查并拒绝包含极端暴力、性内容、仇恨图像、他人IP等文本输入提示等。
3.3 技术尺度的主导性引发主体危机
普罗泰戈拉认为“人是万物的尺度”,而在生成式AI的内容生产中,人只是提出需求,技术尺度成为主宰内容生产的核心存在。但遗憾的是,目前人们始终无法透明地知悉这种“尺度”的基本逻辑或准则,人类对其算法规则知之甚少。也就是说,人的感性实践在内容生产中失去了力量,使其对人主体性的思考再次陷入先验主义的窠臼之中。这种主体危机体现在两个方面:一方面,生成式AI降低了人类劳动的积极性和主动创造性,使之逐渐沦为技术的附庸。需要警惕的是,“人工智能把技术创新的目标从解放体力转向解放智力,从‘征服’自然转向有可能‘征服’人类自身”。[13]另一方面,生成式AI可能会带来如下问题:①生成虚假、有害的信息,误导或操纵用户;②侵犯用户的隐私及版权,滥用或窃取用户的数据作品;③可能会超越、取代人类在某些领域或职业中的角色功能,削弱并破坏人类的价值意义;④与人类产生竞争与冲突,威胁人类的利益安全。这些主体危机导致生成式AI对人类作为语言使用者和创造者的身份产生了挑战,可能带来人类在认知、情感、道德和社会等方面出现困惑、不安、失落和冲突等负面影响。
应对主体危机,首先,必须强调原创价值,尽管AI可以高效地生成大量内容,但应强化对原创性、独特见解和深度思考的重视,确保人类作者的核心创造力不被忽视。鼓励业界设立相应标准,明确区分AI辅助创作与纯AI生成内容,并给予原创作品应有的尊重和保护。其次,对生成式AI的应用边界加以管控,建立起对AI生成内容的管理法规,对利用AI生成和传播的不良不实内容进行规避。最后,加强治理工具的开发,通过技术手段识别生成式AI在数字出版平台中所生成的内容。
4 结语
未来,以ChatGPT、Sora为代表的生成式AI将在数字出版内容生产、“出版+虚拟现实”、“元宇宙出版”等出版新形态中取得实质性的突破。生成式AI在数字出版内容生产中利用大规模语言模型突破了人类思维的壁垒,凭借海量数据的组合设计为内容生产提供更加多元的创意空间。诚然,这种变革是令人惊叹的,其趋势也是不可逆转的,人类的确会在现实层面上依赖AI的辅助。但也要认识到,人类本身的灵感、创造力及想象力才是推动数字出版在知识文化内容生产方面变革与进步的源泉。在建设数字中国,走向数字出版文化大繁荣的征程中,数字出版的内容生产仍需审慎前进,方能行稳致远以拥抱更为广阔的未来。
参考文献
/
| 〈 |
|
〉 |
