科技与出版, 2023, 42(8): 5-13 doi: 10.16510/j.cnki.kjycb.2023.08.004

专稿·深入学习贯彻党的二十大精神

历史、变革与赋能:AIGC与全媒体传播体系的构建*

胡正荣1), 樊子塽2)

1)中国社会科学院新闻与传播研究所,110000,北京

2)中国传媒大学传播研究院,100024,北京

摘要

OpenAI公司对话式人工智能ChatGPT的发布,引发了全球社会人工智能内容生成的狂潮,AI再一次以颠覆式的姿态出现在人类面前。AIGC的发展经历了规则驱动的实验、机器学习的崛起、深度学习的革命、生成智能的突破四个阶段,从生产者、生产方式和内容消费三个层面深度变革了当前全媒体内容生产体系。与此同时,AIGC也将从多个层面赋能全媒体传播体系的构建。

关键词: 人工智能 ; AIGC ; 内容生产 ; 全媒体传播体系

PDF (1479KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

胡正荣, 樊子塽. 历史、变革与赋能:AIGC与全媒体传播体系的构建*. 科技与出版[J], 2023, 42(8): 5-13 doi:10.16510/j.cnki.kjycb.2023.08.004

在邓小平提出的重要论断“科学技术是第一生产力”的指导下,中国在改革开放的数十年间取得了巨大的发展进步。科技的进步推动了人类社会的结构变革,特别是新一轮科技革命的迅猛发展,加速推动人类社会迈向工业4.0的进程,引领了产业变革向更深层次的方向发展。新一轮科技革命也是世界百年未有之大变局产生的内在因素之一。正如习近平总书记在致2021年世界互联网大会乌镇峰会的贺信中写道:“数字技术正以新理念、新业态、新模式全面融入人类经济、政治、文化、社会、生态文明建设各领域和全过程,给人类生产生活带来广泛而深刻的影响。”

在过去的两年里,以数字技术和智能技术为主要驱动力的媒介技术的快速发展,显著地改变了人们的生活方式。2021年,人们满怀兴奋和忐忑地迎接了“元宇宙元年”的到来,短短一年之后,又在2022年底见证了一场颠覆式的新技术革命,即ChatGPT、DALL·E 2、Topaz Video AI等生成式人工智能(Generative AI)应用的广泛问世。生成式人工智能的普及,将AI从科幻作品的想象正式引入人们的日常生活,使得“元宇宙”的实现真正成为可能,同时掀起了人工智能生成内容(artificial intelligence generated content,AIGC)的创作浪潮,将人类社会的信息生产和信息泛滥推向了另一座高峰。

毫无疑问,AIGC的出现,是内容创作领域的一次巨大飞跃,为广大用户提供了更多的创作灵感,内容创作过程变得更加高效。与此同时,AIGC的出现也为新时代主流媒体的发展带来了新的机遇和挑战,如何处理好主流媒体与AIGC之间的关系,如何利用好AIGC从事内容生产,是建设全媒体传播体系、塑造主流舆论新格局的重要课题。

1 AIGC的发展历史与运行逻辑

AIGC是一种通过人工智能技术,利用大数据、机器学习和自然语言处理(NLP)等技术,自动生成各种形式的内容,如文章、新闻、图片、音乐、视频等的新内容生产方式。继专业生成内容(professional generated content,PGC)、用户生成内容(user generated content,UGC)、专业用户生成内容(professional generated content,PUGC)之后,AIGC成为当前内容生产领域的第四种主要类型,可以在短时间内生成大量内容。AIGC的广泛应用,离不开AI技术奠定的基础。本文在已有文献[1,2,3]的基础上,根据AI技术的迭代和智能生成内容的特征,将AIGC的发展划分为四个阶段。

1.1 奠基萌芽阶段——规则驱动的实验(1956—1980年)

一般而言,人工智能这一术语诞生在1956年的达特茅斯会议上[4],因此1956年被认为是“AI元年”,人们开启了AIGC的尝试。1957年,Lejaren Hiller和Leonard Isaacson通过蒙特卡罗算法将计算机程序中的控制变量换成音符,生成了历史上第一支由计算机创作的音乐作品——《依利亚克组曲》(Illiac Suite)。[5] 1962年,最早的诗歌写作软件Auto-beatnik诞生,由R.M. Worthy领导的团队研发,通过向计算机输入语法结构和词汇,让计算机随机选择,并组合成诗歌。[6]

1966年,Weizenbaum在麻省理工学院开发了最早的人机对话系统——Eliza,通过关键词扫描和重组实现人与计算机之间的简单对话。[7]1972年,Colby在斯坦福大学开发了另一款人机对话系统——Parry,可以模拟患有偏执型精神分裂症患者的思维模式,旨在通过计算机模拟和理解人类的精神和行为。值得一提的是,1973年,Eliza和Parry之间产生过一次对话,前者扮演心理治疗师,后者则是病患的角色。[8]但是,由于这一时期的人工智能主要依赖规则系统(rule-based system)和专家系统(expert system),尚处于符号AI的阶段,内容生成主要基于固定的规则和模板,这使得两款程序都无法真正理解对话的语境和情感,导致对话结果通常是机械化且无意义的。这也揭示了早期AIGC的局限性,生成的内容大多基于规则和模板,过于依赖预定义的语句和结构。在大数据和深度学习技术普及之前,计算机生成的内容通常缺乏真正的创造性和多样性,也缺乏深度的语义理解和情感感知能力。

1.2 沉淀积累阶段——机器学习的崛起(1980—2006年)

机器学习的概念在AI研究诞生之初就已经出现,目的是让计算机能够更好地模拟和实现人类的学习行为,但在AI发展的初期,由于技术、理念等因素的影响,机器学习一直处于蛰伏状态,直到1980年卡内基·梅隆大学召开第一次机器学习国际研讨会,机器学习的系统研究才开始兴起。同年,日本科学家福岛邦彦提出了人工神经网络模型Neocogniron,被认为是卷积神经网络(CNN)的雏形。1990年代初期,由于计算机技术的发展和数据量的急剧增长,统计学习方法开始广泛应用于信息处理领域。这使得AIGC能够摆脱依赖固定模板和预设规则的限制,转向更加自适应和灵活的内容生成方式,以及更为复杂的生成策略,AI技术的应用逐步从实验性向实用性转变。在这个阶段,许多基于统计的方法,如决策树、随机森林、支持向量机等开始流行;又如统计机器翻译系统通过大量双语语料库训练,自动翻译出更为流畅自然的文本。此外,互联网在这一时期开始兴起,产生了大量的数据,可用于AI模型的训练。传统的一对多传播模式转变为多对多的互动模式,个性化的内容生成需求逐渐凸显,同时带来了新的应用场景,如搜索引擎、智能推荐系统等。

1997年5月,IBM研发的国际象棋程序深蓝(Deep Blue)打败了世界象棋冠军卡斯帕罗夫(Kasparov),从而证明AI在某一领域能够超越人类的水平,引发了社会对AI的广泛关注,从现实意义上真正解决了大规模复杂系统的开发问题[9],成为AI史上一个重要里程碑。深蓝采用的是决策树搜索算法,通过对可能产生的对弈走向进行预测,从而作出最有利的选择,以此生成下一步走棋。尽管深蓝并没有直接涉及内容生成,然而它显示了AI在复杂问题解决上的潜力,为后续的AI开发打入了一剂强心针。类似于采用决策树搜索算法的机器学习模型,可以通过学习大量的训练数据,实现内容的自动化提取和生成,并应用于内容的个性化和定制化推荐。

1.3 快速蝶变阶段——深度学习的革命(2006—2014年)

这一时期AIGC的发展迎来了一场革命性的重大突破,即基于人工神经网络的机器深度学习的广泛应用给AIGC的发展带来了革命性突破。2006年,多伦多大学教授Geoffrey Hinton和他的团队发表了一篇关于深度置信网络(Deep Belief Nets)的论文,提出了一种快速学习算法,用于训练深度人工神经网络[10],自此拉开了机器深度学习的帷幕。同年,李飞飞教授意识到“数据”在AI算法研究中的重要性,于是带头构建大型图像数据集——ImageNet,包含上百万张带有详细标注的图片[11],对深度学习,尤其是卷积神经网络(CNN)在计算机视觉领域的发展起到了关键作用。

这一时期,大量的人工神经网络得以广泛应用,尤其是递归神经网络(RNN)和长短期记忆网络(LSTM),在文本生成领域取得了显著进步,进一步提高了AI在自然语言处理方面的能力,能够更加容易和快速地识别和生成自然语言。例如,LSTM能够学习和理解长距离的文本依赖关系,使得生成的文本更加连贯和自然。2007年,艺术家Ross Goodwin开始了一个基于人工神经网络深度学习技术的艺术实验项目,他驾驶一辆名为Wordcar的汽车穿越美国,车上的AI系统在旅行的过程中实时生成和打印与所处环境相关的内容,并最终形成了一部长篇小说The Road。谷歌的Smart Reply也是一个很好的深度学习应用实例,Smart Reply使用RNN模型来理解用户在电子邮件中的对话,并自动生成相关的回复建议。

同时,机器学习模型开始被广泛应用于媒体新闻生产。2009年,美国西北大学智能信息实验室研发的StatsMonkey系统撰写了一篇关于美国职业棒球大联盟季后赛的新闻稿件。它运用统计分析技术识别出比赛期间的重大事件,并总结整体比赛动态,从而自动生成一份体育报道。2014年,美联社开始采用Automated Insights推出的人工智能平台Wordsmith来增强核心新闻报道能力,Wordsmith能够根据结构化的数据自动撰写新闻报道和财务报告,成为第一代撰稿机器人。此后,全球各大媒体纷纷开始开发和应用新闻撰稿机器人,如洛杉矶市时报的Quake、纽约时报的Blossom、腾讯财经的Dreamwriter、新华社的快笔小新、第一财经的DT稿王,等等,均是AIGC在新闻内容生产领域的实践。[12]

1.4 全面爆发阶段——生成智能的突破(2014年至今)

这个阶段是AIGC发展的最新阶段,也是最具影响力的阶段。前面三个阶段的AIGC大多是围绕自然语言的文本生成,而生成智能的突破是AIGC发展的最新阶段,也是最具影响力的阶段。这一阶段的AIGC开始向多模态、跨模态内容生成转变,图片、视频、音乐等内容的创作均可以被AI完成,并能够生成高质量内容,人工智能实现了向生成式人工智能的跨越。

2014年,生成对抗网络(generative adversarial network,GAN)由美国机器学习研究者Ian J. Goodfellow等人提出[13],标志着这一阶段的开始。GAN的核心思想是让两个神经网络进行对抗,通过学习真实数据生成与原数据分布相符的新数据,从而生成更加真实、多样的内容,当前被广泛应用于图像的生成。2018年10月,法国巴黎艺术组合Obvious利用GAN生成了一幅名为Edmond de Belamy的肖像画,并在佳士得拍卖出了43万美元的高价。[14]同年,英伟达发布了一款基于GAN的AI图像生成模型StyleGAN,目前已升级到第四代模型StyleGAN-XL,可以生成极其逼真的人脸图片,普通人难以分辨真假。此外,近几年引起广泛热议的“AI换脸”技术Deepfake,也是基于GAN模型生成人脸图片,Deepfake还可以进行语音模拟和视频合成。2017年5月,微软人工智能助手“微软小冰”出版了第一部人工智能创作的诗集《阳光失了玻璃窗》。[15]2017年12月26日,新华社在成都发布了中国第一个媒体人工智能平台——“媒体大脑”,生产的第一条MGC(机器生产内容)视频新闻是《新华社发布国内首条MGC视频新闻,媒体大脑来了!》。[16]

越来越多的AI研发者意识到,他们需要的不仅是一个能够快速处理大量数据的系统,更是一个能够理解用户需求,并以自然语言和人类交流的AI程序。2015年7月,Google推出DeepDream,开创文本生成图像AI模型的先河。

2018年,AI的研发开始转向基于大规模预训练语言模型(PLMs)的方法,充分利用大模型(large language model,LLM)、大数据和大计算,对人类的语言系统进行全方位的深度学习。其中,OpenAI研发出了第一代GPT(generative pretrained transformer)模型,将自然语言处理带入“预训练”时代。[17] 2021年1月,OpenAI发布DALL·E模型,正式将文本生成图像推入大众视野。2022年4月,OpenAI将DALL·E升级为第二代,在文本智能生成图像的基础上加入了图像边界拓展、元素编辑和风格转换的功能,进一步提升该模型的实用性和创造性。2022年7月,Midjourney发布了图像生成模型Midjourney,游戏设计师Jason M. Allen使用该模型生成了一幅名为《太空歌剧院》(Space Opera Theater)的AI绘画,并赢得了科罗拉多州博览会美术竞赛数字艺术单元的第一名。[18]

2022年11月30日,OpenAI推出全新的对话式通用人工智能工具——ChatGPT,它通过深度学习和自然语言处理技术,在大量的文本数据上进行训练,能够理解人类的语言和思维方式,并用自然语言与人进行对话,极大地提高了人机交互的效率和体验。ChatGPT的横空出世,改写了AIGC的生产逻辑,人们可以用人类的自然语言向机器描述问题、发布指令,而机器也能以自然语言的方式进行反馈。在Transformer模型与注意力机制(attention mechanism)的共同作用下,AI可以快速捕捉人类语言中的重点信息,并能够解决上下文学习(in-context learning)中的长距离依赖问题,做到内容的持续输出,从而与人类达成深彻的交互。这样,AI不仅能够理解用户的需求,还可以与之互动,提供个性化的服务。

2 AIGC对全媒体内容生产的颠覆式变革

2.1 生产者——从人到机器,再到人机协同

AIGC改变了媒体内容生产者的角色。在PGC时代,传统媒体的内容生产通常需要团队协作完成,内容的采集、创作、编辑、传播分别需要不同的专业生产者完成,专业知识技能和创造力是内容生成的核心要素。到了社交媒体蓬勃发展的Web2.0时期,平台型媒体的崛起和生产技术准入门槛的降低,使得内容生产者的角色延伸到了整个互联网用户,UGC时代到来。这一转变使得内容生产由团队转向个人,每个人都具备了创造和分享内容的能力,以极大的开放性和普及性丰富了媒体生态体系。然而,由于大部分用户缺乏专业知识和技能,UGC时代的内容质量良莠不齐,许多内容缺乏深度、准确性和可信度,促使UGC向PUGC转变。无论是PGC还是UGC,其内容生产的核心主导者依然是人,需要生产者依靠自身的知识和能力进行内容创作。

随着AIGC的出现,自动化内容生成开始替代部分媒体生产者的工作。在新闻报道方面,撰稿机器人开始在体育、财经等需要强时效性的领域取代人类记者,如腾讯财经于2015年推出的自动化写稿机器人Dreamwriter,在奥运会、NBA等大型体育赛事的报道中担任内容生产者的角色,以“比赛视频+比赛回顾+阵容介绍”的形式向用户进行赛事的实时报道。在视频生产方面,短视频的自动化内容生成已经普及,进一步降低了视频制作的门槛,如字节跳动旗下的剪辑软件剪映具备一键成片功能,用户可以自主导入视频素材,由剪映AI分析画面,匹配相应的风格和音乐,从而形成一部较为完整的短视频内容。另外,AIGC在文学、音乐、绘画等艺术领域也已占据重要的内容创作者地位。至此,机器已经成为内容创作过程中不可或缺的重要参与者。

DALL·E 2、Midjourney、ChatGPT等基于大模型的AIGC程序问世以后,内容生产者的角色又一次发生了变化,从人和机器各自生成内容转变为人机协同。此时的人类创作者无须承担内容生产的全部任务,也未被边缘化,更不用担心机器生成内容的同质化与机械化,而是通过“人类指令—AI创作”的模式,实现人与AI的共创,即人类负责策划、审核与优化,确保内容的质量和人文关怀;AI负责内容的制作,人与机器的关系实现了史无前例的融合。如美国漫威公司于2023年上线的美剧《秘密入侵》(Secret Invasion),采用了人机协同的创作模式,其片头动画由Method Studios使用AI程序制作而成,这是AIGC技术首次在大型媒体平台的作品中得到应用。虽然片头动画有着十分明显的“AI绘画感”,且较为粗糙,但正如该剧导演兼制片人Ali Selim所说,那种变幻莫测的不稳定的状态与剧集的主题以及剧中主要族群斯克鲁人(可以随意变幻外形的外星人)的特质极为契合。

2.2 生产方式——从人工到机器辅助,再到智能交互

AIGC驱动的内容生产方式的三次变革可以看作是科技解放和发展生产力的过程。早期的内容生产都是由人类亲力亲为,如写作、绘画、雕塑等需要人操作特定的器具进行,内容是由人类经过观察和思考所表达出来的。换言之,只有人类才能进行内容创作。但是,此时的人类创作行为往往被限制在特定的物质材料之上,如纸笔、画布、石头等,一种材料只能用于生产一种特定的内容,而一些大型的创作活动会对人类的生理机能产生一定的负担。可以说,纯人工的内容生产方式是低效且难以规模化的。

内容生产方式的第一次变革是计算机的诞生以及配套软件设施、硬件设施的发明,让人们摆脱了特定物品和空间的束缚,仅在一台计算机设备上就能完成写作、绘画、编曲、剪辑等一系列内容生产,彼此之间还能够产生交互组合,促使多媒体内容的诞生。例如,人们可以使用Word、Photoshop、FinalCut等软件进行文字、图像、视频的编辑,也可以使用手绘板辅助绘画和建模的创作。此时的机器已经开始辅助人类生产内容,大大提升了生产效率,但只是作为一种工具化的手段,并未主动参与内容创作,人类仍然是内容的唯一生产者。

内容生产的第二次变革是早期的AIGC工具的产生。这一时期,机器的辅助属性变得更为明显,从先前的被动使用转变为主动协助,将内容生产者从大量重复、多余的劳动中解放出来,将更多注意力放在内容质量方面。同时,AIGC工具的应用第一次大幅度降低了内容生产者的创作门槛,将内容生产的权利从部分专业人士扩散到掌握基础数字技能的普通人手中。例如,撰稿机器人的发明可以让体育和财经领域的新闻生产者不再耗费心神捕捉大量动态的数据,转而将重心投入对事件的分析和解读当中。由字节跳动AI Lab联合上海交通大学研究团队发布的全新升级版AI新闻记者Xiaomingbot,通过内置的新闻生成器、翻译器、跨语言阅读器和头像动画,能够独立完成新闻报道的整套工作流程。[19]此时的机器仍然是作为人类的辅助工具进行内容生产。

内容生产的第三次变革是自然语言处理与大模型的AI技术的应用,彻底改变了内容生产方式的格局,将机器与人类提升到同等的地位,形成智能交互的生产模式。这种模式简化了工作流程,进一步提高了生产效率,再一次降低了内容制作的门槛,人类甚至不需要掌握软件和硬件的使用方法,仅仅向AI描述创作意图和想法就能够生成高质量作品,这在内容生产层面将“数字鸿沟”缩减到最小,进一步放大了人类的独特性、创造性。同时,人类与AI进行交互的过程也是相互学习的过程,AI大模型在预训练中已经通过大量的参数获取学习、理解、记忆、总结、预测、创作等能力,并能够通过上下文机制将大规模的文本有机串联起来,同时激发处理复杂问题和思考的能力。此外,AI大模型的微调机制能够让AI从与人类的交互中进一步理解人类的意图,学习语义,模仿特定风格,从而生成更加真实、准确、生动的内容。而人类也可以在与AI的交互中扩展知识谱系、激发创意灵感。

2.3 内容消费——从找我喜欢到猜我喜欢,再到懂我喜欢

随着科学技术的发展,人类获取知识与内容的方式发生了数次颠覆性的转变。在互联网诞生之前,人类能够获取到的信息大多来自传统媒体,属于“你说我听”“你播我看”的阶段,内容消费的渠道和模式较为单一,可供选择的内容相对缺乏,消费者是处于被动接受地位的受众。随着计算机与AI基础技术如NLP、网络爬虫等的发展,搜索引擎应运而生。此时的内容消费逐渐由被动接受转变为“找我喜欢”,即用户运用搜索引擎在互联网海量信息中寻找自身感兴趣的内容,内容的发现和消费依赖于用户的主动性。但由于搜索引擎只是一个查询和分类的工具,如果关键词使用不当或者不够精确,用户即使花费大量的时间和精力来二次筛选搜索引擎罗列出的内容,也难以找到他们真正想要的。

进入21世纪后,大数据和机器学习技术开始蓬勃发展,内容消费模式再一次发生转变,基于智能算法的推荐系统逐渐占据内容消费市场的主导地位。内容提供者或平台通过搜集用户与互联网交互产生的数据,确定用户的偏好,再使用协同过滤、混合推荐等算法将机器认为用户喜爱的内容推送到用户面前,此时的内容消费从“找我喜欢”变成了“猜我喜欢”,AI只承担类似于“邮件分拣员”的工作,不涉及具体内容的生产。

而大语言模型的诞生,生成式AI的出现,彻底颠覆了内容消费的逻辑,用户对一切内容信息的获取将从与机器的交互中产生。此时,基于深度学习和NLP技术不断迭代后的AI,更容易理解用户的意图,能够最大限度给用户推荐或生成其想要的内容,甚至能够从过往的交互活动中记录、分析、判断用户内容消费的变化逻辑,从而预测用户接下来的消费偏好。此时的内容消费从“猜我喜欢”转变为“懂我喜欢”。对此,有人担忧这一密闭在私域的人机互动行为,会加厚算法推荐时期形成的“回音壁”,将人们牢牢困在自己与AI形成的“另一个自己”所构成的思维茧房中。担忧的同时,我们也不能忽视人类的主观能动性,以及人类适应环境和改造环境的能力。由于现在仍处于生成式AI发展的起步阶段,是否真的会形成人们所担忧的局面,还需要持续不断的观察。

3 AIGC赋能智慧全媒体传播体系构建

一直以来,中国的主流媒体建设都十分重视科学技术的应用,无论是5G、大数据、虚拟现实,还是AI、元宇宙,中国的主流媒体都在第一时间进行积极的理论探索,并应用到媒体实践。2022年底,以ChatGPT为主的大模型AI诞生和开放以后,AIGC风靡全球,再次掀起一场技术革命。通过梳理AIGC发展史,初步分析内容生产生态带来的变革,可以直观地感受到,AI已经全面渗透到人类社会的运行机理,并可能随时引起结构性变化。尤其是对于传媒行业而言,AIGC带来的机遇和挑战更是一触即发。恰逢中国媒体行业改革历经十年,由媒体深度融合向全媒体传播体系转变的历史际遇,中国的主流媒体更应该登上AIGC这趟时代的“高速列车”,将AIGC融入智慧全媒体传播体系的建设。本节尝试从全媒体传播体系的六个微观层面[21]出发,探讨AIGC如何赋能智慧全媒体传播体系的构建。

在思维体系层面,AIGC时期的全媒体人才应当在全媒体思维的基础上,加入人机互动的思维模式和创新创意的思维能力。尤其是在内容创作层面,生成式AI的运行逻辑注定其拥有比人类更为丰富的知识体系、更为成熟的创作手段,以及更为迅捷的响应速度。因此,我们需要改变以往人本位的思考方式,将人工智能置于与人类创作者同等的地位,将其作为创作的伙伴,而非传统意义上的工具。改变这一思维模式的关键之处在于培养人机交互能力,即如何实现与生成式AI更为高效的沟通,理解人的意图,同时更快速地将其训练成可靠的创作伙伴。此外,由于AIGC能够大幅解放人类创作者的生产力,因此更需要人类创作者拥有创新创意的思维能力,这样才能更好地指导AI进行内容创作,生成高质量的作品。

在技术体系层面,我们应当加强主流媒体自主大模型的建设。其中,对大模型进行预训练的数据集更是重中之重。在平台型媒体时代,用户数据已经成为第一生产力,谁掌握了用户数据,谁就掌握了话语权。而随着生成式人工智能的发展,数据的重要性进一步扩张,用户数据不再是唯一的争夺目标,人类社会自诞生以来产生的知识数据成为最宝贵的财富。当前,这些数据被掌握在具有能够支撑起大模型学习的大算力的企业当中,这也是企业争夺用户资源的核心竞争力。主流媒体若想在未来与商业平台继续博弈,那么对于数据的收集和大模型技术的研发已经迫在眉睫。

在用户体系层面,应当进一步厘清用户群体,对其进行更为细致的划分,从而实现更为垂直化、精准化的传播。AIGC的出现,使得用户个性化的内容需求能够在最大程度上被满足,如孙燕姿的粉丝利用AI音频识别与合成技术翻唱孙燕姿歌曲一度在短视频平台流行。因此,在AIGC极大提升了内容生产力的基础上,满足多元化的用户需求成为主流媒体下一步的努力方向。

在产品体系层面,应当打造品类更加齐全、内容更加丰富的全媒体产品体系。AIGC的多模态、跨模态生成能力使得产品的一次创意、多种生产、多次传播更容易实现,一段文本就可以生成图像、视频、音乐等多种形态的内容。同时,AIGC也能帮助实体创意产品进行更为全面的开发。

在业态体系层面,应当建设智慧全媒体平台,构建一个多元、跨界、开放的业态体系,该体系包含传统的内容提供商、服务运营商和平台商,还涵盖所有与之适应的相关业态,同时建立“内容+政务+服务+商务”体系,服务区域综合治理。基于大模型的AIGC可以满足几乎所有业态的内容生成需要,同时NLP技术也允许AI与人类进行实时交流,功能性更强的政务服务更是可以依靠AI满足用户对高效率的追求。

在体制机制层面,应当在原有的全要素融合理念中加入AIGC相关规制与政策。首先,建立一套AIGC全流程的配套管理机制,完善AIGC生产全流程的规范,明确各个环节的权责机制;其次,建立一套完整的AIGC审查机制,明确AIGC内容的合法范围,同时探索AIGC背后的隐私与版权保护机制;最后,在技术开发、内容策划、人机对话、安全监管等方面培养专业型人才,全面提升AIGC的应用水平。

4 结语

AIGC经过短短几十年的发展,已然成为人类社会不可或缺的一部分,AIGC不仅是内容创作领域的一次突破,更可能是人类文明历史上的一个重要节点。在全媒体传播体系的建设中,AIGC无疑可以承担极为重要的角色,能够快速实现全程媒体、全息媒体、全员媒体、全效媒体的构建,为智慧全媒体平台的搭建提供基础条件。

虽然AIGC为人类的内容生产活动带来了极大的便利,但也存在许多不足之处。尤其是ChatGPT等大模型人工智能,存在生成内容可信度和真实性不足、独特性和原创性匮乏、舆论刻板印象与偏见、威胁隐私和数据安全、深度伪造影响社会治理等问题,为全媒体传播体系的建立带来了许多挑战。然而,每一次技术革命都有可能带来风险,人类不能因此而否定或拒绝新技术的产生和发展。AI技术进步的脚步不会停止,未来将会以通用AI甚至赛博格(Cyborg)的形式更加深植于人类社会中。在中国式现代化的语境下,中国的发展“必须坚持科技是第一生产力”,不断“开辟发展新领域新赛道,不断塑造发展新动能新优势”,AI赛道必然是未来中国参与世界竞争的核心手段之一。因此,应当在接受AIGC带来的技术利好的前提下,警惕其可能引发的社会风险和对人类文明发展的威胁。在AIGC的实际应用过程中,仍需以人的需求为核心,并与社会伦理及相关法规相协调,以实现技术与社会的和谐共生。

基金项目:本文系教育部人文社科重点研究基地重大项目“中国传媒体制机制创新研究”(18JJD860002)阶段性研究成果。

参考文献

CAO Y, LI S, LIU Y, et al.

A comprehensive survey of ai-generated content(aigc):a history of generative ai from gan to chatgpt

[EB/OL]. [2023-05-10]. .

URL     [本文引用: 1]

LIU Y, HAN T, MA S, et al.

Summary of ChatGPT/GPT-4 research and perspective towards the future of large language models

[EB/OL]. [2023-05-10]. .

URL     [本文引用: 1]

中国信通院.

人工智能生成内容(AIGC)白皮书(2022年)

[EB/OL]. (2022-09-13)[2023-05-09]. .

URL     [本文引用: 1]

尼克. 人工智能简史[M]. 2版. 北京人民邮电出版社2021368.

[本文引用: 1]

ASSAYAG G E R.

Computer assisted composition today

[C]//1st Symposium on Music and Computers. Applications on contemporary music creation:esthetic and technical aspects. Corfu19981.

[本文引用: 1]

WORTHY R M.

A new American poet speaks:the works of A. B.

[J]. Meanjin Quarterly,19642):166-172.

[本文引用: 1]

WEIZENBAUM J.

ELIZA:a computer program for the study of natural language communication between man and machine

[J]. Communications of the ACM,196691):36-45.

[本文引用: 1]

GARBER M.

When PARRY met ELIZA:a ridiculous chatbot conversation from 1972

[EB/OL]. (2014-06-09)[2023-05-09]. .

URL     [本文引用: 1]

张钹朱军苏航.

迈向第三代人工智能

[J]. 中国科学(信息科学),20209):1281-1302.

[本文引用: 1]

HINTON G E, OSINDERO S, TEH Y.

A fast learning algorithm for deep belief nets

[J]. Neural Computation,20067):1527-1554.

[本文引用: 1]

FEI-FEI L, DENG J, LI K.

ImageNet:constructing a large-scale image database

[J]. Journal of Vision,20108):1037.

[本文引用: 1]

周志明. 智慧的疆界:从图灵机到人工智能[M]. 北京机械工业出版社2018356.

[本文引用: 1]

GOODFELLOW I, POUGET-ABADIE J, MIRZA M, et al.

Generative adversarial networks

[J]. Communications of the ACM,202011):139-144.

[本文引用: 1]

COHN G.

AI Art at Christie’s Sells for $432,500

[EB/OL]. (2018-10-25)[2023-05-10]. .

URL     [本文引用: 1]

陈根. 泛智能革命:从人工智能到元宇宙的关键革新[M]. 北京电子工业出版社202299.

[本文引用: 1]

新华社发布国内首条MGC视频新闻,媒体大脑来了!

[EB/OL]. (2017-12-26)[2023-05-10]. .

URL     [本文引用: 1]

RADFORD A, NARASIMHAN K, SALIMANS T, et al.

Improving language understanding by generative pre-training

[EB/OL]. [2023-05-10]. .

URL     [本文引用: 1]

METZ R.

AI won an art contest,and artists are furious | CNN Business

[EB/OL]. (2022-09-03)[2023-05-09]. .

URL     [本文引用: 1]

XU R, CAO J, WANG M, et al.

Xiaomingbot:A Multilingual Robot News Reporter

[EB/OL]. [2023-05-10]. .

URL     [本文引用: 1]

胡正荣.

构建全媒体传播体系:内涵与层次

[J]. 新闻与写作,20198):1.

/