生成式人工智能赋能出版高质量发展:价值意义、现实梗阻与调治路径*
关键词:
本文引用格式
李巨星, 姜莹.
当前,以ChatGPT、Sora、百度文心一言、阿里通义千问等为代表的生成式人工智能席卷各行各业,重构了人类社会的传播生态与交往形态,引发了整个社会权力和资源的重新分配与布局。现代出版业在生成式人工智能的影响下,机器内容生产、人机协同编校、智能印制以及知识服务等新型创作形态与行业生态逐步得以建构,极大地提升了出版行业的数字集约化工作效率与智慧出版水平,但也对出版伦理、版权责任、舆论生态等带来了多维风险。因此,如何系统把握生成式人工智能赋能出版高质量发展的具体实践与现实挑战,已经成为出版学界和业界亟待思考解决的重要议题。
1 生成式人工智能赋能出版高质量发展的价值意义
生成式人工智能是基于算法、模型等技术自主生成文本、图片、音频、视频、代码等内容的人工智能软件系统[4],能够在大语言模型、大算力、预训练和人类反馈强化学习等技术的基础上,自主整合创造、生成全新内容。因此,利用生成式人工智能在自主语言理解、多模态内容生成、高模拟人机交互以及全场景嵌入等方面的突出优势,能够有力推动出版业高效化与智能化发展的实现。
1.1 降本增效,推动出版资源的共通共享
《规划》明确提出要“尊重人民主体地位,坚持为人民出好书理念,保障人民阅读权益”。然而,传统出版业地区结构之间存在巨大的不平衡现象,出版资源向经济发达地区过度集中,与我国出版事业普惠性的发展目标还有一定差距[5]。而生成式人工智能显著提高了内容创作的效率,增强了出版流程的灵活性,并为丰富的出版资源提供了一个公平的、开放的数字平台,使得出版物的生产和传播不再受到传统出版流程的限制。出版内容生产智能化在给出版增效的同时,也将实现出版存量资源的价值最大化和出版增量资源的持续补给[6],这在数字资源可复制和可循环的加持下[7],有效地稀释了用户连接知识资源的成本。因此,生成式人工智能能够帮助出版业不断突破财富、地域等条件制约的窠臼,高效统筹精神生产、文化生产和知识生产[8],兼顾出版事业和出版产业协调发展,以保障群众基本文化权益,关照社会弱势群体的阅读资源供给,让出版资源和服务尽可能多地惠及不同地区或社会群体,让出版成果为广大人民群众共享,提升全体人民的精神文化生活,推动更有效率、更加公平、更可持续的现代化出版业高质量发展。
1.2 精准触达,促进出版成果的多元满足
当前碎片化、娱乐化的信息内容和文化消费广受欢迎,传统出版业已经难以适应广大受众阅读偏好的转移。而生成式人工智能可以通过交互积累丰富数据,精准分析用户偏好,在出版产品生产方面,能够实现生产思维从“传者本位”到“受众本位”的转变,并推动创作者从专业出版人和出版机构向更广泛的主体扩展,释放多元生产力,实现多样化表达,助力社会主义文化成果多元共享与繁荣发展;在出版内容分发方面,能够突破传统出版“千人一面”的模式,实现“千人千面”的个性化分发推送,[9]通过独特的现代化出版产品和优质的服务体验,最大化吸引用户和提升其对社会主义文化的情感共鸣度。
1.3 优化运营,增益出版市场的开放发展
在当前出版业努力“走出去”却未能有效“走进去”的情况下[10],生成式人工智能有望成为驱动出版市场进一步开放发展的新动能。通过生成式人工智能技术,出版业可以实现从内容生产、多语翻译、发行推广到用户反馈的面向国际出版的全流程运营优化。生成式人工智能可以利用多语种海量语料库进行跨语言内容生成与精准翻译,同时实现文化的本地化与适应性改进,并在交互问答中为具有深度信息需求的用户提供启发性的背景阐释[11],帮助人们更好地阅读和理解文本,弥合语言与文化障碍。此外,出版业可以利用生成式人工智能打造面向国际出版的分众化、互动式智能服务平台,增强出版物的国际传播效能。通过用户交互生成的数据分析,出版商能够进行市场洞察,优化内容分发,精准定位海外读者需求,提高国际市场竞争力。由此,生成式人工智能辅助出版业切实增强国际传播效能,为出版市场的开放发展增益。
1.4 升级产业,催发出版业态的智慧转型
《规划》已明确了我国出版行业的发展蓝图和工作方向,提出要“大力发展数字出版新业态”。生成式人工智能的深度参与能够有效引动出版新质生产力提质增效,助力出版业的数字化、智能化进一步升级换代,更将引领其从数字出版逐步向以智能技术为驱动的智能出版和以智慧发展理念为指引的智慧出版[12]进行持续迭代。一是在生产端,生成式人工智能能够加速出版业知识生产模式和流程的革新,使内容生产迈入自动化、智能化、智慧化的行列;二是在需求端,生成式人工智能赋能下的智慧出版,不仅可以准确感知和理解用户需求,及时地向用户提供知识服务,还能协助用户快速进行内容理解和知识生产。[13]由此,生成式人工智能的持续嵌入,能够有效助力出版业向智慧出版业转型,进而实现以认知智能技术为基底,以知识服务、文化传播和社会教化为核心目标的新型出版业态建设。
2 生成式人工智能赋能出版高质量发展的应用场景
生成式人工智能正在重新塑造着内容创作生态与知识传播方式,已经创造出了智能选题撰稿、人机协同编校、智能印厂和智能知识服务等诸多出版应用场景,《自然》期刊发文称这将有可能彻底改变研究实践和出版实践[14]。未来,相关的智能出版场景将得到进一步丰富和拓展。
2.1 赋能内容生产:选题策划与协同撰稿
生成式人工智能的出现能够带来一种全新的内容生产模式,即人工智能生成内容(AIGC)。基于社交媒体、新闻报道、历史出版物等大量文本数据和算法技术加持下的生成式人工智能,通过快速有效的系统分析,能够更加高效地辅助出版单位挖掘热门话题与优质内容,进而更加科学地提升选题的准确性与针对性。同时,基于社交媒体数据和用户行为数据,生成式人工智能还能够精准把握和分析不同读者的阅读兴趣和偏好,辅助出版主体更加精确地定位和策划更契合目标市场需求的主题内容;在一定程度上协助分析自身产品与竞品出版物的市场表现和最新动态,助力差异化生产出高创新性的优质作品。
此外,借助强大的知识整合技术和逻辑推理能力,协同撰稿也是生成人工智能助推内容生产提质增效的重要方式。依据指定的主题和关键词,自动编撰大纲、生成行文与可视化量表等已是生成式人工智能的“常规操作”,不仅可以提供实时的语法、拼写纠错,还能根据编辑的具体要求和读者偏好进行写作风格的智能推荐与美化,提供多维文体风格和丰富内容参考的同时,大幅提升文本的吸引力和可读性。亚马逊Kindle商店中的不少电子书,已经将ChatGPT等生成式人工智能技术明确标注为作者或合著者;基于文本描述生成视频的人工智能模型Sora一经发布也迅速引发广泛的市场关注,进一步加强了文字、图片、声音、视频等不同形态高效融合的可操作性,极大提升了多模态内容创作的便捷度,有助于实现出版物不同体裁间的快速转化。
2.2 赋能质量把关:编辑校对与筛选汇编
“三审三校一通读”是传统出版流程中非常重要的质量把关制度,意味着“把关人”对出版物质量的保证。而生成式人工智能的出现带来了一种全新的质量把关模式,即技术辅助编校把关。利用其庞大的数据库、智能分句等自然语言处理技术和强大的语义理解能力,生成式人工智能不仅可以进行格式、语法、逻辑等多维度的辅助审校,根据文章内容进行自动分段、界面排版、版式美化等,还能快速进行内容检索、溯源核查和生成目录文献等,在很大程度上能够节省编辑的时间精力,大幅提升编辑审校加工的工作效率和质量规范。
在汇编类图书、系列图书等出版物的筛选、分类和整合过程中,生成式人工智能的质量把关职能也尤为突出。利用其先进的自然语言处理能力,生成式人工智能能够对大量文本和知识资料进行自动化分析和标注。这一过程不仅加速了编辑根据主题或风格对不同来源稿件的内容检索和分类,还确保了每篇文章或段落与选集的主题或风格相匹配,从而提升了汇编作品和系列作品内容的一致性和逻辑性。这种技术极大地支持了汇编类图书、系列图书及专题出版物的创作与发行,提高了整体出版质量。
2.3 赋能智能印发:印刷出版与营销推广
印刷与发行是图书出版中的关键环节,面对市场科学决策、面对用户精准营销是出版企业获利的基础。传统意义上的按需印刷与智能印刷通常依靠事先定义的规则和算法运行,缺乏个性化和自适应性。而智能印刷高质量发展的突破点就在于要“使印刷设备具有自感知、自学习、自决策、自执行和自适应的新功能”[15]。生成式人工智能的出现实现了智能印刷的进一步优化。它能够凭借深度学习和生成式对抗网络等技术,根据印刷机器和材料的特性,自动化、个性化生成最佳的印刷参数,并实现更加智能化和精准化的颜色管理。在智能发行层面,生成式人工智能也可以借助交互对话与大数据计算分析等技术,深度挖掘用户交互数据,为智能化的ERP信息管理系统提供一定的数据支持。[16]
同时,生成式人工智能还能够辅助出版社进行营销推广,尤其在对国外市场的开拓中发挥重要作用。凭借大语言模型,它能够根据国外用户的语言、文化和兴趣特点,生成个性化的推广文案、海报、视频等优质内容,并根据国外用户的兴趣和行为数据,分析市场需求和及时提供优化国际广告投放策略的实操性建议。借助生成式人工智能与用户交互形成的数据信息以及深度学习算法,出版社还可以构建智能定价和客服营销系统,有助于企业收益最大化。美国出版发行商Thrift Books就将生成式人工智能和数据仓库应用于图书销售流程,利用算法分析销售数据和市场趋势,以确定旧书出售类型及最佳价格。[17]
2.4 赋能平台服务:知识服务与产业升级
生成式人工智能作为强力的技术中介,能将出版产业链各环节中的生产者、把关者、分发者与消费者等更加有机地连接起来。[18]与此同时,生成式人工智能还可以作为“交互窗口”,通过在出版领域搭建起来的多功能技术服务平台,衍生和开展一系列新的产品形态比如智能知识服务、阅读陪伴业务等,助力出版产业的升级、增值和产业活力释放。以知识服务为例,出版领域传统思维下的知识服务通常依靠固定模板或人工编辑提供内容,同质化、效率低且受限于人员知识和经验等,容易产生一系列问题。而利用生成式人工智能技术,可以逐渐开发和进行“人机对话机制+智能生成技术+知识文化资源”的立体化出版业务实践,优化出版领域的智能问答系统,自动生成更加详细准确、更加优质个性的精准化答案内容,进而有力提高出版类知识服务的效率和质量。同时,利用生成式人工智能对出版领域的知识服务进行升级,不能仅停留在单纯的“知识点”服务或者静态的出版专业知识库或文档集合,更要从海量数据中自动构建知识图谱,围绕“知识体系”[19]进行逻辑建构,帮助用户更好地理解出版领域的知识结构和内在关联,起到真正的“智慧型”“专家型”顾问的作用。人民卫生出版社就利用人工智能技术,产出了人卫临床知识库等知识服务型产品,[20]已成为以智能技术催生知识服务转型的行业范例。
此外,在智能出版领域,生成式人工智能技术还正在被用来创造和提供具有一定社交互动体验的“阅读陪伴服务”,即读者可以通过智能助手与书籍中的角色进行对话甚至探讨。2023年掌阅科技就推出了小说IP对话智能交互应用“阅爱聊”,构建了阅读场景中的人机亲密关系[21]。还有出版商依托生成式人工智能技术创建了“虚拟阅读社群”来推荐话题、引导讨论交流,或利用语音复刻与生成技术,模拟亲友“虚拟在场伴读”等,有效增强了出版物可读性和趣味性,激发了市场活力。
3 生成式人工智能赋能出版高质量发展的现实阻梗
相较于其他技术,生成式人工智能在内容与形式上能够很好实现智能技术与出版现代化的恰当融合,但其赋能出版高质量的发展还存在一定问题,亟待完善。
3.1 内容生产下的数据黑箱与侵权风险
生成式人工智能与出版业的融合推动专业生成内容向人工智能生成内容发展,新的内容生产者和内容生产方式的出现,也给现行版权制度带来很大挑战。生成式人工智能的主流训练数据集大多来源于互联网上的广泛文本内容,不仅包括用户交互过程中输入的个人隐私信息,甚至还间接性访问报纸、图书等版权密集型资源[22]97。而这些训练数据经过“黑箱”清洗、筛选后,通常不会保留信息来源,导致人工智能的生成内容往往是在“元数据”版权不清的基础上,经过智能化合成与重组而进行的二次创作。一方面这些内容存在过度使用隐私数据和挪用他人作品的风险,一旦盲目广泛应用到面向社会的内容生产与文化传播工作中,就容易引发侵犯用户隐私或侵犯知识产权等一系列问题[23];另一方面部分生成式人工智能的使用者本身并不完全了解其运作机制和潜在道德、法律风险,在借助AIGC进行内容创作时,可能会无意地出现对未知来源数据资料的抄袭和使用问题,进而出现侵权现象。
3.2 质量把关下的伦理风险与主体性危机
“把关人”职能在出版业中的核心体现不仅仅是确保内容方面的准确和高水准,更要坚守行业的伦理规范和承担相应的社会责任。生成式人工智能技术赋能出版领域的质量把关工作,一旦运用失当,也会产生偏见、歧视和过度娱乐化等伦理失范问题。一是存在原始基础数据中自带价值观的隐性风险。生成式人工智能训练数据体量巨大而丰富,饱含不同文化和价值观念的信息。而机器学习是无感知的,原始数据中暗含的世俗偏见、种族歧视会在AIGC的包装下散布出来。二是存在数据加工人员标识错误价值导向的显性风险。以ChatGPT为代表的生成式人工智能,大多采用基于人类反馈的强化学习机制,需要引入人工标注员进行模型学习训练。[24]这个过程中因为主观性的介入,一些居心叵测、格调不高的数据加工人员可能会趁机注入自身价值偏好,假借“客观数据”夹带私货、兜售错误价值导向、误导公众。三是存在盲目信从市场数据加大社会正向文化生态失衡的风险。生成式人工智能拥有与用户交互的能力,能快速反馈用户需求和市场热点,使得出版业能更加精准把握市场需求的同时,也更容易造成部分主体陷入对受众需求和市场经济的盲目迎合,忽略自身社会责任,进而加大积极正向社会文化生态的失衡风险。
同时,随着生成式人工智能技术在出版领域各环节的广泛、深度介入,许多编辑和从业人员因受到技术性程序指令操作的影响而决策,在一定程度上会削弱其在内容选择和决策中的主体性作用,进而对其在出版活动中身份认同和主体性地位形成一定冲击。出版产品的知识质量把关环节也存在着从“依赖编辑经验判断”向“依赖技术工具检验”过度偏移的风险。[25]这就对相关人员从传统出版流程的核心把控者向智能技术的有效运用和引导者的角色转变能力,提出了新要求。
3.3 智能分发下的价值渗透与文化边缘化
当前主流生成式人工智能的模型训练主要基于英文语料库,其在原始数据的分布上存在向西方话语倾斜的状况。以Instruct GPT 3为例,其微调指令中超过96%为英语,仅包含20种少量的以西班牙语、法语、德语等为代表的其他语言,[26]其中中文语料在总语料中占比不足0.1%。[27]AIGC中涉及我国优秀传统文化、革命文化和社会主义先进文化的话题也存在明显的匮乏和谬误。[28]这种在语料库上的偏差,往往使得部分生成式人工智能在内容生成和分发时更倾向于进行反映英美主流文化的知识服务和暗含西方价值观的内容产品渗透,而导致包括中国文化在内的非西方文化传播声量弱小,存在较大的文化边缘化风险。加之智能算法下的信息茧房作用,在一定程度上容易造成国际社会对中国文化的片面理解,诱发文化冲突、加剧刻板印象甚至意识形态偏见,对中国国家形象、文化形象和品牌形象等造成损害,不利于中国出版物“走出去”。与此同时,不同语种语料库体量的巨大差异,也使得生成式人工智能在处理非英文类出版物时的准确性十分有限,经常需要经过额外的技术适配和专业训练才能获取相对优质的产品服务。长此以往,这既严重影响出版领域智能分发工作的提质增效,也不利于国际高质量出版物及时“引进来”。
3.4 平台接入下的信息失衡与数字鸿沟
平台化是媒介深度融合发展的产物,基于生成式人工智能技术研发的智能出版平台是实施出版产品升级、产业转型的有效载体。然而,因经济发展、受教育水平、文化氛围等差异化因素影响,当前智能出版平台在不同地区、不同群体的接入与服务情况发展并不平衡,这就在一定程度上加剧出版行业之间和用户之间在知识、技术、信息等各类资源方面的失衡性,扩大了数字鸿沟。一是扩大了接入沟。生成式人工智能对数据、算力和人力都有极高的要求,不同出版业的接入水平有差距。爱思唯尔、施普林格·自然和威立等头部出版机构通常在开发和实施生成式人工智能技术方面处于领先地位[29]。二是扩大了使用沟。生成式人工智能的语义理解和内容生成建立在人机交互的基础上,对于包括出版行业的工作人员和用户在内的“人”的技术使用能力要求较高。传统的编辑出版人员对机器的不接受、不了解都会导致应用效果大打折扣。同样,也有高达25.0%的用户尚未掌握初级数字技能[30],被拦在了智能出版物的使用门槛之外。三是扩大了效果沟。出版社和用户对于生成式人工智能的接入和使用上的差异,会带来大相径庭的社会后果。发展较早的智慧出版社正在逐步成型,而部分出版社则可能继续停留在传统出版、电子出版行列,从而导致行业和社会的信息失衡与数字鸿沟。
4 生成式人工智能赋能出版高质量发展的调治路径
智能出版时代,生成式人工智能对出版业的高效赋能,是信息文化传播的新空间,也是出版现代化发展因时而进、因势而动的重要创新之路。当前生成式人工智能的发展机遇和挑战并存,如何最大程度地激发生成式人工智能的技术活力与红利,调治发展过程中的现实梗阻,引导科技向善,值得深思。
4.1 紧抓内容生产全域,加大版权审查治理
生成式人工智能深度赋能出版业各个环节智能升级的同时,其在内容生产领域的数据来源不透明和生产过程“黑箱化”等侵权风险也在强化,这就需要出版企业、编辑人员、版权专家和推送平台等从内容生产的角度,持续加强对人工智能在“组稿-编校-发行”等内容生产全域过程环节的多维数据审视和版权风险排查力度。一方面,出版企业、内容生产机构要协同版权专家和技术专家,在组稿阶段就要及时对创作者引用的AIGC训练数据库和相关服务等,开展系统严格的专业内容审查与生成内容技术检测,准确判断信息的最初发表状态和数据来源的真实、安全和版权明晰;在编校加工阶段,出版企业和编辑人员在智能审核工具的协助下,要进一步加强人工交叉核验监管,持续对生成内容进行二次版权审查检测,以及时识别和预警生成内容可能涉及的署名权、发表权和复制权潜在侵权行为,保护原著作人合法权益;产品发行阶段,要注意利用区块链、数字水印等相关技术对涉及AIGC的论文、著作等出版产品进行版权确权,明确产品归属,并开展用户市场的实时反馈监测,及时进行侵权投诉处理[22]103。另一方面,要协同管理、宣传、教育和法律等多领域的行业专家与学者,面向创作者、编辑人员及出版机构等群体,持续开展针对性新技术的版权工作培训和经验交流活动,提高其对AIGC基本运作机制的了解、潜在道德与法律风险的认知以及实操性技术运用的能力。
4.2 强化伦理风险规制,锤炼从业者多元素养
生成式人工智能技术的快速发展,使得编辑出版工作的方式和内容都已经发生了深刻变化,面对生成式人工智能技术对出版业可能带来的各种伦理失范风险,出版业界相关的策划、生产、编校、销售、服务等全链条的从业人员,必须尽快适应和锤炼多元素养,以更自如地融入现代数智技术环境。一方面,相关管理部门及出版机构等要尽可能多地协调多种资源,充分利用宣讲教育、制度规范、技术竞赛、实践活动和交流合作等多元形式,加强对契合人工智能技术发展要求的高素质出版人才队伍建设,尤其是对从业者在内容理解运用能力、信息甄别整合能力、主题策划遴选能力以及精准为读者服务能力等多种素养的培育和强化,最大限度激发出版业相关人员的主观能动性,推动其尽快从传统出版流程的核心把控者向智能技术的有效使用者和引导者的角色转变;另一方面,相关出版机构也要在上级单位的指导下,及时细化明确涉及技术伦理方面的制度规范,灵活调整考核指标,加强对出版业从业者及其产品服务在市场经济因素以外的多维度考量和伦理审查力度,鼓励和支持其在社会责任、文化传承和思想道德方面的成效凸显,助力人工智能出版融合工作的提质、降本、增效。
4.3 建设智能技术阵地,传播好中国声音
话语即权力,面对生成式人工智能所加剧的西方国家对国际话语权的垄断问题,建设生成式人工智能技术阵地势在必行。一方面,可以构建中文知识本体为主的语料集,研发中国本土生成式人工智能,以便出版业加强与本土技术的交流合作。另一方面,要推动建立国际标准数据集,重点部署如何平衡发展与安全、如何兼顾赋能与防范两大难题,避免出现“逐底竞争”。在此基础上,出版业要立足于受众思维,着眼于全球视野,掌握智能化国际传播规律,借助生成式人工智能与用户交互积累的海外用户数据,探寻能被国际社会普遍理解的世界性中国话语[31],将其通过智能知识服务、图书跨国贸易以及版权输出等形式向世界范围广泛传播。
4.4 加强行业内外协作,制定多层次市场策略
面对生成式人工智能赋能出版下可能扩大的数字鸿沟问题,出版行业亟须通过合作实现资源共享和技术普及,以推动整个行业的共同进步,缩小数字差距。同时,出版业也应关注数字弱势群体,采取有效措施消除信息获取的不平等现象。在行业内部,出版机构可以通过联盟或共建共享平台等形式加强合作。这不仅可以促进技术、数据资源和专业知识的共享共用,还能开展联合性技术培训,促进成员间的经验分享和技术提升,共同培养具备高数据素养与技能的出版专业人才队伍,从而引领出版业的高质量发展。面向社会,出版业可以制定并实施多层次的市场策略,提供适应不同经济能力和技术水平的智能出版产品。例如,可以推出基础版本和高级版本的智能出版服务,基础版本可以降低价格或免费提供给数字弱势群体。这一策略不仅可以扩大受众群体,提升市场占有率,还推动了信息普惠,实现社会价值。
5 结语
生成式人工智能无疑将引导出版业走向一场深刻的大变革,成为实现出版高质量发展的强力引擎,而其中可能引发的版权争议、伦理风险、价值渗透和数字鸿沟问题则是出版高质量发展路上必须解决的“拦路虎”。出版业要谨慎对待生成式人工智能,统筹发展和安全,审视清楚人与机器的关系,通过技术弥补出版人能力的局限,通过人的智慧来纠正机器的偏狭与误区,让生成式人工智能最大程度赋能出版高质量发展。
参考文献
ChatGPT:Five Priorities for Research
[J].
/
| 〈 |
|
〉 |
