人工智能技术与出版深度融合的焦点透视与趋势展望*
——基于CiteSpace的可视化分析
关键词:
本文引用格式
陈伊高, 黄楚新.
新闻出版业肩负着文化选择、传播、积淀和创新的重要使命。2013年,习近平总书记作出“加快传统媒体和新兴媒体融合发展”的重要指示。2023年4月,中共中央宣传部印发《关于推动出版深度融合发展的实施意见》,强调夯实数字时代的发展主阵地,始终用主流价值引领网络出版舆论,扩大主流价值影响力版图。十年间,出版业处于变革发展与探索转型的融合阶段,媒体业态、传播生态、媒介形式都发生了深刻改变。2022年末ChatGPT发布,掀起新一轮技术变革,生成式人工智能(AIGC)被列为全球2023年十大最新创新技术。[1]出版与技术的深度融合面临发展与安全的问题,2023年8月我国施行《生成式人工智能服务管理暂行办法》,激活数据要素需整合数据资源、加强数据引领、打通数据体系。[2]随着生成式人工智能应用的落地,理应思考人工智能技术如何契合出版产业数字化转型的不可逆趋势,进一步打开新时代出版高质量发展新格局。
1 研究概述
媒体融合十年,出版业的发展主阵地、产业格局、经营版图以及传播形式已然发生深刻变化。2018年,中央全面深化改革委员会第五次会议审议通过的《关于加强和改进出版工作的意见》明确提出建设出版强国的战略目标,2035年之前将我国建成出版强国。科学是一种存在问题的信息群。[3]科学、技术与社会是以各种不同方式相互依赖和相互独立的变量,科学和技术对人类文明的发展产生越来越深远的影响。技术作为人类文化中的一部分,而不是一个孤立的体系,这种思想也在长期的科技史研究中繁衍孕育。科学与技术之间的联系十分紧密且复杂,其发展与社会、经济、文化、教育、政治、法律等方面逐渐聚合在一起。2023年,以GPT、Bard等基于自然语言处理的生成式预训练大语言模型的迅速崛起为标志,人类的知识生产已经进入人工智能生成内容时代。以技术为导向推动出版业高质量发展,是落实出版强国战略部署的一大力举。
总体上看,面对新兴技术引发的新挑战,在“移动优先”理念的引领下,“央—省—市—县”四级融媒体按照媒体融合战略部署走稳落实,而传统出版业的融合节奏相对媒体机构稍显缓慢。如今,效率的最低限度已不再依赖于机器体系中部分的绝对速度,更重要的是为了实现维持和促进人类生活的终极目标,人类需要关注机器体系中各部分是否处于相对速度。即使从技术角度来看,机器中的各部分也需要协调一致,以确保能够为人们提供所需的动力、产品、服务和设施。为了达到这个目标,技术应用需要调整节奏,而绝非一味追求机器生产的效率。因此,需进一步厘清人工智能技术与出版融合的内在关系。
现阶段,出版业的智能化即通过人工智能技术,编辑、加工、审校知识信息,从而引发数字出版形态创新,越发凸显智能出版的先进性和技术化。人工智能技术对出版深度融合的赋能日渐显性化,出版业呈现了数字化、智能化、专业化、自动化的技术融合特征。与传统出版相比,智能出版的知识生产逻辑发生了根本改变。借助生成式人工智能系统的强大知识生成能力,知识的创造、整理与传播变得更加高效和智能化,知识生产过程中的人机协作变得更加密切,知识的开放和共享变得更加普遍和容易。以最新版GPT的生产力,只需14天就可以完成从古登堡时代到现代的所有人类书籍内容的整理工作。
人工智能技术的迅猛发展为人类的认知能力带来了显著提升,同时也产生了一系列不可回避的问题,需从法律和伦理的角度制定规范。在出版复杂系统视野下,媒介系统、符号系统和由人作为主体构成的运行系统的创新机制,随着人工智能生成内容的广泛应用,融入智能技术为支撑的出版机构不仅致力于“技术增效”,更有意于“IP运维”。一方面,新兴技术对传统出版业形成冲击;另一方面,新兴技术助力打开出版产业迭代的新格局,为构建出版学科自主知识体系创造发展机遇。
20世纪60年代中期,卡尔·米切姆对STS概念进行了最初阐释,其内涵核心为“科学、技术与社会”,主要强调了其作为一个学术领域的运动性质。科学、技术与社会是以各种不同方式相互依赖和相互独立的变量。依照广义的STS研究范式,是努力在这些依赖和独立因素中为后现代世界发现新的平衡。[4]本研究基于人工智能技术与出版融合的研究视角,概览媒体融合十年以来该命题下国内相关文献的关注焦点,展望人工智能技术影响下的出版行业发展趋势。综合采用文献计量法和质性分析,为出版深度融合找寻新的可行性与平衡性。一方面,夯实研究基础,即在出版融合的高质量文献中爬梳演进动态,以期加快出版学科自主知识体系构建;另一方面,辅以出版融合先进案例,为参与出版深度融合的多元主体提供一定参考。
2 文献计量
2.1 数据来源
为保证文献样本能覆盖出版领域的代表性研究成果,本文以CNKI为检索平台,选择高级检索方式,将检索条件设定为主题=“人工智能”AND“出版”、期刊来源类别=“CSSCI”,检索时间区间设置为2013—2023年,共获得478篇文献。为确保研究的精确性,研究者进一步做了数据清洗工作,经人工比对每一篇文章的摘要、关键词等基本信息,剔除会议论文、书评、报纸上刊发的文章、无作者的文章以及重复刊发的文章等步骤,筛选得到符合本研究主题的441篇有效文献。之后,全部选择以RefWorks格式导出,由此获取研究样本。研究样本采用CiteSpace6.2.R4软件分析,通过共现分析、聚类分析、突现分析及时间线分析,绘制可视化图谱,并进行图像解析和焦点解读。
2.2 研究方法
本研究主要采用文献计量法和质性分析,重点透视关于出版与人工智能议题的学术研究。以CiteSpace知识图谱可视化软件展示研究主题相关文献的关键词聚焦点和文献关联度,并对文献进行归类辅助分析。一是研究热点与前沿趋势分析,探寻人工智能技术与出版领域研究的文献关联、研究脉络以及前沿趋势;二是基于研究样本,观测媒体融合十年之中该研究议题的总体情况,了解相关研究者已经回应了哪些问题,当前关注哪些问题,从而进一步探析该命题的未来研究方向。文献计量的可视化方法,可以突出技术与出版的深度融合,聚合学界对人工智能与出版融合的深度思考。在此基础上,切合时代背景和国家战略,提炼出版融合应用人工智能技术的探索经验,以期对出版深度融合予以启示意义。
3 国内人工智能与出版融合研究议题嬗变的可视化分析
将CiteSpace软件节点类型选为关键词,时间切片设为1,TopN阈值设为25,即在每个时间切片中提取25个被引次数最高的文献。按此设定进行研究主题分析,对检索文献进行关键词共现分析,制作关键词共现图;采用聚类分析,制作关键词聚类图;选择突变分析,制作关键词突变图;制作关键词时线图,呈现研究主题的整体演化进路,展现国内出版业与人工智能技术相结合的研究脉络、主题分布及热点前沿。
3.1 关键词共现图谱分析
本研究的关键词共现图谱共计273个网络节点、655条连线,网络密度为0.0176,显示了人工智能与出版融合的研究领域的关键词及其内在联系,如图1所示。图中网络节点大小代表关键词出现的频次;圆圈大小代表关键词频次,频次越高,圆圈越大;连线所示为关键词的共现关系,连线的粗细程度代表关联紧密程度,网络密度是该研究领域所有关键词的联系紧密度。
按不同年份标注的颜色可见,出版领域人工智能、数字出版、智能出版、科技期刊、出版业的研究具有持续性的研究关注度,频次高,关键词的中心性强。近年来,该主题研究视域下,知识服务、学术期刊、媒体融合、教育出版、大数据、融合出版、融合发展、元宇宙等关键词热度上升。从关键词的分布来看,研究者的关注范围较为广泛,涵盖人机关系、经营模式、业务板块、期刊分类、人才队伍建设、技术伦理等多重维度,由此可见人工智能技术与出版的融合并非概念性的形式化,出版融合已经产生了技术逻辑、内在机理和研究范式的转向,打破了传统出版学的学科藩篱。图1中网络密度为0.0176,研究视角较集中,即该研究涉及的多个焦点有明显的关联性、交叉性。
图1
通过此图可知出版融合十年的研究热点涉及技术逻辑、出版流程、生产模式、产业形态等多个方面,既包括人工智能、大数据、5G、区块链、元宇宙等技术方面的研发创新与运用形态,也包括实施媒体融合战略以来,出版融合发展呈现出了数智化特征。技术引发的新兴生产力供给刺激了出版业的生产关系、产业结构,研究者普遍关注了出版行业面临的技术冲击。
3.2 聚类分析
选择CiteSpace的LLR聚类选项对关键词共现网络进行分析,对国内人工智能技术与出版融合的核心研究内容进行梳理。聚类标签设定为关键词,自动生成12个人工智能与出版具有关联性的研究类别,序号为0#~11#。序号数字由小增大,对应该聚类的重要性由低到高,如图2所示。
图2
Q值即聚类模块值,临界值为0.3,Q值大于0.3意味着聚类结构显著,图2关键词聚类分析图谱的Q值为0.4942,表明聚类的网络模块度相关性紧密。S值为聚类平均轮廓值,临界值为0.5。当S值大于0.5,说明聚类合理;当S值大于0.7,说明聚类令人信服。本图谱的S值为0.7627,说明多个聚类群体之间具有相对显著的同质性,聚类合理且令人信服。这12个聚类与上文关键词共现结果结合分析,可以分为出版机制研究、出版技术创新研究和出版产业应用研究3个大类。
3.3 突现分析
利用CiteSpace软件进行出版研究领域的关键词突变探测(burst detection),识别出不同频次对应的关键词,并显示它们增长的起止时间。通过实现分析,能够识别出不同时间段的研究热点,并获得各个时期的突现词。突变强度增加,表明在这一时期,围绕特定关键词展开的相关主题研究的影响力跃升。这种方法能够更全面地理解人工智能与出版融合的研究动态,为今后的同类型研究提供有价值的参考和创新方向。本研究选取了25个突变词及其起止时间,突显程度按由高到低的顺序排列,如图3所示。据突现值排序,笔者结合国家战略方针及该时段的文献,对排布在图中前四位的突现词逐一进行解析。
图3
“出版业”一词以3.72的凸显程度位列第一。出版业这一研究主题在2018—2019年具有很强的研究价值,研究结论认为人工智能推动了出版流程中选题策划、内容生产、编辑加工、传播发行的智能化、精准化,规模化,但过分依赖数据可能引发出版内容同质化、碎片化问题,以及机器生产面临的版权风险。此外,编辑加工自动化对编辑技术人员的工作形成替代等消极影响。
“语义网络”一词的突显程度为2.49。2015—2017年,语义技术的丰富与成熟表现为出版物本体建设、语义功能识别与标引、出版物内容语义组织三大主要方面。语义网络基于规定的数据执行精准操作,解决特定问题,在数字出版环境中,出版商作为数据提供者,为用户提供广泛的信息并且自由获取所需数据的支持。此外,图3中“技术赋能”“大数据”“算法”“增强现实”“全媒体”等词语也反映了技术与出版的融合。
“融合”一词的突显程度为2.18,2018年热度上升。传统出版与新兴出版融合发展在时间切片上的演化路径展现了技术驱动下的出版形态、结构、组织和模式的转型升级。“出版+技术”指的是出版业以大数据、人工智能、AR/VR/MR、区块链等技术为支撑,拥抱新媒体、新业态、新模式,升级产品服务,拓展产业边界。
“开放科学”一词的突显程度为2.12。国际方面,2021年11月联合国教科文组织发布《开放科学建议书》。由此,全球开放科学的发展进入了崭新阶段。在政策的支持和引导下,我国出版界对出版诚信与伦理的重视程度大幅提升,构建出版伦理理论体系,防范学术不端、内容失真的意识逐渐增强,出版伦理学术活动日益活跃,相关研究项目和论著呈持续上升趋势。
3.4 时间线分析
图4
因人工智能技术偏向性的出版机制变革研究普遍从出版业的内容生产模式、经营管理模式、风险应对模式、人才培养模式等方面切入:在内容生产中,人工智能的技术逻辑再造出版流程,生产力关系随之发生变化;在经营管理中,人工智能对网络版权监管、信息科技人才的关键能力构建等产生重大影响。基于实务层面的革新,传统出版业规制准则难以为继,出版企业亟待解决需求与技术匮乏的矛盾,生成式出版物与版权风险的纠纷,以及智能推送与算法歧视的冲突。在出版人才队伍建设的议题中,提升期刊编辑的数字素养和专业技能是出版深度融合的重要着力点。2023年,生成式人工智能热度爆发,关于人机关系走向的探讨骤然增多,技术对人力的挤出、出版物的权责归属以及人工智能技术治理等研究视角留有大量空间。
站在技术创新研究视角,科技与数字出版产业的深度融合是出版业高质量发展的必然要求。人工智能正引领出版业的智能时代,这一趋势颠覆了传统的知识生产、解读和传播模式。以ChatGPT为例,人工智能与出版的融合进路在顶层设计上始终坚守技术向善、人文关怀以及意识形态工作的极端重要性,受制于生成式人工智能的技术逻辑,研究者多聚焦ChatGPT在学术出版应用场景中的伦理困境,围绕技术安全与行业发展的平衡协调,考量出版物的内容可信度、智能算法设计的主观性、价值对齐的风险挑战,并提出版权监管的调治路径及应对策略。
应用研究主要关注出版场景的开发,人工智能技术与有声读物、云出版、古典文献等联系密切。技术融合之初已涉及内容生产、知识服务、出版流程等领域。近年来,主题出版导向、知识生产体系则备受重视。研究者重点回应了诸多出版实务的转型升级问题,例如思考机器参与智能出版的人机关系主体间性;出版产业链如何向数字化、智能化方向延伸拓展;全媒体体系增强现实技术、多模态模型如何丰富全息出版图景;技术创新如何迅速融入学术出版、主题出版领域的选题策划、内容设计等。
4 生成式人工智能与出版深度融合的趋势展望
以ChatGPT为代表的生成式人工智能大模型成为新一轮科技创新引爆点,加速了出版智能化时代的到来。在内容维度上,AIGC可提供一种生成式人工智能的出版生产方式;在技术维度上,AIGC是可用于出版流程自动化的一类技术集合。技术对于出版行业而言,既有推力,也有冲击。因此,在人工智能佐助出版深度融合的探索实践中,必须高举中国特色社会主义伟大旗帜,坚定不移地走好中国特色社会主义文化发展道路,坚定四个自信,始终践行社会主义核心价值观,不断巩固壮大主流思想舆论,持续提升宣传思想文化工作水平,长效落实精神文明建设工作。
4.1 注重技术审度,主流价值导向驾驭算法
技术发展的目标是舍弃无用的机器和繁琐的规定,减轻人们的负担,但并不意味着完全回归手工劳动时代。开启科学实践领域的权力关系,即一种解蔽关系、一种真理关系。[5]人机协同模式下,维持生产关系的和谐是出版深度融合的效能保障。智能出版领域的机器人应用,正在推动“出版+人工智能”新模式的涌现和升级。从顶层设计来看,2022年1月,《中华人民共和国科学技术进步法》正式实施,明确了国家将积极推动开放科学的发展;2022年3月,中央办公厅、国务院联合下发了《关于加强科技伦理治理的意见》,进一步完善对科技伦理治理的顶层设计;2022年4月,中共中央宣传部颁布《关于推动出版深度融合发展的实施意见》,强调要坚持正确发展方向,优化出版生态环境;2023年5月,习近平总书记向2023中关村论坛发出贺信,表明了我国支持和推动开放科学发展的积极态度。
新闻出版业通过理念、内容、技术等方面的创新推进融合出版的高质量发展,还需解决技术、伦理、资本等多方博弈的问题。[6]例如,人工智能的“算法黑箱”持续引发研究者的热议和疑虑。“道德物化”的科技伦理启示在于不再将科技和伦理二分,认为科技产品内部可以嵌入道德价值。这一思路不仅重视反思出版物中是否物化不当价值,同时积极地考虑将恰当的价值嵌入物。[7]按此逻辑,主流价值导向驾驭算法应成为出版深度融合的技术标准核心,AIGC除降本增效的技术理性之外,必须考虑发展与安全的平衡性,且出版工作者天然是技术伦理的践行者。体系建设是出版领域做好战略布局的基础。核心的问题是,在技术驱动的深度智能化时代,如何运用技术赋予的权力构造一种可以让人们能够共处的生活方式。[8]出版业的科创体系建设不仅是出版融合的有力支撑,也是出版行业自身发展的迫切需要,出版领域应探讨一套基于伦理与政治安排的全新的社会契约。只有推动文化产业与科技融合发展、促进项目管理和制度创新协调发展、鼓励技术研发纵深发展,才能更好地建立完整的科技创新体系。数字治理方向的社会试验需厘清各方角色与责任,区分数据的控制者和处理者,并且明确出版企业在数字治理业务中的责任与边界。[9]
4.2 突出理论创新,构建出版学科自主知识体系
出版文化是人类知识生产与文化传承的基础和核心。[10]编辑出版学是中国自主知识体系建构的重要组成部分。智能时代的知识生产与传播重塑了出版体系的底层逻辑,以内容为核心,技术为抓手,呈现数字化、智能化、场景化、定制化的新特征。人工智能技术集群的特性与功能,创新了“AI+内容”的知识生产和知识服务,将不断弱化以图书为载体的传统出版理念。因此,应不断完善编辑出版学的学科体系、学术体系和话语体系,全面推动编辑出版学的基础理论创新、学科建制创新、人才培养创新,从而进一步推动中国学派建设。
迈入新时代,应借助人工智能技术,提升出版物原创性,推进出版理念创新、出版内容创新、出版技术创新、出版业务创新。一方面,从供给端促进知识生产创新,通过场景化、多元化的知识产品研发,构建“人+机+场景”的知识生产模式。例如,虚拟数字人在图书出版领域的多元身份将充分赋能出版全产业链条,助推出版产业智能化转型升级,引领出版融合新生态的全面构建。此外,出版企业应精耕知识服务范式,实现从单向服务到联盟体服务、从单一知识产品服务到多形态知识服务,从单个领域向多个领域跨界的多功能型知识服务。例如,出版机构运用自然语言生成技术,将本土化的学术论文快速传播到国外,提升我国学术论文的国际传播效率,形成更为广泛的国际化学术合作和知识共享;阅文集团推出了国内网络文学行业首个大模型“阅文妙笔”,上线了基于该模型的应用产品“作家助手妙笔版”[11]。
4.3 增进虚实交互,担负新时代文化使命
出版始于知识积淀与文化传承,未来将实现知识服务与“科技+文化”的新一轮双核转化。2022年5月,中共中央办公厅、国务院办公厅印发《关于推进实施国家文化数字化战略的意见》。以人工智能技术加速文化数字化,是出版深度融合的可行性路径选择,有益于建设文化强国、提升国家文化软实力。2022年10月,党的二十大报告中提出“铸就社会主义文化新辉煌”的目标要求,文化已被纳入中国式现代化建设的考量维度。2023年6月,习近平总书记在文化传承发展座谈会上发表重要讲话,出版机构应深刻理解和把握“两个结合”,突出“第二个结合”;2023年10月,全国宣传思想文化工作会议首次提出习近平文化思想。出版人才队伍需遵循文化实践工作布局上的方法要求,从文化认识观点上激发出版融合的创新举措和发展动力,通过人工智能技术将中华优秀传统文化的内容、形式、精神、价值等方面进行创造性转化,为实现中华民族伟大复兴提供重要保障。
中华优秀传统文化创造性转化的实质是“推陈出新”,AIGC结合出版场景将为古籍保护和文化传播提供建设性方案。例如,对古籍进行数字化沉浸设计,探索基于AI绘画、VR体验等数字方式的教学与传播设计方法等。国家图书馆的“基于典籍整理的传统文化图典标引与素材库建设”项目将传统文化图像纳入中华传统素材库,实现古籍文本智能开采。该项目与文化大数据体系对接,推动数字资源汇聚共享;与深圳文化产权交易所、成都文化产权交易所合作,共同打造数字出版产业链。中华书局创新借鉴数字技术,以“中华名人数字人元宇宙”为代表,通过3D建模和人工智能,以超写实的数字人形式呈现中国文化偶像苏东坡。从这种转化的实践而言,AIGC能够为中华优秀传统文化的创造性转化提供便利,形成中华优秀传统文化与马克思基本原理的互嵌,塑造用户具身感知,建构规律性的文化转化体系。
4.4 促进成果共享,挖掘数据化附加价值
数据在促进出版供需匹配、生产端和消费端的高效循环中,发挥着更加重要的作用,数据思维需贯穿整个出版流程。随着数据资源的广泛开放,通过深入的数据分析,出版企业能够更精准地提供与读者需求匹配的定制化内容服务。目前,出版领域技术赋能的一批科技创新成果崭露头角,如地图大数据融合出版知识服务平台,基于大模型的轻量级智能出版知识服务平台,基于历代典籍整理的中国传统文化图典深度标引与素材库建设,基于区块链的全媒体医学数字出版平台,基于图书用户行为大数据分析与应用的新零售智慧书店系统,基于《竺可桢全集》的大数据挖掘和人工智能问答融合出版技术,基于知识图谱和云原生技术的数字教育云平台、科技期刊国际化数字出版平台、数字教材服务平台、数字教材“云创”平台、图书电商智能配送管理平台、“中华先贤数字人”之“苏东坡3D超写实数字人”等。
“数字化”一词在《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中出现了25次,数字社会、数字技术、数字孪生等词语累计超过60次。“数字化”是技术向度,指的是把模拟数据转换成用0和1表示的二进制码,而“数据化”则是信息向度,是把现象转变为可制表分析的量化形式的过程[12]。从关注技术到关注信息本身,迈向通用场景的生成式人工智能具备赋予出版“数据化”附加价值的潜力,这也意味着需发挥多元主体协同作用,整合资源,激发创造力,提升出版服务水平,实现出版成果全民共享。数据要素的本质是高流动性。对数据主体最大的保护是通过加强数据的流动性,发挥数据的生产要素功效,造福数据主体[13]。在人工智能技术的赋能下,随着文化产业边界的消弭,知识服务将朝着个性化、场景化、智能化和公平化的方向发展,逐渐促成“知识服务—知识产业—知识经济”的效益转化,此过程应以社会效益为优先级,达到两个效益相统一。中国新闻出版研究院与北京版上阅动科技公司合作的“版阅AI内容服务平台”为新闻出版业提供智能审校、对话式AI应用和综合解决方案,实现高效准确的内容编辑和安全把关,用户通过与AI助手互动完成编辑审校工作。中国地图出版集团自主研发智慧地图服务平台GISWAY,运用深度学习等技术,推动交互式数字地图创新。该平台以“用地图讲故事”的方式占据舆论主阵地,以在线平台众包方式吸引创作者编著沉浸式故事;通过图文叙事、交互体验、3D场景和故事感,为出版物注入感染力和传播力;采用城市地图数据集生成城市人口真实画像,为城市规划、政府管理和企业洞察提供科学依据。
5 结语
面向未来,数智化发展趋势下的出版深度融合不仅致力于媒介传播生态的智能化,更致力于将科学、技术与文化融为一体。人工智能是出版领域的“技术新基建”,需统筹规划算法、算力、数据三大核心要素,不断完善优化出版业基础设施体系;以技术创新为驱动,以数据为核心,以信息网络为基础,面向高质量发展需要,提供数字转型、智能升级、融合创新的知识生产和知识服务;根植中华文化沃土,突出中华文明的连续性、创新性、统一性、包容性与和平性,促进出版事业和出版产业繁荣发展,推动中华优秀传统文化保护传承,形成具有中国特色、中国风格、中国气派的自主知识体系。结合出版实务,发展以人工智能技术创新为主的新质生产力,有利于增强出版物出海的国际影响力和传播力,为党的新闻舆论工作提供智力支持和理论支撑,推动中国特色社会主义文化建设以及中华优秀传统文化的创造性转化和创新性发展,助力我国尽早实现建成出版强国的目标,谱写中国式现代化的出版文明新篇章。
参考文献
Top 10 Emerging Technologies of 2023
[EB/OL].(
In Search of a new relation between science,technology and society
[J].
/
| 〈 |
|
〉 |
