出版+人工智能:未来出版的新模式与新形态
——以《新一代人工智能发展规划》为视角
编委: 苏磊
关键词:
本文引用格式
张新新, 刘华东.
人工智能是指根据对环境的感知,做出合理的行动,并获得最大收益的计算机程序。人工智能包含的范畴特别广泛,包括但不限于智能推理、新闻推荐和新闻撰稿、机器视觉、AI艺术、智能搜索、机器翻译、语音识别、自动驾驶、机器人、深度学习、数据挖掘、知识图谱等方面;覆盖了经济、政治、社会、生态等各个领域,具体包括智能家居、智能教育、智能交通、智能金融、智能医疗、智能制造、智能超市等。
随着以大数据、深度学习、互联网为支撑的第三次人工智能高潮的到来,各行各业的从业者无不在理念和实践中感受到了较强的冲击和影响。就新闻资讯行业而言,机器撰稿、新闻推荐已不是新鲜事物:2017年8月11日,一则“四川九寨沟地震,中国地震网机器人写稿,用时25秒”的新闻引起了国内民众的广泛关注,人工智能离新闻出版业如此之近,是很多人所始料未及的。2013年美国“作家”人工智能技术平台Wordsmith自动撰写的新闻稿件数量达到3亿篇,超过了所有主要新闻机构的稿件产出数量;2014年,已撰写出超过10亿篇的新闻稿。新闻推荐、自动推荐则每天都在“今日头条”等各资讯类平台中无数次被应用,无怪乎大家感觉看了一篇报道之后马上会有类似资讯的出现。会写新闻的计算机人工智能程序大规模、持久性应用,将会导致的最终结果便是大量的传统新闻记者的失业,尤其是不涉及深度报道、评论类的新闻记者群体。
2017年7月《新一代人工智能发展规划》的发布标志着人工智能被列入国家战略层面,成为未来国际竞争的主要角力点。举全国之力,2030年抢占全球人工智能制高点、总体达到世界领先水平的战略目标,鼓舞和激励着国民经济各行业,涤荡和冲击着无数国民的心灵。
“不优雅转型,则遍体鳞伤。但是我们会优雅地完成这次转型,还是会在这个过程中变得遍体鳞伤?我并不确定。”杰瑞•卡普兰讲的是人工智能的转型大潮,但其过程、结果、预测恰如新闻出版业的转型升级过程。出版行业,从目前来看似乎还不是人工智能第一轮波及的“失业潮”群体。然而,从《新一代人工智能发展规划》所公布的内容来看,人工智能的快速发展将会对出版业产生颠覆性的改革,将会推动数字出版步入飞速发展的“快车道”;这种影响、推动,包括流程再造、内容重塑、业态创新、大范围高新技术的应用、传统生产方式的变革以及传统出版业态的智能化改造等。
1 未来出版:群体智能应用于流程再造
从人工智能的视角审视出版业,流程再造、流程重塑将会首当其冲,以大量的自动化、智能化系统取代人力资源的投入将会成为主要趋势。目前的编辑、审查、校对、印制、储运、销售等环节仍然依赖人力资源的大量投入,2013年央企数字化转型升级的目标—传统出版与数字出版的流程一体化,仍然没有全面实现。《新一代人工智能发展规划》中多次提到群体智能,包括四个方面的基础理论研究任务和八个方向的关键共性技术研究任务。实践表明,群体智能在社会其他领域已经得到了充分运用:基于群体编辑的维基百科、基于群体开发的开源软件、基于众问众答的知识共享、基于众筹众智的万众创新、基于众包众享的共享经济等等。
群体智能对出版流程再造最大的启发在于互联网环境下出版社内部编校共同体的数字化协同生产,以群体智能为理念先导、以知识体系构建为核心的出版流程再造将会在人工智能时代大放异彩:①在选题创意环节,基于知识体系的查缺补漏进行策划、约稿,将会在很大程度上发挥“蓝海战略”的竞争优势;②在审校环节,按照知识点对章节、片段进行知识标引,将会实现纸书、电子书、知识库等多种产品的同步上线、协同生产
2 未来出版:数据是生产要素
第三次人工智能浪潮最明显的特征是以大数据为基石,正是海量数据的积累和深度学习的应用,使得Alpha Go在第一局失败后,连战连胜,战胜了人类围棋冠军。《新一代人工智能发展规划》共有24处提及“大数据”,涉及农业大数据、金融大数据、工厂大数据、教育大数据、城市大数据、健康大数据等。应该说,我国的出版体制特点,决定了每个行业、领域都有相应的出版机构做知识服务支撑,上述领域的大数据构建,不可避免地会延伸到专业出版、教育出版和大众出版大数据的建设。
2017年3月8日,《新闻出版大数据应用工程》入选发改委大数据发展重大工程,这意味着国家层面的新闻出版大数据将正式步入启动和实施阶段。从数据类型来看,新闻出版大数据主要包括内容数据、用户数据和交互数据,也包括基于专业出版、部委出版社所产生的条数据和基于地域性出版机构所产生的块数据。新闻出版大数据的构建,要结合新闻出版业条数据、块数据同时并存、各有千秋的数据特点和规律,围绕着数据作为生产要素,重塑新闻出版数据的采集、存储、标引、计算、建模和服务体系。
长久以来,传统出版业将每一本书作为一个产品、一个数据单元加以销售,每本书动辄包含二三十万字,从数据价值的角度来说,是一种较大的浪费。换句话说,传统纸质图书的数据化价值没有被重视和挖掘,这在以数据作为能源、作为生产要素的人工智能时代,是需要极大改进和提升的。以数据作为生产要素来看,每本书可根据情况不同,分别拆分为数十到数百个数据单元,这些数据单元作为单一数字产品加以销售,其产生的价值将会大大超过一本书所实现的价值。用户数据和交互数据则长期被我国传统出版社忽略,很少有出版社构建自身的客户关系管理系统,更少有出版社采集对相关图书的反馈、点赞、评论等交互数据。与此相反,亚马逊的创始人杰夫•贝索斯“一直都知道力量存在于数据中。他花了近20年的时间,史无前例地积累了大量关于个人和集体购买习惯的统计数据,其中包括两亿活跃买家的详细个人信息。”
综上,传统出版社粗犷式的经营方式、以纸质产品为主的传统业态,导致了内容数据的价值没能被充分挖掘、用户数据的积累不足以及交互数据基本没有被采集的现象出现。而未来出版的大数据构建,需要以知识体系为基础,以知识标引为关键,研究数据驱动与知识引导相结合的人工智能新方法、以自然语言理解和图像图形为核心的认知计算理论和方法,以知识计算引擎和知识服务技术为枢纽,通过各行业、领域、学科的知识的标引、计算和模型建构,最终建成一个跨学科、跨领域、跨媒体的新闻出版业超级大数据。
3 未来出版:出版+智能化升级
未来出版的形态将会因为智能化的出现而呈现出智能化发展的方向。在知识服务领域,以知识计算引擎为核心的前瞻技术将得到大范围应用,进而推动知识服务向着纵深方向发展;在增强现实和虚拟仿真领域,在原有的3D实景建模、虚拟建模的基础上,智能建模将会被快速推广和迭代;在原有的MOOC、SPOC的基础上,大数据技术运用于在线教育将催生出以学习者为中心、以交互式为主要特点的智能教育新形态;人工智能作用于新闻出版业,还将带来一系列标准的立、改、废和法律法规的及时调整。
3.1 出版大数据是基石
未来出版形态,无论是知识服务、智能AR、智能VR,还是智能教育,都将以大数据为基石,这与整个第三次人工智能热潮产生的原理是一脉相承的。就知识服务而言,大规模、高质量的数据是知识标引的基础,是知识图谱形成的素材,也是知识计算作用于专业数据的前提。以法信大数据平台为例,目前该平台已经初步具备了智能化知识服务的雏形,其“同案智推”的模式可以在知识解决方案层面解决一定程度的“同案不同判”的问题,而随着法信平台的数据量越来越大,知识标引越来越精细,其大数据的预测功能、知识发现的价值将会得到更大程度的发挥。
就智能AR出版、智能VR出版而言,目前建模成本,尤其是虚拟建模成本居高不下,导致增强现实、虚拟仿真等技术在出版业的大规模应用始终不能实现,AR、VR模型数据量还不够庞大。随着AR模型的大量数据的积累,其参数、指标、规格、尺寸、比例等方面的共通性原理将被揭示,人机交互的体验感将进一步友好,输出展示终端将进一步个性化和常态化,AR出版将会进一步由教育出版、大众出版向着专业出版的方向渗透和延伸。
就智能教育而言,对学习者个人数据的采集、分析、评估、跟踪和回馈将会进一步发挥SPOC等教育模式的价值,变灌输式、填鸭式的教学方式为交互式、反馈式的教学模式,进而在技术层面推动教育的实质公平,真正实现因材施教、因人施教。
3.2 知识计算与智能知识服务
目前,新闻出版业第一批知识服务模式试点单位已经公布、第二批正在申报;知识服务技术提供商名录已经发布;法律、化工、地质等领域的知识服务产品研发取得了阶段性进展。但知识服务市场盈利能力还很薄弱,知识变现规模很小,知识服务的关键技术如知识计算引擎、知识图谱应用还没能突破,跨领域知识服务图谱尚未对接和形成,知识服务的高级形态—知识解决方案仍付之阙如。
未来知识服务的方向,将重点围绕突破知识计算引擎和知识服务关键共性技术而展开。《新一代人工智能发展规划》旗帜鲜明地将知识计算引擎与知识服务技术作为“关键共性技术体系”的第一项加以列出,明确指出要“重点突破知识加工、深度搜索和可视交互核心技术,实现对知识持续增量的自动获取,具备概念识别、实体发现、属性预测、知识演化建模和关系挖掘能力,形成涵盖数十亿实体规模的多源、多学科和多数据类型的跨媒体知识图谱”。
知识计算的类型主要包括属性计算、关系计算和实例计算,其作用在于通过海量知识数据的统计分析,得出背后的数据,推断出隐性知识。根据知识体系,研发知识元,构建知识元库;运用知识计算工具,对海量数据进行属性、关系和实例计算,进而实现知识发现的预期目标;单一领域的知识库,通过知识体系的连接,形成跨领域、跨媒体、跨数据类型的知识图谱,进而为全社会提供全方位、立体化、多层次的知识服务,包括信息服务、知识产品和知识解决方案。这种涵盖数十亿实体规模的跨媒体知识图谱,更有助于满足人民对美好生活的向往,有助于解决知识需求不平衡、不充分的问题。中国新闻出版研究院已经正式组建了国家知识资源服务中心,其“1+N”(一个国家知识资源中心+多个支撑中心)的模式,是最有可能实现跨媒体知识图谱的具体路径。
3.3 AR/VR的智能出版
AR、VR技术应用于新闻出版业目前在企业标准、行业标准研制取得了阶段性进展。在产品研发方面,从融智库统计的三大网络图书营销平台的数据来看,截至2017年7月份,全国共出版了276种AR图书
在人工智能时代,AR、VR技术应用于出版业,主要发力于以下几个方面:
其一,关键共性技术方面。建模的智能化将覆盖虚拟对象实体、虚拟对象的行为,更加增强虚拟对象行为的社会化、智能化和交互性,而不是停留在目前简单的交互层面
其二,人工智能经济方面。增强现实、虚拟仿真的高性能建模技术将会取得突破性进展,AR出版物的成本将大大降低;输出展示终端、设备将会更加友好化,开源便捷的开发引擎将会加速应用,AR、VR出版物的标准体系和评价体系将会出现;一大批AR、VR龙头技术企业将会出现,并成为文化产业尤其是新闻出版业的技术提供商,协助政府主管部门解决好AR出版物版权复合性、监管即时性、标准研制与应用等时代课题。
其三,智能社会构建方面。“虚拟环境和实体环境的协同融合,满足个人感知、分析、判断与决策等实时信息需求,实现在工作、学习、生活、娱乐等不同场景下的流畅切换”,这种虚拟环境与实体环境相融合的社会网络的形成,将会提升网络文学业态,推进网络文学演变为“阅读+沉浸式体验”的虚拟与现实并存的新生业态,这种新生业态将会以“AR+LBS”游戏的面貌出现在消费者的生活中。
3.4 智能教育的广阔空间
人工智能将广泛作用于教育领域,从智能教育学科的设立、智能教育人才的培养、智能教育环境的搭建到智能教育政策体系的形成,将无所不包。智能教育出版将会出现以下几种新业态:
3.4.1 基于大数据的在线教育智能化
从MOOC演进为SPOC,在线教育理念和业态升级的最重要的因素在于大数据技术的植入。2013年1月,哈佛大学法学院教授威廉姆开设了名为“著作权”的SPOC,成为哈佛大学对SPOC的首次尝试。2015年下半年开始,在线教育产品纷纷倒下,但在2014年秋开始的新东方SPOC却在2016财年(2015年6月至2016年5月)实现了2 000万元营收、付费用户17 000人次、教师最高单季度增收超30万元、开通SPOC的教师比率高达25%的优秀业绩。SPOC作为在线教育的最新发展模式、智能教育的雏形,已经展示出了较强的市场潜力,取得了预期的经济效益。
未来的在线智能教育平台将通过追踪每个学习者的学习时长、性格特征、高频错误知识点等学习行为特点,进行知识计算和大数据分析,找寻出学习者的学习规律,进而为每个学习者提供“线上+线下”的个性化、定制化教育服务,真正做到因人施教、因材施教,推进教育实质公平目标的实现。
3.4.2 基于语音识别的智能教育助理
世界范围内的企业巨头都纷纷推出了各自的智能助理,例如Facebook M、Amazon Echo、Google Assistant,Allo、苹果Siri、IBM Watson、微软小娜(Cortana)和小冰等。这些智能助理的共同特征有:基于语音识别、具备较强的交互性,能够提供对话式服务,同时集中于专业领域,主要提供信息和咨询服务。
致力于提供智能教育服务的“智能教育助理”在《新一代人工智能发展规划》也被列出,但是目前还没有现象级的产品出现。未来智能教育助理的发展应该仍然是以语音识别、会话式服务为主要服务方式,同时,关联着大量的教育服务数据库以及学习者本人的信息资料库,通过对该学习者学习行为的分析统计,进而为其提供全面、智能、快速的教育服务。
3.4.3 “交互+内置”式的智能教育机器人
《新一代人工智能发展规划》重点提出要研制和推广智能工业机器人、智能服务机器人、空间机器人、海洋机器人、极地机器人等特种智能机器人,其中空间机器人、海洋机器人、极地机器人这些特种机器人与国土资源系统的“三深一土”(即深地探测、深海探测、深空对地观测、土地科技创新)的国土资源科技创新战略紧密相关;而智能教育机器人则属于智能服务机器人的序列。
目前市场上的点读笔、学习机,甚至是机器人外形的学习设备,最主要的原理在于将相关儿歌、诗词、英语、故事等知识素材内置于芯片,然后通过单向灌输的方式向学习者传递,其最大的问题在于缺乏交互性,无法实现人机互动。
人工智能时代,在幼儿教育领域,智能教育机器人将会全面取代市面现有的点读笔和学习机等产品。智能教育机器人将以教育大数据知识库作为数据池,建立健全学习者个人的信息资料数据库,以语音识别来调取相关资料,以人脸识别来推送精准服务,进而实现与学习者的交流互动。这种交互式、智能式的教育将是未来智能教育的重要发展方向。
3.5 标准化体系重塑
人工智能影响的是社会生活的方方面面,人工智能时代的到来,必将在标准化方面引起相关领域标准的制定和修订。从标准的层级来看,《新一代人工智能发展规划》首先明确了当下人工智能领域标准体系亟待完善的现状,然后将初步建成人工智能技术标准作为战略目标提出。在具体内容中,提出重点培养“人工智能+标准”的横向复合人才,鼓励相关企业参与或者指导制定国际标准,尤其是鼓励智能机器人、智能制造、增强现实、虚拟仿真等产业领域形成标准体系,加强安全防范。最后,在保障措施中,专门提出要“加强人工智能标准框架体系研究”,并对技术标准、重点领域标准、国际标准的带动作用等作出了规定。
新闻出版业所涉及的人工智能领域的标准主要包括出版大数据内容、技术、运营等系列标准,AR技术在出版业的应用规范,VR技术应用于新闻出版业的标准规范;同时,未来的智能教育也将遵循智能机器人的相关标准,包括其硬件接口标准、软件接口协议标准以及安全使用标准等。笔者所在的国土资源领域,还将涉及空间机器人、海洋机器人、极地机器人等特种智能机器人相关标准。
3.6 法律法规的再定位
人工智能的飞速发展必然带来大量法律法规的立、改、废,甚至会引起伦理、道德层面的一些价值冲突。2017年10月27日,女性机器人索菲娅被授予沙特公民身份,成为史上首个获得公民身份的机器人,这涉及法律层面上的人格权的调整与重新定义。
在新闻出版法律法规方面,人工智能的发展可能会带来一系列新的难题:首先,AR出版物的版权归属问题。图片、文字的版权归属于作者,AR模型的版权归属于其所有权人,同一作品的多层版权问题由此而来。其次,大数据技术的广泛运用、知识库的纷纷建立,涉及每个章节、片段的“版权碎片化”问题,以及在“版权碎片化”的基础上,围绕同一专题、知识点而重组起来的整个知识库的“集成性创新”的版权归属问题。第三,AR出版物、智能机器人、智能教育助理等所带来的信息网络安全监管问题。这些产品形态外化的是人机交互,但是其关联的数据网站均隐藏于后端,内容安全和技术安全由单一部门归口管理,还是不同部门分别管理,等等。这些问题已经现实地摆在了我们面前。
4 结语
城市交通大数据联网带来的便捷与高效为我们的生活节约了很多的时间成本,但很少有人意识到,我们正处于一个由指令器、传感器、执行器(我们自己)所构成智能程序之中。人工智能就在我们身边,并不遥远。在不久的将来,我们必将更大范围地感受到知识计算、智能教育、智能机器人、混合现实智能等新的智能产品和服务所带来的福利与美好。
参考文献
新闻出版业大数据应用的思索与展望
[J].
OpenKN:网络大数据时代的知识计算引擎
[J].
“慕课之后,兴起私播课”
[N].
/
| 〈 |
|
〉 |
