科技与出版, 2021, 40(12): 87-90 doi: 10.16510/j.cnki.kjycb.20211220.003

编辑实务

编辑出版质效提升中的新技术应用分析与展望

程军

人民教育出版社课程教材研究所,100081,北京

摘要

科技进步和创新是推动我国出版业转型升级的关键因素。如何利用新技术为编辑出版赋能增效、促进传统出版与新兴出版技术的融合发展,是出版界需要研究的重要课题。文章介绍了不同新技术在提升编校质效方面发挥的作用,分析了当前编辑出版工作中运用新技术存在的问题,提出从出版技术融合、出版流程优化、出版理念提升等方面借助新技术来提升编辑出版质效。

关键词: 新技术 ; 编辑出版 ; 质效提升 ; 技术赋能

PDF (4088KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

程军. 编辑出版质效提升中的新技术应用分析与展望. 科技与出版[J], 2021, 40(12): 87-90 doi:10.16510/j.cnki.kjycb.20211220.003

2021年5月7日,国家新闻出版署在《关于组织实施出版融合发展工程的通知》中指出:要形成融合发展、高质量发展的内驱动力和有效行动。如何利用新技术为编辑出版工作赋能增效,是我国出版业需要研究和解决的重要课题,也是促进我国出版业高质量发展的必要举措。

“技术赋能”是利用技术增加或扩张人的能力,从而产生更好的结果。具体到编辑出版领域来说,“技术赋能”就是充分利用技术手段提高编辑出版工作的质量和效率。构建一种适合新形势发展需要的质效保障机制是提升出版工作质量的关键。已有研究成果从编辑人员素质,编校流程和程序,参考文献、引文、术语等专项内容的编辑加工等角度论述了质效控制问题[1],也有一些文章探讨了“互联网+”“人工智能”等新技术在编辑出版工作中的应用问题。但整体来看,这些文章多是从理论层面进行论述,少有从具体实践层面开展的研究,这正是本文关注的重点,即如何利用新技术提升编辑出版工作的质效。

1 编辑出版工作中新技术应用现状

1.1 利用“标注和提取”技术进行关键词核查

编辑利用标注技术可以一次性将稿件中的关键词标注出来,再通过校对软件对被标注的关键词进行重点核查,可以有效提高稿件中的错误排查率。例如,如果编辑将错误词条“心肌梗塞”及其对应的正确词条“心肌梗死”导入有标注功能的校对软件,稿件中若出现了“心肌梗塞”这个错误词条,校对软件会自动标注出来并给出修改提示。“关键词提取”是借助中文分词等技术实现词性标注、专名识别、新词提取等功能。具备该功能的软件比较常用的有:复旦大学自然语言处理实验室开发的中文自然语言处理工具包(FudanNLP)、北京理工大学大数据搜索与挖掘实验室开发的NLPIR大数据语义智能分析平台、中科院开发的NLPIR-ICTCLAS汉语分词系统等。

1.2 利用“模糊匹配”技术进行一致性检查

针对术语前后文表述不一致问题,编辑在工作中常用的“全字符匹配”方式无法解决,而利用“模糊匹配”技术则能更好地发现这类差错。“模糊匹配”与“术语标注”在功能侧重上有所不同,后者需要编辑提前导入错误词条和正确词条,而前者则是利用中文分词技术,自动对比上下文相似词条来完成一致性检查。编辑将“全字符匹配”和“模糊匹配”技术结合使用,可以兼顾准确性和一致性。

1.3 借助“通配符”和“VBA”查找和修订

“通配符”是能够代替指定信息的字符,编辑利用“通配符”可以快速查找和替换电子文档内的指定内容。以MS Word为例,利用“通配符”可以快速查找并一次性提取引号、书名号、括号等符号内的重点信息,提高查找和修订工作的效率。编校中常用的通配符包括:“?”检索任意单个字符,“*”检索任意字符串,“[ ]”检索指定字符之一,“<>”检索指定开头和结尾的字符,“^#”检索任意数字等。通配符的种类和功能比较多,编辑可以根据工作需要灵活运用。如果需要在MS Word中反复执行某项任务,还可以利用VBA(宏,Visual Basic for Applications)来实现。VBA是一种专用编程语言,通过VBA可以实现一键检索指定网页并呈现检索结果的功能,提高检索和核对术语、参考文献等信息的效率。

1.4 利用权威数据库检索和核查信息

编辑在核查稿件中的一些重要信息时,可以借助一些权威数据库,比如中国共产党思想理论资源数据库、晚清民国期刊全文数据库(1833—1949)、中华文史工具书数据库、术语在线等。除了可以查询我国数据库,编辑还可以参考一些外文数据库,比如美国当代英语语料库COCA(The Corpus of Contemporary American English)、多语对照语料库Linguee等。这些数据库的网站也可以通过“VBA”嵌入到文档检索功能中,提高检索信息的效率。

1.5 利用自动化软件辅助校对参考文献

为了提高参考文献的校对效率,有学者研究并提出了一些参考文献辅助校对的方法,比如基于百度学术的参考文献校对方法。[2]但这些方法需要根据不同的出版格式体例要求修改代码,编辑掌握起来相对复杂,而一些智能的软件更容易操作,比如“腾云期刊协同采编系统”“善锋参考文献自动校对系统”以及NoteFirst知识管理软件的参考文献辅助编校系统。借助这些校对系统可以实现对参考文献中的姓名、题名、刊名、出版时间等自动校对。校对结果还可以一键链接到其他数据库(知网、维普、PubMed、Elsevier等)进行二次校验。

2 当前编辑出版工作中新技术应用的不足

虽然新技术在当前出版工作中已经得到了一定的应用,但还存在一些提升空间,主要体现在以下3方面。

2.1 新技术应用的智能化有待提高

现有的校对软件多是以人工维护字词库或语法库来实现校对,且主要检查的是标点符号、不规范术语、敏感词、异体字等,虽然一定程度上也降低了人工审校的工作量,但仍存在一些不足。比如术语库更新不够及时,没有收录最新的时政类术语和新近出现的学科术语;对于需要结合上下文语境才能判断的错误,现有校对软件也无法准确提示;有些结构比较复杂的句子,校对软件在进行分词处理时容易出错,导致误报、错改。以“黑马校对”软件为例,会把“美国加利福尼亚州神经外科资深专家罗斯”中“亚州”提醒为“亚洲”,这是典型的分词错误导致的误报。

2.2 已有的新技术应用有待整合

目前,可利用的新技术提供的功能往往针对的多是编辑出版的某个环节,比如“黑马校对”软件主要针对字词错误,“腾云采编系统”的自动审校侧重引文和参考文献,“善锋自动校对系统”则只用于参考文献校对。再比如,国内几家采编系统提供的服务针对的主要是投稿和审稿环节,编辑系统有所欠缺。由于商家对新技术的整合不足,造成出版各环节人员无法形成高效的协同工作模式。目前,这些新技术工具多是非开源产品,代码不对外提供,不同产品之间的数据库无法打通。如何使第三方新技术产品与各出版机构内自有编辑出版系统相互贯通,是亟待解决的问题。

2.3 编辑应用新技术的观念有待提升

编辑出版现代化是编辑出版主体将先进的技术和理念作用于编辑出版客体,从而不断提高编辑出版水平的一个动态化过程。[3]但是,技术的变革通常具有跳跃性,而编辑主体意识观念的更新则是一个渐进的过程,这种发展的不平衡导致一些编辑人员在思想观念上未能与时俱进,仍然采用传统的方式开展编辑工作。此外,一些新技术应用在初期需要编辑投入很多时间学习,因此一些编辑人员会产生抵触心理,导致先进的编辑出版技术难以得到充分运用。[4]技术的发展与完善需要使用者不断实践并提出改进需求,如果编辑人员普遍缺少使用动力,也就无法及时发现现有技术工具的缺陷。

3 利用新技术提升编辑出版工作质效的思考

针对当前编辑出版工作中新技术应用存在的问题,今后应积极推进出版技术融合、出版流程优化以及出版观念更新,进一步提升编辑出版工作的质量和效率。

3.1 推进“人工智能+编辑出版”的融合,构建智能化的编辑出版模式

针对现有校对软件在校对时效性较强的术语方面存在的不足,可通过选取优质的语料训练算法来优化校对效果。比如,新华社设计的“基于新闻语料库的中文智能校对”方案利用大规模新闻语料训练来改善校对效果,就是具有代表性的可行路径。该方案利用大量新闻语料作为机器深度学习的样本,通过计算出“正确词—错误词”的组合概率来实现错误判断,有效解决了校对词库容量小、即时性不足的问题。以文稿中出现的“某某国总理张飞”为例,如果校对软件中没有提前录入最新的某某国总理资料,会造成漏判;但如果语料库数据包含了最新的组织机构资料,校对软件就会提示错误信息并提出修改建议。[5]与此类似,如果选择各学科专业性图书作为机器深度学习的样本,通过对已出版的规范学术文献或图书内容与作者提交的初稿对比,可以有效提高软件对学术性、理论性错误的校对能力。前文笔者提到的运用自建术语库提升“黑马校对”软件的术语校对能力的方法,本质上也是基于语料库改进校对功能的思路。在现有技术条件下,也可以尝试利用“网络爬虫程序”等方式抓取更大规模的语料,通过自动分词技术提取关键词和术语,从而有效弥补现有校对软件智能化程度的不足。

在人工智能与编辑出版的融合方面,一些最新的文献以及数字出版产业年度报告均有提及,但未见深入分析,可见目前人工智能与编辑出版活动的融合程度还不是很高。[6]近年来,自然语言处理(natural language processing,NLP)等技术为语言分析领域注入了新的活力,比如《洛杉矶时报》开发的Quakebot、《华盛顿邮报》开发的Heliogra等机器人,已经可以生成含有分析、评论的新闻。可以预见的是,日臻成熟的人工智能技术将会在选题、组稿、审稿和营销等各出版环节得到越来越多的运用。

3.2 推动协同编辑出版平台建设,构建一体化编辑出版流程

协同编辑理念是将编辑、审读、校对、排版、发行甚至作者创作等业务流程整合到一个平台上,使人与人、人与机器产生良好的交互协作关系,实现编辑出版流程的协同化和一体化。一方面,协同编辑平台可以建立人与人的交互协作关系。作者、编辑、专家、读者可以在一个平台上进行交互式协作,打破条块化的工作模式。国外如朗文出版集团、哈珀·柯林斯出版集团很多年前就已经运用字典生产系统(dictionary production system,DPS)协同编纂词典。国内如外语教学与研究出版社和英国柯林斯出版公司合作开发《新世纪英汉大词典》(以下简称“《大词典》”),就是运用协同编辑技术的代表。通过协同编辑平台,《大词典》的译者、审订者、编辑、专家、英方有关人员就内容进行实时交互式协同。另一方面,协同编辑平台还可以建立起人与机器的交互协作关系,在弥补校对软件功能缺陷的同时,使编辑出版人员更便捷地获取外部资源的支持。如在新华社新闻编辑系统中,“黑马校对”软件就作为功能模块被集成到新华社的编辑器里使用。在协同编辑平台建设过程中,可以将术语在线等权威术语库、知网期刊论文数据库等作为参照数据库,在协同编辑器中设置专门的校对功能模块进行调用;还可以将前文提及的“参考文献审校系统”“基于自然语言处理的智能编校系统”等集成进来,用于对稿件的科学性、创新性等进行把关。实现这一目标,需要出版机构在协同编辑出版平台建设过程中,积极与各软件技术开发公司协商,解决技术闭源性的问题。

从目前我国出版实践来看,各出版机构主要进行的是以ERP平台为中心的出版管理活动的协同化,而编校活动的协同化并未大范围开展。实际上,二者应该进行一体化建设,实现对全编辑出版流程的管理,最终产生内容交互加工、产品协同发布、资源互联互通的协同效应。

3.3 提升编辑的技术素养,建立人机协作的编辑出版理念

随着云计算、大数据、人工智能、5G等新兴技术在各领域内容产业的广泛应用与深度融合,人机协同模式的应用将日益普遍,机器与人将迈向“双向理解”和“双向学习”的深层次交互关系,建立起彼此依存的对话机制。[7]在数字媒体时代,编辑出版人员需要处理的内容类型将不断拓宽,新时期的出版人员要树立人机协作的编辑出版理念,突出技术素养在编辑核心素养体系中的重要地位,把相关新技术融入编辑出版工作各个环节中,探索借助新技术为编辑出版事业赋能增效的现实路径。

4 结语

新时期,编辑出版行业面临着很大的挑战,同时也拥有前所未有的发展机遇。虽然目前以人工智能为代表的新技术还处于探索阶段,但随着各种技术的发展成熟及其与编辑出版工作的不断融合,未来各种新技术必将在编辑出版工作提质增效过程中发挥重要作用。

参考文献

马嘉.

层层把关、标本兼治:构建图书编校质量控制流程

[J]. 科技与出版,20186):80-83.

[本文引用: 1]

程红.

Word2007既有功能的新应用:参考文献编辑校对

[J]. 编辑学报,2015275):459-461.

[本文引用: 1]

马俊李亚妮.

编辑出版现代化认识上的几个误区

[J]. 编辑之友,20108):31-33.

[本文引用: 1]

卢苇.

编辑出版技术手段现代化面临的问题及其对策探析

[J]. 新闻研究导刊,201781):241.

[本文引用: 1]

靖纯.

基于新闻语料库的中文自动校对改进方案探讨

[J]. 中国传媒科技,20166):15-17.

[本文引用: 1]

白贵王太隆.

人工智能环境下编辑角色的再定位

[J]. 中国出版,201911):5-9.

[本文引用: 1]

中国数字出版产业年度报告课题组.

步入高质量发展的中国数字出版:2019—2020年中国数字出版产业年度报告

[J]. 出版发行研究,202011):20-25.

[本文引用: 1]

/