科技与出版, 2017, 36(10): 108-111 doi: 10.16510/j.cnki.kjycb.2017.10.030

研究与教育

科技期刊采用XML结构化排版的优势与应用实践分析

苏磊, 李明敏, 蔡斐

北航文化传媒集团《航空学报》编辑部,100083,北京

通讯作者: ✉通讯作者。

编委: 张广萌

摘要

媒体融合的潮流势不可挡,传统出版走向数字出版已成为主流趋势,快速、便捷的排版成为科技期刊数字化和网络化的一个重要环节。按需出版、在线发布和加入全文数据库等促使科技出版社转变传统的出版流程。为适应这些变化,科技出版界正竭力寻求简单高效的工作流程,XML作为一项文档标记规范已逐渐应用于科技期刊的出版工作中。本文分析了传统排版和XML结构化排版的区别,突出XML结构化排版的优势;最后结合国内外实际,分析XML结构化排版在国内滞后的可能原因并给出一定的建议。

关键词: XML排版 ; 方正排版 ; 传统排版 ; 结构化 ; 学术传播 ; 显示度

PDF (2376KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

苏磊, 李明敏, 蔡斐. 科技期刊采用XML结构化排版的优势与应用实践分析. 科技与出版[J], 2017, 36(10): 108-111 doi:10.16510/j.cnki.kjycb.2017.10.030

作为科学技术知识的载体,科技期刊的发展基本能够反映一个国家的科技成果、科技创新水平和国家综合能力。那么如何更好地提高科技期刊信息服务的效能以及拓展信息服务的范围?在通信、计算机、网络化信息高速发展的时代,积极、充分地利用现有信息技术,是提高科技期刊发展水平的必然选择[1],即实现科技期刊的数字化和网络化。在传统纸质出版向数字化、网络化出版的转变过程中,必然会革新传统的编辑和出版方式,而出版中一个必不可少的重要环节即为排版,其在科技期刊数字化和网络化过程中的作用与优势是很明显的。排版技术的不同,直接影响整个出版的工作流程。本文对比了传统排版方式,详细分析了XML结构化排版的优势,以国外应用实例分析,并对比国内传统排版的实际情况,指出国内XML结构化排版滞后的可能原因。

1 传统排版与XML结构化排版

传统的排版方式包括方正书版和方正飞腾(Fit)、InDesign 、PageMarker 、QuarkXpress ,以及非专业排版软件如Word、WPS等,目前国内出版单位使用最多的排版软件是方正排版,传统排版已经应用了较长时间,这里不再赘述。

当前XML结构化排版[2]还较少涉及。简单来说它是一种用于标记电子文件使其具有结构性的标记语言,可以对文档和数据进行结构化处理,将期刊内容与样式分离以进行实时的结构化生产和编辑,使得经过标引的文件或元数据形成资源储备,在独立于文件格式之下实时变更、适应不同媒介进行发布的一套现代出版生产体系[3]。它由一系列标签及内容数据组成,实现了数据与呈现形式的分离,大大提高了数据的跨平台应用能力,利用XML能够实现一次加工多次输出的结构化排版。目前,基于XML结构化数据进行排版生产已经成为大型出版商主要采用的方式,XML结构化排版方式如图1所示。

XML结构化排版流程

2 XML结构化排版同传统排版的区别与优势

经过与某科技信息公司认真的交流与探讨,得出表1所示的XML结构化排版与传统排版的异同点。很明显,除具备传统排版的特点,XML结构化排版还具备另外七大特点,而这十分符合目前传统媒体融合新媒体的主流趋势,优势十分明显。

表1   XML结构化排版与传统排版的异同点

指标传统排版XML结构化排版
方正书版方正飞腾InDesign
①PDF是否可印刷
②PDF是否可复制
③PDF是否可加链接
④是否可直接生成网刊
⑤是否可直接生成HTML多媒体全文
⑥是否可直接生成移动网刊数据
⑦是否可生成数据库所需格式文件
⑧是否可生成更高级数字产品
⑨是否符合传统媒体与新媒体融合发展的战略需要

新窗口打开| 下载CSV


(1)PDF可直接添加链接。改善了PDF静态、不够灵活的缺点,便于电子期刊的制作与传播。笔者所在的编辑部现在是由人工将印刷版的电子版PDF专门制作成电子期刊,既费力费时,又浪费了人工成本。

(2)直接生成网刊。目前本编辑部是将印刷版的PDF文件,发送给合作的网刊公司,由网刊公司制作成网刊然后发布。这既浪费了财力,又耽误了时间。而XML结构化排版的一大特点是可节省大量的时间、财力和物力,直接一步到位。

(3)直接生成HTML多媒体全文。HTML多媒体全文通俗来讲就是一种网页式的论文表现形式,既保留了论文结构,又可以像浏览新闻似得浏览论文[4]。目前国内绝大多数编辑部还没有意识到HTML多媒体论文的优势(这里不再赘述),因此官网上只提供了PDF下载,笔者在文献[4]中详细分析过HTML多媒体论文,有兴趣的读者可以参考。笔者所在编辑部在2014年开始制作HTML多媒体论文,但是必须由专业的期刊服务公司将印刷版的PDF经过二次加工才可以生成HTML多媒体论文。就当前的市场行情,这是一笔不小的开销,而且会耽误较长的时间。

(4)可直接生成移动网刊数据。随着新媒体和自媒体的出现,利用闲暇时间进行碎片化阅读成了一种流行趋势,比如微信、微博。手机、平板电脑、电子阅读器等便携式阅读设备的出现对可阅读文件的格式提出了更高的要求。XML结构化排版后的文件可以直接生成适应阅读设备的移动网刊数据。这大大加速了论文的传播速度和显示度,便于科学知识的传播,也有利于提升期刊的引证指标。

(5)可生成数据库所需格式文件。评价期刊好坏的一个客观标准就是是否被多种多样的数据库收录,每种数据库对论文格式的要求不尽相同,比如PDF、FBD、HTML、XHTML等。虽然这不是被数据库收录的决定因素,但可以间接地提升期刊的显示度。

XML结构化排版具有优势的原因在于这种排版技术只用元素和属性来描述数据,而不提供数据的显示方法,内容和数据显示是相互独立的,因此XML结构化排版技术非常符合传统媒体与新媒体融合发展的战略需要。

3 国内外XML结构化排版的应用情况

3.1 国外情况

基于XML技术的出版流程的价值及其发展趋势在国外已经得到了广泛认可[5]。国际上基于XML的综合性商业投资案例,早在二十多年前就已经存在。近年来随着全文开放存取(OA)数据库的发展,基于XML的科技期刊出版也越来越受到关注,一个良好的出版环境正在逐渐形成[6]

以美国动物科学学会为例,2007年之前其期刊联盟一直在使用落后而低效的排版系统,比较明显的缺点有以下几点[7]

(1)纯手工完成对文章的XML标记,费力且需具备很强的技巧,经常导致稿件处理延误1周以上。

(2)排版系统可输出的文件格式太少,除PDF外,无法解决文件在网刊发布中的数据提取技术问题,满足不了数据库对文件格式的需求。

新型媒体和自媒体的快速发展,使得该学会迫切希望采用新兴的排版技术来解决这些问题,以实现过刊、现刊在网络上的快速发布。2008年他们开始使用XML结构化排版。美国动物科学学会期刊联盟转换系统1年后,取得了很明显的成效。

(1)完成编辑稿到获取校样文件(PDF格式)时间为5周,时间缩短为原来的50%。

(2)2009年在没有增加排版人员情况下,印刷版期刊的总页码反而增加了10%。

(3)耗力耗时、成本高昂、劳动密集的手工插入代码工作不复存在。

(4)文章转换成本降低,在线出版时间缩短。输出格式多样化,满足了不同数据的需求,可以及时将PDF和XML发送到所需的在线出版平台。

但是这里需要重点说明的是[7]:他们采用新系统后,首先最重要的是文章的质量没有受到影响。其次他们根据新系统的特点改变了原有的工作流程,以期发挥新系统的最大优势,而没有让新系统来适应原有的、固化的工作流程。

因此美国动物科学学会期刊联盟的主要负责人说:“尽管在该项目的前期,他们经历了许多不眠之夜,克服了许多挑战,但他们对自己所取得的成果感到非常满意。”[7]

3.2 国内情况

根据笔者对某国内可以做XML结构化排版公司的调研,国内采用XML结构化排版的期刊编辑部非常之少,大多数期刊仍然采用传统的排版方式。在这种传统的排版方式下,编辑部一般的工作流程如下。

编辑部将编辑好的预排版word格式的文档发送给排版公司,排版公司经方正排版后,给编辑部提供PDF格式的文章进行校对,经过几轮的修改校对,最终排版公司为编辑部提供PDF、FBD等几种格式的数据。编辑部根据自身的需求对这些数据进行相应的处理。

这种传统的工作流程比较明显的弊端就是:效率低下、浪费时间、占用劳动力资源。更为关键的是不能满足当下新媒体和自媒体对多样化数据格式的需求,不能最大化提升学术传播速度和增强显示度。

笔者所在的《航空学报》编辑部,近些年对新技术、新动态一直都比较敏感[8],比如HTMI全文显示、微信公众号、新型网站设计等。编辑部曾对此项技术进行了解,当时考虑此项技术的不确定性以及其应用的不广泛性,因此未采用。

众所周知,大部分学术期刊同其他媒体相比对新技术的掌握和应用,具有一定的滞后性。笔者分析可能有以下原因。

(1)国内编辑部特殊的体制与管理问题,导致编辑部相对封闭落后,部分编辑部老龄化、作坊式管理,主观上对新出现的技术关注少、信息获取不足、对新技术不够敏感;客观上注重期刊学术质量的提升,而忽略学术传播。

(2)编辑部办刊经费有限。传统的运作方式以及各项支出已经成型,采用新技术势必会涉及经费问题,目前能够进行XML结构化排版的公司多为国外的公司,成本高,一般的期刊编辑部难以承受,经费有限以及管理的不自由等导致编辑部宁可墨守成规,也不愿做出改变。

(3)国内宣传力度不够。期刊编辑部平时可能更注重参加学术会议,对出版行业的技术新动态关注度不够。如果宣传不够,那么期刊单位势必不会了解此项技术的优点。就目前看,国内这种通过举办讲座或者会议的宣传方式显得吸引力不够,走访式的宣传可能会更合适。

随着XML全文结构化已经成为国际学术、期刊界数字化处理所采用的主流方式,国内一些专注期刊数据处理的科技公司,比如北京仁和汇智信息技术有限公司已经开始着手研发具有自主知识产权的排版软件,为期刊编辑部提供XML结构化排版服务。国内本土公司的参与,将会大大提升XML结构化排版技术的显示度,并且能大大降低采用XML结构化排版的成本,推动XML结构化排版在国内编辑部的应用,从长远来看也有助于推动科技期刊数字化和网络化的进程,从而加速科技期刊的传播和服务能力[9]

4 结语

XML结构化排版为实现国内科技期刊的内容结构化加工(排版)、分层次表达、全媒体发表、按需出版提供了一个非常快捷的方法[10],是实现科技期刊数字化、网络化、便捷化的一条有效途径,是推进传统媒体和新兴媒体结合、推动自媒体发展的一个有力工具。作为期刊编辑部,我们应该:培养优秀青年人才,尤其对新的技术、新的信息敏感的人才,以跟上时代的进步;除关注学术会议,提升期刊的学术质量外,也应该积极关注整个出版行业的技术新动态,以推动学术的传播和服务能力;探索合理的管理机制,增加资金收入来源,积极走创新之路。

参考文献

刘冰游苏宁.

我国科技期刊应尽快实现基于结构化排版的生产流程再造

[J]. 编辑学报,201022(3):262-266.

[本文引用: 1]

肖国强陈壮军.

XML技术在开放式电子图书出版物领域的应用

[J]. 湖南师范大学:自然科学学报,200427(1) :23-25.

[本文引用: 1]

杨郁霞.

从24种农业科技期刊网站调查结果谈科技期刊网站的简约性

[J]. 编辑学报,201224(4):371-373.

[本文引用: 1]

苏磊张玉蔡斐.

科技期刊全文阅读模式PDF和HTML的对比与分析

[J]. 编辑学报,2015():17-19.

[本文引用: 2]

Start with XML: Why&How

[EB/OL]. (2010-12-30)[2017-05-20]. .

URL     [本文引用: 1]

Charles Goldfarb. The SGML handbook[M]. Oxford: Clarendon Press, 1990.

[本文引用: 1]

沈锡宾顾恬吕小东.

国外一基于XML的科技期刊出版工作流个案剖析

[J]. 中国科技期刊研究,201122(4):581-583.

[本文引用: 3]

蔡斐.

科技期刊全媒体出版实施方案探析

[J]. 出版广角,2016(4):8-10.

[本文引用: 1]

刘华坤张志林.

媒体融合下数字编辑人才建设探讨

[J]. 北京印刷学院学报,201523(3):9-12.

[本文引用: 1]

左健孙辉.

复合出版与传统出版社数字化转型

[J]. 中国出版,2010(8):44-48.

[本文引用: 1]

/