我国是科技期刊大国,国家新闻出版广电总局历时3年先后2批次认定了6 468种学术期刊[1,2],总数已仅次美国位列全球第二。但在社会经济、文化发展越来越倚重科技发展的知识经济时代,如何变期刊大国为期刊强国,如何提升期刊的知识服务水准,如何促进将已发表的科研成果转化为现实生产力,是中国科技期刊界亟须探讨的重要问题。
2016年5月30日,习近平同志在全国科技创新大会上提出要加强科技供给,服务经济社会发展主战场。他呼吁广大科技工作者要把论文写在祖国的大地上,把科技成果应用在实现现代化的伟大事业中[3]。作为科技成果传播、交流、转化的重要根据地,科技期刊界当响应习主席号召,深化自身知识服务潜能的挖掘,为推动科技成果转移、转化,推动产业和产品向价值链中高端跃升献策献力。
知识服务、知识管理等概念的提出与技术发展密切相关,其内涵在不断发展变化之中,张晓林对知识服务进行了总结:知识服务首先是一种认识和组织服务的观念[4]。知识服务是用户目标驱动的服务,它关注的焦点和最后的评价不是“我是否提供了您需要的信息”,而是“通过我的服务是否解决了您的问题”。
如何理解知识服务?我们可将其看作为一个满足客户不同类型知识需求的服务过程,是知识服务提供者凭借自身具备的高度专业化知识,在充分挖掘客户需求的基础上,结合内外收集、整理的信息与知识,进行相关创新,并借助适当的方法和手段,在与客户交互的过程中,帮助客户获取知识、提高客户解决问题的能力、帮助客户理性决策,或者直接帮助客户解决问题[5]。需注意:知识服务提供者本身并不产生“原知识”,只是对已有的知识进行整理。
具象到科技期刊的知识服务,其实就是在期刊业已积累的大量、可信的数字资源基础上,对这些海量知识进行筛选、加工、匹配和分发,不断将这些已有资源进行新的知识体系构建并提供优质服务的处理过程。科技期刊知识服务具有高度专业化的知识特性,并且这种服务还高度个性化、定制化,服务的过程中充满交互性,是一种具备高附加值的服务。
由于知识服务的客户大都是某个行业的从业人员,他们需要精准化的内容,需要系统性、权威性、科学性和深入性的知识;而这些恰是科技期刊的长处所在,因为科技期刊有专业编辑、专业渠道,擅长做专业的知识组织和后期服务,这都是其他互联网企业无可比拟的。所以,目前国际主流的出版机构,大多以期刊数据库作为基础依靠各种层出不穷的知识服务进行业务多元化发展及跨界创新。
而今,技术变革正改变着科学研究的进行方式和科研人员的行为模式,同时也深刻改变着期刊出版的产业生态。2016年4月,国际科学技术与医学出版商协会发布的《STM出版技术趋势2020》,颇具前瞻性地展望了学术出版技术的未来发展趋势。该文结合诸多国际学术出版巨头的业务实践活动,从数据仓储技术、文本数据挖掘技术、语义技术、ORCID行业标准和全新的论文版式技术几方面回顾和梳理了海外学术出版的技术热点[6]。
近年来为满足科研人员日益增加的对大宗研究数据获取的需要,诸多学术出版巨头在数据仓储技术方面进行了有力的革新和再造, 促进了数据密集型科学的强劲发展。
例如,2016年4月28日,Elsevier宣布正式上线全新的数据仓储平台Mendeley Data,该平台允许不同学科的科研人员上传、发布和管理其研究数据。与其他以期刊论文为主的数据仓储产品不同,Mendeley Data 上的数据遵循公平(Fair)原则,即易检索、可获取、互操作、可再用[7]。这几项原则完全符合开放科学理念,是Elsevier在数据密集型科学研究模式推动下进行的有益探索。谈及未来期刊发展战略,Elsevier期刊出版全球总裁Philippe Terheggen表示:Elsevier主攻的方向之一就是:期刊文章以及数字化平台要以研究人员的需求和研究所面临的挑战为中心,研究数据的再利用、可重复性、个性化的阅读推荐、共享、合作和内容分析。
Springer Nature则于2016年10月17日宣布将旗下超过1 300 种期刊全部纳入SharedIt 开放平台,倾力打造出一个开放共享的整体数据仓储。SharedIt 允许已订购数据库服务的个人和机构用户自由分享内容,分享渠道包括社交媒体、个人网站、邮件乃至其他数据仓储[8]。尽管这种允许付费用户自由分享的服务并未降低实际订阅成本,但此举却极大提高了付费内容的利用效率,在广大科研人员和机构用户中得到了极高赞誉和广泛宣传。
语义出版则要求不断发掘并丰富文章的知识内涵,使其在网络上能够更方便地被自动发现,可自动链接与之相关的文章;支持对文章中所包含的各种知识进行关联及访问并操作,文章之间各种知识能便捷地进行关联和集成,其核心就是实现知识的关联及共享。
近年来,在英国皇家化学学会(RSC)、美国科学公共图书馆(PLoS)等众多知名学术组织及出版机构的参与和共同推进下,语义出版已经初步实现了从雏形向应用的过渡,研究成果不断涌现。RSC最早推出Rich HTML形式的语义出版服务,为平台的部分期刊全文进行语义标注,并通过与多种类型化学及相关领域本体资源的关联真正实现了语义层面的论文知识内容扩充。RSC语义出版的核心要素包括:对化学学科知识环境(如RSC本体、RSC化学结构数据库ChemSpider)的关联,科技期刊论文的结构化描述与标记以及全文嵌入式HTML的呈现方式等。目前,该功能已嵌入其正常出版流程,RSC出版的科技期刊均已预留Rich HTML功能[9]。
PLoS系列期刊则通过与多种外部信息源及数据集建立链接的方式丰富文献的内容,并在此基础上提供了论文级计量分析服务。
2013年4月,英国医学杂志(BMJ)出版集团更名为BMJ集团 [10]。其更名的主要动因在于弱化传统出版的概念,积极选择从单纯的内容提供商向知识服务商转型。期间的关键,在于BMJ集团意识到随着全球人口的增长、疾病负担的增加和新治疗技术的发展,社会需求的医疗服务更加复杂。医生需要为患者提供更好的治疗和解决方案;医疗机构在寻求提升服务的方式、方法;政府希望能有效地配置有限的资源;BMJ集团寄希望于依仗循证信息和专业的洞察力,高效利用拥有的高质量大数据资源,为他们的潜在用户提供Best Practice、 Clinical Evidence、Best Health、BMJ Learning、BMJ Quality等个性化知识服务。
相比而言,国内科技期刊社仍囿于固有思维,经营模式仍多以内容出版、单纯提供知识为主,缺乏为用户或机构提供决策支持工具和服务方案的产品意识。
当众多国外知名出版商不断在知识服务方向进行卓有建树的探索和创新时,国内科技期刊界的进步却乏善可陈。现今,国内科技期刊社存在的最突出问题莫过于生产规模上的“小、散、弱”,难以聚拢一定规模的优质期刊、优质资源并缺乏必要的政策和财政支持。整体而言,科技期刊的知识服务能力十分薄弱,大多科研成果未能通过有效途径直接服务于人们的工作、学习和生活,数据仓储、语义挖掘、决策支持等高一级的知识服务更无从谈起。此外,相关行业技术标准还有待完善,数字出版人才相对稀缺,整个行业升级转型几乎要从头开始。
尽管整体投入有限,但中国科技期刊对知识服务探索的脚步却从未停止。调查报告显示,2015年中国科协主办的1 081种科技期刊中有915种建设了自身网站,占到总数的84.6%,其中59种可提供全文阅读[11];此外,已有部分期刊意识到结构化数据在知识服务中的重要性,在原有PDF阅读的基础上增加了HTML表现形式。个别期刊还启用了增强型的HTML以提供更多服务,如图集PPT、参考文献自由排序、知识互链、文献扩展等。跨媒体的出版模式亦在部分期刊得到应用,读者可通过“刊网互动”方式获得电子论文、多媒体资源和其他超越纸刊内容的资源。
近年来,中国科技期刊界已认识到通过与国外知名科技出版商合作实现借船出海只是权宜之计。想在国际竞争中谋求一席之地,科技期刊必须痛下决心改变当下小作坊式的运营模式,走规模化发展道路,建立集约化出版模式,倾力打造可与国际科技出版巨头相抗衡的“航空母舰”。现今,政府、学协会、期刊社已形成共识,在各种场合不断强调刊群建设的重要性,指出科技界要增强培育一批实力强大的骨干科技期刊出版集团的紧迫性。
笔者曾指出中国科技期刊的编辑在生产模式、专业化分工、服务手段等方面存在的问题[12],提出工业化时代对于科技期刊的要求。我们希望实现各编辑部与出版社进行分离,进而实现编辑与出版分离,同时在出版社承揽现在编辑部需要处理的其他非学术性事务;让专业编辑从琐碎的非知识增值性工作中解脱出来,进一步赢得知识创作的最大空间,重拾“内容为王”的口号。为满足上述的构想,笔者认为生产模式的改造是其中最关键的一环,集约化生产平台的架设将是实现科技期刊“抱团取暖”、“做大做强”梦想的物质基础。
作为知识服务的基石,结构化数据为知识库的建设、语义出版的支持和信息聚合提供了必要的原材料。纵览国际科技出版商20多年的发展之路,可以说它也是结构化数据从构想、实践到成熟的一段历程。早在20世纪90年代,国外出版商开始尝试应用SGML/XML对文档进行描述,以便实现内容的存储和交换,2000年初以美国医学图书馆(NLM)为核心的工作组开始研制科技期刊的数据存储标准并制定了第一个被广泛接受的全文数据标准NLM DTD 1.0。此后该标准不断迭代升级,随着应用范围的扩大和影响力的延伸,现已成为国际科技出版领域公认的数据标准,被科技出版商、大型图书馆和知识存储机构所认可[13]。2012年,该标准升格成为美国的国标NISO JATS,美国也成为第一个将科技论文的存储和交换标签集作为国标的国家。NLM DTD标准的构建为PMC数据库的数据收集解决了出版商之间数据的差异化问题。作为目前世界上最著名的全文OA数据存储,PMC已经成为全球医学生物科研人员文献访问和新知发掘的宝库。
中国学者对于结构化数据(XML)的研究始于21世纪初,但真正将其应用在科技期刊的传播活动还是近些年的事情。结构化数据之所以能成为知识服务的基础性元件,笔者认为主要原因有以下几点。首先,结构化数据的目标是实现内容与样式的分离,XML只描述论文的内容,而非其表现的样式。其次,结构化数据的层级结构和语义描记性能更适合对论文实体结构的解析,NISO JATS定义了271个元素和136个属性,可进行语义描记的实体超过550个。换言之,用该标准进行标引的文档,最多可定义550多个知识点/信息点,最大限度地保持了知识内容以及知识链接扩展的潜力,它也因此成为知识服务的基础性数据格式[14]。再次,结构化数据另一个优势是其“穿透力”,它可以在不同的操作系统和网络系统间进行传输,实现了在不同出版商、图书馆和仓储机构间数据的传输和交换。最后,结构化数据实现了“一次制作、多元发布”的功能,出版商可通过该文档进一步转换成为PDF、HTML、ePub等多种格式的数据,也可以实现在PC端、手机端、移动应用的不同形式的表现。
当然,生产模式的变化必然要求有经过顶层设计的信息化服务平台以保证不同专业人员在分工明确的前提下实现团队间的协同作业。经调研发现,为实现集约化的刊群化管理,必须在系统设计中考虑到内容采编系统、生产制作系统、资源管理系统、知识生产系统以及外部的知识服务应用。集约化生产平台的构建对于集约化的管理来说是最为关键的环节之一,通过该系统可以获取各编辑部的第一手内容资源,并缩短内容向知识的转化时程。图1是中华医学会杂志社正在构建中的科技期刊集约化生产出版平台示意图。
该出版平台架设有Word文档智能标引工具(实现Word文档自动化转换成XML的功能)、XML排版引擎(实现XML文档的自动化排版)、版面精调工具(实现排版文档的进一步精细化调整)和模板制作工具(为不同期刊的不同内容创建个性化的模板)。结合中华医学会杂志社自行研发的数据标准(CMA JATS),[15] 这些工具使得一篇文献可以从退修后的Word开始一气呵成地生成印刷版格式的文档(高精度PDF)、高度知识化标引的原材料(XML文档)以及可实现在线发布的低精度PDF、EPub和HTML等文档(图2),从前期的测试来评估,编辑上传定版稿件到从平台获取PDF校样的时间比传统的方式节约了大量的时间。上述工具也可以通过云服务方式被单独调用或通过集成平台进行流程化、规模化处理。
通过该生产平台,各生产单元(编辑部)摆脱了传统的生产模式,让科技论文的产出效率更高。更重要的是,为后期知识服务提供了快速敏捷的内容资源支持。而通过云服务的方式,各编辑部不再是分散的个体,从事着相同而重复性的排版工作,实现了编辑部生产环节的集约化管理。
从上述科技期刊集约化生产平台的改造来看,其对知识服务的意义可以总结为以下几点:
第一,集约化生产出版平台是科技期刊做强做大的基础性服务平台之一,通过流程改造,可将分散的内容资源汇聚,通过譬如专业/专科集群的模式,打造具有一定规模的专业性知识文库。
第二,结构化文档成为集约化生成平台的基础性数据格式,使得知识服务系统可随时随地获取具有高度知识标引的原生数据,该过程不单是服务于完成传统出版流程,也完成了对内容的细粒化知识标引过程。
第三,集约化生产出版平台提供了智能化工具,使得内容组织工作与排版生产工作得以分离,让学术编辑无需过多关注内容的生产流程,工作重心回归到优质内容的发现与遴选上。在工业化模式下编辑解放了劳动力,专业价值受到更多的尊重,有可能培养出编辑的产品意识,更多地参与到知识服务的策划和创作中来。
第四,高效能的智能化工具让排版成为过去,极大地释放了编辑部的劳动力。通过上述的生产出版平台,编辑部可以随时将定版的文档上传至平台,通过平台上架设的工具流水式作业,快速获取校样文档,加快了知识上线的速度。
第五,集约化生产平台连同前后的采编和知识发现系统,支持分布式的工作,使得稿件从投稿开始就在为后续的知识服务提供协作的空间。作者在采编环节即参与到文献的知识标引工作,再通过学术编辑的提升,技术编辑的加工,以及辅助的自动化知识标引和知识发现系统可以大大提升文章的知识附加值。
总之,集约化生产平台让出版流程变得更加可控,社会分工更加明确,协同作业成为可能。这种全新的出版生产平台从根本上变革了中国科技期刊现有的出版生产模式,必将成为中国科技期刊向工业化革命迈进的重要标志。
随着数字技术与媒体融合的发展,学术文献的传播方式日益多元化。同时,受阅读需求变化、学术评价体系误导、优质稿件外流等因素影响,中国科技期刊的发展遭受了巨大冲击。中国科技期刊想突出重围,必须直面互联网时代下读者对知识的个性化需求趋势,快速实现从传统出版商向知识服务商的转变,不断提升期刊的传播力和知识服务能力。
尽管近些年国内科技期刊进行了一些探索,得到了一些有益的启示。但期刊界同仁需清楚知识服务没有捷径可言,科技期刊生产流程的重塑是目前较为迫切的一次革新。好风送我上青云,冀望通过集约化生产平台这一创新技术使科技期刊出版实现新的腾飞。