Lee在2000年首次提出语义网[1],Shotton等 [2]2009年提出了语义出版的概念,随后便取得了快速发展。语义网,可以使传统出版资源更易于被计算程序理解,帮助读者快速从大量、无序的学术信息中获取所需的资料。另外,在媒体融合大背景下,传统学术期刊的自媒体平台建设亦如火如荼[3,4],但传统的图、表格、公式、正文、参考文献标注和PDF表述方式已无法满足不同类型平台所需数据的格式需求,出版时,往往需要一个平台,制作一套资源,这大大降低了出版效率,而语义出版有望通过元数据实现信息服务标准统一[5]。
传统学术期刊纸质刊出版和微信公众平台出版等不容置疑地认为应“内容为王”,只有抓住内容,才能吸引读者眼球,因为读者购买的不是技术,而是内容。而在语义出版环境下,这种购买动机会发生变化,购买文章内容只会是读者的需求之一,他们更需要的是具有语义关系的知识,也即“语义为王”。语义出版的主要功效体现在:第一,语义出版可以通过合著关系以及引文耦合等,将学术论文聚合、关联,进而实现语义检索,建立起论文或期刊间的联系;第二,语义出版在一定程度上可以反映科学研究参与者、学术内容的变化过程,反映科研成果的引用、创新成果的提出时间、科研工作者的相互关系等,这决定了其可被用作科研评价工具。
鉴于语义出版的上述独特优势,诸多国外的出版机构开始关注语义出版并已经取得了一定的成果,如PLOS、Elsevier、Springer、维基百科等。但国内相关研究与应用明显滞后,当前只有CNKI、万方等少数大型数据库有所涉猎。鉴于国内语义出版的落后局面,关于语义出版的研究亦以借鉴国外优秀语义出版平台为多,如翁彦琴等[6,7]详细介绍了英国皇家化学会(RSC)和Elsevier的语义出版模式,但国外拥有非常完善的本体基础,如常识性本体库系统Cyc、WordNet、HowNet等,种类繁多的领域本体库系统UMLS、EnterpriseOntology、TMO等,而国内目前能称得上本体库的大概只有 HowNet(知网)一个[8],但HowNet只是一个在线的常识知识库,尚不具备本体系统的推理、知识发现等功能,仅可作为汉英机器翻译的语料库使用。这种技术代差只能交给信息技术方面的专家和专业公司去填补,对于学术期刊来说,要做的可能更多的是:期刊调整定位,组建专业化学科刊群,以满足语义出版组建本体库及学科语义检索的要求;编辑部调整出版流程,加强数字资源建设,用XML技术制作电子资源并优先于纸本印刷,满足语义出版的数据需求;个体做好角色转变,适应语义出版环境下的科研人、编辑人、读者、作者身份。因此,在借力语义出版的大潮提升学术期刊整体实力的大背景下,本文从宏观的期刊定位、微观的出版流程、具体参与者的角色转变3方面分析语义出版下学术期刊的发展,试图为国内传统学术期刊实现语义出版提供思路。
实现语义出版的必经之路是建立知识结构关联,而泛泛地在整个学科中谈知识关联是不切实际的,纵然学科交叉现象日益成为普遍现象,也许可以通过交叉点将不同的学科组成知识网,但那将是不可完成的巨大工程,对实施者的知识体系也会有甚至难以企及的全面要求。另外,完整学科建立知识结构关联的必要性也值得商榷,毕竟使用者是单个个体,其使用方向也只是个人关注的学术领域,存在一定的局限性,过于庞大的知识关联只会徒增资源消耗。因此,分学科、领域切割现有知识体系是较为可取的思路。这里就存在度的问题,切的太细,会对语义出版发展造成障碍,结果将仍然是一个个的信息孤岛。综上,语义出版的知识结构关联属性决定了实现语义出版的前提条件是建立数量相对有限的学术期刊专业化集群,因为本体及知识结构关联需要以学科为基础。
另外,单个的孤立期刊的生存压力越来越大,无法产生巨大的影响,集群化是提高传统学术期刊核心竞争力和国际影响力的重要途径和模式。市场经济下的专业化分工促成了产业聚集,产业聚集便可在更大程度上降低生产成本,提高生产效率。学术期刊集群化的结果亦是如此,如可以统筹规划、节约单刊数字化成本(独立建网站、远程稿件处理系统),但最为重要的是:通过集群建立的公共数字平台,可以使相应信息得以共享,这对提升学术期刊的学术水平影响较大。
国外的学术期刊集群化发展起步较早,并取得了一定的成绩,形成了较多的专业化期刊平台。如美国光学学会建立的光学学科Optics Info base平台,其已开展了语义出版的实践[9]。但由于语义出版引入国内较晚,出版理念相对落后,国内学术期刊界对期刊刊群建设的意义认识相对不足,积极性不高,再加之国内特殊的事业体制,学术期刊市场化参与程度较低,使大多期刊改革动力疲软,导致国内的学科刊群建设步履维艰。表1为国内建立的学科刊群基本情况。
由表1可见,目前国内的刊群学科主要分布在医学、地学、材料、光学、水产、汽车等领域,刊群中期刊数量分布较为广泛,期刊数量最多的中国地学期刊网有246种期刊,肿瘤科学网只有3种。大部分期刊群都建立了出版平台,只有首都医科大学期刊联盟没有统一网站。出版平台是刊群的精髓所在,如果没有统一的出版平台,刊群建设只剩下形式,难言形成真正的合力,因为只有通过出版平台将各刊的出版资源串联,形成学科大数据,才能为语义出版打下基础,进而实现学术资源融合、分析、提取,方便读者检索,达到语义出版的要求。在这10个专业化刊群中,中国光学期刊网的平台建设较为领先,中国光学期刊网由中国光学学会和中国科学院上海光学精密机械研究所联合主办的4本杂志(《光学学报》《中国激光》《激光与光电子学进展》《中国光学快报》(英文版))发起成立,现在刊群规模扩大到50余种,基本涵盖了中国光学领域的优秀学术期刊。其独自开发的期刊集群管理平台能实现集群中期刊的作者投稿、专家审稿、编辑办公的集中处理,并实现了各刊过刊的统一检索。目前,该系统已应用于中国水产期刊网、肿瘤期刊网、材料期刊网等学科平台。另外,除了完成语义出版的基本要求—集群建设外,中国光学期刊网还更延伸了一步,成立了中国光学资源库,目前该库涵盖期刊50余种,会议30余届次,外文文献25万余篇。但该库目前只具备常规的检索命令,无法进行语义联想。
综上,国内的刊群建设尚处在初级阶段,学科平台少,且既有平台的数据挖掘工作基本没有展开,以现在的技术水准去对接语义出版前路茫茫,因此,国内的千余种中文学术期刊在遭受唯SCI化的不合理评价准则导致的国内优秀稿源外流背景下,想要在语义出版的潮流中扳回一局,增强作者的投稿、阅读、检索体验,就应该重视学科抱团,加大刊物深度融合,共通有无,共同将服务学科发展作为第一要义,借力专业的数据服务公司,投身语义出版。
传统学术期刊出版流程为:组稿、编辑、校对、出版、发行,而最终的结晶—纸质刊的发行量问题成为悬在众多传统学术期刊编辑部的达摩克利斯之剑。在阅读方式发生翻天覆地变化的今天,大量社会资本投入到改善阅读体验研发领域,阅读终端品类繁多、呈现方式多种多样,丝毫没有松懈的意思。在读者适应甚至享受这种崭新的阅读方式时,传统学术期刊如果硬着头皮继续印刷大量纸质刊,结果将大多沦为搁在书架上的艺术品,甚至从印刷厂搬到杂志社库房时起,就注定下一站只能是废品回收站。因此,在数字出版横空出世、迅猛发展、日渐成熟的今天,传统学术期刊应该正视并适应这种革新,调整出版思路,改变出版形式。学术期刊的数字化经历了云出版、大数据出版,直到时下最新的语义出版,出版形式的调整一直没有停歇。语义出版或将带来传统出版流程的彻底革命。语义出版的基石是离散化的数字资源,因此,新的出版流程将是以数字资源为核心,展开的策划、创作、结构化处理、发布、营销,传统学术期刊应改变纸本优先的局面,形成电子优先的思路。
语义出版下按需印刷将是传统期刊出版方式改变的直观体现。也即,先制作结构化、离散化数字资源,然后再进行数据整合。有了语义数字资源后,就可以按照读者需求,随时生成各部分PDF交付印刷厂,制作纸质版本;自媒体平台微博、微信公众平台则可以直接调用数字资源重新组合生产,省去了传统学术期刊再加工的麻烦;出版平台则方便地运用数字资源实现读者需求、实现语义搜索。在制作流程中,数字资源通过可扩展标记语言(eXtensible Markup Language,XML)技术制作。XML是将语义出版中的数字资源打散、聚合的有力工具,其可以用来对数据进行标记,也是当今处理分布式结构信息的有效工具[10]。
在语义出版流程中,数字资源的收集加工阶段,除对传统的各种文档、音频、视频等进行结构化处理操作外,还需采用语义技术标准对数字资源进行再组织。与传统出版不同,语义出版还需要制作数字内容,这一般通过协同编辑、自动排版技术或平台实现,而且这也不是传统编辑能胜任的,需要专业的技术编辑参与。另外,语义出版物的语义化过程本身是一种创作过程,因此,需要专门的人员进行内容审核,检查语义标注、语义关联等是否恰当。综上,传统学术期刊应改变出版思路,优先制作数字资源,借力语义出版带来的标准统一优势,实现以语义出版为主、传统出版为辅的出版格局。
科研人员回归本位搞科研,脱离附体的“检索人”,检索的事交给平台做。科研人员进行科研工作的基本过程如下:查找当前研究领域的研究资料并分析整理,从中找到有价值的研究方向,经过精心规划、设计,提出合理的试验路径并进行试验,最后将试验结果整理汇总,撰写学术论文。一般认为,在科研人员的整个科研周期中,查找资料要占去一半的时间,剩下时间的一半是试验研究,一半是计划、思考、撰写学术论文。之所以查找资料如此耗时,主要还是在于查资料的目的是找到创新点,而不是机械地一篇一篇的去找,这时,文献、知识间的关联性便尤为重要。而凭借强大的语义出版平台,大量个体用户的信息检索和分析整理工作会被嫁接给出版系统。如,当某个科研人员需要查询热障涂层相关的文献时,可能有几种方式:第一,去经常关注的几种在学科内比较权威的期刊网站中去逐个查找;第二,去大型数据库检索;第三,去学科专业化集群系统中去寻找。现阶段,由于学科专业化集群建设进度滞后,可能主要是前两种途径。去单个行业优秀刊中取查,可以获取最前沿的资料,但匹配度不一定高,而且耗时,去大型数据库,则会蹦出来大量其他学科同关键词的资讯,需要花大力气“去伪存真”,而且,最关键的是,当你好不容易下载下来PDF阅读后,当对其中某点感兴趣时,需要重新再走一遍老路,再一次检索、查找、筛选,如此反复,让人身心疲惫,一会就不知道在哪个“频道”了,好不容易才又找到最初那篇PDF,此时,又把前面看的啥给忘了,返回去再看一遍,思维接轨了,再接着继续往下看。而如果能在专业化集群语义平台去科研,科学交流效率将直线上升。因为与普通的科研人员相比,出版机构能借助元数据、本体等技术,在开始就做好数据基础工作,进而对文章的分析、综述、聚合等活动先于用户完成,文章此时“全身都能动”,科研人员只需动动鼠标,所有需要的信息都会自动检索、分析后呈现,此时,科研人员便由之前的“检索人”变成了真正的科研工作者,用节省的近一半时间去做更应该做的创新工作。
编辑将是具备专业知识的编辑人。语义出版的机器属性决定了后期使用过程中人力资本投入必然较少,在一定程度上释放了编辑的编务工作,提高了出版时效。智能化的语义出版平台能够将传统编辑流程中的收稿、送审及编辑实现统一,如自动将作者的投稿传送到相关栏目的编辑系统中,如果作者没有标明栏目的,系统也会自动识别,将具备相似语义内容的文章自动分配到相关编辑手中,随后,由机器来建立论文与专家库的联系,自动适配到合适的审稿人。如此,编辑将从传统的编辑审校模式中解放出来,编辑人员工作中创造性成分陡增,比如数字内容的语义标注、抽取领域词汇、建立内容中实体之间的关联等,编辑更大程度上将成为一个具备专业知识的“编辑人”。
另外,传统出版中被动接受出版内容的读者也将化被动为主动,可以积极参与到语义出版中。借助数字阅读平台,读者可以对数字资源进行个性化操作,如读者根据的自己的知识储备,在阅读过程中可给出版物添加语义标注信息,并交给语义出版后台进行审核,从而让数字资源源源不断地自增长。还要注意的是,作者的身份也将发生变化,不仅是提交论文供读者阅读,而提供的是思路、知识结构与创新点等具有语义关系的知识,作者比任何一个人都清楚自己这篇文章的结构,以及文章中暗含的语义关系,因此,在必要时,作者可以将论文中的语义、逻辑关系明确地提炼,提交这些元数据给编辑部,方便语义平台更好、更准确地处理论文。
语义出版可以通过合著关系以及引文耦合等,将学术论文聚合、关联,进而实现语义检索,建立起论文或期刊间的联系,亦可被用作科研评价工具。语义出版的明显优势决定了传统学术期刊应积极接触并改变旧有的出版思路,学习语义出版知识,迈入语义出版舞台。传统学术期刊应该期刊调整定位,重视学科抱团,组建专业化学科刊群,加大刊物深度融合,共通有无,共同将服务学科发展作为第一要义,借力专业的数据服务公司,投身语义出版。编辑部应以数字资源为核心,展开策划、创作、结构化处理、发布、营销,改变纸本优先的局面,要形成电子优先的思路,调整出版流程,加强数字资源建设,用XML技术制作电子资源并优先于纸本印刷,满足语义出版的数据需求。个体做好角色转变,适应语义出版环境下的科研人、编辑人、读者、作者身份。虽然语义出版总趋势向好,但除了做好本文提到的几个方面外,语义相关标准不统一、出版商业模式不完善、语义出版前期投入巨大等问题,尤其是新兴的数字出版新形式语义出版的飞速发展是否兼顾到了中国的国家利益[11],仍是有待持续关注的重要方向。
教育部人文社会科学研究规划基金项目“国家利益视域下学术期刊国际化出版研究”(12YJA860023);中央高校基本科研业务费专项资金项目(310850170444,310850154018,2013G6501003,2014G6501006,310850151003,310850160322)。