Science-Technology 【-逻*辑*与-】amp; Publication, 2019, 38(05): 112-116 doi:

编辑实务

中文医学科技期刊申请PubMed Central数据文件标准与技术实现

周白瑜1), 王玥2), 刘谦2), 谭潇1), 石婧1)

1)北京医院期刊编辑部,100730,北京

2)天津医科大学总医院《中国肺癌杂志》编辑部, 300020,天津

编委: 张广萌

摘要

生物医学领域期刊入选Medline及PubMed Central对提升期刊的国际影响力具有举足轻重的作用。PMC于2018年7月收录了第一本中文期刊,开启了全文非英文生物医学期刊国际化的新尝试。期刊入选PMC需经过严格的科学及编辑质量评估和数据质量评估,期刊出版商必须提供符合PMC文档结构定义(DTD)的XML全文文件及高质量高分辨率的图片,同时在文档命名、文件集打包压缩及传输等方面也有很多具体细致的要求。本文对中文医学期刊申请PMC技术评估标准、源文件制作质量要求和技术实现作探讨研究,为Medline收录的中文期刊申请PMC提供参考借鉴。

关键词: PubMed Central ; 中文医学期刊 ; 技术评估 ; 可扩展标记语言(XML)

PDF (2269KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

周白瑜, 王玥, 刘谦, 谭潇, 石婧. 中文医学科技期刊申请PubMed Central数据文件标准与技术实现. Science-Technology 【-逻*辑*与-】amp; Publication[J], 2019, 38(05): 112-116 doi:

2018年11月14日召开的中央全面深化改革委员会第五次会议审议通过了《关于深化改革培育世界一流科技期刊的意见》,会议强调科技期刊传承人类文明,荟萃科学发现,引领科技发展,直接体现国家科技竞争力和文化软实力。要以建设世界一流科技期刊为目标,科学编制重点建设期刊目录,做精做强一批基础和传统优势领域期刊。

建设世界一流科技期刊,科技期刊国际化是我国科技期刊建设发展的战略目标,学术期刊应努力增强在国际上的地位和影响,并把科技期刊被检索系统收录及收录的数量作为评估期刊的重要指标。在生物医学领域,PubMed/Medline是最权威、最具影响力的检索系统,PMC是美国国立医学图书馆(National Library of Medicine,NLM)建立的开放获取(open access,OA)学术仓储[1],PMC平台包含了目前生物医学领域大量重要学术成果的全文文献[2],其所收录期刊内容涵盖几乎绝大多数权威生物医学期刊的重要内容,包括四大医学期刊NEJM, Lancet, JAMA, BMJ,及Cell,Nature,Science等,是生物医学领域极为重要的全文存档数据库。全文非英文生物医学期刊要走国际化之路,加入PMC有利于扩大中文期刊的传播范围,吸引更多国际作者的高水平稿件,不断提高我国中文期刊的学术水平和国际竞争力。有鉴于此,本文针对中文医学科技期刊申请PubMed Central(PMC)数据文件标准与技术实现作探讨。

随着中文生物医学期刊越来越多地被Medline收录,我国科技期刊工作者在提高中文医学期刊传播力和展示度方面也做了很多新的尝试,如PubMed中文摘要展示[3,4],LinkOut全文链接至期刊网站[5]。与此同时,也有很多学者对PMC的选刊标准和申请收录流程进行了一些研究[6,7]。但由于技术局限和语言屏障等方面的限制,目前我国期刊界对中文期刊在PMC的申请、技术评估及数据生产等方向的研究还是空白。这方面的空缺对提高中文期刊在国际上的传播和展示度非常不利。因此,加强中文期刊对PMC的申请、技术评估及数据生产等方向的研究迫在眉睫。

1 明晰PMC选刊原则,开启中文刊国际化新尝试

由于PMC对收录期刊的要求极为严格,需要同时满足学术质量标准(Scientific Quality Standard)与技术标准(Technical Requirements)[8,9,10]。因此,截至2018年7月,PMC从未收录过全文非英文内容的期刊。PMC选刊需经过学术和技术两方面的审查评估,已经被Medline收录的期刊一般可省略学术审查。依据Medline电子期刊索引策略(Medline Policy on Indexing Electronic Journals),所有Medline收录期刊,无论以何语种出版,只要能够满足PMC的技术标准,即可被PMC收录。

PMC与我国中文医学刊《中国肺癌杂志》于2017年底开展了Medline系统对全文非英文内容支持度的测试,于2018年3月通过技术评估,2018年7月过刊回溯至2010年的《中国肺癌杂志》在PMC平台上线,成为PubMed Central完全收录(Full Participation)的第一本非英文生物医学期刊。以下就《中国肺癌杂志》申请PMC为例探讨中文医学科技期刊申请PMC数据文件标准与技术实现。

1.1 PMC技术评估标准

申请期刊需向PMC提交符合期刊论文文档类型定义(document type definition,DTD)XML文件,该文件需满足PMC数据评估的最低要求[11]。NLM推荐使用美国国家信息标准组织(NISO)发布JATS,PMC同时也将接受其他在生命科学期刊出版中广泛使用的全文DTD。

技术评估所需文件:①每篇文章一个单独的全文XML文;②文章中所有图片的原始高分辨率图像文件;③PDF文件;④文章附带的补充数据文件(如电子表格或视频文件等)。

技术评估流程:期刊出版商在技术评估阶段要向PMC提交一组有代表性的示例文件,PMC对这些文件进行评估以确保期刊的数据符合PMC的技术质量标准。PMC对示例文件有如下要求:①示例文件集应包含约50篇各种类型和样式的文章;②示例集需包含PMC技术评估要求部分列出的所有文件;③示例集中的文件需满足PMC最低数据标准;④每个示例文件包必须根据PMC文件提交规范中描述的规则进行文件组织、打包和交付。

收到期刊的样本文件后,PMC首先校验文件集是否满足PMC最低数据标准,对于不满足该标准的文件会拒绝其申请。若校验通过,PMC会对样本文件作更进一步的审查,主要检查以下两个方面:XML标记是否符合DTD要求;通过与期刊网站上的PDF或全文比对,审查从XML及相关图像文件生成的在线文章预览是否精确、无误、完整。

第一轮数据审核大约需要4周,一旦数据评估完成,PMC向出版商发送审核结果和错误报告,出版商应及时修改并重新提交数据文件进行下一轮审核。如果在第3次提交中仍存在错误,期刊的申请将被拒绝。图1所示为PMC第一轮技术评估结果报告,报告中详细列出了必须修改与建议修改的错误信息。出版商在修改完所有错误后重新提交整个样本文件包进行下一轮审核。

PMC技术评估报告

通过技术审核后出版商与NLM签署一份正式的PMC完全收录参与协议(PMC Participation Agreement),并根据PMC要求制作一个横幅(banner)图片文件,随后即可制作过刊数据文件并通过FTP上传。

1.2 中文医学期刊PMC源文件数据标准

PMC致力于提供对期刊内容的开放访问,并长期收集维护高质量的文献存档。因此,PMC设计了一系列文件提交的数据标准[12]

1.2.1 XML标记

期刊需向PMC提交符合期刊论文DTD的XML全文文件,不接受HTML格式文件,每篇文章需制作一个独立的XML文件。PMC推荐使用JATS或NLM Journal Publishing Tag Sets,并提供了格式校验工具供出版商在提交前对XML文件进行校验。无论使用何种DTD,出版商必须对如下元数据进行正确标记:ISSN(或其他期刊ID),期刊出版商,版权声明,许可声明,卷,期,页码/文章编号,出版日期。

中文文章与英文文章在XML文件制作过程中的区别主要体现在语种方面。中文文章,主题语种是中文,英文信息部分要加英文的语种标示(图2);英文文章,主题语种是英文,如果有中文信息,要给这部分信息加中文的语种标示(图3)。

中文文章标记示例

英文文章标记示例

1.2.2 图片的要求

通常作者在投稿时将不同格式的原始图像数据文件提交给出版商(如ppt,pdf,tif,jpg,xml等),出版商对图像进行规格化处理后输出用于印刷版或电子版的文件。PMC对图片要求很高,在图片分辨率、显示尺寸、文件格式、清晰度等方面都做了细致的要求。

(1)分辨率:线图800 dpi,半色调图像300 dpi,组合图600 dpi。

(2)显示尺寸:预期显示尺寸是数字图像呈现在打印产品、网站中的物理尺寸。如一副900 px宽,600 px高,分辨率为300 dpi的图像,预期显示尺寸应不小于3×2英寸。

(3)文件格式:PMC推荐提交无压缩高分辨率的tiff或eps格式的图片,经过压缩的分辨率为72 dpi的jpg或gif文件不能满足PMC的要求。

(4)清晰度:当以预期显示尺寸显示时,文本高度不低于8个点;线的宽度不少于2个点,实线不能中断;文本清晰,且所有文字内容都包含在图片文件中。

1.2.3 PDF文件

出版商应该为每篇文章提供单独的与XML数据文件相对应的PDF文件。如有打印质量的PDF文件,可直接提交。如果期刊没有印刷版,则PDF文件中图像的分辨率要求不低于:线图800 dpi,半色调图300 dpi,彩图600 dpi。使用到的所有字体必须嵌入PDF文件。图像压缩需是无损压缩或高质量JPEG。

1.2.4 附件

PMC要求所有补充材料以.PDF、.doc、.csv等可移植文档格式提交,不能链接到外部URL。补充材料可以是如下内容:①用来支持叙述性结论的材料,如基因组数据库或体现论文创新点的数据集;②正文中未包含的额外表格,如为同行评议专家提供参考的论文;③为强调目的而添加到论文的材料,如测验、教学视频、可填写的表格等。

PMC只能接受小于2GB的文件,如果文件大于2GB或者不能合理地包含在文章、图、表及补充文件中,NLM建议期刊和作者将数据发布到公共存储库,并在论文中包含相关的数据引用。

1.2.5 文件命名

PMC要求出版商将所有文章数据文件按以下规则命名:①图像文件和补充数据文件的名称必须与XML文件中引用的名称相匹配;②同一卷(volume)中所有文件名必须唯一;③XML和PDF的基本文件名必须一致;④卷和页码的数字补零,以确保每个文件中的数字位数相同;⑤文件名不能包含空格。

图4所示为《中国肺癌杂志》2018年第21卷第9期文件命名样例。

文件组织与命名

1.2.6 文件打包与传输

文章数据文件要打包成压缩文件,并上传至PMC提供的FTP站点。PMC接受.zip、.tar、.gz和.tgz格式的压缩包。由于PMC只支持单级解压缩,如果压缩包内有嵌套压缩文件,则它们不会被解压缩。《中国肺癌杂志》2018年第21卷第9期文件压缩包命名为zgfazz-21-09.zip。对于与PMC签署了完全收录协议的期刊,需注意要向PMC提交全部文章的数据文件,否则PMC会在定期审查中发现缺失的文章,并告知出版商及时补充。

2 标准化办刊:以英文刊的数据标准做好中文刊数据基础

《中国肺癌杂志》作为1998年创刊的中文医学期刊,自创刊伊始就将进入国际化检索系统作为重要目标,按照英文刊的数据制作标准做好中文刊数据基础,进行了以下规范化建设。①丰富英文内容展示:包括中英文目次,而且对文章的题目、作者、单位、图表和参考文献提供英文内容,提供了符合国际惯例的英文稿约、英文版权页、英文编委名单。②国际标准化全文发布平台建设:2008年起采用加拿大的OJS(Open Journal System)全文发布平台,直接实现了中英文双语全文平台和现代化的外观和内在功能,HTML和PDF双格式全文发布和内连接,DOI外连接的使用,使《中国肺癌杂志》网站符合国际主流期刊的全文要求。③国际化在线投稿审稿系统:2009年起采用中英文版ScholarOne Manuscripts投审稿系统。④尽早开始OA期刊建设:网站平台建成后采用OA策略,严格按照OA期刊标准进行建设,并被国际公认的“开放存取期刊目录”(DOAJ)收录。⑤国际化版式:期刊采用排版软件为国际期刊常用的Adobe Indesigner系统,英文字体由方正飞腾改为国际期刊常用的Arno Pro、 Book Antiqua等字体,版式也借鉴同行国际期刊的优点进行改进。

《中国肺癌杂志》以“标准化办刊、以质量取胜”的思路为指导,于2010年6月成功被Medline收录后,又于2018年3月成功通过PMC技术评估。这些成果的获得离不开扎实的学术质量和国际化的数据标准建设的加持。从《中国肺癌杂志》全文非英文内容支持度的测试示例也能看到,PMC技术评估烦琐严格,在XML文件标记、图片质量、文件命名、打包与传输、修订及更正等方面都有严格细致的要求。评估阶段只有两次修改机会,因此技术质量评估可能会成为已被Medline收录的中文期刊入选PMC的最大障碍,须以严谨的工匠精神对标PMC技术标准。

3 讨论

科技期刊是一个国家赢得科技话语权的重要工具,办好中国科技期刊在推动科技创新和科技成果的转化及应用、传播中华科技文化方面有着不可替代的作用。提高期刊文章内容的展示度是每个办刊人不懈追求的目标,随着我国生物医学领域研究水平的不断进步,大量的生物医学期刊及论文在Medline等国际权威检索平台上得到了展示,生物医学领域期刊入选Medline及PubMed Central对提升期刊的国际影响力具有举足轻重的作用。《中国肺癌杂志》被PMC完全收录,是国际生物医学界对中国肺癌学术成果的肯定,也是中国文化“走出去”在生物医学领域的有益实践与探索。今后必将会有越来越多Medline收录的中文生物医学期刊尝试申请加入PMC。

本文结合实践经验,对PMC申请、技术评估及数据文件生产等方面的流程、标准及需要注意的问题作分析与探讨,以期有越来越多的中文刊被PubMed Central和Medline收录,同时随着PubMed中文摘要展示等中文信息的增加,今后PubMed数据库或将实现中文检索,从而极大提高中文生物医学学术信息的国际展示度与影响力。

参考文献

National Center for Biotechnology Information, U.S. National Library of Medicine.

PMC Overview

[EB/OL].[2018-09-12]..

URL     [本文引用: 1]

潘璇.

两种科技电子期刊平台的XML文档系统特点分析

[J]. 中国科技期刊研究,201728(5):443-440.

[本文引用: 1]

阮继王玥尤嘉琮.

PubMed多语种摘要在中文医学科技期刊中的应用

[J]. 天津科技,201845(2):89-91.

[本文引用: 1]

张玉楠王晴王姝.

完善PubMed文章展示有利于提高中文医学期刊传播力:以《华西口腔医学杂志》为例

[J].编辑学报,201830(4):423-425.

[本文引用: 1]

董文革王玥刘谦.

过刊数字化回溯与PubMed LinkOut全文链接在医学科技期刊网络全文平台中的应用

[J].中国科技期刊研究,201425(4):520-526.

[本文引用: 1]

沈锡宾吕小东郝秀原.

PubMed Central简介及其对期刊的评估和收录

[J]. 中国科技期刊研究,200617(5):866-868.

[本文引用: 1]

翟自洋林昌东林汉枫.

加入PubMed Central的实践及其对期刊的积极影响

[J]. 中国科技期刊研究,200718(5):761-765.

[本文引用: 1]

National Center for Biotechnology Information, U.S. National Library of Medicine.

FAQs for Publishers

[EB/OL]. [2018-09-12]. .

URL     [本文引用: 1]

NLM Musings from the Mezzanine.

Happy One Billion, PubMed Central!

[EB/OL]. [2018-09-14]. .

URL     [本文引用: 1]

U.S. National Library of Medicine.

MEDLINE Policy on Indexing Electronic Journals

[EB/OL]. [2018-09-16]. .

URL     [本文引用: 1]

National Center for Biotechnology Information, U.S. National Library of Medicine.

Minimum Requirements for PMC Data Evaluation Submissions

[EB/OL]. [2018-09-17]. .

URL     [本文引用: 1]

National Center for Biotechnology Information, U.S. National Library of Medicine.

File Submission Specifications

[EB/OL]. [2018-09-17]. .

URL     [本文引用: 1]

/