理念革新与技术驱动：2023年海外科技期刊出版的挑战与新思路*

doi:10.16510/j.cnki.kjycb.2024.03.012

理念革新与技术驱动：2023年海外科技期刊出版的挑战与新思路^*

徐丽芳, 周伊, 罗婷, 田峥峥

武汉大学数字出版研究所　武汉大学信息管理学院出版科学系，430072，武汉

摘要

系统回顾2023年海外科技期刊出版动态，在S联盟提出建立由学者主导的学术交流生态系统的背景下，分析以转换协议为代表的商业OA模式与开放科学所期冀的社群导向OA模式间的碰撞；探讨生成式AI作为效率工具应用于学术出版的优势、风险与对策；梳理政府、大学、研究机构、学术出版商等各类主体在推进科学数据开放共享与重用方面的努力，以及学术出版商的数据出版活动。指出面临变局，科技出版商应以技术赋能，加强对内容资源的集聚和深度开发，完善科研工作流以应对科研诚信问题并提升自身竞争力，并应在与新兴替代性平台的复杂竞合中寻求发展。

关键词： 开放科学 ; 开放获取 ; 科技期刊 ; 数据出版 ; 数字出版

PDF (1546KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

徐丽芳, 周伊, 罗婷, 田峥峥. 理念革新与技术驱动：2023年海外科技期刊出版的挑战与新思路^*. 科技与出版[J], 2024, 43(3): 33-45 doi:10.16510/j.cnki.kjycb.2024.03.012

2023年，全球科技期刊出版经历重大变革。随着S计划（Plan S）进入下半场，高昂的文章处理费（Article Processing Charges，APC）屡遭声讨，是维持现有商业性开放获取（Open Access，OA）出版模式还是探索新的路径，成为横亘在全面、立即开放获取面前的一道难题。ChatGPT横空出世给内容生产行业造成的巨大影响在这一年初现端倪，科技出版领域也深受冲击。新倡议、新行动、新规范纷至沓来，从科技出版基础设施和工具、出版工作流程、开放共享路径到科技出版伦理和愿景，都在这一年经受着新的检视、省思和调整，2023年或许正是全球科技出版生态转变的重要节点。

1　开放获取出版：道路的抉择

2023年，《开放获取期刊目录》（Directory of Open Access Journals，DOAJ）收录的OA期刊数量突破20 000种，但增长速度持续放缓，新收录的OA文章数量相较去年同比减少4.46% ^[1]。这或许是由于新冠疫情的影响逐渐消退，OA出版重回平稳发展曲线；也或许随着S计划渐入尾声，其通过转换协议推动开放获取的力量已开始衰减。

1.1　转换协议何去何从

S计划的推出旨在促进向全面和立即开放获取过渡。历时5年，以转换协议（Transformative Agreements，TAs）作为主要行动抓手的S计划掀起了期刊开放获取转换浪潮。S联盟（cOAlition S）年报数据显示，上一年年底约20家出版商、2 500余种期刊加入转换期刊框架^[2]；而截至2023年年底，全球通过ESAC倡议（ESAC Initiative）登记的转换协议数量已经突破900项，涉及70多个国家与60多家出版商，覆盖的文章数量超过27万篇^[3]。2023年亦有多项新转换协议陆续签署，以施普林格·自然（Springer Nature，SN）、爱思唯尔（Elsevier）、约翰·威利父子出版公司（John Wiley & Sons，Inc.，Wiley）为代表的全球领先科技出版商在欧美之外积极拓展亚非国家和地区的业务。例如SN与南非、韩国，爱思唯尔与中国台湾，威利与中国香港，英国物理学会出版社（Institute of Physics Publishing，IoPP）与中国香港、印度均首次达成TAs合作，并且爱思唯尔还与日本签署了亚洲规模最大的TAs。

领先的跨国科技出版商几乎无一例外地全面拥抱TAs，并将之誉为实现OA过渡最快、最可持续的方式。不可否认，过去5年内TAs是OA出版持续增长的主要推动力。但S计划转换期刊路线的执行效果并不如预期。3年过渡期后，受S联盟资助的转换期刊最迟应在2024年年底前转换为完全OA期刊。但截至2023年6月，所有参与S计划的转换期刊仅有1%已转向完全OA；30%达到了OA内容占比每年绝对增长5%、相对增长15%，以及75%的文章OA后撤销订阅的目标。近1 600种、占比68%的期刊由于未能达成目标将被踢出S计划，其中包括加入S计划的1 721种SN期刊的77%、182种爱思唯尔期刊的63%、64种美国化学学会（American Chemical Society，ACS）期刊的56% ^[4]。

S联盟显然也充分意识到这种过渡性安排成为永久性实践的风险，因此重申将于2024年年底停止对转换协议的财政支持^[5]。即便如此，未来这种风险是否可消弭却仍是未知数，因为事物的发展往往有其惯性。2023年10月，S联盟发布新提案《迈向负责任的出版》，以推动建立适应21世纪开放科学的、由学者主导的学术交流生态系统。其中，学者可自主选择何时何地分享他们的研究成果并参与成果的质量控制和评估。提案设想了一组出版、审查、组稿（Publish-Review-Curate，PRC）模型：即先由作者到专门的托管平台发布未经审查的出版物，读者可进行非正式评论；收到非正式反馈后作者可提交给专业学者队伍进行高质量审查，且同行评审过程全部透明公开；最后由编辑组稿，选择经过审查的论文发表在期刊或平台上^[6]。相比于S计划主要通过商业模型推动OA，新提案基于欧盟开放研究出版平台（Open Research Europe）和eLife等的现有实践，提出了几乎颠覆性的学术出版体系，无疑是全面、立即开放获取思潮下的一剂猛药。

1.2　APC及其他

迄今为止的开放获取出版革命中，日益高涨的APC为学术界带来了巨大的经济负担。如果说订阅时代昂贵的期刊订阅费将很多科技文献的读者拒之门外；开放获取时代，则是昂贵的APC将许多研究者挡在了门外。2023年4月，两家领先的神经科学期刊《神经影像》（NeuroImage）及其姊妹刊《神经影像报告》（NeuroImage: Reports）的编辑团队集体辞职，以抗议过高的APC门槛。尽管出版商声称收取APC是公平的，能有效保障学术出版物的质量；但每年约20亿美元的利润仍使APC的合理性遭到强烈质疑^[7]。调查数据显示，APC费用从2010年到2019年提高了50%，并且主要出版商的价格仍在上涨^[8]。似乎基于APC的OA出版正在成为更加有利可图的商业模式^[9]，这也可以部分地解释主流出版商对TAs的热衷。

2023年10月，钻石开放获取全球峰会（The Global Summit on Diamond Open Access）上，S联盟、欧洲科学协会（Science Europe）、欧洲研究基础设施OPERAS等利益相关者达成一致，承诺未来将培育钻石开放获取学术交流生态系统。而在较为激进的钻石OA路径之外，一些出版商也在探索其他OA方案。2020—2023年底，共有约180种期刊尝试为开放而订阅（Subscribe to Open，S2O）模式，2023年净增71种^[10]。其中，年度评论出版社（Annual Reviews）通过S2O将全部51种期刊的内容转为开放获取^[11]。继社会和人文科学、物理科学和数学领域后，2023年也首次有生命科学期刊加入，其中包括卡尔格出版社（Karger Publishers）的两本神经科学类期刊。同时，美国物理联合会（American Institute of Physics）出版社的两本旗舰刊与BioOne出版社的80余种学会刊也将分别于2024年、2026年启动S2O试点。美国化学学会则推出文章开发费（Article Development Charge，ADC）新举措，对于要求无时滞期的绿色OA文章收取每篇2 500美元的服务费（包括同行评审与技术支持费用）。反对者批评ADC是“不光彩的猫捉老鼠游戏”，违背学术交流开放、包容的准则^[12]。

解决高额出版费用是科学界包括科技出版界共同面临的长期、严峻的问题，其并不会因为取消商业运营而自动消失；相反，商业运营从前一直是，今后恐怕也仍将是一个高效的知识生产和传播体制的重要组成部分。问题的关键在于怎样以科研伦理乃至法律法规来制衡失控的商业运营。2023年的国际开放科学周以“社群优先于商业化”（Community over Commercialization）为主题，强调社群控制知识共享系统的重要性，指出学术生产应以社群需求和利益而非商业利益为优先考量。但是“社群利益优先”是需要制度保障的。2023年，牛津大学和剑桥大学相继宣布启动权利保留试点（Rights Retention Pilot）。继奥地利、法国、德国、比利时、意大利、荷兰和西班牙七个国家在国家法律中容纳二次出版权（Secondary Publishing Rights）^①后，欧盟也开始鼓励成员国引入二次出版权^[13]，权利保留政策或将拥有更强有力的制度性保障。这或不失为制衡此前科技出版商过于凌厉的版权政策的切入点。

1.3　开放科学愿景

2023年5月，欧盟理事会发布《关于高质量、透明、开放、诚信、公平的学术出版的结论》（Conclusions on High-quality, transparent, open, trustworthy and equitable scholarly publishing），重申加速向开放科学过渡的重要性，呼吁立即、无限制地开放涉及公共资助的研究成果，探讨非营利性OA出版模式^[14]。荷兰设立新的开放科学管理机构Open Science NL、意大利通过开放科学路线图以促进开放科学实践。非洲、拉丁美洲、阿拉伯等地区相继举办开放科学论坛以推动区域开放科学运动。2023年年底，联合国教科文组织发布《开放科学展望：世界各地的现状和趋势》报告，以评估全球范围内的开放科学状况。PLOS持续发布开放科学指标数据集来监测和衡量开放科学实践进展。

美国对开放科学的重视也达到了新的高度。白宫科技政策办公室（Office of Science and Technology Policy，OSTP）宣布2023年为开放科学年，围绕加强开放科学政策、投资开放科学基础设施、支持研究界培养开放科学技能、推动社群扩大开放科学参与、提升开放研究实践的激励措施五个关键问题展开系列行动^[15]。OSTP并与国家科学技术委员会（National Science and Technology Council）发布“开放科学”官方定义：“使研究产品和过程对所有人可得的原则和实践，其间尊重不同的文化，维护安全和隐私，并促进合作、可重复性和公平性。”美国国立卫生研究院（National Institutes of Health，NIH）、国家航空航天局（National Aeronautics and Space Administration，NASA）、国家标准技术研究院（National Institute of Standards and Technology）等部门陆续更新公众获取计划以响应OSTP上年发布的纳尔逊备忘录（the Nelson Memo），该备忘录要求联邦资助的研究成果立即向公众免费开放。然而，这并不意味着开放科学在美国的推广毫无阻碍。纳尔逊备忘录的实施就遭遇了阻力。2023年7月，美国众议院拨款委员会发布《2024年商业、司法、科学及相关机构拨款法案》（FY24 Commerce, Justice, Science and Related Agencies Appropriations Bill），明确要求该法案及任何其他法案提供的资金不得用于实施纳尔逊备忘录。该法案如经通过，备忘录将在下一财年内被冻结。eLife、Frontiers、MDPI、PLOS等8家完全OA出版商则联名致信美国政府，警告拟议法案严重威胁科学知识的公共获取^[16]。显然，这样一项有可能从根本上改变科学研究和学术知识传播格局的政策将波及从资助者、作者、出版商、图书馆到研究人员的所有利益相关者，因此其落地实施必然取决于整个研究和出版生态系统利益相关者持续的博弈。

2　AI与学术出版：与“危”“机”共舞

随着ChatGPT的发布，生成式人工智能（Generative Artificial Intelligence）逐渐被用于学术生产，并迅速成为2023年学术界的焦点。毋庸置疑，AI强大的内容生成能力能有效提升学术生产力，但技术的双面性也带来了研究质量与学术道德方面的隐忧。

2.1　AI作为效率工具

AI高效的信息处理与内容生成能力越来越多地被用于科学研究和学术出版流程。在学术生产阶段，AI能够收集并初步整理海量研究资料，帮助研究者迅速掌握研究领域的基本情况并寻找研究空白。AI也能够快速解构复杂文献，并通过人机对话等形式帮助研究者了解文章关键内容^①，有效提高文献阅读速度。而在写作过程中，AI可以用来完成统计分析、图表制作、语言润色、引文整理甚至文章撰写工作。正如9月发表在《自然》（Nature）杂志的调查文章所示，在全球1 600名研究人员中，30%以上依赖大语言模型（Large Language Models，LLMs）生成代码，28%借助LLMs撰写文章，32%认为AI工具能够提升撰写效率^[17]。而且，研究表明ChatGPT撰写的文章有很大机会能够通过优秀金融类学术期刊的评审^[18]；而世界顶级语言学专家识别AI生成内容的成功率不到39% ^[19]。不仅如此，对不擅长使用英文进行学术写作的研究者来说，AI工具能够帮助作者或审稿人突破语言藩篱，改善现有学术交流体系中存在的语言不平等问题。

在评审阶段，AI早先已被广泛用于扫描参考文献、检测抄袭或合规、匹配审稿人等流程；生成式AI的出现进一步超越了这些外围环节，直指科学成果评价的核心步骤。近年来，随着预印本、开放出版平台的兴起，研究成果数量急剧增加。2023年，Scopus收录的新增文章数量超过400万篇；但是，科学界同行评审可承载的文章规模增长有限，因此造成系统性压力。传统同行评审因效率低下、缺乏透明度和潜在的偏见问题饱受诟病。生成式AI的出现提供了技术性解决思路，在改进和简化同行评审流程、提高同行评审质量和效率方面具有极大潜力。斯坦福以人为本人工智能研究所（Stanford Institute for Human-Centered AI）的研究人员选取近5 000篇论文，其中3 000多篇来自《自然》系列期刊，1 700多篇来自国际学习表征会议（International Conference on Learning Representations，ICLR），比较其人工评审和GPT-4评审结果的差异。结果显示，评审人与GPT-4关于《自然》期刊论文的结论存在31%重合，而不同审稿人之间评审结论的重合率仅为28%；ICLR论文中人与GPT-4的重合率达到39%，而人际间重合率仅为35%。更重要的是，该研究同时调查300余位学者对GPT-4生成结论的看法，超半数学者认为有帮助，82%的学者认为GPT-4的反馈比某些审稿人更有用。这些数据指向了“GPT-4的审查表现与人类相当”这一结论，尽管不可否认其依然具有局限性^[20]。

2.2　AI应用风险与对策

技术是一把双刃剑，在提高学术交流效率的同时也带来了一系列问题。首先，AI应用使研究诚信与学术完整性面临危机。一方面未经声明的AI使用成为一大隐患。2023年，多篇未声明使用AI的论文中出现“重新生成响应”等ChatGPT用语。英国物理学会出版社甚至出版了此种论文，被读者发现后撤稿。另一方面，论文造假问题在学术出版领域日益严重。AI的写作能力越强大，用AI创建的欺诈性研究也就越难被检测出来；同时AI技术本身并不完美，基于海量在线数据的内容输出无法保证准确性，凭空捏造参考文献、虚构信息、抄袭等例子屡见不鲜，对文章质量把控提出巨大挑战。其次，AI训练数据的缺陷很可能带来系统性偏见，从而影响学术交流的包容性与多样性。再次，在同行评审中使用AI还存在保密问题。NIH于2023年6月发布公告，禁止审稿人在评审拨款申请和研发计划时使用生成式AI，理由是使用这类AI工具时需要上传大量与评审内容相关的信息，AI工具无法保证这些数据在何处被发送、保存、查看或使用，这违反了NIH同行评审过程的安全性和保密性要求^[21]。最后，AI也被认为缺乏创造力和原创性^[22]，尤其在同行评审中，“同行”的专业知识和经验被很多人认为是不可替代的，AI若被滥用，将大大削弱同行评审作为可信任科学基础设施的价值。

生成式AI以迅雷之势席卷各内容生产领域，尽管存在诸多风险，但已无法将其拒之门外。正如《科学》（Science）起初试图禁止作者在手稿中使用任何ChatGPT生成的内容，但2023年底又推翻这一禁令。在技术革新这条快车道上，有效引导与规范人们的AI使用行为，尽可能降低AI技术带来的风险将是一场持久战。其中，透明度与问责制是现阶段普遍应用的解决方案。2023年年初，SN、爱思唯尔、泰勒-弗朗西斯（Taylor & Francis Group，T&F）、剑桥大学出版社（Cambridge University Press，CUP）等出版商，以及arXiv、eLife等新兴出版平台均更新了有关生成式AI的政策，允许作者使用生成式AI工具，但必须正确披露其贡献，同时禁止将ChatGPT及类似语言模型列为作者。出版伦理委员会（Council on Publishing Ethics，CoPE）明确立场：“作者对其稿件内容负全部责任，AI工具生成的部分也包括在内，作者要对任何违反出版伦理的行为负责。”而在同行评审实践中，生成式AI目前大多被禁止使用。爱思唯尔、SN、T&F、世哲出版集团（Sage）更新的同行评审准则均要求审稿人不得将未发表手稿的任何部分输入ChatGPT或类似工具，但爱思唯尔允许使用其自有AI工具。2023年9月，中国科学技术信息研究所与爱思唯尔、SN、Wiley联合发布《学术出版中AIGC使用边界指南》（Guideline on the Boundaries of AIGC Usage in Academic Publishing），为生成式AI使用规范提供基本原则框架和指导^[23]。12月，STM发布《学术交流中的生成式人工智能：在出版过程中使用生成式人工智能的伦理与实践指南》（Generative AI in Scholarly Communications：Ethical and Practical Guidelines for the Use of Generative AI in the Publication Process），为生成式AI的使用提供最佳实践原则和建议^[24]。

不论技术如何革新，学术生产与评价应始终由经验丰富的人类主导，AI应始终被视为辅助工具而非替代工具^[25]。问题的关键不在于是否允许在学术出版中使用AI，而在于如何负责任地将AI整合到学术交流过程中，以使人类智慧与机器自动化相得益彰^[26]。

3　科学数据：开放共享与出版实践

随着数据密集型研究范式的兴起，数据不再只是科学研究所需的事实材料或者产出的观察结果，它同时也成为科研工作不可或缺的实体工具和推动力量^[27]。科学数据和科学文献已经成为两大支柱性科研产出。因此，如何将科学数据纳入科技出版版图，是当前和未来相当长时期内科技出版企业面临的巨大挑战。

3.1　开放共享与基础设施

开放共享和可重用被普遍认为是充分发挥数据价值的有效途径，因此各国政府、大学、研究机构等各类主体纷纷启动和实施关于科学数据开放共享的诸多倡议、战略和举措。2023年，爱尔兰开始实施第二个为期5年的《开放数据战略2023—2027》（Open Data Strategy 2023-2027），指出要通过支持出版商来推动更多高质量、高价值开放数据集的制作。由欧盟资助的欧洲开放科学云（European Open Science Cloud，EOSC）旨在为研究人员提供可信赖的开放环境，以便他们能共享、查找和重用研究数据，而最终目标是为欧洲构建“FAIR数据和服务网络”（Web of FAIR Data and Services）^[28]。EOSC负责的FAIRCORE4EOSC项目拟通过开发9个核心组件来支持数据实现FAIR原则，并于2023年12月发布Beta版。除政府层面的行动，越来越多的大学和研究机构开始采用数据存储库来实现数据的开放共享。英国利兹贝克特大学（Leeds Beckett University）、美国米德尔伯里学院（Middlebury College）、非洲图书馆协会（African Library and Information Associations and Institutions）与卡塔尔国家图书馆（Qatar National Library）2023年先后与Figshare合作建立论文和数据存储库；2023年9月，萨塞克斯大学（University of Sussex）成功地将Figshare与其自2020年以来一直使用的研究活动信息系统Symplectic Elements集成，并将集成结果作为机构知识库使用。另有部分机构则通过自建门户网站、自行开发API等方式实现数据共享。如由哈佛大学（Harvard University）和贝勒大学（Baylor University）研究人员与开放科学中心（Center for Open Science，COS）、盖洛普咨询公司（Gallup）合作开展的全球繁荣研究（Global Flourishing Study）作为同类最大规模的研究项目，2023年8月宣布将通过COS门户网站公开发布项目样本数据集。又如荷兰研究理事会（NWO）9月宣布公开提供其所资助研究项目的基本数据，包括项目标题、摘要、参与研究人员及隶属关系等，并借助其自行开发的NWOpen-API将这些信息传输、集成到外部各方系统中，如大学注册系统等，由此使项目的基本信息更易于获得和重复利用。此外，研究人员与学术组织也依旧关注数据开放共享。2023年10月，国际数据委员会（Committee on Data）、世界数据系统（World Data System）和研究数据联盟（Research Data Alliance）联合举办“2023年国际数据周”（International Data Week 2023），其中多场讨论都与数据开放共享密切相关。

尽管有关数据开放共享的政策、流程、基础设施等在持续完善，但根据2023年11月Digital Science、SN和Figshare联合发布的2023年度《开放数据状况报告》（The State of Open Data 2023），研究人员连续8年都在反复关注这一问题：公开共享数据没有让他们获得应有的认可^[29]。这表明对数据开放共享的经济激励或声誉激励等应该成为学术交流系统未来的工作重点之一。麻省理工学院（Massachusetts Institute of Technology，MIT）便作出了这种尝试。它于11月正式公布第二届开放数据奖（MIT Prize for Open Data）获奖的10个个人和小组研究项目，以奖励其在数据开放共享方面作出的贡献。

随着科学研究愈发依赖数据驱动，为最大程度发挥数据对科学发展的促进作用，除了持续推动数据开放共享外，同时还必须构建支持数据重用的基础设施。其中，能够实现数据跟踪和定位的持久标识符（Persistent Identifier，PID）越来越被认为是支持性的重要基石和首要前提。国际标准书号（International Standard Book Number，ISBN）、国际标准连续出版物号（International Standard Serial Number，ISSN），可以在图书馆或书店实现对纸质出版物的跟踪和定位。但随着学术出版进入数字时代，仅靠ISBN和ISSN这类PID已经无法满足多类型、细粒度、动态性的数字学术资源定位需求。而URL既不稳定，也不持久，随时可能失效，导致“死链”问题出现。于是，能够永久可靠地指向数字实体的PID被越来越多地开发并推出^[30]，具体包括分配给期刊文章、图书章节、科学实验报告、数据集和软件等研究成果的数字对象标识符（Digital Object Identifier，DOI）；面向研究人员的开放研究者和贡献者标识符（Open Researcher and Contributor IDentifier，ORCID iD）；面向研究机构的研究机构注册标识符（Research Organization Registry，ROR）；面向生物医学研究中所使用试剂、抗体、生物模型和软件工具的研究资源识别符（Research Resource Identifier，RRID）等^[31]。近年来，S联盟、OSTP、英国研究与创新署（UK Research and Innovation，UKRI）等资助机构以及爱思唯尔、Wiley等学术出版商都开始倡导或强制要求使用PID。2023年11月，STM、DataCite和Crossref发布《研究数据联合声明》（Joint Statement on Research Data）强调PID的使用：①研究人员发表成果时要将相关研究数据和成果存入可分配PID（如DOI）的可信数据存储库，方便研究人员使用PID链接到研究数据；②研究人员使用他人创建的研究数据时，要在参考文献中使用PID注明数据集出处；③出版商要将数据引用和数据可用性声明中的数据链接以及PID（如DOI）纳入Crossref注册的文章元数据中；④存储库和出版商通过元数据和参考文献列表中的PID连接文章和数据集^[32]。这些规定不仅凸显了对确保数据永久可跟踪和可发现的重视，还表现出对促进期刊论文与数据双向发现、关联机制的关注。

3.2　数据出版实践

以往很长一段时间，数据只是作为文献的辅助材料存在；而文献发表后部分数据甚至直接被废弃，数据蕴藏的巨大价值并未得到认可。但随着数据开始被看作科研和创新的基础驱动力，其已经取得几乎和文献同等重要的地位，因此许多出版机构纷纷开始布局数据出版业务。

数据出版（Data Publishing）指通过一定“公共机制”发布数据，使公众可以根据一定规则发现、获取、分析和重用这些数据^[33]。因此，2023年数据开放共享与重用也是出版机构的工作重点之一。2023年3月，SN决定在旗下期刊实行单一数据政策（Single Data Policy），未来其所有期刊都将采用同一套数据可用性声明（Data Availability Statements，DAS），并遵循相同的数据存储和数据共享规定。同时，它首次为旗下图书引入统一数据政策（Unified Data Policy）；但鉴于图书在迈向开放科学时的不同进程，该政策并不强制要求提供DAS，但强烈建议共享数据和使用存储库。这一举措能够显著降低研究人员在向不同期刊投稿或出版图书时面临的数据政策复杂性，使数据共享变得更加容易^[34]。4月，《科学》系列期刊与数据存储库Dryad达成合作，将数据共享无缝集成到作者投稿流程中；5月，IntechOpen期刊也成功地将其投审稿系统ReView与Figshare集成。然而，数据开放共享远非终点，公开数据的发现和重用才是直接关系知识发现与创新的关键一步。7月，PLOS继续其于上年首次推出的“可访问数据”（Accessible Data）实验，将所链接的特定存储库从Dryad、Figshare、Open Science Framework等3个扩展为9个。这将使具有“可访问数据”的文章数量增加3倍，达到15 000多篇^[35]。

尽管开放共享是当前数据出版的主流模式，但也有一些出版机构开始推出付费获取的数据集（Datasets）。如集合12种美国医学会（American Medical Association）所出版期刊的JAMA Network（Journal of American Medical Association Network）于2023年1月底宣布在数据许可联盟（Data Licensing Alliance）上添加JAMA Network Open和JAMA Health Forum数据集，它们3个月的许可售价截至2024年2月底均为60美元。这些数据集来源于JAMA Network的高影响力同行评审数据，能够用于训练AI和机器学习（Machine Learning，ML）算法^[36]。不同于JAMA Network借助第三方数据交易平台发布数据集的做法，爱思唯尔选择自行销售数据集。2023年12月，它宣布推出科学数据集，其中包括1 900万篇同行评审期刊的全文文章、1 700万作者简介、18亿篇被引参考文献、3.33亿种化学物质和反应、8 600万条生物活动和生物医学记录以及3 500万项化学专利。这些经过同行评审的数据能够为研究人员、数据科学家和实践领导者更快、更精确地回答生命科学、能源、技术、化工和材料等行业的研发问题提供洞见和预测。数据集可通过API或无格式文件（Flat Files）灵活交付。与大多数开放共享的数据集相比，此类付费数据集并非由投稿作者本人提供，而是出版商基于已有内容和资源，在投入一定人力、物力与财力后形成。

4　科技出版商：内外兼修谋发展

为了适应日益开放、智能化、数据化的科技出版与科学交流新生态，加快向信息分析公司或解决方案提供商转型^[37]，传统科技出版商既注重内涵式发展，持续丰富内容资源、重视维护科研诚信、提升内容质量；又注重外延式发展，推进前沿技术和优质学术内容相结合，以研究者需求为导向不断完善数字解决方案，力求全方位支持科学创新。

4.1　内容夯实发展基础，技术赋能外延式拓展

内容是出版企业的立身之本。因此，跨国科技出版商从未停止从外部吸纳学术期刊等内容资源的脚步。其常见方式之一是加强与学协会的联系，为之出版旗舰刊，以整合特定领域内具有领先地位的内容资源。2023年，已拥有600多家学协会合作伙伴的爱思唯尔继续携手美国药学院协会（American Association of Colleges of Pharmacy）、韩国分子与细胞生物学学会（Korean Society for Molecular and Cellular Biology），分别合作出版《美国药学教育杂志》（American Journal of Pharmaceutical Education）、《分子与细胞》（Molecules and Cells），以补充现有优势领域的期刊组合^[38]。另一种方式是借助收购、合并等资本手段增加旗下期刊或平台的数量。2023年10月，博睿学术出版社（Brill）和德古意特出版社（De Gruyter）合并组成De Gruyter Brill，每年可出版800种期刊^[39]，一跃成为人文学科领域的头部出版商。随后，Sage收购IOS出版社（IOS Press），借此新获近100种期刊，其中20多种为完全OA期刊^[40]；T&F收购医学、生物科技与科学研究出版社未来科学集团（Future Science Group），由此新增32种期刊与5个数字平台^[41]。

技术是科技出版转型的核心驱动因素之一；因此，跨国出版商莫不以新兴技术赋能多年积累的学术内容和数据资源，创造各种分析和决策类工具与服务，以释放内容价值^[42]。2023年，SN、爱思唯尔的技术人员在员工总数中占比约为30% ^[43,44]。其中，AI技术一直备受出版商关注。如爱思唯尔推出的Scopus AI、ClinicalKey AI工具能更有效地解决科研人员和临床医生遇到的典型问题。其中，前者可以Scopus数据库中超过2.7万种期刊的文献和数据为基石，生成可溯源性科研主题概要，助力研究者迅速切入新研究课题；还能定位特定领域的关键文献和专家等。由于依托经过同行评议的可信数据集，它可以弥补当前AI在信息准确度方面的缺陷^[44]。ClinicalKey AI是爱思唯尔同AI公司OpenEvidence合作开发的一款临床决策支持工具；相比于之前的版本，融入生成式AI技术的新工具重塑了临床信息获取方式，支持医生以问答形式在短时间内获得准确、简洁的循证信息。

4.2　科研诚信和替代者的双重挑战

转型中的科技出版领域看似静水流深，但是对于传统出版商而言从来不乏未知水域的暗礁险滩。科研诚信问题愈演愈烈以及ResearchGate一类新兴替代性平台的兴起，无疑为出版商的生存和发展带来了巨大挑战。

一直以来，出版商是维护科研诚信、保证内容可信可靠的重要主体，扮演着把关人的角色。因此，当确定已发表论文有不诚信迹象时，出版商通常会实施撤稿行动。《自然》发文称2023年撤稿量突破1万篇^[45]，其中9 800多篇来自Wiley子公司Hindawi旗下的期刊，比其他出版商撤稿量的总和还要多。撤稿量的激增与论文工厂（Paper Mill）的大规模欺诈活动有较大关系。2023年3月，Hindawi旗下19种期刊因未达到质量标准而被科学网（Web of Science）剔除^[46]。这严重破坏了Hindawi期刊乃至母公司的声誉。为此，Wiley采取多项举措来清理不诚信论文与期刊，包括暂停特刊出版、持续撤稿、关闭4种已被论文工厂渗入的期刊、在出版流程中新增更严格的检查步骤等。12月，Wiley决定壮士断腕，废除子品牌“Hindawi”；彼时距收购Hindawi还不到3年。后续其旗下200种期刊将迁移至Wiley的期刊组合中，并统一实施新的论文提交和同行评议系统^[47]。

随着ResearchGate发展成为当前科学领域访问量最大的数字平台，出版商已无法对其视而不见，遂逐渐扭转此前与之对立的关系，并尝试利用它来扩大自身学术内容的可见性。2023年，12家出版商与ResearchGate达成合作，将旗下部分期刊集成到平台中，以便用户更轻松地查找和访问所需论文^[48]。值得注意的是，SN、T&F、Wiley和Sage均位列其中，爱思唯尔却并未参与。2月，爱思唯尔联合美国化学学会、英国皇家化学学会（Royal Society of Chemistry）、T&F、Wiley将35种有机化学和运输类期刊文献聚合在ScienceDirect平台的试点项目到期并取得初步成果，推动相关期刊的文献访问量（包括摘要访问和全文访问）显著提升，增幅为4.1%～18.8%不等。因此，美国微生物学会（American Society for Microbiology）和Brill也加入试点项目，将36种期刊内容转至ScienceDirect平台^[49]。

4.3　完善科研工作流解决方案

面向用户科研工作生命周期构建的工作流框架在前些年已初具规模^[50]，但跨国出版商仍在动态跟踪用户在科研过程各阶段的需求，以打造更精细化、更先进的工作流解决方案。

在学术写作环节，针对研究者特别是母语非英语研究人员的痛点，SN于2023年10月推出AI驱动的科研写作助手Curie，免费帮助用户处理上传手稿的语法错误、润色语言。由于向《科学报告》（Scientific Reports）和《发现》（Discover）系列期刊投稿前使用了该工具，中国作者的发表成功率增加了14% ^[51]。此外，SN还将可指导研究者撰写论文摘要的工具TooWrite收入麾下并扩展其功能，使之后续能辅助撰写完整论文。在退稿论文再投环节，T&F于9月为被退稿作者免费提供“传播与媒体研究网络”服务，即在涉及健康传播、跨文化传播等多领域54种期刊组成的网络内，推荐适于退稿论文再投稿的期刊，并提供转刊服务。在研究成果影响力评估环节，通过与科技公司Overton合作，Sage、英国医学会下属出版机构BMJ分别开发了评估工具Sage Policy Profiles、BMJ Impact Analytics，聚焦研究对政策、公众等作出的实际贡献而不只停留在标准化的学术指标上。如前者可让研究者明晰其成果在政策文件中的具体引用情况，并以图表形式对研究成果影响力作可视化表现，以方便作者使用和分享^[52]。

如前所述，科研诚信一直面临严峻的挑战，尤其伴随生成式AI产品的出现，论文造假和批量产出的门槛明显降低。为保证期刊质量和可信度，许多出版商采用技术投入、流程管理、制度建设等多元化对策。2023年，SN、爱思唯尔加大力度开发和应用AI工具，以便能够更快判断论文是否存在失信问题。Wiley同撤稿观察数据库（Retraction Watch Database）合作，在投稿工作流程中插入参考文献撤稿检查，供作者根据检查结果及时调整被撤引文，也为编辑提供监测工具。Sage则不仅扩大内部科研诚信小组（Research Integrity Group）的规模，还专门组建用于防范道德失范行为的团队。该团队强化对工具和技术的使用，以改进出版政策、识别潜在的问题期刊等。

5　结语

S计划执行的5年间，全球开放获取出版取得重大进步。然而，以TAs为代表的商业OA模式虽然有效扩大了OA出版量，但也滋养了日益升高的APC，将许多研究者、甚至国家拒之门外。这违背了科学交流的平等初衷。APC带来的巨大利益让出版商坚定不移地拥护金色OA路线，使S计划最初设想的过渡性安排有难以回头的风险。S联盟的新提案倡导建立学者主导的知识共享系统，优先满足科学交流需要。而作为科技交流的重要基础，出版商的态度和行动至关重要。尽管科技出版商正加速向数据和信息产品提供商、服务商转型，但解决科技出版的可持续发展与广泛开放共享之间的矛盾依然是首要问题。新提案能够引发多大涟漪有待时间进一步检验。同时，随着数据密集型研究范式兴起与AI技术革新，整合前沿技术、容纳数据出版实践、改善出版流程甚至创新科技出版观是未来科技出版需要持续面临的考验。必须承认，建立起高效、高质量、公平、开放、诚信的学术交流生态体系依然道阻且长。

*基金项目：本文系文化名家暨“四个一批”人才工程项目“中国科技出版国际传播战略研究”中期成果。

①2022年10月，欧洲研究型图书馆协会（LIBER）的“21世纪知识权利”项目（Knowledge Rights 21,KR 21）提出“二次出版权”概念，具体指公共资助的研究成果除了在学术期刊上发表，还可在互联网可搜索的开放获取知识库或其他地方再次发布的权利。这些权利可以通过许可授权给第三方使用。

①如ChatPDF等文献阅读工具。

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

DOAJ.

[EB/OL].（2023-12-31）[2024-01-20]. .