科技与出版, 2024, 43(6): 38-47 doi: 10.16510/j.cnki.kjycb.20240613.006

产业观察

2019—2022年语义出版研究进展述评

周妍, 翁梦娟, 王晓光

武汉大学信息管理学院,430072,武汉

通讯作者: ✉通信作者。

摘要

近年来,语义出版作为学术出版领域内的研究热点,国内外有关出版形式和应用实践的学术研究数量可观,成果颇丰。梳理和总结学术界的讨论和研究,能够有效把握语义出版今后的发展方向。本文梳理2019—2022年语义出版相关研究文献,将语义出版在这期间取得的研究进展从出版内容、出版流程和应用实践三个方面进行述评,并对该领域未来的研究趋势加以展望,以期为出版行业的进一步转型和升级做出贡献。

关键词: 语义出版 ; 本体 ; 科学知识图谱 ; 纳米出版物 ; 研究综述

PDF (1556KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

周妍, 翁梦娟, 王晓光. 2019—2022年语义出版研究进展述评. 科技与出版[J], 2024, 43(6): 38-47 doi:10.16510/j.cnki.kjycb.20240613.006

语义出版作为数字出版的高级形态,其概念最早由Shotton于2009年提出[1],目前已经成为学术出版领域的主流出版形式。利用语义技术实现对文献内容的语义增强是实现智能化出版和知识服务的重要基础。

伴随人工智能技术与语义技术的普及与应用,语义出版领域的研究在围绕文献内容的结构化、关联化、语义化等方面均获得了重要进展。新兴的科学知识图谱和开放关联数据成为语义出版物的常见表现形式,语义出版开始向知识网络建设稳步迈进[2]。语义出版物数量的快速增长为其在科学发现和科学交流的深入应用带来新的机遇。

近年来,语义出版作为学术出版领域的研究热点,国内外有关出版形式和应用实践的学术研究数量可观,成果颇丰。有必要对近年来语义出版的研究现状进行全面的梳理和总结,明确目前语义出版的研究热点、面临的挑战以及未来的发展趋势,为相关领域的研究提供有价值的参考,为出版行业的进一步转型和升级作出贡献。

1 数据获取

本研究构建了如图1所示的工作流程,将2019—2022年语义出版代表性文献作为数据样本,在主题词检索、多重筛选的基础上总结近年来语义出版领域的主要研究主题。具体工作流程如图1所示。

图1

图1   本研究工作流程示意


(1)文献检索的对象为国内外语义出版相关的可检索文献。考虑到2018年以前已有相关的综述文章[2,3],本研究将文献检索的时间范围设置为2019—2022年。首先,以“主题”字段值为“语义出版”“语义出版物”“纳米出版”“纳米出版物”“微型出版”“微型出版物”“增强出版”“增强出版物”在中国知网期刊数据库和万方数据知识服务平台上检索。然后以“主题”字段值为“semantic publishing”“semantic publication”“micropublication”“micropublishing”“nanopublication”“enhanced publishing”“enhanced publishcation”在Web of Science核心合集数据库和Google学术搜索中检索文献,共计得到2 065篇中、外文文献。

(2)本研究根据以下文献筛选标准对基础文献进行排除:语种不是中、英文的文献;综述、新闻、报告、硕博士学位论文等非研究性论文以及无法获取全文的研究性论文;本身是纳米出版物和微型出版物的论文;文献标题明显与语义出版研究没有相关性的论文;同一作者发表的论文内容重复较多的仅保留一篇。首先,去除重复检索结果,然后根据文献标题、摘要、关键词或主题词初步判断,通过对论文的阅读决定是否要纳入进行下一步的深入分析,又经过全文阅读进一步排除文献。最终确定纳入综述的文献共计77篇,包括中文12篇、英文65篇。

(3)对最终纳入的文献进行编号和数据摘要操作,数据摘要主要包含8项基础元素:论文标题、作者、期刊、发布时间、摘要、主要研究内容、未来研究方向、研究局限。

本研究经过对77篇文献的分析,将2019—2022年语义出版领域的相关研究进展归纳为三个方面:科技文献内容的语义增强、出版流程的语义化增强以及语义出版的应用实践。

2 语义出版研究进展

近年来的研究不仅注重对科技文献内容组织的深入分析与挖掘,还致力于利用人工智能技术改进语义出版流程,促使科技文献的出版工作流程从数字化向智能化升级。这一趋势将推动出版业知识服务向着更智能、更高效、更纵深的方向发展,从而更好地满足读者和科研人员等各类用户的需求,推动知识的传播、交流和再生产。

2.1 科技文献内容的语义增强

出版物内容本体是对出版物各类内容单元及关系的形式化描述。本体模型为促进文本间深度语义关联和学科领域知识的体系整理提供了框架。

当前通用领域出版物内容本体建设的侧重点是从引用动机及情感倾向、论证角度来揭示科学论文中的隐性语义。作者在引用先前研究时,往往会在上下文中表达其观点态度。揭示引用动机及情感倾向有助于读者深入把握作者的引用意图,为科技文献的影响力评估、智能推荐等研究提供参考。例如,CCRO本体将科学论文间互相引用的原因简化为8个不相交的方向[4],OpenCitations本体通过规范学术引用关系来追踪学者思想观点的演变。[5]科学论文内蕴含的论证结构体现了作者的逻辑推理过程。王晓光等关注科学论文内隐藏的重要科学观点、结论以及论证过程,在国内首次提出论证本体SAO。[6]曲佳彬等从语句、实体及语境3个层面构建科学论文论证结构本体,更全面、更细粒度地揭示了论文的论证结构。[7]结合论证理论和引用关系,本体EVI基于文献数据为用户透明地生成和扩展证据图。[8]

出版物内容本体构建的另一个重要方向是描述具体学科领域内文献资源中的知识实体关系,以实现该领域内的知识聚合与知识搜索。其中,最具代表性的科学知识图谱本体套件SKGO,对现代科学各个领域的研究成果实现建模,以结构化的方式表示研究问题,构建知识库并辅助生成领域知识图谱。[9]SKGO包括五个领域本体,分别是计算机科学(SemSur)、化学(ChemSci)、物理(PhySci)、牙科(DentSci)以及药剂学(Pharmsci)。[10,11,12]除此之外,基于跨学科、跨研究科学文章构建的本体也体现出语义技术在特定领域知识组织上的应用,例如食品药物相互作用证据本体FIDEO [13]、临床试验证据本体C-TrO [14]等。

基于引用原因本体、论证本体、领域知识本体等模型将科学论文中蕴含的知识关系转化为形式化的语义表示,能够进一步细化对出版物进行语义组织的粒度、拓展了语义揭示的视角,有力支撑了语义出版物的下游应用场景。

2.2 出版流程的语义化增强

语义环境下,科技文献内容的语义组织粒度进一步细化,而由众包或本体模型主导的科技文献内容结构化与语义化成本较高。在此背景下,学者们正密切关注语义技术与出版流程的有机整合。出版对象从传统出版物至结构化“知识单元”的形式转变,能够有效促进信息的再利用和按需重组,为构建可持续知识基础设施带来机遇。[15,16]

面向语义出版的可视化编辑工具的开发,将为学者和编辑人员参与语义出版流程提供新的可能,尤其是在科技文献的创作和审稿发布阶段。[17]目前已有研究将CCRO本体融入LaTeX编辑工具以支撑带有引用原因信息的文献创作和发布。[18]RDFtex框架集成了SciKG与LaTeX编辑工具,旨在缩小传统出版物与RDF之间的距离。[19]结合Fidus Writer学术编辑器和OJS评审管理系统支持的同行评审工作流程,能够生成带有注释且内容机器可读的数据。[20]STM(Smart Topic Miner)是辅助Springer Nature等科技期刊编辑团队的常见效率工具,用来进行学术会议论文的研究主题自动归类,并有望进一步实现科学出版物内容高质量元数据的自动生成。[21]

基于上述研究,学者们的探索还在持续向语义出版工作流的各个后续环节延展,以向广大科研工作者提供更加智能化的知识服务。例如,K-Grid-China从内容组织语义化的医学期刊文献中提取可计算医学知识并应用于医疗实践。[22]Augustus等设计了具备实时更新计算结果功能的发布系统,旨在探索科学论文产生持久价值的有效方式。[23]此外,出版流程的语义化增强在学者们创作前期的知识发现阶段也有所表现。例如,ComplEx模型能够帮助领域专家识别新的研究假设,促进自动化的科学发现。[24]

出版流程的语义化增强能够有效解决科学论文原始数据与知识对象之间存在的D2K(data to knowledge)和K2D(knowledge to data)问题。如何在出版物编辑创作伊始就完成语义处理和分析,乃至最终以语义化的方式实现对学者科研工作的知识反馈,还需要继续深入探索。

2.3 语义出版的应用实践

2.3.1 纳米出版物模型的应用

纳米出版物的核心内容在于论断、出处和出版信息三类数据。作为一种语义表达模型,它以其高度互操作和机器可读的特征被广泛应用于科学数据与知识的发布,从而增强了科学数据与知识的可访问性和可计算性。目前,围绕纳米出版物的研究主要集中在知识表示和交互实现两个方面,体现了学界对语义出版物的可用性探索。

到目前为止,纳米出版物被应用于多个学术领域的知识表示。一方面,纳米出版物被应用于描述学术论文中的结论型知识元[25]、科学论断[26,27]、研究主张出处[28]等。基于纳米出版物实现对同行评审意见的语义表达,还可以为出版审查提供可靠的数据依据,为科学交流中的同行评审活动提供便捷的知识服务。[29,30]另一方面,纳米出版物的机器可读性对实现学术界的各类数据重用存在很大助益,例如生物医学领域的基因组数据集[31]和社会研究领域的语言类数据集等[32]。需要注意的是,由于自然语言的复杂性,利用NLP技术抽取论断生成纳米出版物还需要更多技术层面上的探索,创建高质量的纳米出版物需要一个更加统一、详细、准确的建模指南。[33]

纳米出版物的可视化系统设计和开发,正在试图推进以人类易理解的形式实现纳米出版物的发布、检索、浏览、获取与引用。具体来说,Nanobench利用分散式服务网络,帮助用户通过界面交互操作发布小型关联数据语句,同时也为用户查询知识提供了更加便捷且可靠的途径。[34]NanoWeb系统提供了能够访问、探索和重用开放纳米出版物的可视化接口,并支持链接到纳米出版物的出处论文和数据库。[35]纳米出版物引用框架Nanocitation为纳米出版物缺少引用标准提供解决方案,并开发公开可用的WebApp,以便用户自动创建引文文本片段以及机器可读的纳米出版物引用。[36]

上述研究表明,学界正在积极探索如何实现纳米出版物从创建、发布到分享全过程的标准化和规范化,纳米出版物有望像科学论文一样被检索、阅读和引用。此外,围绕纳米出版物的可用性探索研究中,以可视化方式增强用户与系统之间的交互亦是语义出版流程中增强作者参与度的体现。

2.3.2 领域知识图谱的构建

知识图谱能够实现不同科技文献内实体之间的语义关联,有助于知识发现与语义检索。不同学科领域的知识图谱构建是语义出版向知识网络建设的积极探索。

众包与人机协同的细粒度、大规模知识图谱构建方法得到关注。开放研究知识图谱ORKG融合了众包与自动化技术,被学界视作开放科学背景下语义知识服务的下一代基础设施。[37]目前,有关ORKG的研究仍处于探索阶段,有学者指出这类开放知识图谱需要在迭代和增量中不断改进和评估,注重作者和用户的参与。[38]除ORKG之外,微软学术知识图谱MAG[39],以及大规模异构学术知识图谱OAG[40]等也体现了学界对科学文章内容上知识单元互连的积极探索,其中OAG的2.0版本着重实现了两个大型异构数据集中实体的自动化匹配。学者Dessí和他的团队关注大规模自动生成知识图谱的构建,首次提出AI-KG[41]之后,再次改进知识提取方法提出SCICERO构建方法[42],构建了更大量级、全自动化的CS-KG[43],未来还将允许用户参与构建流程,以实现更细粒度的实体分类。学者们还就语义标注[44,45,46]、知识抽取[47,48]、语义推理与预测[49,50]以及知识图谱构建工作流[51,52]等方向探索优化方案,以提升各类文档资源的语义价值和可用性。这些大规模领域知识图谱的构建为AI for Science(简称AI4S)的发展提供了更多机遇。

开放科学背景下,跨学科研究是解决当今众多纷杂社会问题的重要手段。如何存储、管理并集成这些分散学科下的数据,实现领域性数据融合已经成为研究热点。借助本体模型,这些特定领域和学科的研究人员开始致力于多领域融合的知识图谱构建,以更精准地捕捉知识的结构和语义内涵。这类研究涉及生物多样性科学、复合材料科学、生物医学信息学等大量跨学科的问题场景,为学科之间的交叉合作和创新研究提供了基础的技术和知识支撑。[53,54,55,56]

基于科技文献构建论证知识图谱也成为新的关注点。具体来说,包括论证话语的论证单元识别[57,58]、论证结构识别[59],以及扩展至文章主体的全文论证挖掘[60]和针对论证挖掘的性能评估方法[61]等多项研究成果涌现。相关学者已经设计出通用的模版来实例化科学论文中的科学论断和学术主张,以构建基于研究贡献的论证知识图谱。[62,63,64]

领域知识图谱在规模、覆盖领域和构建方法与技术等方面都呈现出多样化和不断发展的趋势。推进跨领域大规模异构知识图谱的融合工作,基于本体建设积极探索知识单元标注、提取、管理到知识图谱的自动构建,是聚合学术知识以形成科学知识网络的关键路径。

2.3.3 基于语义出版物的科学计量

基于语义出版物的科学计量分析,能够实现对数据和分析过程的有效溯源,增强分析结论的可信度,为科学论文的质量评估和演变分析提供循证。

引文分析是科学计量学的重要分支。以计算机可理解的方式表示科学论文中的引用关系,可以从引文结构、引用原因、引文网络等多维度进行可溯源的引文计算分析,进而用于科学计量中的学术影响力和知识演变等研究。结合本体和关联数据等语义技术的引文分析方法区别于传统引文分析,具有一定的可操作性,为学者进行科学计量研究提供便利。[65]现阶段语义出版在引文分析上的应用旨在为计量评估开辟新的研究视角,例如聚焦实体以实现更细粒度的引文结构可视化、作者网络自引趋势分析、基于书目实体和引用数据量化书籍在学术交流中的作用[66,67,68]

借助语义技术对科学计量指标进行建模,从文献资源中半自动生成计量指标,也是语义背景下开展科学计量研究的全新方式。[69]首先,从科学论文元数据出发构建本体,能够为科研评估提供更深入的视角,例如科学事件本体SEO[70]、基金项目本体Dingo[71]、重构BiDO以评估科学生产的文献计量数据本体[72],以及兼顾文献计量和替代计量两种数据来源的本体AI-SPedia[73]等。以ROH为代表的本体,对科学交流生命周期中的关键实体与关系进行了建模,包括科研项目、科研学者、学术论文以及研究成果等知识要素。[74]除此之外,还有大型语料库的语义演化分析以及计算机科学领域的科学事件评估与演变探究等。[75,76]

基于语义出版的计量分析较之传统计量分析,优势在于能够利用高度结构化和语义化的数据精准、高效地计算出更复杂的指标,并实现对原始数据和分析过程的查看与浏览,以增强计量分析结果的可信性与可循证。但这也对研究人员的技术能力和数据质量提出了更高的要求。

3 语义出版研究趋势前瞻

综观2019—2022年语义出版领域已有的研究成果,并结合近两年的技术发展趋势,本研究认为语义出版未来的研究应当聚焦以下三个方向。

3.1 优化技术方案,促进跨学科出版物的深层知识融合

语义出版物有望成为下一代数据基础设施的形态。但是,不同语义出版物之间的语义异构问题仍较为突出,包括但不限于不同领域的知识表达差异、同领域的语义建模缺乏标准化方案以及同词异义、异词同义等现象。同时,大量增强型出版物间存在模态层面的语义鸿沟,进一步阻碍了基于语义出版物的深层次知识融合。未来,需要更高效、透明、可解释的算法,结合本体、语义标注等语义技术,从不同学术领域的复杂文本中抽取实体、关系、陈述等不同模态和粒度的知识单元,实现对大型复杂数据集的自动化标注、主题识别、知识抽取。此外,利用人工智能技术,尤其是基于大语言模型的AI系统,从文献资源中抽取语义关联的数据,能够建立多模态可计算知识库,从而实现各学科应用数据的效率提升。这种出版物之间的深层知识融合,还能够进一步支持深度知识发现与推理工作,推动学科间的交叉与合作。

3.2 协调“人智协同”,实现知识单元良性循环的语义出版流程

AI4S时代下,“人智协同”的动态语义出版系统将有望兼顾语义出版物快速发布与高质量发布的要求,以实现出版工作流程各环节之间的语义互连和知识更新实时同步。以GPT为代表的生成式大语言模型的发布及其能力潜力,意味着大语言模型作为基础模型嵌入出版全流程将成为短期内可预见的现实。无论是在非结构化出版物的基础上进行语义增强,还是学者学术实践与语义出版流程的平衡性探索,人类与大语言模型等人工智能协同完成出版物的语义化编辑、处理与发布工作已成为趋势。语义出版物将作为高质量语料用于训练和增强AI模型,使模型从不同学术领域的复杂文本中识别实体、关系、陈述等不同类型和粒度知识单元的能力得到提升,自动语义标注的效率和准确度得到提高。而语义技术与出版编辑流程的实时结合,将帮助学者们在学术创作的过程中,对生成式模型进行错误认知的纠正反馈,进而提高数据质量和模型效果。在这样一个双向循环、迭代优化的出版过程中,人类的专业知识、判断力、创造力与机器的智能化技术相结合,能够充分将人类作为创作者对知识的塑造和理解能力转化为机器可理解的表现形式。

3.3 注重用户体验,设计用户友好且计算透明的知识服务工具

纳米出版物、微型出版物、知识图谱等以形式化的方式表示知识单元类型及其关系,突出了内容的机器可读性,却忽略了它们作为一种出版物的人类可读性和可交互性。[77]已有少量研究尝试将单个纳米出版物转化为人类可读的HTML页面,但基于大规模语义出版物的知识挖掘和计算过程对用户来说依旧是不透明可见的。未来,面向人类可读的语义出版物阅读工具需要被设计出来,以提高知识对象在动态语义出版过程中的可供性,让用户在使用时能够有效发现新的知识,且有迹可循、有据可依。如此,这种知识服务工具能够提高学术作者、编辑、同行评审人员等角色对语义出版物的理解与应用水平,支撑用户从复杂的互链信息生成见解,进一步实现人类阅读与机器理解的协同作用。

4 结语

综上所述,到2022年为止,语义出版研究已经取得了阶段性进展,在出版物内容、出版流程以及应用实践等方面积累了一定的研究成果。未来,整合学者学术实践与出版流程,充分发挥出版多主体与人工智能的协同优势,注重协调人类阅读与机器理解的创新型出版范式,将给出版行业乃至整个科学交流体系带来了变革性的发展机遇。

本文的研究局限在于文献排除及主题分类带有不可避免的主观因素,少量以非英语发表的论文与语义出版高度相关,但由于语言阅读障碍,这一部分未被纳入,可能导致遗漏某些主题;此外部分论文由于版权限制无法获取,也未被纳入综述范围。

参考文献

GENTILE A L, GRUHL D, RISTOSKI P, et al.

information extraction in editorial setting. A Tale of PDFs

[C]//HITZLER P, KIRRANE S, HARTIG O, et al. The semantic web:ESWC 2019 satellite events. ChamSpringer International Publishing201969-74.

[本文引用: 1]

KIM H, CHOI J, PARK S, et al.

Layout aware semantic element extraction for sustainable science & technology decision support

[J]. Sustainability,2022145):2802.

[本文引用: 1]

RAHMAN M M, FININ T.

Unfolding the structure of a document using deep learning

[DB/OL]. arXiv,20192019-09-29)[2023-05-10]. .

URL     [本文引用: 1]

NAYYERI M, KRAVCHENKO A, ANGIONI S, et al.

Link Prediction using numerical weights for knowledge graph completion within the scholarly domain

[J]. IEEE Access,20219116002-116014.

[本文引用: 1]

ARAB OGHLI O, D’SOUZA J, AUER S.

Clustering semantic predicates in the open research knowledge graph

[C]//TSENG Y H, KATSURAI M, NGUYEN H N. From born-physical to born-virtual:augmenting intelligence in digital libraries. ChamSpringer International Publishing2022477-484.

[本文引用: 1]

VAHDATI S, FATHALLA S, AUER S, et al.

Semantic representation of scientific publications

[C]//DOUCET A, ISAAC A, GOLUB K, et al. Digital libraries for open knowledge. ChamSpringer International Publishing2019375-379.

[本文引用: 1]

ABAD-NAVARRO F, BERNABÉ-DIAZ J A, GARCÌA-CASTRO A, et al.

Semantic publication of agricultural scientific literature using property graphs

[J]. Applied Sciences,2020103):861.

[本文引用: 1]

PENEV L, DIMITROVA M, SENDEROV V, et al.

OpenBiodiv:a Knowledge graph for literature-extracted linked open data in biodiversity science

[J]. Publications,201972):38.

[本文引用: 1]

MCCUSKER J P, KESHAN N, RASHID S, et al.

NanoMine:A knowledge graph for nanocomposite materials science

[C]//PAN J Z, TAMMA V, D’AMATO C, et al. The semantic web–ISWC 2020. ChamSpringer International Publishing2020144-159.

[本文引用: 1]

ZHU Q, QU C, LIU R, et al.

Rare disease-based scientific annotation knowledge graph

[J]. Frontiers in Artificial Intelligence,20225.

[本文引用: 1]

ANGIONI S, SALATINO A, OSBORNE F, et al.

AIDA:A knowledge graph about research dynamics in academia and industry

[J]. Quantitative Science Studies,202124):1356-1398.

[本文引用: 1]

ACHAKULVISUT T, BHAGAVATULA C, ACUNA D, et al. Claim extraction in biomedical publications using deep discourse model and transfer Learning[M/OL]. arXiv2020[2024-06-05]. .

URL     [本文引用: 1]

SHOTTON D.

Semantic publishing:the coming revolution in scientific journal publishing

[J]. Learned Publishing,2009222):85-94.

[本文引用: 1]

王晓光宋宁远.

延续与突破:2017年语义出版研究与实践回顾

[J]. 科技与出版,20182):33-38.

[本文引用: 2]

苏静曾建勋.

国内外语义出版理论研究述评

[J]. 中国科技期刊研究,2017281):33-38.

[本文引用: 1]

IHSAN I, QADIR M A.

CCRO:citation’s Context & Reasons Ontology

[J]. IEEE Access,2019730423-30436.

[本文引用: 1]

DAQUINO M, PERONI S, SHOTTON D, et al.

The open citations data model

[C]//PAN J Z, TAMMA V, D’AMATO C, et al. The semantic Web-ISWC 2020. ChamSpringer International Publishing2020447-463.

[本文引用: 1]

王晓光周慧敏宋宁远.

科学论文论证本体设计与标注实验

[J]. 情报学报,2020399):885-895.

[本文引用: 1]

曲佳彬欧石燕.

语义出版驱动的科学论文论证结构语义建模研究

[J]. 现代情报,20214112):48-59.

[本文引用: 1]

AL MANIR S, NIESTROY J, LEVINSON M A, et al.

Evidence graphs:supporting transparent and FAIR computation,with defeasible reasoning on data,methods,and results

[C]//GLAVIC B, BRAGANHOLO V, KOOP D. Provenance and annotation of data and processes. ChamSpringer International Publishing202139-50.

[本文引用: 1]

FATHALLA S, AUER S, LANGE C.

Towards the semantic formalization of science

[C]//Proceedings of the 35th annual ACM symposium on applied computing. New YorkACM20202057-2059.

[本文引用: 1]

FATHALLA S, VAHDATI S, AUER S, et al.

SemSur:a core ontology for the semantic representation of research findings

[J]. Procedia Computer Science,2018137151-162.

[本文引用: 1]

SAY A, FATHALLA S, VAHDATI S, et al.

Semantic representation of physics research data

[C]//12th international conference on knowledge engineering and ontology development(KEOD 2020). Setúbal,PortugalScience and Technology Publications,Lda202064-75.

[本文引用: 1]

SAY Z, FATHALLA S, VAHDATI S, et al.

Ontology design for pharmaceutical research outcomes

[C]//Digital libraries for open knowledge:24th international conference on theory and practice of digital libraries(TPDL 2020). ChamSpringer International Publishing2020119-132.

[本文引用: 1]

BORDEA G, NIKIEMA J, GRIFFIER R, et al.

FIDEO:food interactions with drugs evidence ontology

[C/OL]//11th International Conference on Biomedical Ontologies. 2020[2023-05-09]. .

URL     [本文引用: 1]

SANCHEZ GRAILLET O, CIMIANO P, WITTE C, et al.

C-tro:an ontology for summarization and aggregation of the level of evidence in clinical trials

[C]//Proceedings of the Workshop Ontologies and Data in Life Sciences(ODLS 2019)in the Joint Ontology Workshops’(JOWO 2019). AachenRWTH2019.

[本文引用: 1]

闻丽张扬谢荣秀.

中文科技期刊语义出版态势分析

[J]. 传播与版权,201912):29-32,35.

[本文引用: 1]

Chan J, Qian X, Fenlon K, et al.

Where the rubber meets the road:identifying integration points for semantic publishing in existing scholarly practice

[EB/OL].(2020-07-07)[2024-02-02]. .

URL     [本文引用: 1]

闻丽罗列.

科技期刊语义出版的学术不端防范功能的实现

[J]. 中国传媒科技,201931910):25-27.

[本文引用: 1]

IHSAN I, QADIR M A.

An NLP-based citation reason analysis using CCRO

[J]. Scientometrics,20211266):4769-4791.

[本文引用: 1]

MARTIN L, HENRICH A.

RDFtex:Knowledge exchange between LaTeX-Based research publications and scientific knowledge graphs

[C]//SILVELLO G, CORCHO O, MANGHI P, et al. Linking theory and practice of digital libraries. ChamSpringer International Publishing202226-38.

[本文引用: 1]

SADEGHI A, CAPADISLI S, WILM J, et al.

Opening and reusing transparent peer reviews with automatic article annotation

[J]. Publications,201971):13.

[本文引用: 1]

SALATINO A A, OSBORNE F, BIRUKOU A, et al.

Improving editorial workflow and metadata quality at springer nature

[C]//GHIDINI C, HARTIG O, MALESHKOVA M, et al. The semantic Web–ISWC 2019. ChamSpringer International Publishing2019507-525.

[本文引用: 1]

杜建孔桂兰李鹏飞.

可计算医学知识的基本概念与实现路径

[J]. 情报学报,202111):1221-1233.

[本文引用: 1]

ELLERM A, ADAMS B, GAHEGAN M, et al.

Enabling live publication

[C]//2022 IEEE 18th international conference on e-science(e-Science). New YorkIEEE2022419-420.

[本文引用: 1]

DE HAAN R, TIDDI I, BEEK W.

Discovering research hypotheses in social science using knowledge graph embeddings

[C]//VERBORGH R, HOSE K, PAULHEIM H, et al. The semantic Web. ChamSpringer International Publishing2021477-494.

[本文引用: 1]

王丽丽于淼.

结论型知识元语义描述模型探析

[J]. 图书情报导刊,202010):40-45.

[本文引用: 1]

李春秋徐曾旭林宋宁远.

基于纳米出版物的中文学位论文语义组织研究

[J]. 中国图书馆学报,2021475):97-115.

[本文引用: 1]

LEUNG T I, KUHN T, DUMONTIER M.

Representing physician suicide claims as nanopublications:proof-of-concept study creating claim networks

[J]. JMIRx Med,202233):e34979.

[本文引用: 1]

ASIF I, TIDDI I, GRAY A J.

Using nanopublications to detect and explain contradictory research claims

[C]//2021 IEEE 17th international conference on eScience(eScience). New YorkIEEE20211-10.

[本文引用: 1]

BUCUR C I, KUHN T, CEOLIN D.

A unified nanopublication model for effective and user-friendly access to the elements of scientific publishing

[C]//KEET C M, DUMONTIER M. Knowledge engineering and knowledge management. ChamSpringer International Publishing2020104-119.

[本文引用: 1]

DIMITROVA M, GEORGIEV T, PENEV L.

A nano(publication)approach towards big data in biodiversity

[J]. Biodiversity Information Science and Standards,20215e74351.

[本文引用: 1]

FEIJOÓ M P P, JARDIM R, SERRA DA CRUZ S M, et al.

GAP:enhancing semantic interoperability of genomic datasets and provenance through nanopublications

[C]//GAROUFALLOU E, OVALLE-PERANDONES M A, VLACHIDIS A. Metadata and semantic research. ChamSpringer International Publishing2022336-348.

[本文引用: 1]

LEK T, DE GROOT A, KUHN T, et al.

Provenance for linguistic corpora through nanopublications

[C]//Proceedings of the 14th Linguistic Annotation Workshop. 202013-23.

[本文引用: 1]

ASIF I, CHEN-BURGER J, GRAY A J G.

Data quality issues in current nanopublications

[C]//2019 15th International Conference on eScience(eScience). New YorkIEEE2019522-527.

[本文引用: 1]

KUHN T, TAELMAN R, EMONET V, et al.

Semantic micro-contributions with decentralized nanopublication services

[J]. PeerJ Computer Science,20217e387.

[本文引用: 1]

GIACHELLE F, DOSSO D, SILVELLO G.

Search,access,and explore life science nanopublications on the Web

[J]. PeerJ Computer Science,20217e335.

[本文引用: 1]

FABRIS E, KUHN T, SILVELLO G.

A Framework for citing nanopublications

[C]//DOUCET A, ISAAC A, GOLUB K, et al. Digital libraries for open knowledge. ChamSpringer International Publishing201970-83.

[本文引用: 1]

JARADEH M Y, OELEN A, FARFAR K E, et al.

Open research knowledge graph:next generation infrastructure for semantic scholarly knowledge

[C]//Proceedings of the 10th international conference on knowledge capture. Marina Del Rey CA USAACM2019243-246.

[本文引用: 1]

BRACK A, HOPPE A, STOCKER M, et al.

Analysing the requirements for an open research knowledge graph:use cases,quality requirements,and construction strategies

[J]. International Journal on Digital Libraries,2022231):33-55.

[本文引用: 1]

FÄRBER M.

The microsoft academic knowledge graph:a linked data source with 8 billion triples of scholarly data

[C]//The semantic Web–ISWC 2019:18th international semantic web conference,part II 18. ChamSpringer2019113-129.

[本文引用: 1]

ZHANG F, LIU X, TANG J, et al.

Oag:toward linking large-scale heterogeneous entity graphs

[C]//Proceedings of the 25th ACM SIGKDD international conference on knowledge discovery & data mining. New YorkAssociation for Computing Machinery20192585-2595.

[本文引用: 1]

DESSÌ D, OSBORNE F, REFORGIATO RECUPERO D, et al.

AI-KG:An automatically generated knowledge graph of artificial intelligence

[C]//PAN J Z, TAMMA V, D’AMATO C, et al. The semantic Web–ISWC 2020. ChamSpringer International Publishing2020127-143.

[本文引用: 1]

DESSÌ D, OSBORNE F, REFORGIATO RECUPERO D, et al.

SCICERO:a deep learning and NLP approach for generating scientific knowledge graphs in the computer science domain

[J]. Knowledge-Based Systems,2022258109945.

[本文引用: 1]

DESSÌ D, OSBORNE F, REFORGIATO RECUPERO D, et al.

CS-KG:a large-scale knowledge graph of research entities and claims in computer science

[C]//SATTLER U, HOGAN A, KEET M, et al. The semantic Web–ISWC 2022. ChamSpringer International Publishing2022678-696.

[本文引用: 1]

牛丽慧欧石燕.

科学论文语义标注框架的设计与应用

[J]. 情报理论与实践,2020433):124-130.

[本文引用: 1]

D’SOUZA J, AUER S.

NLPContributions:an annotation scheme for machine reading of scholarly contributions in natural language processing literature

[C]//EEKE 2020-Workshop on Extraction and Evaluation of Knowledge Entities from Scientific Documents. AachenRWTH202016-27.

[本文引用: 1]

LI X, BURNS G, PENG N.

Scientific discourse tagging for evidence extraction

[C]//Proceedings of the 16th conference of the european chapter of the association for computational linguistics:Main Volume. CedarvilleACL20212550-2562.

[本文引用: 1]

ACCUOSTO P, SAGGION H.

Mining arguments in scientific abstracts with discourse-level embeddings

[J]. Data & Knowledge Engineering,2020129101840.

[本文引用: 1]

AL KHATIB K, GHOSAL T, HOU Y, et al.

Argument mining for scholarly document processing:taking stock and looking ahead

[C/OL]//Proceedings of the second workshop on scholarly document processing. OnlineAssociation for Computational Linguistics202156-65[2023-04-05]. .

URL     [本文引用: 1]

BINDER A, VERMA B, HENNIG L.

Full-Text argumentation mining on scientific publications

[J]. AACL-IJCNLP 2022CedarvilleACL202254.

[本文引用: 1]

RUOSCH F, SARASUA C, BERNSTEIN A.

BAM:benchmarking argument mining on scientific documents

[C/OL]//CEUR Workshop Proceedings2022[2024-06-05]. .

URL     [本文引用: 1]

VOGT L, D’SOUZA J, STOCKER M, et al.

Toward representing research contributions in scholarly knowledge graphs using knowledge graph cells

[C]//Proceedings of the ACM/IEEE joint conference on digital libraries in 2020. Virtual Event ChinaACM2020107-116.

[本文引用: 1]

BUCUR C I, KUHN T, CEOLIN D, et al.

Expressing High-Level scientific claims with formal semantics

[C]//Proceedings of the 11th on knowledge capture conference. New York,NY,USAAssociation for Computing Machinery2021233-240.

[本文引用: 1]

石泽顺肖明.

基于本体和关联数据的引文分析方法研究

[J]. 图书馆杂志,20193812):82-91.

[本文引用: 1]

SKULIMOWSKI M.

A semantic representation of the citation structure

[C]//Metadata and semantic research:13th international conference(MTSR 2019). ChamSpringer2019298-303.

[本文引用: 1]

PERONI S, CIANCARINI P, GANGEMI A, et al.

The practice of self-citations:a longitudinal study

[J]. Scientometrics,20201231):253-282.

[本文引用: 1]

ZHU Y, YAN E, PERONI S, et a.

Nine million book items and eleven million citations:A study of book-based scholarly communication using openCitations

[J]. Scientometrics,20201221097-1112.

[本文引用: 1]

LOPEZ-RODRIGUEZ V, CEBALLOS H G.

Modeling scientometric indicators using a statistical data ontology

[J]. Journal of Big Data,202291):9.

[本文引用: 1]

FATHALLA S, VAHDATI S, LANGE C, et al.

SEO:a scientific events data model

[C]//GHIDINI C, HARTIG O, MALESHKOVA M, et al. The semantic Web–ISWC 2019. ChamSpringer International Publishing201979-95.

[本文引用: 1]

CHIALVA D, MUGABUSHAKA A M.

DINGO:an ontology for projects and grants linked data

[C]//BELLATRECHE L, BIELIKOVÁ M, BOUSSAÏD O, et al. ADBIS,TPDL and EDA 2020 common workshops and doctoral consortium. ChamSpringer International Publishing2020183-194.

[本文引用: 1]

TAPIA-LEON M, SANTANA-PEREZ I, POVEDA-VILLALÓN M, et al.

Extension of the BiDO ontology to represent scientific production

[C]//Proceedings of the 2019 8th international conference on educational and information technology. New YorkACM2019166-172.

[本文引用: 1]

MAATOUK Y.

AI-SPedia:a novel ontology to evaluate the impact of research in the field of artificial intelligence

[J]. PeerJ Computer Science,20228e1099.

[本文引用: 1]

EMALDI M, PUERTA M, BUJÁN D, et al.

ROH:towards a highly usable and flexible knowledge model for the academic and research domains

[J]. Semantic Web,2022.

[本文引用: 1]

PAHARIA N, POZI M S M, JATOWT A.

Change-Oriented summarization of temporal scholarly document collections by semantic evolution analysis

[J]. IEEE Access,20221076401-76415.

[本文引用: 1]

LACKNER A, FATHALLA S, NAYYERI M, et al.

Analysing the evolution of computer science events leveraging a scholarly knowledge graph:a scientometrics study of top-ranked events in the past decade

[J]. Scientometrics,20211269):8129-8151.

[本文引用: 1]

徐雷.

几个值得关注的语义出版研究热点

[J]. 出版科学,2018262):16-22.

[本文引用: 1]

/