困境与突围:人工智能赋能学术期刊知识服务的技术架构*
通讯作者:
关键词:
本文引用格式
姬建敏, 王琪.
知识服务原本是美国专业图书馆协会讨论图书馆如何进行知识管理时提出的概念。这一概念引入出版领域后,随着学术出版的发展与生产技术的推进,学术期刊的知识服务在不同时期展现出不同的内涵、诉求、服务方式与表现形态。在学术出版的纸媒时代,学术期刊服务定位偏向于内容供应商,单向度的纸本出版、知识输出,研究者需要订购、翻阅、查找才能够获取学术期刊有用的知识。数字化转型以来,纸质订发渠道已经无法满足学术期刊读者快速获取知识的需求,学术期刊相继推出网络出版扩展知识获取渠道、建设学术知识传播与管理平台提升知识获取效率、采用微信与微博等社交媒体加速知识传播等举措,知识服务完成了信息化转型,其内涵也从仅提供学术论文变为了集论文出版、内容传播、知识收集为一体的全新服务模式。[1]近几年来,人工智能技术强势嵌入出版业,使用新技术拓宽学术期刊知识服务范围的研究逐渐增多,如刘坚提出运用大数据搜集、处理、分析的能力,提升出版资源的内容研发、营销和服务;[2]汤超等提出了将传统媒体与新兴媒体深度融合,构建全媒体知识服务体系;[3]黄凯健等提出用户需求驱动出版知识服务,促成知识共建共享。[4]从强调知识生产到注重知识传播、从关注知识本身到关注受众需求、从注重宏大方向到重视具体的服务形式,学术期刊知识服务的演进脉络表明,从“能服务”“泛服务”迈向“服务好”“服务精”,则是当今时代赋予学术期刊知识服务的重要使命。
本文基于人工智能技术的高速发展为知识服务带来的机遇,在分析学术期刊知识服务现状、困境基础上,针对性地提出包含知识图谱、数据挖掘、GPT技术的技术构架作为突围之道,通过多元化融合学术知识、智能化连接知识与受众、多样化多模态学术知识表达,破局学术期刊知识服务困境,赋能学术期刊知识服务高质高效。
1 现状:我国学术期刊知识服务模式
关于我国学术期刊知识服务现状,现有研究或从服务内容与主体,或从服务类型与策略等方面有所总结。[5]本文结合对相关学术期刊门户网站、微信公众号等的调查,通过学术期刊知识服务模式进行分析。
1.1 知识出版服务
知识出版服务主要是指面向作者、编辑和审稿专家等知识生产端主体的服务,也是为学术期刊知识内容生产和知识出版阶段提供的服务。目前,随着技术手段的更新迭代,学术期刊为作者、编辑和审稿专家提供的服务种类越来越多。比如,中国知网出版平台可以为作者、编辑等提供选刊投稿、期刊采编发、网络首发、会议论文提交等服务;“腾云”在线投稿系统,可以为作者提供格式转化处理、自动识别、辅助作者引文核对等服务,其集成式的一体化编校平台,可以为编辑和审稿专家提供稿件审、编、校、发辅助服务。《中华医学杂志》建有“一体化学术期刊出版服务平台”(MedPress),可为作者、专家、编辑提供智能检校、参考文献核查等多样化智能辅助工具。
1.2 知识检索服务
知识检索服务是学术期刊采用知识检索系统的技术和理论,储存、发现、检索与使用知识,并向学术期刊作者、读者等受众提供检索结果的服务。目前,国内学术期刊主要借助出版商或第三方数据库提供平台实施这种模式的知识检索,检索系统的类型主要有全文数据库、专题数据库、引文数据库、题录数据库、文摘数据库等。其中,中国知网、超星、万方等综合数据库与中华医学期刊等专业期刊群数据库最常用。图表音视频检索多集中在自然科学、医学期刊,如《北京大学学报(医学版)》提供图表库检索,《中南大学学报(自然科学版)》提供图片库、视频库、音频库检索等。
1.3 知识发现服务
知识发现是从大量的学术论文相关数据集合中抽取或提炼出潜在的、有用的知识的过程,为学术期刊作者、读者提供论文的引用情况、作者关系图谱、研究热点等信息,帮助其发现潜在的知识和研究趋势。目前,我国学术期刊较多提供作者、关键词、参考文献、施引文献、相关论文的知识关联等,有的可以关联到外部网站和数据库,有的发布最新会议资讯等热点,有的提供摘要点击排行、全文下载排行、论文引用排行等多维度评价,有的有集合式的专题栏目推荐。如《中国科学:技术科学》提供各大数据库下载次数和引用数据(总被引、复合影响因子、综合影响因子);《激光与光电子学进展》设有主编推荐论文和历史首屏推荐等服务。
1.4 移动社交服务
移动服务是学术期刊通过移动社交平台或者电子邮件为受众提供论文推送、论文简易信息聚合(Really Simple Syndication,RSS)推送,以及前沿学术资讯、招聘信息等的服务。微信、微博、QQ、抖音、E-mail Alerts、学习强国等是常见的移动服务平台。其中,微信提供移动社交服务最普遍;新刊目录和纸刊论文是学术期刊公众号的标配;人文社科期刊多照搬纸刊、全文推送,科技期刊多模块化信息提取加工后图文导读推送。《马克思主义研究》建有微信矩阵,可链接到外部如学习强国、喜马拉雅、b站、微博等网站。“壹学者”构建了“内容+工具+社交”的移动知识服务产品,依托微信平台吸引流量。《中国实用内科杂志》的微信平台已基本实现移动端的投稿、查询、检索、论文浏览与咨询等服务,交互性良好。
1.5 多媒体服务
多媒体服务是学术期刊通过计算机技术对文字、数据、图表、音视频等信息进行综合处理,使学术期刊受众获得多种感官体验的服务。多媒体技术为学术期刊内容提供了更加立体、多元的展示空间,更容易吸引学术期刊受众,有利于学术研究成果发布、传播、应用,促使学术成果效益最大化。目前,我国学术期刊多媒体服务,除了前面提到的图表库、视频库、音频库外,还有虚拟现实(VR)、增强现实(AR)、HTML富媒体阅读等丰富论文内容的增强阅读模式,也有围绕学术成果进行的再开发。如《科学通报》通过文本、图片、音视频等基本的流媒体格式文件,对期刊进行介绍;《东方法学》的东方法学大讲堂通过系列视频播放展现学术期刊的原创内容;《旅游学刊》邀请年度优秀论文的作者制作视频并发布在视频号上。
2 困境:我国学术期刊知识服务难题
毫无疑问,学术期刊正在通过各种创新举措和技术应用提供广泛、便捷、高效的知识服务,促进科学研究的进步和社会的发展。但学术期刊知识服务走过了信息化服务阶段,距离真正的智能化知识服务,仍存在知识难以融合、需求难以定制、表达难以多元等困境。
2.1 受众难以获取聚焦的知识点
知识的一大特征是其组织性。组织性是按照一定的规则、逻辑和结构进行组织和归纳的。人类认知的方式,也是通过在新知识与已知的知识之间建立连接,从而完成新知识的接纳。因此,如何高效获取知识点和知识点之间的关系,是研究者进行知识生产、知识创新的关键,也是学术期刊知识服务的一大重点。
学术期刊作为一篇篇具有创新性的学术论文集结,学术论文生产的过程,是论文作者站在巨人的肩膀上,将前人的方法、思想、成果内化为知识创造或创新发展的过程。[6]其中,需要运用相对系统的、专门的学科知识,聚焦于一个领域、一个方向,讨论或研究某一问题,提出创新性观点,进行深入地论证。学术期刊论文虽然是各个领域知识创新最前沿成果,最先进知识精华,但“前沿成果”“知识精华”包含在作者的严谨论证中,学术期刊受众想要获取有价值的知识,则需要在长篇大论、有血有肉的论文中爬梳、挖掘、勾连、合并,需要将其从论文中提取出来并建立与相关知识的连接。
当知识的来源范围扩大到所有学术期刊,这个工作量将呈几何倍增长。毕竟每个期刊都有自己特定的研究范畴与特色,每个学科领域分散在各种期刊上,每个知识点又可能隶属于多个学科、多个领域……学术期刊中的知识处于零散的、杂乱的无组织状态,如果不进行二次加工,单篇论文中的知识将形成“知识孤岛”,淹没在一本本期刊、一篇篇论文的“汪洋大海”中,形成知识隔离,阻碍知识组织,不利于知识的学习与使用。
分析知识隔离的原因,首先是隶属问题。由于学术发展与商业运作理念相异,学术期刊与技术商、出版商等运营商之间的决策未免相左,分布在不同的数据库和平台上的学术资源难以连接。其次是技术问题。相对于隶属问题,更棘手的是技术问题:现有的资源数字化方法难以支持自动化地在知识层面建立连接。其一,论文不分割。数字化技术分割了摘要、关键词、中图分类、作者信息并形成单独的实体,但是没有对论文的内容进行知识分离与再加工。当受众的需求聚焦于某个观点、某种技术、某种方法时,知识服务仅能反馈整篇论文,而不是文内对该观点、技术、方法的描述,受众仍需自行抽取知识点提炼、分析。其二,标准不统一。标准化的格式对于加强数据互操作至关重要。目前,不同的学术期刊或平台方在数字化中使用数据格式不尽相同,不同平台间不兼容,难以进行互操作,无法融合。尽管“元数据”已经推出,但过去遗留的标准不统一问题仍然是阻碍知识聚合的“拦路虎”。
2.2 受众难以获取差异化的知识推送
为了扩大学术知识、期刊影响力,达到良好的传播效果,学术期刊提供了多渠道的学术出版服务与检索服务。但是,当服务受众带着个人兴趣、特定目的寻找知识时,服务效率低,效果并不理想。
首先,学术期刊的知识内容丰富,条分缕析难。学术期刊涵盖广泛的学科领域和主题内容,学术期刊所发表论文的学科、类型、方向、技术、方法、影响等千差万别,尤其是综合性学术期刊,若按方向、按关键词细分,涉及的知识可谓五花八门。面对五花八门的知识,且不说为目标受众提供精确、准确的个性化、定制化服务,单就对学术论文知识元数据的解构、重组、再造,就需要将论文知识快速、精确地填充到学科知识地图,形成清晰明了的知识脉络,需要将相近的知识聚合、打包,形成知识认知、应用、再造中不可分割的部分。
其次,作者、读者的学术背景与研究风格各异,精准推送难。学术期刊内容多、领域广,与之相关的作者、读者自然群英荟萃。他们躬耕于不同的学科领域,有着各自学科不同的研究特征,再加上不同的生活习俗、个人好恶,使得他们对于学术期刊知识服务的偏好与需求,极具个性化、独特性。在知识的检索和推送中,学术期刊仅提供“是否接收推送”“学科领域检索”“关键词检索”这样的基本服务,自然无法深入挖掘受众偏好的知识信息与接收形式,更不用说进行智能化推送了。
2.3 受众难以获取多媒体化知识结果
缺乏多媒体元素导致的信息表达的局限性,使复杂的知识概念、繁多的实验流程、丰富的实验结果难以清晰呈现,势必影响受众的阅读体验和知识理解。目前,我国一部分学术期刊虽然使用了图表库、视频库等多媒体方式丰富论文内容的阅读,但这样的期刊为数较少,且较少的期刊中提供多媒体辅助的论文更少,传统的纯文本和静态图表形式依然是大部分学术期刊的“最爱”。
借助于新媒体技术提升受众感官体验是学术期刊的共识,让学术期刊知识产品“活”起来、“动”起来、“立”起来、“飞”起来是学术期刊的共同愿景,但“理想很丰满,现实很骨感”。以多媒体制作为例,因为知识服务的源头可以追溯到内容资源的首次生产上,所以学术期刊提倡作者使用多媒体方式辅助学术观点表达与传播。但对于作者而言,完成学术论文需要花费大量的精力进行数据收集、结果分析和文本撰写;需要考虑学术标准,查找、引用参考文献,构思逻辑结构,论证创新性观点等。如果再增加多媒体表达,还需要进行额外的实验、数据处理和编辑工作,需要选择合适的软件、工具并进行文件格式转换和嵌入等操作。这不仅会增加工作量、复杂度,还会因为学术期刊知识的时效性,影响论文尽早发表、尽快见刊。
对于学术期刊而言,帮助作者进行学术知识的多媒体化,需要投入额外的技术资源、开发工作和资金保障。囿于机制体制,我国多数学术期刊出版单位为非营利组织,雇佣技术人员将学术知识多媒体化,需要花费数目不小的资金。在不确定最终的多媒体产品是否与作者原始意图一致、是否能达到学术期刊受众对知识产品成果效果满意的情况下,学术期刊回避以“制作主体”身份进行学术知识的多媒体创作。再加上多媒体内容的使用,涉及版权和法律问题,图像、音频、视频等素材的版权归属、合法性和许可使用等,又需要期刊花费额外的时间和资源,增加了操作的复杂性、困难度。
可见,即使认识到多媒体学术知识表达的优势,多媒体制作的工作量与复杂性依然制约作者、学术期刊积极实践的动力与热情。换言之,丰富多彩的学术期刊知识表达亟待低成本多媒体制作技术的拯救。
3 突围:人工智能赋能学术期刊知识服务
如果说从2016年围棋比赛中AlphaGo战胜人类,到AlphaFold预测了蛋白质结构、视频中频繁出现AI换脸,再到2023年ChatGPT火爆全球,人工智能技术犹如“阿拉丁神灯”给各领域带来了光明前景的话,那么赋能学术期刊知识服务也就成为应然、必然的现实问题。针对学术期刊知识服务的三个困境,本文提出人工智能技术赋能的学术期刊知识服务技术构架(见图1)。
图1
在该框架中,知识图谱技术能够自动化地将多元化的学术知识进行关联、融合,实现知识间的互操作;数据挖掘技术作为知识服务的大脑,基于计算为受众匹配到其需要的知识;GPT技术一方面作为服务接口保障良好人机沟通,另一方面利用多模态技术实现知识多媒体化。多元人工智能技术赋能学术期刊知识服务,满足受众精准的知识需求,并使其获得良好的服务体验。
3.1 知识图谱:知识融合,构建知识服务基底
知识点蕴含在学术论文论述中,制约了知识受众高效收集、整理知识并形成知识脉络。如果以“知识点”为对象,将各期刊论文中的相同知识点合并、相关知识点连接,将解决学术期刊知识服务底层知识来源问题。知识图谱(Knowledge Graph)技术源自谷歌公司提出的“以语义而非字符连接事物”的概念,它能够自动化地利用语义关系将“实体”及其“属性”以“关系”连接的方式构建网络,描述现实世界中的知识,对解决底层知识来源问题具有优势。
知识图谱主要包含信息抽取、知识融合和知识加工三个环节。信息抽取环节针对每一篇学术论文,将文中知识点剥离成为单独的“实体”,识别属性,并根据论文中论述的关系建立知识点之间语义化的链接。在知识融合环节,对上一环节获取的实体、属性、关系进行整合,把从所有学术期刊论文中抽取的知识进行语义消歧并融合。例如,一个知识点在多篇论文中有不同表达(如“北大”和“北京大学”),则融合为同一实体。知识融合环节将所有论文的知识点融会贯通。知识加工环节通过本体构建、知识推理等技术,从学科知识上修整、补全知识图谱,进一步优化、完善知识库。
3.2 数据挖掘:知识计算,构建知识服务计算大脑
学术期刊蕴含多学科领域知识,基于知识图谱生成的知识库数据庞大、关系复杂。知识服务需要满足个性化、差异化受众的定制化需求。如何将二者精准匹配,是评价知识服务能否达成、服务质量水平高低的重要因素。
数据挖掘通过各种算法从海量数据中发现模式、规律,通常包括三个步骤:首先,收集并准备数据,包括清洗、整合和转换等操作;其次,应用各种数据挖掘算法分析数据、发现模式;再次,评估和解释挖掘结果。数据挖掘帮助学术期刊了解受众的知识服务需求。通过收集受众的学科背景、教育水平、研究方向、职业特征、生活方式、知识获取途径等越多越好的个人数据集,应用数据挖掘中的序列相似度计算、关联规则挖掘等算法,将受众分类;应用特征工程挖掘出每类受众的知识偏好;构建受众画像以求实现个性化推荐。同时,数据挖掘可以完善知识与受众的匹配。算法根据受众对推荐的反馈重新计算,调整匹配知识的内容与形式,以增强受众的满意度和服务黏性;受众持续接收到符合其偏好的知识,逐渐加深对知识服务的探索和兴趣。[12]
可以说,作为知识服务的大脑,数据挖掘技术能够通过分析海量的受众数据、知识内容,发现隐含其中的受众需求与知识内涵,将知识模式、规律等内容,智能分发给受众,进而帮助知识理解、知识应用和知识再生产。
3.3 GPT:知识问答,构建知识服务交流通道
良好的人机沟通是数字化下知识服务的重要前提。机器需要听懂人话,知道受众的服务需求;同时用人话提供受众能够理解的答案,而非用自己的“0”“1”语言回答。2023年爆火的ChatGPT,以其高质量的长对话能力,实现了智能化的人机交流。
GPT(Generative Pre-trained Transformer)是OpenAI开发的基于深度学习的语言生成模型。它通过大规模的文本数据预训练和微调,捕捉不同单词、短语和句子之间的语义关系,根据给定的上下文信息生成连贯、合理的答复,并能够进行语言、图片、视频等多模态知识转换,是合格的知识服务发言人。目前,知识情报、信息管理、出版传媒均有学者对GPT关于人机交流、知识生成的讨论。GPT被认为是生产力的又一来源,提高了知识萃取、知识生成、知识传播的效率;具有媒介属性,扩大了内容影响力;能将内容进行多模态转换,呈现出直观知识表达,降低知识内容的理解难度。[13]这些在学术期刊的知识服务中均能得到广泛运用。
GPT理解受众的知识服务需求。以往机器无法理解长句表达,受众仅能通过关键词搜索。GPT解决了长句理解问题,甚至它的人工反馈强化学习机制能够感知到长句背后的潜在意图,在做到满足知识服务需求的同时还可以提供增值服务。比如,根据受众的问题给出受众需要的知识点,同时结合受众对话上下文,有重点地附上该知识点的形成原因、发展脉络、未来趋势等相关内容。
GPT生成受众喜闻乐见的知识表达。从纸质出版物到网络平台再到移动端服务,从文字到图片再到音画共存,多模态的表达形式更符合人感受、认知、描述世界的模式,有利于降低学术知识的学习门槛,加深知识印象。GPT不仅可以进行自动化的多模态转换,具有自然语言处理功能,而且能够实现图像识别与生产、语音识别与合成、视频理解与动作捕捉等。面向不同知识背景,基于相关领域知识特征,GPT将以低成本甚至无成本的方式高效将学术期刊论文生成图片、语音、视频、动画、VR等多元化的表达形式,满足受众的高效学习与认知。
4 结语
斯蒂夫·乔布斯(Steve Jobs)曾说过,“科技并不仅仅是一个工具。科技是人类改变世界的一种表达方式。”学术期刊知识服务从信息化到智能化,人工智能技术的参与,不仅可以优化知识表达、认知与再创造,而且也可以成为改变学术期刊进而改变世界的表达方式。本文从学术期刊知识服务的现状、困境出发,提出了基于知识图谱、数据挖掘和GPT的技术架构,以期为改变学术期刊知识服务表达方式、指导知识服务实践提供借鉴。
参考文献
Open Research Knowledge Graph:Next Generation Infrastructure for Semantic Scholarly Knowledge
[C]//
Unveiling scholarly communities over knowledge graphs
[C]//
/
| 〈 |
|
〉 |
