人工智能视域下的学术出版:新变、实践与进路
关键词:
本文引用格式
谢炜, 王瑾.
人工智能是模拟、延伸和扩展人的智能的理论、方法、技术及应用系统,党的二十大报告明确提出要“推动战略性新兴产业融合集群发展,构建新一代信息技术、人工智能……等一批新的增长引擎”。[1]人工智能快速发展深刻影响了学术研究和知识生产,推动各学科研究范式、理论建模、研究路径实现新的突破,深刻影响着知识内容的生产、审核、传播、评价和消费。学术出版是学术共同体的重要组成部分,人工智能推动学术出版向数字化、智能化方向拓展,对学术出版的内涵和外延产生深远影响,学术出版的学术服务功能在深度和有效性上面临新的挑战和机遇。人工智能时代,学术出版机构要么成为引领学术研究数字化、智能化潮流的创造者和使用者,要么彻底沦为学术内容的“搬运工”。
2015年,汤雪梅《人工智能与数字出版的创新应用》[2]开始关注人工智能对数字出版的影响,提出人工智能给新闻出版生产、编辑、服务模式带来全方位变革,顺应新技术发展趋势,在思维与模式上创新应用,是传媒界赢取未来的保障。2018年,孙赫男《人工智能技术与学术和专业出版的融合发展》[3]从学术出版的角度,关注人工智能技术与学术出版的融合发展,论述人工智能技术与学术内容、专业内容的融合方法与创新应用。近年来,相关研究多关注人工智能技术对学术出版流程的再造和效率的提升,如向飒《人工智能对学术出版流程的再造及知识服务提升》[4]、刘银娣《学术出版领域的人工智能应用:现状、挑战与应对》[5]、刘平《人工智能与学术出版融合发展的机遇、挑战与应对》[6]等,提出人工智能技术可以加速学术传播,推动出版流程各个环节之间的数据传递,重构智能化的学术出版流程,通过反剽窃和同行评议专家匹配、智能学术搜索、质量评价环节的文献计量等实现选题策划便捷化、编辑加工自动化、生产印刷按需化及营销发行精准化。也有研究关注人工智能可能对出版内容、版权责任、编辑加工带来的消极影响,但从数量和内容上看,相关研究的充分性还远远不足,大部分研究多关注学术期刊的发展和创新,而对学术图书这一学术内容的重要生产者和传播者的关注度不足。更重要的是,人工智能不仅在智能化和效率上发挥作用,更在促进知识生产、挖掘、组织与传播,助力新知识的自主形成和规模化使用方面有重要意义。学术出版作为学术研究的主要参与者之一,对昌明学术、促进学科繁荣起到关键作用,仅从出版流程探讨人工智能影响而不深入学术研究全过程和需求,很难从本质上认识到人工智能对促进学术出版高质量发展和学术研究革故鼎新的关键作用。因此,有必要综合考察人工智能对学术研究全生命周期和学术出版全流程的深刻影响,从服务学术研究和学术生产的角度认识学术出版的智能化发展和实践,探索人工智能时代学术出版的基本着力点和发展路径,从而使学术出版真正成为知识生产和学术共同体不可或缺的重要组成部分,推动学术研究数字化、智能化繁荣发展。
1 人工智能视域下学术研究周期与出版流程的智能化重构
从确定研究问题开始,学术研究全过程大致包括信息资料收集、文献数据分析、学术写作、成果交流等环节,传统纸质出版流程则包括选题策划与论证、内容审校、印制出版、推广发行等步骤。二者相互交叉、影响,学术研究为学术出版提供内容来源,学术出版促进学术交流,学术交流启发新的学术研究周期。人工智能理论、技术的不断推进,正在推动学术内容生产、组织、消费的新变化,重构学术研究周期和学术出版流程。
1.1 人工智能驱动下学术研究的数字化发展
1.1.1 学术选题精准化
学术选题是研究者开展阶段性研究的起点,规定了成果阐述的方向、角度和规模,很大程度上决定了学术成果最终的价值和效用。传统研究范式主要依靠研究者的问题意识、学术敏感度、对学科研究现状和趋势的把握程度,很可能出现选题和研究重复,造成学术资源浪费。选题服务和支持可以在一定程度上避免研究者个人“闭门造车”,例如万方智搜平台、万方选题系统、CiteSpace可通过专业检索及知识挖掘,构建多维度、多层次、内容深度关联的知识脉络,帮助研究者洞察学科研究前沿和发展趋势,快速把握选题方向,客观评估选题价值。维普智能选题可帮助筛选合适的参考选题;已有初定选题的情况下,也可辅助检查选题是否重复,以此帮助研究者决定是否继续进行深入研究。
1.1.2 信息获取数字化
查阅文献、积累资料是研究的基础性工作,有研究表明,获取资料所花费的时间约占全部科研工作的40%以上。随着数字化和人工智能的发展,资料存储量大、内容更新率高的文献库、资料库、数据库实现了学术研究成果和资料的数字化;智能检索手段的进步,基本满足了研究者收集文献、资源和获取数据的需求,节约了研究者翻检、誊录、引用的时间,同时可进行跨库检索,将文献进行汇总、整理,使单独、零散、碎片化的知识汇聚成立体的知识网络,将研究者从基础工作中解放出来,集中精力进行深入的思考和探索。
1.1.3 数据分析科学化
2009年,微软研究院出版《第四范式:数据密集型科学发现》[7],数据密集型科学研究方法成为继实验范式、理论范式、仿真范式之后的第四范式。数字化技术和人工智能驱动下,线性阅读的“近读”向依赖计算机方法的“远读”转变,SPSS、Stata、微词云、图悦等工具被广泛应用于数据分析、数据管理和专业图表绘制,数据处理高成本、低效率、主观干扰性大的情况有所改善,超越小数据集的大量文献、资料、数据信息的宏观对比、分析从自然科学拓展到社会科学和人文学科,计量经济学、社会统计学、教育计量学、文学计量学等新兴跨学科研究逐渐出现,进一步增强了学术研究的科学性、客观性、精确性。
1.1.4 学术写作智能化
学术写作是研究人员某一阶段性探索结束后进行的创造性活动,以论文、专著等形式呈现研究过程和结论。基于海量数据素材和机器学习算法,通过自然语言生成技术,机器智能模型能够完成海量文献的收集、筛选、归纳,提供词汇选择、语法改善、背景知识支持等服务,可以自动生成摘要,辅助文献综述、智能审校和排版。2019年,学术出版商施普林格发布第一本完全由人工智能技术编写的研究书籍《锂离子电池:机器生成的当前研究摘要》,该书通过AI自动扫描总结过去三年超过53 000份锂离子电池的研究论文,旨在探索“机器生成内容的当前进展与剩余边界”[8]。2022年,微软旗下人工智能研究室OpenAI发布对话式大型语言模型ChatGPT,其通过信息整合、语言理解和文本生成,可辅助生成学术成果大纲,完成文献综述,对文本进行翻译润色,甚至根据指令完成学术成果撰写。2023年8月,百度全新一代知识增强大语言模型“文心一言”率先向全社会开放,用户仅需输入简短字句,即可生成较高质量内容。复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型“MOSS”也为信息服务、知识搜索、智能写作提供新的可能性。
1.2 人工智能视域下学术出版的智能化重构
1.2.1 选题策划高效化
学术出版的选题策划与学术研究异曲同工,基于大数据技术支撑,学术编辑可检索查阅相关作者的研究方向、基金项目、论文发表情况,有针对性地进行组稿、约稿。人工智能以数据为支撑、以研究需求为导向,能够实现资源的多元重构,捕捉相关领域的热点和难点问题,预判学术内容的出版效果、影响力和关注度,制定更具前瞻性的选题策划,成为机器价值的“发现者”和“开发者”。人工智能辅助评议工具“元文献计量智能”挖掘全球数百万篇学术文献进行训练后,与业界合作开展大规模试验,发现元文献计量智能在出版前对新稿件影响级别的预测准确性是人工预测的2.5倍。[5]人工智能数据演算能力驱动下,英科特的出版模式调整为首先演算趋势、判断用户使用模式、收集读者偏好,然后根据市场趋势和用户偏好修改作品内容,内容完成后先通过网络数字出版打造口碑,最后才进行实体出版。[9]
1.2.2 内容审校自动化
内容质量是学术出版最关键的因素。在海量语料库、知识库的支持下,人工智能在编校出版阶段可以自动匹配合适的审稿人和学术编辑,自动排版生成目录、索引,利用智能语言模型协助编辑核查拼写错误、错别字、常识错误、语法错误、敏感词、公式、图表、参考文献、排版格式等,缩短审校时间并提高准确性。未来,随着智能编校的发展,人工智能等技术服务还可将通用型智能编校转变为专业型智能编校,将技术手段从审校后端向书稿预审等前端转移,更大限度调整学术出版流程,自动生成满足出版要求的内容产品,以内容增值服务促进学术编辑工作重心从重复性劳动向高质量的内容生产和传播本身聚焦,编辑角色从传统意义上的“审读编校者”“学术搬运工”向“内容生产者”“产品创造者”转变,提高知识生产效益。通过智能化的任务分配和进度管理,人工智能还能帮助学术编辑随时了解各编校流程和协作成员的工作进度,促进沟通协作。学术内容质量控制方面,学术不端文献检测系统等基于学术出版物组成的庞大数据库可对研究成果文字、数据进行学术诚信检查;艾普蕾软件系统、美国科研诚信办公室的系统还可发现图像的剽窃和篡改,有效保障学术内容的原创性与学术价值。爱思唯尔旗下的同行评议管理系统采用的StatReviewer软件,可用于检查学术成果中统计数据和方法是否真实可信。这些对学术成果文献完整性、数据可靠性和准确性的判断手段有助于学术出版高质量发展和学术创新。
1.2.3 学术传播个性化
传统学术研究和学术出版生态中,学术传播交流方式以论文发表、专著出版、学术会议等为主,学术内容和受众之间是选择和被选择关系,传播效率较低。海量数据和文献在为学术进步提供基本资料的同时,也带来了大量的冗余和干扰。人工智能重构了传播者与受众的关系,可通过用户画像进行读者行为分析,利用数据挖掘算法感知用户端场景,提高内容与用户匹配的精准性和高效性,提供“千人千面”的个性化阅读推荐和内容定制,实现了单向被动传输至双向交互体验转化,虚拟与现实、线上和线下的多维度交互,提高了学术交流和传播的效率。美国国家科学基金会资助研发的AI驱动分析平台“布克斯比”能够基于内容进行辅助分析、推断、量化和预测,预测准确度远超编辑和营销人员。英科特利用人工智能收集用户使用模式和偏好,可辅助进行内容修改。[10]除同一语种的交流之外,学术内容的国际传播与国际学术话语权建设紧密相关,是国家软实力和综合国力的重要体现,机器智能翻译可实现学术内容的自动翻译、纠错和优化,促进跨语言的学术交流,进一步扩大学术交流的范围和可能性,促进学术合作和学术影响力提升。
1.2.4 学术评价客观化
学术评价是学术发展的风向标,影响着学术研究的方向和水平,对学科体系、学术观点、科研方法的创新发挥着“定标准、立规矩、树导向”的工作。数字化环境下,学术成就的多寡,发表期刊的层次,出版社的优劣,收录数据库的档次,学术成果的下载、引用、转载等,都可以被量化,并进行客观、科学计量,有助于客观、规范地评估学术成果对科研创新的作用,为学者、期刊编辑部、出版社了解自身社会影响力与学术影响力变化提供了动态观察窗口,有助于促进学术共同体的繁荣和发展。
2 构建学术出版与学术服务新体系——智慧学术出版
学术出版机构作为知识创新、思想传播、文化传承的重要承担者,需要主动承担学术责任,以服务学术研究为根本宗旨,以区块链、大数据、云计算、人工智能、5G等新技术为支撑,实现建设“智慧出版社”的目标:推动出版社实现互联网化、流程化、数据化、移动化、知识化、协同化、智能化,从知识生产、知识传播、知识服务多角度、全方位创新业务模式,拓展学术出版的内涵和外延,重构学术出版流程。近年来,学术出版机构不仅应用智能审校提高生产效率和质量,也从人工智能对学术研究和学术出版的智能化重构角度出发,积极探索成果出版、数据出版,以及学术科研平台、专题数据库建设,还通过技术手段完善学术规范、学术评价、投约稿、开放获取、国际传播、学术共同体建设等服务。人工智能视域下的学术出版,业务形态从纸质书出版、成果发布向为学术研究全生命周期提供资源、数据、规范、评价、传播、共享等多元服务转变,营利模式由学术成果的传统纸质出版为主向全流程深度智能化服务转变,构建赋能型内容资源平台、学术型知识仓库和智慧出版生态系统,形成全周期、全流程智慧学术出版体系。
2.1 成果出版和数据出版服务
成果出版是出版机构的传统业态和业务优势,内容不仅是出版的核心竞争力,更是人工智能发挥作用的内容来源。2022年,中宣部印发《关于推动出版深度融合发展的实施意见》,要求“坚持内容为王,把握数字化、网络化、智能化方向”,“切实把出版内容优势转化为融合发展优势”。学术出版机构立足专业化,为研究者提供图书出版、期刊出版等多元出版服务;并以纸质出版为根基积极推动融合发展,不断创新出版形式,以电子书、有声书、数据库出版、视频出版、多媒体出版等多样化方式呈现学术成果和研究过程。
数字化和人工智能不仅为学术研究提供内容,更在全周期中改变学术研究的方法和范式。2018年,国务院发布《科学数据管理办法》,鼓励推动数据出版和传播。为深入服务学术研究前端,学术出版机构积极探索数据集注册、收录、检索和共享能力建设。2021年,社会科学文献出版社联合有关经济学专家开发建设中国市场化指数数掘库,发布全国31个省市场化相对进程指数体系,为各省份市场化进展实证分析、模型分析提供了基础数据。
2.2 学术科研平台与学科主题数据库服务
学术成果、文献、数据是学术研究的基础,也是学术共同体最重要的资源。对高校和科研机构来说,需要通过丰富的检索功能、清晰的学科分类、定期备份等技术手段对海量的知识成果和知识资源进行整理、共享和交流。学术出版机构积极探索数字学术科研合作模式,以学术科研需求为驱动,面向机构提供定制化知识服务解决方案,共建机构知识库,为学术机构提供全方位的资源整合、平台建设、成果发布推广,基于学术共同体建设实践探索档案资料和研究数据共享、学者网络、协同翻译、学术交流、在线会议沙龙等灵活多样的服务模式。
伴随学术研究的蓬勃发展,学术资源和知识内容实现几何级增长。相对于知识内容的缺乏,更加困扰研究者的是知识的筛选、辨析。以学科为中心,对学术资源进行鉴别、选择、标引,实现“一站式”的检索和使用更有助于将繁杂的学术信息秩序化、简洁化,使隐含的学术观点明晰化、条理化。学术出版机构可以基于自身资源总库、平台技术和知识组织体系为用户整合数据、技术、资源和平台,提供定制化主题数据库、学科专题数据库服务,如社会科学文献出版社殷墟出土文物知识库等专题学科知识库可帮助研究者进行知识采集、知识组织、知识挖掘,构建知识图谱和知识体系;人民法院出版社“中国法律应用数字网络服务平台”突出法律知识数据聚集和分析,提供一站式法律知识解决方案。
2.3 学术规范和学术评价服务
学术规范是学术研究繁荣发展的重要保障,有利于整治学术生态,净化学术环境。为此,学术出版机构积极推动学术著作出版规范标准的建设和推行,如社会科学文献出版社发布《作者手册》,对学术标准和学术规范起示范引导作用。人工智能时代,学术出版规范在作者智能写作和编辑智能编校两个环节仍有较大的探索和应用空间。
学术评价具有规范和引导研究者学术研究行为、调节学术资源分配、维护学术公平正义的关键作用,与研究者个人利益与荣誉、国家学术创新均有密切关系。人工智能视域下,客观、规范的学术出版评价既为出版机构了解自身社会影响力与学术影响力变化提供了动态观察窗口,也为学术研究提供了客观、公正的数据参考,有助于学术出版的高质量发展和社会效益提升。学术出版机构应联合建立中国学术出版评价数据库,提供数据查询、评价结果查询等服务。
2.4 投约稿和开放出版服务
出版是学术交流和传播的重要环节,内容是学术出版机构的核心资源和竞争力,聚合优质选题和优质学术成果是学术出版机构扩大学术出版规模、彰显社会价值和社会影响的关键。学术出版机构可以通过在线投稿、约稿实现审稿流程集约化,通过学术不端检测、在线专家评审、稿件审校、稿件授权、组稿、单篇稿件优先发布等功能记录稿件流转,方便稿件管理,实时掌握稿件进度,提高出版效率。
开放获取是国际学术界、出版界突破传统购买和订阅模式,促进学术内容互联网自由传播而采取的学术行动。学术出版机构通过学术图书、数据库等学术内容的免费阅读和下载回应研究者需求。例如,在学术论文出版平台(集刊全文数据库)架构下,社会科学文献出版社打造哲学社会科学成果开放获取平台,构建人文社会科学领域开放、包容、公平的学术生态系统,增强学术成果可见性;以预印本服务弥补传统期刊发表延迟的问题,缩短学术成果的发表时间,推进学术成果的交流、传播与再生产。
2.5 学者服务和学术共同体建设
掌握充足的作者资源、从作者学术研究需求出发做好作者服务是学术出版机构的中心工作。不少学术出版机构旗帜鲜明地提出以作者服务为核心,发布《作者手册》,严格执行匿名评审和编审分离制度,组织召开“学术研创研修班”“成果传播集训班”等,提升作者写作研创能力。学术成果出版后,出版机构还通过作者社区提供学术成果查询、电子书阅读、资讯获取等快捷、便利、精准的专业服务。
学术共同体与学科发展相辅相成,是优化学术环境,促进学术研究发展的重要工作。学术出版机构积极推进学术共同体建设服务,以服务学者为核心,联合高校、媒体、科研院所共同举办学术论坛和研修班,发布学术成果,构建学术社群,提供阅读、科研、传播、社交一站式服务,进一步推动学术共同体建设的有效性和智能化。
2.6 国际出版和国际传播服务
国际出版和传播有效促进了跨国、跨机构的学术合作,对增强学术互信和学术交流,拓宽学术视野和研究思路,提升研究者的学术声誉和影响力,提升我国学术话语权有着重要作用。近年来,学术出版机构高度重视国际出版和学术成果“走出去”,积极关注全球学术动态,提升国际传播能力,以具有原创性和主体性的中国学术观点和方法回应国际学术研究。经典中国国际出版工程、丝路书香工程等“走出去”工程精心打造和广泛传播具有中国特色、凸显中国精神、蕴含中国智慧、宣介中国道路、体现中国价值、展示中国贡献的精品出版物,提升中华文化国际影响力,深化中外文明交流互鉴。专业数据库也积极回应国际学术发展趋势,促进国际学术交流与传播,社会科学文献出版社皮书数据库、中华书局中华经典古籍库、上海交通大学出版社“东京审判文献数据库”等为全球学术研究提供了重要的辅助和支持服务。同时,我国学术出版机构通过向全球研究者组稿,在国外设立出版中心,与国际出版机构联合产品线、共同进行选题论证等创新国际合作方式,推动学术出版“走出去”的本土化运作。
翻译的程度和质量是影响国际学术交流和传播的重要条件,人工智能技术的发展进一步改变了翻译生产方式和效率。2018年,电子工业出版社和网易有道合作出版《极简区块链》,这是全球首本由AI机器完成翻译、人工审校的图书。[11] 2019年,知识产权出版社知识产权信息多语言智能翻译与服务系统对专利文献特定性语言现象和句式规范进行针对性处理和优化,为科研和审查人员快速、准确理解专利文献提供便利。[12] 2022年,社会科学文献出版社发布AI多语学术资源库,采用AI神经网络机器翻译技术,围绕中国主张、中国智慧、中国方案筛选人文社科类优质学术资源,针对不同语种阅读习惯、句子长度进行差异化适配,满足使用者的多样化需求。
总体来看,智慧学术出版体系建设并不单纯是在原有学术出版流程上加入人工智能元素,也不是以人工智能工具替代传统出版,而是要以高质量的学科资源和专业学科语料库为基础,以符合学科专业要求的人工智能算法为依托,以学科研究需求和场景为出发点,提供高效便捷的学术研究全生命周期出版服务。
3 人工智能时代学术出版高质量发展的未来进路
在技术进步的趋势下,出版业从意识和行动层面积极应用人工智能,推动出版管理和出版流程科技化、自动化、智能化。但是,学术出版机构从学术研究前端参与学术生产,服务学术研究全周期的意识仍有不足,在智能辅助学术选题策划、智能辅助学术写作方面的探索和实践还十分欠缺。发展学术出版人工智能,必须从根本上转变出版理念,以智慧学术出版为目标,建设全流程、全周期的智慧学术出版生态,从内容上促进出版机构学术资源整合,积累大数据、发展大模型、具备大算力;从传播上提高学术内容加工深度和学术交流效率,推动学术出版机构从人工智能工具的应用者向知识内容提供者、发现者转变,推动全要素的智能化革新。
3.1 摆脱“路径依赖”,建设全流程、全周期智慧出版生态
受传统业务模式、生产流程、营利机制的影响,现阶段出版业应用人工智能的方式基本是“+AI”方式,即将技术手段施加在原有出版流程、业务场景上,以丰富内容发布形式、优化生产流程、提高生产效率,这种方式对出版机构来说是一种渐进式创新,易于被传统业务吸收、利用,干扰性低,相对稳定,有利于保持学术出版机构原有竞争优势。但这种小修小补式的应用创新存在明显的“路径依赖”,并没有改变学术内容知识的组织方式,管理和业务流程仍以纸质出版为前提,忽略了人工智能重构不同于传统出版模式的新业态的可能性。为健全现代文化产业体系,扩大优质学术产品供给,推动学术繁荣,助力学术强国建设,出版机构需要以数字化、智能化的管理思维,由“单纯运用数字技术对学术内容进行编辑加工、复制传播”向更广阔、开放、立体的智能出版转变,用“AI+”方式彻底改进出版业运行方式。学术出版机构需要主动挖掘人工智能在知识组织、知识挖掘、知识传播方面的潜能,建设人工智能实验室,重构人工智能环境下的学术出版场景,深入推进技术与内容深度融合,创新理念、内容、题材、形式、方式、手段、业态、体制、机制,将以纸质学术出版物为核心的管理方式转变为智能学术出版管理方式和业务流程,拓展学术出版功能从传统学术成果发表和传播到知识溯源、构建知识图谱,乃至提供全方位专业知识服务解决方案。[13]
3.2 消除“数据壁垒”,发展人工智能视域下学术出版大数据、大模型、大算力
人工智能是一场知识革命,计算机不断运用经验知识解决问题并积累新的经验,以多层神经网络进行深度机器学习。因此,人工智能和语言生成模型的快速演进,需要高质量、大规模语料的支撑。但原有各自为政的学术研究和出版模式,学术资源分散在不同研究者、学术机构、学术出版机构的现状,以及学术资源专有性和版权保护造成的“数据孤岛”,已经成为阻碍学术研究范式革故鼎新的关键性要素。仅以版权期为例,纸质出版物版权期结束并不影响读者阅读和使用,但数字环境下,出版机构可能面临产品和服务还未开发建设完成,版权已经到期的窘境,或因版权期结束不得不下架相关资源。重新认识人工智能时代的版权问题,是学术出版发展的迫切需要,应推动研究机构和出版机构从“小、散、乱”模式转向学术资源合作,以知识仓库为基础形成服务学术出版的智慧大脑;同时,应推进学术内容开放获取和算法公开,消除“数据壁垒”,避免拥有最大用户数量的平台和掌握人工智能算法的公司掌握数据和算法霸权,以更广泛、更大规模的学术数据为学术出版应用人工智能提供更多学习样本,进一步促进学术出版服务智能化、智慧化发展。
3.3 细粒度学术资源开发,促进学术研究方法革新
技术改变了学术资源的收集和应用方式,但目前大多数出版机构还只是将学术资源经过扫描、识别、录入后以数字化方式存储在网络空间,这种线上的“图书馆”“期刊阅览室”仅是载体变化。学术出版机构在对学术资源进行加工时,需要改变现有以整本书为单位的加工方式,按章、节、段落、句子甚至词进行更细粒度的深度加工,以知识单元为对象进行解构、挖掘、关联与重组,将业务驱动转变为数据驱动,信息拆分为数据单位,促进知识挖掘、知识组织的实现。一方面,改善数字产品检索时字的生硬匹配,减少检索的冗余、缺漏和错配,兼顾“检全”和“检准”;另一方面,将传统出版处于学术研究后端的知识组织过程前置,通过知识图谱工程,信息资源语义标注和链接,实体、事件、概念之间的关联等,使碎片化的内容形成相互联系的学术知识网络,以知识单元细粒度化、知识组织语义化、知识呈现可视化克服人工数据采集带来的碎片化、不系统弊端,为研究者从学术选题至成果阐述、发布交流全过程提供立体化、精细化的学术服务。
3.4 创新学术传播形式,提高知识发现与学术交流效度
学术内容和知识是人工智能参与学术生产和传播的基础,计算机和网络技术为学术传播和交流构筑了全新的基础设施,但人工智能在对语料进行机器学习时并不具备选择能力,输出时基于模型算法而非知识内容的准确性、学术性和权威性,极易造成数据信息的错误和干扰。学术出版机构长期深耕学术研究领域,拥有大量大模型训练和人工智能参与学术研究、学术写作所必需的高质量语料。学术出版机构要完善出版内容数据、用户数据、市场数据,在个性化的学术需求和交互式学术传播与交流中重塑学术传播系统,创新知识获取和挖掘、知识内化和创新、知识分享和展示方式,从单向的学术信息发布、学术内容出版向全方位的科研支撑转型。学术出版机构要充分调研用户需求,通过建立标签体系、提取模型和关键算法完善学者画像、机构画像、基金画像、学科画像并及时更新,精准把握学术研究前沿和趋势,实现学科信息精准推送和个性化服务。同时,学术出版机构要主动参与人工智能算法和“数据投喂”,由专业学科编辑或专业营销人员承担数据标记、数据描述、模型训练和机器学习职能,通过对自然语言处理模型的反复追问和指导为人工智能提供“知识”,提高学术内容被接受、发现、推荐的频次和效率,促进学术传播和交流。
3.5 加大智慧学术出版资金投入,提高出版机构人工智能技术应用积极性
相对于传统学术出版,人工智能和大语言模型的应用需要较长时间周期和较高成本投入,试错成本和风险较大。在当前的考核机制下,出版机构面临较大的资金和人力资源压力,常陷入不敢投入、害怕投入的困境;学术编辑面对绩效和利润指标压力,缺乏转型的动力和积极性。从出版管理部门的角度看,需要在国家出版基金等出版资助项目评选和规划中,单列数字项目、融合项目评选或增加比重,鼓励具有相当理论高度,学术水平、文化价值高,内容品质强的数字出版产品开发,并积极引入地方资金和民间资本,丰富学术出版内容来源和产品形式。对出版机构自身来说,可在财务预算中建立融合发展基金,或对智慧学术出版成本进行单独列支,建立合理的试错机制,调动专业学科编辑的参与积极性,促进出版业务转型升级。此外,人工智能研发随着技术的革新不断变化,带有明显的持续性特点,要形成可持续的智慧学术出版资金投入机制,避免中断研发造成的资金浪费和学术数据遗失。
3.6 促进“AI+”人才培养,保障学术出版智能化发展
《新一代人工智能发展规划》提出“把高端人才队伍建设作为人工智能发展的重中之重”,“培育高水平人工智能创新人才和团队”。《出版业“十四五”时期发展规划》要求“加强创新型、应用型、复合型人才培养”,“建设新时代出版人才矩阵”,都对技术发展条件下的人才培养提出了较高的要求。出版机构要把“AI+”人才选拔培养落实在员工招聘、日常培训、绩效考核等环节,注重社内编辑人员的转化和培养,完善人才考核激励机制,激发新老员工从事智慧出版的积极性与创造性。高校要紧跟时代、技术和产业发展趋势,坚持教研结合,扩大相关学科方向博士、硕士招生规模,形成“AI+”复合专业培养新模式。政、校、企各主体应加强合作,结合人工智能特色和行业发展趋势,建设人才培养基地、实习基地等,培养有较高理论素养,又能上手、懂实践的专业人才。出版管理部门畅通智慧出版从业人员职业资格考试渠道,健全完善继续教育培训和职称评定长效机制,为智慧出版人才提供更有益的成长空间。学术出版机构需要自觉置身于学术共同体之中,提升从业人员的学术素养,使编辑人员“懂研究”“能研究”,形成学术研究者和专业编辑之间的旋转门机制,为了解和满足学术需求奠定基础和保障。
4 结语
当人工智能深刻影响信息内容的产生、组织、传播时,不可避免会造成知识获取的狭隘性、粗糙性及“信息茧房”,用户的原有偏好被不断固化,形成知识壁垒。人工智能条件下的机器筛选和推送造成的“把关人失灵”可能带来内容质量参差不齐、更多冗余和错误信息出现等问题,大数据语料的不可考、不可溯源带来更多的内容资源权属不明和版权保护困境,随之出现的学术伦理、学术信任、国家安全、意识形态问题同样亟待解决。为兼顾数字技术进步与人文理性,践行大国责任,中国出版业更需要重视学术出版的功能地位,加强学术编辑和学术出版机构在学术共同体中的影响力,充分发挥其专业性、权威性职能,对人工智能生成、发布、推荐内容进行选择、判断,积极推进全球技术治理,探索提升数字话语权的中国方案。
参考文献
知识产权出版社自主研发的机器翻译系统在国家知识产权局开放日主会场发布上线
[EB/OL].(
/
| 〈 |
|
〉 |
