AI大型语言模型引入视域下的科技期刊二次传播探析*
关键词:
本文引用格式
邱蕾, 刘建明.
AI大型语言模型(Large Language Models,LLM)是人工智能技术驱动的自然语言处理工具,它能够学习和理解人类的语言,根据聊天的上下文进行互动,像人类一样聊天交流,甚至能完成撰写邮件、视频脚本、文案,翻译,写代码等任务。[6]继ChatGPT之后,谷歌发布了Bard测试版、百度推出了“文心一言”。2022年4月,中宣部印发《关于推动出版深度融合发展的实施意见》,明确提出应“加强前沿技术探索应用”“强化大数据、云计算、人工智能、区块链等技术应用,创新驱动出版深度融合发展”。[7]新一代AI大型语言模型的出现,为科技期刊开展科技论文的可理解性和普及性的二次传播开辟了一条新的路径。已有学者分析了LLM技术在医疗[8]、教育[9]、图书情报[10]、学术出版[11]等领域的影响。总体观点认为AI技术的广泛应用不可避免,但一定要在谨慎评估的前提下使用。
本文在分析传统出版模式下科技期刊二次传播存在问题的基础上,探讨AI大型语言模型的技术突破及其在科技期刊二次传播中的作用,分析AI大型语言模型在科技期刊二次传播中的应用场景和需要注意的问题,为创新科技期刊二次传播提供思路。
1 科技期刊二次传播的内涵
“二次传播”是一种相对于“初次传播”的传播学概念,指经过初次传播的信息通过其他媒介形式进行再次传播。[12]对于科技期刊而言,二次传播是指原创科技论文内容以纸质期刊形式印刷发行或者以电子版形式发行于学术资源库之外,在微信公众号、抖音、哔哩哔哩(以下简称“B站”)等新媒体平台通过图文、直播、短视频等形式进行传播。[1]就内容形式而言,科技期刊的二次传播有两种方式:第一种是保留科技论文的原创内容和形式的二次传播,例如在期刊自有网站上的开放获取、在期刊微信公众号的全文链接;第二种是对期刊内容进行改写、加工,语言风格和内容呈现形式发生变化的二次传播。本文所指的二次传播是第二种,即将科技论文中的研究成果以通俗易懂的方式进行解释和传播,使非专业读者能够理解和应用,是科技论文可理解性和普及性的二次传播。
科技期刊的二次传播对科技期刊自身发展、科学知识的普及具有重要意义。就科技期刊自身发展意义而言,二次传播一方面能够在传统发行形式之外开辟新的传播路径,不仅使知识传播由单一静态向多元动态发展,而且可以使知识获取由学术共同体向社会大众延伸[1];另一方面适应读者信息获取方式的变化,促进科技信息在新媒体领域的持续传播。调查显示,超过95%的科技期刊开通了微信公众号,对期刊内容进行加工后传播[13],并且已经有多种科技期刊在B站开设官方账号,以短视频的形式发布科技信息。[12]就科学知识的普及而言,二次传播可以将科技论文的内容以更易懂的方式呈现给公众,提高科学知识的普及率。目前,科技期刊二次传播形式主要有科普文章、科技新闻报道和综合报道,以及社交媒体、科学博客、科普网站等。
2 传统出版模式下科技期刊二次传播存在的问题
由于我国科技期刊编辑缺乏科学传播的相关训练,传统出版模式下科技期刊二次传播在内容生产和传播形态方面存在诸多不足。例如,在改写科普文章方面,容易出现专业知识储备不足、信息失真、语言风格变化等问题;在新闻报道方面,容易出现夸大研究成果、科学内容简化和失真、内容缺乏可信度和准确性,以及错误引述等问题;在综合报道方面,容易出现知识选择偏见、引用错位等问题。总的来说,这些问题可归结为以下4个方面。
一是专业性解释问题。科技期刊的原始研究成果通常涉及专业领域的复杂知识和概念,为了让更广泛的读者了解,在二次传播时需要对内容进行解释和简化。然而,专业性解释的不当可能导致信息的失真或误解,尤其是在传达科学细节和推理过程时。
二是语言和风格变化问题。在原始研究中,研究者通常使用专业术语和方式来表达他们的工作。在二次传播过程中,为了使内容更易于理解,需要进行语言和风格上的转化。这种转化可能导致信息丢失、造成误导、削弱科学准确性等。
三是规范性文本生成的速度和效率问题。科技期刊依赖人工编辑或作者生成规范性的二次传播文本需要较长的时间,对于需要快速传播的信息,如紧急的科学发现或新闻,这种规范性文本生成方式可能导致研究成果的发布延迟。
四是传播形态单一的问题。传统科技期刊二次传播形态——科普文章、科技新闻报道和综合报道等几乎都是静态的出版物,通常不支持即时互动。读者不能立即向作者提问,也不能就研究内容进行实时讨论,从而限制了知识的即时交流和反馈。
3 AI语言模型的技术突破及其在科技期刊二次传播中的作用
3.1 AI语言模型的技术突破
一是信息抽取技术。信息抽取(information extraction,IE)是指从非结构化或半结构化的文本中自动识别抽取出实体、实体属性、实体之间关系以及事件等事实信息,并形成结构化表示的一种文本挖掘技术。[14]该技术能够快速准确地提取和归纳知识,并将其整合到一个标准化的术语体系中[15],在科技期刊二次传播中能够解决自然语言处理、文本挖掘、智能搜索、自动问答系统、知识图谱构建等问题,可以实现科技论文的文献摘要生成、关键词提取、引用网络构建、实体识别和趋势分析,可以协助科技期刊建设特定的专业数据库,进而有效解决科技期刊二次传播中的专业数据、专业术语的解释问题、内容的精准表达问题和知识选择偏见问题。
二是文本自动生成技术。AI文本自动生成技术是一种利用人工智能技术和自然语言处理技术,通过算法模型自动生成具有一定结构和语义的文本内容的技术。[16]这种技术可以基于给定的文本样本,通过学习和分析文本的规律和特征,生成类似的新文本。在科技期刊二次传播过程中,它涵盖自动摘要生成、机器翻译、对话系统、文案创作等语言模型的多种应用。LLM的底层模型使其具有优异的归纳总结和语言组织能力,可以快速、准确地从大量文字中抽取关键信息,形成有一定逻辑的内容,还可以查找并标注字词错误、语法错误,提供更简洁、更专业的词汇,优化文章结构,提高二次传播文本写作效率。
三是人机交互技术。AI人机交互技术是指利用人工智能技术来改善人与计算机之间的交互体验和效果的技术。[17]这种技术可以使计算机更加智能化和人性化,使人们更方便、自然地与计算机进行交流和操作。交互式问答是科技期刊二次传播的发展方向之一。传统科技期刊通常以单向的方式向读者提供科研成果,读者只能被动地阅读和获取信息。交互式问答使读者可以与科技期刊的内容进行深入的交流和探索,科技期刊通过整合、分析和展示大量的问答数据,让读者更好地理解和应用科学知识。此外,交互式问答还能引入用户生成内容,促进学术界和产业界的合作与交流,推动科技信息的传播和普及。
3.2 AI大型语言模型在科技期刊二次传播中的作用
一是对科技论文中的专业数据进行快速分析和处理。科技文献受篇幅限制,往往通过含有大量数据的图表呈现研究过程和研究结果,非专业读者很难理解。AI大型语言模型通过快速分析和处理论文数据可以将大量信息转化为简洁、易于理解的形式,使读者快速了解论文的核心内容和重要数据,节省阅读时间和精力。AI大型语言模型的出现为快速分析和处理论文数据提供了强大的工具和方法。一方面,AI大型语言模型通过对语义和上下文的理解,将复杂的论文数据转化为简洁、易于理解的形式。另一方面,AI大型语言模型能够自动识别和提取重要的实验结果、图表、统计数据,以及论文中的关键概念和观点。此外,AI大型语言模型还可以进行情感分析、主题建模,以更深入地理解和挖掘论文数据中的信息,识别出研究的贡献和亮点,并对论文进行评价。
二是为科技论文中的专业术语和知识点提供更为科学的解释。在二次传播过程中,AI大型语言模型对专业术语和知识点的科学解释能起到画龙点睛的作用,可以将复杂的概念和信息转化为易于理解的形式,使非专业读者易于理解。AI大型语言模型是新一代的“知识表示和调用方式”,可以用自然语言直接调用这些知识,识别出文本中的专业术语,并理解它们的特定含义;生成相应的定义或解释,说明该术语的含义和用法;分析上下文中的其他词语和句子,提供更准确和详细的解释,避免知识选择偏见和解读误差。此外,AI大型语言模型可以通过学习上下文中的词语关系和语义含义与读者的背景知识建立联系,通过比较和类比的方式,将论文中的概念与日常生活经验联系起来,增加读者的兴趣和参与度。
三是对文章进行润色和编辑,提高语言自然度。科技论文往往包含大量的专业术语和复杂的概念,非专业读者可能不熟悉这些术语和概念。如果在二次传播过程中使用过于专业化或晦涩难懂的语言,读者可能会感到困惑和挫败,从而影响对论文内容的理解和接受。使用自然、通俗的语言表达可以使复杂的概念和信息更易于理解,从而增强读者的兴趣和参与度。AI大型语言模型可以对文章进行润色和编辑,可以自动检测并修改文章中的语法错误,如拼写错误、错误的词性使用和错误的句法结构等;还可以提供替代词汇和短语,以提高句子的表达力,通过更优雅和精确的句子结构改进句子的清晰度和连贯度。
四是快速生成规范性的文本,提高科技期刊二次传播效率。传播效率指的是科技期刊文章在发表后再次在其他平台或媒体上传播的速度和范围。通过快速生成规范性的文本,包括文本排版(文字、图表、图像的整合和布局)、参考文献格式化等,显著减少科技期刊二次传播时滞,可以有效提高科技期刊二次传播的质量和效果。AI大型语言模型可以克服传统文本生成通常需要编写复杂的规则和模板的问题,通过训练大规模的数据集和深度学习算法,可以实现迅速理解上下文、语义和语法规则,在短时间内生成大量规范的二次传播文本。
五是与公众实现知识的交互式问答,进一步优化传播渠道。一方面,科技期刊中的科学文章通常充满专业术语和复杂的理论,非专业读者可能难以理解。交互式问答可以用于解释和澄清这些概念,使其更易于理解。另一方面,读者可能会对科技期刊中的研究产生疑问,他们可以使用交互式问答工具提出问题并获得解答。对科技期刊而言,通过与公众进行互动,可以促进科学对话和讨论。AI大型语言模型可以与公众实现知识的交互式问答,可以在网页、移动应用程序、智能音箱等平台上运行,进而拓展科技期刊二次传播的渠道。
4 AI大型语言模型在科技期刊二次传播中的应用场景——以ChatGPT为例
4.1 场景一:解释和澄清复杂概念
科技论文具有明显的学术性和专业性,解释和澄清复杂概念对科技期刊二次传播具有重要意义,它不仅有助于促进科学普及,提高公众科学素质,增强科学传播的可信度,还能帮助决策者做出明智决策,同时推动科学研究的社会影响力,对整个社会产生积极的推动作用。传统科技期刊的二次传播(例如新闻报道、科学普及文章等)在解释和澄清复杂概念时面临信息简化和失真、过度一般化、缺乏深度、认知差异等方面的问题,而ChatGPT的引入能够缓解上述难题。一方面,ChatGPT能够以简单易懂的语言回答用户问题,避免了专业术语和复杂语句,从而降低了信息的失真和简化;可以根据用户问题提供答案,避免对复杂概念的过度一般化。另一方面,ChatGPT虽然无法提供极为深入的解释,但它可以针对用户的追问逐步提供更为详细的信息,缓解了缺乏深度的问题;同时,它可以根据用户的问题进行个性化回答,提供更为贴近用户认知水平的答案,缓解认知差异。总之,ChatGPT基于广泛的训练数据和知识库,可以提供对广泛领域的科技知识和概念的理解和解释,帮助科技期刊编辑将这些复杂概念解释为通俗易懂的语言,消除读者对科技论文的理解障碍。
4.2 场景二:根据论文摘要改写科普文章
摘要是科技论文的缩写版,拥有与文献同等量的主要信息,读者可以只阅读摘要不阅读全文,就能获得必要的信息。科技论文摘要的全息性决定了其成为期刊编辑改写科普文章最简洁的参照。而将科技论文摘要改写成科普文章并非易事,需要注意使用语言简明易懂、突出关键信息、介绍背景知识、阐明实际应用和意义、提供生动的案例和比喻、提供规范的图表和图像、表明引用来源、避免歧义等。ChatGPT具备强大的自然语言处理能力,能够轻松化解上述问题。例如,ChatGPT能够将复杂的句子结构简化,使用通俗词汇替代专业术语,确保语言易懂;可以识别和强调论文摘要中的关键信息,确保这些信息在改写中得到突出展现;可以提供相关领域的基础知识,帮助解释研究的背景和前提条件,使读者能够更好地理解文本内容;可以引用相关的实际应用案例,帮助读者直观地理解研究成果的实际价值和影响。例如,ChatGPT可以确保句子结构清晰,避免使用含糊词语,降低文本的歧义性;通过引用可靠的来源和数据,确保信息的准确性和可信度;确保文本的逻辑连贯性,帮助读者顺畅地理解文章的内容和论证过程。此外,还可以提供丰富的例子和比喻,使得抽象概念更具体,更容易被读者理解。
4.3 场景三:与编辑协作编写科技报道
根据科技论文编写科技报道容易出现夸大研究成果、简化和失真科学内容、缺乏科学可信度和准确性、缺乏全面性和多样性等问题。[19]为了确保科技报道的准确性和可信度,编辑需要采取仔细核实信息、引用可靠来源、审查数据和图表、平衡报道、科普解释等措施。完成这些工作并不容易,编辑需要具备很强的专业性,还需要花费大量的时间和精力。ChatGPT可以快速检索并验证数据和信息、查找相关的来源和参考文献、分析文章的逻辑结构和段落之间的连贯性、解释科技报道通常涉及的复杂的术语和技术词汇、确保引用格式符合标准、提供关于当前科技趋势和热点话题的信息。因此,借助ChatGPT可以轻松、有效地解决科技报道编写中的难题。
4.4 场景四:开发知识问答平台
随着交互式技术的发展,知识问答逐渐成为公众获取碎片化科技信息的一种重要方式。传统科技期刊开发知识问答平台面临专业性和准确性、更新速度、可信度、信息过载等方面的问题。ChatGPT可以基于其大量的训练数据和模型智能化地回答用户的问题,提供较高准确性的答案。虽然ChatGPT并不是专家,但在一般性的科技问题上,它的回答通常具有一定的专业性和准确性。ChatGPT可以实时获取最新的信息,提供关于最新科技进展的信息,缓解传统期刊信息滞后的问题。在解决可信度问题方面,ChatGPT可以通过引入专家监督,审核答案并进行答案质量评估,提高答案的可信度。ChatGPT可以帮助用户过滤和整理信息,根据用户问题提供有针对性的答案,减轻信息过载的压力。ChatGPT还具备连续对话和追问能力,可以与读者进行有机交互,处理多轮对话,理解上下文,并根据先前的交流提供更准确和个性化的回复和建议。此外,ChatGPT还能智能化地根据期刊论文的核心思想、结果和趋势生成各种图像化、可视化元素,使读者更容易理解和记忆。总的来说,ChatGPT的智能化、即时性、可定制性等特点,使得它能够为传统科技期刊搭建知识问答平台提供更多解决方案。
5 我国科技期刊利用AI大型语言模型进行二次传播时需要注意的问题
5.1 可靠性和准确性问题
尽管LLM技术具有强大的语言生成能力,但它仍可能生成不准确、误导性或不完整的答案,这是因为AI大型模型在生成文本时是根据它们在大量数据上训练的统计概率进行操作的,而不具有人类智能的理解和判断,有可能出现数据偏差、语境不完整、信息不准确或过时、语法和结构问题。因此,科技期刊利用AI大型语言模型生成二次传播内容时需要期刊编辑进行编辑和审核,以确保内容的准确性和合适性。
5.2 知识产权问题
科技期刊利用AI大型语言模型进行二次传播时,涉及版权、合理使用原则、引用和引用标准、数据库许可、数据脱敏和隐私、法律责任等知识产权问题。其一,AI大型语言模型创作的版权问题。科技期刊论文通常受版权保护,AI大型语言模型在处理这些文章时,需要遵守著作权法。通常情况下,二次传播应该尊重原始文献的版权,不得擅自复制、分发或传播整篇文章。其二,合理使用原则。根据“合理使用”或“公平使用”原则,科技期刊利用AI大型语言模型进行二次传播时可以使用受版权保护的内容。其三,引用和引用标准。AI大型语言模型在分析和生成文本时,可以使用引用和引用标准,以指明原始文献和作者。这样做可以确保知识的来源得到恰当的承认,同时避免侵犯知识产权。其四,数据脱敏和隐私问题。在分析和生成文本时,AI大型语言模型需要谨慎处理可能包含个人信息或敏感信息的内容,因为这涉及隐私和数据保护法规。其五,法律责任问题。AI大型语言模型的使用者应该对模型生成的内容负有责任,如果生成的内容侵犯了知识产权,使用者可能会承担法律责任。
5.3 隐私保护和数据安全问题
科技期刊利用AI大型语言模型进行二次传播面临数据安全和隐私保护的挑战。一是数据隐私保护。AI大型语言模型可能需要访问和分析科技期刊中的文章或其他文献,这可能包含一些个人信息或敏感信息。科技期刊利用AI大型语言模型进行二次传播时,需要确保AI大型语言模型在处理这些数据时采取适当的隐私保护措施,如数据脱敏、数据聚合和身份去标识化,以防止泄露个人信息。二是合规性和法规遵守。随着数据隐私法规的不断发展,使用者需要确保他们的行为合规,尊重用户的隐私权。这包括明确获得用户的同意,限制数据的收集和使用,以及提供透明的隐私。三是第三方数据提供商的可信度。为了提高科技期刊二次传播效果,可能需要补充一些相关研究的内容,这就涉及使用第三方提供的数据。因此,科技期刊利用AI大型语言模型进行二次传播时,需要确保第三方数据提供商提供的数据是可信的、得到学术认可的,或者进行适当的标注和注释,以帮助读者评估信息的可信度。
6 结语
通过分析传统出版模式下科技期刊二次传播存在的问题,本文对AI大型语言模型的技术突破及其在科技期刊二次传播中的作用进行了梳理。研究发现,AI大型语言模型在信息抽取技术、文本自动生成技术、人机交互技术等方面实现了对传统科技期刊二次传播的技术突破,能够对科技论文中的专业数据进行快速分析处理、为科技论文中的专业术语和知识点提供更为科学的解释、对文章进行润色和编辑、快速生成规范性的文本、与公众实现知识的交互式问答等。基于此,本文提出了AI大型语言模型在科技期刊二次传播中的4个应用场景,即解释和澄清复杂概念、根据论文摘要改写科普文章、与编辑协作编写科技报道、开发知识问答平台。
目前,类似ChatGPT的AI大型语言模型对科技期刊的改造并不是万能的,一方面,科技期刊的发展面临学术智能与人机协作中知识正义的维护问题;[18]另一方面,现有的AI大型语言模型仍然存在一些技术障碍。就语言生成技术而言,AI大型语言模型生成的文本可能存在语义不准确、逻辑不连贯等问题,这些问题在复杂领域的科技内容解释方面较为显著,因此需要进一步开发和训练AI大型语言模型,理解和准确转化领域专业知识。随着技术的进步和科技期刊的大胆实践,未来,科技期刊利用AI大型语言模型进行二次传播将会展现出更广阔的前景。例如,摘要和解释自动生成、个性化推荐和定制化服务、多模态内容呈现、社区互动和知识共享、多语言支持和跨文化交流等。
参考文献
/
| 〈 |
|
〉 |
