网络学习社区出版组稿内容筛选与评估
编委: 韩婧
关键词:
本文引用格式
杨艳妮, 袁甜阳子.
在“大规模业余生产”的时代里,各类网络虚拟社区内容资源飞速增长,越来越多的垂直型网络学习社区将平台内优质内容资源进行再组织形成网络出版物输出,常见的《知乎周刊》《雪球专刊》《虎嗅精选》《云阅读周刊》等长期占据图书排行榜前列,如在2016年亚马逊免费电子书年度排行榜前100中有22本是来自网络学习社区,其出版效率和质量均显得尤为惊人。
网络学习社区包括内容、作者和平台等众多资源,利用一定的科学规则和方法,实现对平台内资源的序化或整序,完成向网络出版物的转化,是实现社区知识内容传播增值的过程。为发挥网络学习社区中数字内容的长尾价值,将有效且高质量的内容聚合并推送给用户,网络编辑往往从繁杂的信息中按照内容之间的语义联系,将内容进行整合和编辑,实现内容的再组织和优化,从而凸显网络学习社区的核心价值。与传统线下的出版内容组织相比,网络学习社区环境下资源组织的内容和形式发生了巨大变化。用户在网络学习社区中针对不同主题内容生产创造出海量的信息资源,但从内容价值上来看良莠不齐,在粗泛内容资源转向精细的出版内容过程中,需要经过网络编辑的把关、获取、分析与筛选的过程,以聚合有价值的内容。该过程中,编辑的内容组织能力和效率、文本信息分析能力和信息处理能力都面临较大的考验。因此网络学习社区中网络编辑如何有效、有序地对选题进行稿件内容组织是极为重要且亟待解决的问题。
基于数据挖掘分析建立起高效的内容筛选与评估方法,不仅有利于提高编辑个人的内容组织效率,且能确保多位编辑在内容选择上有一致的客观评估标准。本研究提出网络学习社区出版流程中,对组稿内容的筛选和评估需要编辑结合以数据为支撑的客观评价以及其本身对内容判断的主观评价来实现。
1 网络学习社区出版内容质量评估体系建立
网络学习社区环境下,网络编辑依据选题内容,分析筛选并与作者用户联系沟通获取稿件资源,形成备用稿件库。为实现网络学习社区出版组稿的全过程评估,一方面本文借鉴网络电子期刊的评估方法,另一方面结合选题的目标和方向考虑网络学习社区环境下网络出版内容和流程的特殊性,制定出版内容质量评价指标,以确保各评价要素客观反映稿件内容质量的优劣情况。同时,本文还结合对社区资源的数据挖掘进行定量分析,采取合适的评估实现方法。
国内外研究者对出版稿件的评估主要是从稿件内容、稿件影响力角度提出相应的评价指标,如表1所示。上述分析可知,对于出版稿件质量高低的评价除了内容本身之外,也考虑了稿件内容的传播情况和读者反馈。
表1 出版稿件评估指标及来源
为实现网络学习社区优质内容资源的聚合和传播利用,网络编辑组稿方式已然改变。但在虚拟社会网络环境下,编辑仍需秉承传统出版原则,在内容组织和选择上坚持政治性、科学性、价值性等。基于以上认识,本研究在借鉴以往研究者设定的评价指标基础之上,结合网络文稿的辞章、结构特征,主要从组稿稿件的基本内容情况、内容传播与用户评价以及内容的可获得性3个方面进行评价,如表2所示。
表2 网络稿件质量评估指标及方法
| 评估维度 | 评估 指标 | 指标释义 | 评估数据 来源 | 评估 方法 |
| 内容基本情况评价 | 政策接纳度 | 内容有无思想导向上的问题,是否符合出版政策 | / | 定性主观分析 |
| 内容易读性 | 是否容易被阅读和理解 | / | 定性主观分析 | |
| 内容价值性 | 知识需求满足情况,以及同类内容对比 | 同类内容 数量 | 定量统计分析 | |
| 内容关联性 | 内容与选题的关联,内容与内容的关联 | / | 定性主观分析 | |
| 内容传播与用户评价 | 内容传播度 | 内容在网络社区内外的传播阅读情况 | 阅读数、转发(载)数、评论数 | 定量统计分析 |
| 内容认可度 | 用户对内容的评价反馈 | 赞同数、评论倾向、收藏数 | 定量统计分析 | |
| 内容可获取性 | 内容授权与否 | 编辑是否有权使用内容 | / | 定性主观分析 |
1.1 稿件内容基本情况评价
对组稿稿件内容基本情况的评价主要是从稿件本身来思考,具体而言,内容基本评价涵盖了以下几个方面。
(1)政策接纳度。网络出版中对于政治导向应保持警惕,不严把政治关所造成的消极影响不可预估[17],浪费人力物力资源且无法满足读者用户需求。
(2)内容易读性。社会网络环境下,膨胀的信息资料对用户有限的阅读时间形成挑战,快速阅读成为在线阅读的必备基本技能。但网络文稿亦有其自身特点,相较于传统文稿,写作形式更为随意,网络语言、生造词泛滥。对组稿稿件的易读性进行把关是满足读者用户需求,适应网络出版环境的重要手段。因此,稿件易读性也成为网络出版物的基本品质要求。
(3)内容价值性。多元化的信息获取渠道稀释了用户注意力,只有有价值的内容才能吸引用户关注。网络学习社区环境下网络编辑更便捷地感知市场,使组稿内容满足不同用户的偏好需求。对稿件内容价值性要求是实现出版差异化竞争的方式之一。稿件内容价值性亦是组稿内容质量核心衡量标准。
(4)内容关联性。网络编辑在组稿过程中,除了考虑稿件的价值性也需注意稿件内容与选题的关联度,以此保证稿件内容间的一致性、与选题主题的统一性以及内容与用户群体需求的切合性。若各稿件内容主题过于分散,则网络学习社区出版组稿的价值易丧失,再次面临内容碎片化的情景。因此稿件内容关联性对稿件组织有着重要影响。
1.2 内容传播与用户评价
知识在传播过程中不断产生出价值节点,使得价值链得以延伸,知识传播的深度和广度共同反映了其价值,对稿件内容的认可度和传播度这两个维度的计量是网络学习社区出版组稿内容评估的特殊之处。基于媒介数据挖掘技术,使得这两方面的评估有据可依。传统组稿过程中,编辑主要依赖于个人经验对市场反馈进行预判。而文献计量学中对文章的传播与评价则通过文章的被引量、下载数等指标来反映。另外众多学者通过基于PageRank及其改进算法的网络搜索结果或基于网站链接分析来评价网站影响力等[18]。以此为研究基础,本文提出对组稿稿件的内容传播与用户反馈情况的评估。
(1)内容传播度。网络学习社区环境下,具有高传播度的稿件内容更具吸引力,往往能够触达更广泛的用户群体,引起大众转发、讨论,形成口碑效应。内容传播程度体现其网络影响力,文章传播度高体现出读者市场对其内容和质量的认可。
(2)内容认可度。传统出版审稿中同行评议的方法常提常新,对保障稿件内容质量有着重要意义。网络学习社区环境下,群体用户参与得到极大发挥,用户的点赞、转发、评论、回复、投票等行为反映出对内容的认可与赞同或是否定与反对。大众用户群体决策帮助编辑更全面、准确地审阅稿件,从而提高决策的科学性。
1.3 内容可获取性
网络学习社区中资源的可获得性需特别注意,网络稿件资源的获取涉及知识产权的问题较为复杂。对于不同网络学习社区,在认可用户在社区平台发布的原创内容其著作权均归用户本人所有的前提下,各社区的“版权处理”有所不同。例如,雪球的社区规则中关于“知识产权与版权处理”明确表示,“用户在雪球发布内容时即默认雪球官方拥有免费的、不可撤销的、非独家使用许可权……雪球有权将该内容用于雪球各种形态的产品和服务上。”同样知乎社区的“知乎协议”中有相似的条款。豆瓣则通过授权合作协议取得相关版权。网络编辑对于什么稿件可以合理使用,是否需要征得作者用户授权需力求审慎,因而是否获得稿件的转载使用权是稿件最后能否选用的重要因素。
2 网络学习社区出版内容筛选评估实现方法
2.1 基于数据分析的筛选评估
用户在网络学习社区内的交互行为都能够被记录和采集,而对用户属性信息和交互信息的分析挖掘是社区网站的重要竞争力之一。网络学习社区中大量用户属性信息、互动关注信息、发布信息、收藏信息、社交行为信息等数据。在稿件质量评估中,网络编辑可基于对与稿件内容关联的数据分析从而来辅助决策,利用对信息数据的挖掘评估稿件质量从而客观筛选稿件。在上述网络学习社区出版内容质量评估体系中,内容价值性、内容认可度、内容传播度3项指标可借助于对组稿稿件相关的社区数据挖掘分析来支持判断决策。
2.1.1 内容价值性
从内容资源的稀缺性来看,同类稿件内容的数量能够在一定程度上反映文章内容的价值。关于某一主题的少量优质文章往往不可替代性强、价值高。若同类内容大量充斥于社区之中,此时若不对内容作进一步剖析,仅将内容输出,则于读者而言,意义并不大。本研究通过对同类内容数量的抓取,以作为组稿内容基本评价要素之一。
2.1.2 内容传播度
网络学习社区上用户的转发、评论等行为促使生产内容在更广泛的受众群体中分享和传播,其内容传播度主要与内容的阅读数、转发(载)数及评论数紧密关联,目前在各社区中可以通过文本挖掘抓取相应数据。
(1)阅读数。阅读数是反映稿件内容热度的重要指标,每当稿件网页被浏览时均会被记录。
(2)转发(载)数。转发行为是网络学习社区中信息传播的主要方式,实现对内容的再次传播。
(3)评论数。评论强调用户读者参与的主动行为,与点赞相比,需用户更为深入的思考并发布自身的见解。用户评论数越多,稿件传播量越高。
2.1.3 内容认可度
网络学习社区中,用户的交互行为反映了其对稿件内容的态度,主要有以下几方面。
(1)赞同数。众多社交平台上均设置类似于“点赞”的功能,引导用户对其认可的内容表达出肯定或赞美的情感。如“
赞”“
”“打赏”等数量越多反映出大量用户对内容质量的认可。通过对“赞同”数的抓取,以作为内容认可度评价主要方面。
(2)评论倾向。社交网络环境下“无跟帖,不新闻”的理念使得屏幕后的读者成为传播中“不沉默的大多数”,社区中评论功能的设置使编辑与读者间的距离缩短。各类观点的碰撞,帮助编辑从更多角度审读稿件内容,本研究以稿件内容的相关评论中正向、负向或中性情绪倾向的占比作为编辑量化评价的重要依据。
(3)收藏数。网络学习社区中用户对其自身感兴趣或认可的信息内容保存起来的行为即社区的收藏功能实现。用户对某一主题的回答(即拟组稿稿件内容)的收藏行为亦可认定为对内容一定程度的认可,因此,通过挖掘抓取稿件内容的收藏数将其作为内容认可度分析要素。
2.2 网络编辑主观经验判断
数据挖掘分析为编辑组构提供了重要依据,在基于数据分析的基础上,网络编辑仍需要从以下几个方面进行主观经验判断。
2.2.1 政策接纳度
网络学习社区出版要严把政治关,组稿过程中对出版导向问题需谨慎处理,避免不合规的内容被采纳。由国家新闻出版广电总局、工业和信息化部在2016年2月发布的《网络出版服务管理规定》中对网络出版物的范围相关内容等已经做出了明确规定,网络编辑应保持敏捷的洞察力,及时发现问题并予以纠正。
2.2.2 内容易读性
易读性考察的是稿件内容是否易被读者理解和接受。网络编辑从稿件整体的逻辑结构框架、语法规范、用词用语等方面综合判读稿件并做出审稿结论,这是文稿采纳与否的重要依据。
2.2.3 内容关联性
关联性能够建立起组稿稿件间的新秩序。对内容关联度的评估主要从3方面入手:稿件间的关联—能否揭示同一主题内容;稿件内容与选题主题的关联—内容是否切题,是否属于选题范围、是否是对选题的阐释和展现等;内容与读者群体间的关联—稿件内容是否与读者需求相契合,甚至激发读者二次传播分享行为。
2.2.4 内容授权与否
除了评估稿件质量是否满足出版要求,对于文章使用权的获得需编辑与作者沟通联系,对于文章的转载、编辑、稿酬等事项达成一致协议,这也是稿件是否采纳使用的决定要素。
整体而言,基于内容热度数据挖掘的稿件组织方法虽然不需网络编辑较大精力参与,聚合热门内容的效率及内容时效性均较高,但可能存在稿件内容的关联性较弱的问题,因此单纯依赖于数据筛选的方法并不完全适合于网络出版。基于人工的稿件筛选方法对网络编辑自身专业素养提出高的要求,需要对选题本身有深入的理解。人工筛选的方式对于新手编辑而言,需不断学习才能较好掌握,从编辑团队的组织效率来看是不利的。但通过数据分析和人工筛选相组合的学习社区出版组稿内容筛选与评估的方法,其筛选出的稿件与选题高度相关且质量优良,是提高网络编辑组稿效率的有效方式。
3 结论
文本数据挖掘方法日臻成熟,本研究提出网络学习社区出版内容质量评估体系,结合大数据处理分析和人工判断的筛选方法,基于对用户交互行为数据的分析,融入网络编辑主观经验辨识,一方面满足读者需求,另一方面从基本内容、传播和认可情况、可获得性等方面进行把关,保障组稿内容质量精良,形成优秀的网络出版物。使编辑在出版内容组织上有系统的指导和评估依据,由计算机辅助完成编辑工作,提高网络出版的内容组织及开发效率。
另外,值得一提的是,在未来网络出版生态演进中,大众用户参与出版内容组织工作的程度会逐渐加深,内容聚合的模式和应用扩展,如类似于豆瓣的豆列、知乎的收藏等均是用户个人对内容资源的筛选重组,但这种形式目前并没有被充分利用或重视。专业编辑如何基于大数据的处理分析在用户个人编辑的基础上深度开发,推进互联网数字内容产业发展,推动网络出版的优化升级值得深入探讨。
参考文献
Errors of omission and their implications for computing scientometric measures in evaluating the publishing productivity and impact of countries
[J].
Internet-Based Review Models for Scientific Knowledge: A Radical Innovation?
[C]//
Emergent phenomena in scientific publishing: A simulation exercise
[J].
Impact of prior electronic publication on manuscript consideration policies of scholarly journals
[J].
Bias and effort in peer review
[J].
Law libraries in hyperspace: A citation analysis of World Wide Web Sites
[EB/OL].[
/
| 〈 |
|
〉 |
