科技与出版, 2017, 36(12): 101-104 doi: 10.16510/j.cnki.kjycb.2017.12.027

数字无限

大数据时代图书生产与UGC联姻研究*

李宁1), 姚丽2), 陈兵3)

1)安徽科技学院新闻与传播学系,233100,安徽滁州

2)复旦大学中国语言文学系,200433,上海

3)武汉大学信息管理学院,430072,武汉

编委: 彭远红

摘要

针对当前图书生产领域竞争加剧的现状,以大数据与UGC产业发展为契机,将大数据与UGC研究引入图书生产领域,系统分析图书生产与UGC联姻的可能、动因,并在此基础上探索了大数据与UGC结合的现实路径。

关键词: 大数据 ; 图书生产 ; UGC

PDF (2283KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

李宁, 姚丽, 陈兵. 大数据时代图书生产与UGC联姻研究*. 科技与出版[J], 2017, 36(12): 101-104 doi:10.16510/j.cnki.kjycb.2017.12.027

1 UGC的内涵

UGC(user generated content,用户生成内容)是一种相对于PGC(professional generated content,专业生成内容)的概念,指用户将自己原创的内容,如文字、图片、音频、视频等,通过互联网平台进行展示或者提供给其他用户[1]。世界经济合作与发展组织(OECD)在2007年的报告中综合性地提出它的3个特征:①在互联网上共享内容;②此内容具有一定的创新性;③非专业人员或权威人士创作。除此以外,本文探讨的UGC还包括用户基本信息(用户个人基础信息和注册信息)以及用户行为信息(用户写作过程信息、点击、浏览、查询以及阅读信息)。

2 大数据时代图书生产与UGC联姻的可能

大数据时代,海量信息持续累积,其中有相当一部分信息是用户自主制造的。这些信息表达了用户真实的想法和需求,越来越多的组织机构开始将UGC与自身所处领域结合,这些看似碎片化的信息的价值逐步得到了开发和利用。百度文库、豆瓣、知乎等一批现象级UGC产品喷涌而出,各种成功案例也为笔者思考UGC与图书生产的结合带来了契机。当然,任何一种新事物的产生不仅需要适应时代的需求,还要接受时代的考验,在与时代的磨合当中,或多或少会出现问题,图书生产与UGC联姻也不例外。只有解决了图书生产与UGC联姻存在的现实问题,消除其结合的障碍,它们的联姻才能成为现实。那么图书生产与UGC联姻究竟会有哪些迫在眉睫的问题呢?笔者总结下来,主要有隐私问题、知识产权问题、冗余信息等几大突出问题。

2.1 隐私

很多时候用户的网上活动属于个人隐私的一部分,作为用户本人可能并不希望被网站自动追踪,或者将其创作的内容公开,这样不仅侵犯了用户的隐私,也可能使得用户丧失创作积极性,并在内容创作过程中趋向保守或者隐藏自身真实想法。大数据的真正价值在于其数据信息的真实,在于其真切反映用户现实。只有公众隐私得到了较好的保障,只有公众打消“互联网时代人人都在裸奔”的顾虑,认可UGC是公众真实想法的自然流露,其数据才更具开发价值,与各行各业的结合、实践才更具指导意义。

2.2 知识产权

用户制作出来的内容被他人转载或占为己有,将会极大地打击用户创造内容的积极性,进而影响整个UGC产业的健康有序发展[2]。大数据时代,信息以数字形式分散存储于各地服务器上,内容复制更加便捷。此外,媒介互联、即时互通的当代社会信息环境也为内容信息最大限度传播提供了便捷条件。加之用户生产的内容在很大程度上是公开的,且很多情况下用户与内容承载平台之间产权不明晰,国内网络知识产权法律建设相对滞后,凡此种种使得UGC知识产权问题在当前环境下显得尤为突出。图书生产过程中版权或者知识产权涉及出版企业核心利益,至关重要。因此图书生产若想和UGC较好的结合,UGC知识产权问题需要更加妥善合理的对待和解决。

2.3 冗余信息

大数据时代海量信息纷繁复杂、良莠不齐。UGC数据固然有其有价值的部分,但也囊括了众多不良信息、错误信息等。这些冗余信息加大了UGC数据开发与利用的难度,并带来了一定的风险。UGC环境下部分用户在虚拟空间中过于低俗化、暴力化的表达在污染网络文化环境的同时也在不自觉地创造低俗的文化环境,使得UGC读者阅读品味在潜移默化中变迁并间接影响未来图书文化。而一些错误信息一旦被图书选题策划部门收集并当做未来选题策划依据时,将会导致出版单位对市场走向研判失误,产生严重后果。

上述问题在UGC与图书生产深入融合的过程中起着至关重要的作用,而归根结底,这些问题的出现与当前UGC模式不够成熟,与之相适应的环境建设、规章制度建设相对滞后有莫大关系,这为我们后期更好地服务于UGC产业提供了思路。

3 大数据时代图书生产与UGC联姻的动因

3.1 技术变革

媒介技术的发展和移动终端的普及使得实时互联互通成为可能,随之催生的各类互联网平台迅速崛起,为各类用户提供了自由创作的平台。用户借助各类平台发布的各类文字、图片、音视频信息,随着时间推移,其数据体量逐步增加。随着大数据时代的到来,与大数据相关的大数据技术也得到了长足的发展,借助于数据采集、存储、管理、挖掘以及可视化分析技术数据中含有的洞见和价值得到更好的呈现。而大数据中“要全体不要抽样”的数据处理方式在处理UGC数据的过程中能够更全面地挖掘用户需求,洞见客观现实,引入图书生产领域以后能够使出版机构更好地把握市场图书走向和读者需求并进一步推动图书生产领域的变革,促进传统图书生产模式的转型升级。

3.2 用户需求

后转制时代的出版企业运营机制更加灵活,市场体制更加健全,参与市场竞争的积极性、主动性得到了充分调动,书业市场竞争加剧。此外,随着互联网以及智能移动终端的普及,普通大众获取知识信息的渠道更加多元,部分传统图书市场受到蚕食。用户需求也从传统的获取知识、培养技能、礼品收藏扩展到自助出书、个性化定制等诸多领域,在图书的生产过程中用户的积极性、主动性得到了前所未有的提高。国内原创文学平台起点中文网的一些连载作者在这方面曾经在这方面做了尝试,连载作者发起投票或根据读者留言来撰写后续故事的情节和人物的命运,赋予读者前所未有的权限。传统出版社也开始涉足,2013年中信出版社推出的电子书“中国故事”,由一个个普通人的故事组稿,大众直接参与书籍的选题和创作过程,该系列在市场上获得不错的业绩和口碑。上述用户需求的发掘,除了出版机构工作人员敏锐的洞察力以外,大数据与UGC功不可没。随着大数据技术的深入发展,UGC内容将得到更加全面细致的分析,更多潜在的用户需求将逐步浮出水面。

3.3 形象建构

在图书生产过程中充分挖掘UGC的潜在价值对于出版机构形象建构具有很大助益。UGC用户在内容创作和共享的过程中,通常会根据各自的好奇心和兴趣作出不同的选择,并更加愿意参与一些自身有浓厚兴趣或者正在试图了解的主题和活动,在利他主义、外部奖励以及互惠性等综合因素的影响下产生自我效能,在此基础上产生归属感,并对关联组织产生责任感和义务[3]。在借助于大数据技术对大量UGC内容深入分析的基础上,我们的图书生产活动能够最大限度地“贴近实际、贴近群众、贴近生活”,能够在内容、心理和情感上与UGC用户产生共鸣,进而为出版机构或出版物树立良好形象。此外,研究显示,大多数的消费者都认为社会化媒体发布的内容和品牌官网的内容具有相同的可信度,UGC深刻影响着人们获取信息和决策的方式,并对用户的消费决策也产生直接或间接影响[4]。出于组织责任和义务以及归属感,UGC用户发出的对于出版机构及其出版物的正面积极评价将会在网络上形成口碑营销效应,为出版机构树立良好的品牌效应,并进一步对其他用户的购买行为产生积极影响。

4 大数据时代图书生产与UGC联姻的路径

随着UGC开发利用的逐步深入,传统各个领域在引入UGC以后发生了深刻变化,形成了新的业态。传统的知识百科与UGC联姻成就了维基百科、百度知道,传统的在线视频与UGC联姻成就了Youtube、优酷,传统的书评、影评与UGC联姻成就了豆瓣评分。然而,纵观国内外书业发展现状,传统的图书生产与UGC联姻又将形成什么新的业态,其结合路径总结起来大致可分为以下几点。

4.1 预判市场走向

出版企业对于书业市场走向的研判关乎企业的生存与发展,在任何一个出版机构都是尤为重要的。传统出版时代,为把握书业市场走向,出版企业紧密追踪社会热点的同时还不需断派遣团队赴国内外各大综合性、专业性书展参观、参展,奔赴各大书城实地考察,力求通过细致的观察调研获取市场先机。如今这些工作在借助于大数据技术对UGC内容深入分析的基础上得到了部分的替代。通过数字挖掘和语义分析技术,对关联UGC内容进行深入分析,进而形成一系列用户关注度最高的“高频词”“共同主题”,这些高频词和共同主题在一定程度上反映了用户一段时间内关注点和需求点,而这些关注点和需求点能够在一定程度上反映未来书业市场走向。由于UGC数据是一定范围内的全部数据,其在反映市场走向方面比相关工作人员较为小范围的主观观察和经验所得更为客观和真切。

4.2 提供选题思路

作为图书生产的首要环节,选题策划的重要性不言而喻,其质量的好坏直接决定着图书未来的命运。传统出版时代,选题多来自策划编辑自身的洞察和经验,判断准确,适销对路则图书未来成功概率很大,一旦判断失误则图书未来命运堪忧。而洞察与经验缺乏可量化指标,在实际操作过程中很难加以明确。部分企业借助于相关调研数据进行辅助判断,由于调研方法、指标、样本等方面的限制,其可靠性也需进一步商榷。然而,大数据的出现正在潜移默化地改变这一切,出版社渐渐“从对市场调研数据的重视转变到对大数据的积累、挖掘与分析运用。” [5] 。借助于数据挖掘与语义分析技术,UGC数据中与图书市场相关的信息得以被最大限度的发掘,为图书的选题策划提供可靠参考。如2011年MSN上线的MSNNOW数字出版项目,在对各大网站,如Twitter、Breaking News、Facebook等的数据信息进行分析的前提下,根据分类单位识别热度话题,再由团队策划将热门词汇组织编写成百字左右的话题故事,一度受到市场追捧[6]

4.3 满足个性需求

虽然当前国内书业市场竞争激烈,市场细分已经深入少数群体,但是受用户数量、购买力、集散程度、收益预期等方面的影响,对于部分用户的个性化需求传统出版机构仍然难以充分满足,甚至于没有发觉用户需求。然而随着大数据时代的到来,这一现象逐步得到了改观,个性化的用户需求正逐步得到满足。UGC中的用户需求得到了全方位的扫描和重视,从博客书、到微信书、微博书,再到个人文集、宝宝成长记录等各类自助出版业务遍地开花。小群体用户需求也同样得到了照顾。例如2014年世界杯之际,京东图书事业部在充分分析京东图书销售数据和用户消费行为的同时,深度挖掘用户需求的基础上推出了“京东出版”品牌的第一本重磅新书—《大卫•贝克汉姆》(由京东和新世界出版社合作出版),标志着京东图书定制化时代的到来。该书正式面世以后迅速在球迷圈儿热传,在贝克汉姆球迷社区,该书被粉丝列为必看之作。

4.4 提供实时反馈

目前,国内以Bilibili、Acfun等为代表的弹幕视频网站,通过弹幕技术,可以提供给观众一个在线互动的平台。弹幕的内容是用户根据观看视频时产生的即时心情或者感受所发表的内容,不仅其他人可以看到进行在线互动,视频制作方更是可以通过弹幕获得更多的用户生成内容。这些内容是用户看到视频后最直接最快速最真实的反馈信息。同样,如果将弹幕与图书生产嫁接,在电子图书中接入弹幕,读者可以通过弹幕表达正在读的图书内容的想法或者提出问题,与在线读者进行思想交流。而这些内容都是出版社、书店或者作者最有价值的反馈信息。相关网站可以利用大数据技术,对用户弹幕所产生的内容进行分析,了解读者最感兴趣的情节、最有争议的部分等,为图书线下出版或者再次选题策划提供讯息。除此之外,用户弹幕内容还可以被引用到图书当中,产生适应需求的丰富内容,不仅能增强读者的参与感,还能满足用户的需求。

4.5 助力精准营销

依托用户注册信息,充分分析用户购买和浏览行为的精准营销活动,在国内外发展的已经相对成熟。我们在亚马逊上买过一本书之后,当你再次打开亚马逊时,就会给你推荐给你同类书籍。如当你买了一本《编辑人的世界》,它就会给你推荐《老猫学出版》《编辑力》等同类型图书。很多网站都会有类似的情况,并通过“排行榜”“畅销榜”“热门搜索”“为你推荐”“评分最高”“你的朋友在看”“你可能会喜欢”等多种形式向用户推荐其可能会感兴趣的内容。毫无疑问,这些精准的营销推荐都来自己UGC数据的深度挖掘和分析,并根据分析结果为用户量身打造个人定制版的合理推送方案。

5 结语

传统的图书生产遵循二八定律,即20%的客户带来80%的收益,放弃另外80%的客户。然而在大数据时代,更注重长尾理论,处于长尾部分的80%的用户也至关重要,他们生活在各种各样虚拟的、现实的社区,每个人都会牵动周围的一个圈子,传播的信息量极大,放弃了一个用户等于放弃了一群用户。面对日益加剧的书业市场竞争与挑战,充分利用用户生产内容,发掘其潜在价值并应用于图书生产,才能更多地发现用户需求,开辟真正的书业蓝海。虽然当前图书生产与UGC的结合尚处在探索阶段,但从长远来看二者的结合有其必然性和合理性所在。

基金项目:安徽省高校人文社科重点项目《出版业数字化转型中的科技与文化融合现状及发展趋势研究》(SK2016A002)。

参考文献

张一涵.

阐UGC之内涵 探UGC之应用:《新一代互联网环境下用户生成内容的研究与应用》评介

[J]. 图书情报工作,2014(20):145-148.

[本文引用: 1]

邓晓磊.

“用户生产内容”与传统出版

[J]. 出版参考,2012(12):14-15.

[本文引用: 1]

赵宇翔朱庆华.

Web2.0环境下影响用户生成内容的主要动因研究

[J]. 中国图书馆学报,2009(5):107-116.

[本文引用: 1]

Rowley J.

Remodelling marketing communications in an internet environment

[J]. Internet Research,2001, 11(3): 203-212.

[本文引用: 1]

闫伟华.

大数据分析与畅销书选题的精准策划

[J].编辑之友,2015(6):5-9.

[本文引用: 1]

谢誉元冯炜.

“互联网+”对出版行业发展的影响及对策

[J]. 编辑之友,2015(10):26-30.

[本文引用: 1]

/