科技与出版, 2017, 36(12): 96-100 doi: 10.16510/j.cnki.kjycb.2017.12.026

数字无限

大数据出版视域下的电子书盈利模式分析*

秦艳华, 孙琳, 段泽宁

北京师范大学新闻传播学院,100875,北京

编委: 苏磊

摘要

大数据出版时代的电子书市场主体呈多元化趋势。本文以京东为例,梳理其在数据发掘与知识服务领域中的创新性盈利模式。基于数据绘制“读者脸谱”考察京东推出的内容消费与知识服务,透过产业链深度参与探究京东塑造的出版生态系统。电商平台作为一支独立力量,为我国电子书出版经营提供全新思路,但也应客观认识到,现有盈利模式存在数据依赖过度、跨平台使用障碍与文化品位欠佳等问题。

关键词: 大数据出版 ; 电子书 ; 盈利模式 ; 电商平台

PDF (2292KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

秦艳华, 孙琳, 段泽宁. 大数据出版视域下的电子书盈利模式分析*. 科技与出版[J], 2017, 36(12): 96-100 doi:10.16510/j.cnki.kjycb.2017.12.026

早在2009年,“大数据”就引起了学界、业界的广泛关注。但直到2011年,学者Davenport和Kim才将“大数据”界定为“大量非结构化数据聚合”,并将人机互动产生的非结构性、多结构性数据,例如使用网页程序、社交媒体而产生的数据,也纳入研究领域之中。此时虽有学理性概念出现,但学者们并未进一步挖掘“数字化”与“数据化”的核心差异。这一现象投射至出版领域造成了“数字出版”与“大数据出版”概念的混淆。

直到2012年12月,学者维克托·迈尔·舍恩伯格在《大数据时代》一书中才提出了“大数据出版”的定义,即“将(纸质书本)内容转化为可为计算机识别并进行运算的信息,构建大型内容数据库,以实现对库内文本的深度挖掘和分析[1]”。国内学者张振宇、周莉则将大数据出版视为一种动态过程,是“将海量的出版物转化为可制表分析的量化形式,并通过建立数据库使信息产生相关关系的过程[2]”。

大数据出版以数据为核心生产要素。首先,充分肯定数据资源的价值,建设种类繁多、内容丰富的数据库;其次,从单一的产品售卖行为转向知识服务,通过深度参与产业的各大环节重塑现存的产业生态系统。

自20世纪末,电子书就成了学界关注的热点。以2002年为节点,研究初期(自美国第一代电子阅读器出现至2002年),学者多从技术装置角度对电子书开展研究;而当下的国外学者进一步丰富了电子书的内涵,即用传统的电子书(e-book,electronic book,digital book)来指代内容产品,用阅读设备(reading device)或载体(container,carrier)、手持设备(handheld device)、专用电子阅读器(dedicated e-book reader)等词来考查其硬件产品。除此之外,伴随着手机的普及,又延伸出“e-book reader software”来特指阅读软件。因此,本文从当代电子书的内涵层面出发,考查电子书内容制作、专用电子阅读器及客户端软件三重层面上的盈利模式创新。

据媒体报道,2014年,京东所占的图书市场份额已超过亚马逊(中国),位居行业第二。如今,京东依旧保持着良好的发展态势,已经成长为拥有200万种图书音像产品,累计服务3 000万用户的强大图书销售平台。在借鉴以亚马逊(Kindle)为代表的欧美先进经营模式与产品服务的基础之上,京东运用“大数据”思维,在电子书生产经营的不同层面都实现了创新,为我国其他平台商探索大数据背景下的电子书新兴盈利模式提供了思路。

京东的电子书盈利涵盖产品与服务两大方面。其中产品盈利包括电子书内容盈利与硬件载体盈利两大渠道,而服务盈利则涵盖数据资源挖掘与相应软件开发。因此,本文将从以下几方面对京东展开分析。

1 大数据思维指导下的内容消费模式探索

1.1 自出版模式的开发

“自出版”(Self-publishing)是指图书或者其他形式的出版物在没有第三方出版商参与的情况下由作者自行出版的新兴出版业态[3],按照成果形式可分为电子图书“自出版”和印刷图书“自出版”两种形态。

2007年前后,美国开始出现“网络自出版”。而中国的网络自出版可分为两大阶段:以网络文学出版为代表的自发阶段、以京东为代表的电商平台试水阶段。京东于2014年3月试水“自出版”领域,推出《大卫•贝克汉姆》一书。与传统出版流程不同,此次选题决策完全建立在对京东1 700万名用户数据的分析基础之上。策划人员以读者的兴趣和偏好为数据搜集目标,考查用户搜索、购买、评价等行为,绘制出“读者图谱”“专业图谱”以及“兴趣图谱”,从而判断出读者的潜在需求,将非结构化数据最终转化为实际购买行为。这一过程充分体现了大数据在出版市场分众化应用中的巨大潜力。京东通过提供自出版服务,既可以从产业源头控制内容制造,又可以对先前的客户数据进行二次挖掘,从而指导早期的选题策划活动,实现按需生产,缓解库存压力,满足长尾市场需求。

1.2 云阅读式图书馆建设

早期的电子书消费主要表现为图书购买,无形之中提高了消费的门槛,降低了读者的阅读意愿。因此,国外大型阅读服务网站例如Oyster、Scribd等都新增了图书借阅服务,以较低的价格满足消费者的阅读需求。电商平台虽有意尝试新型销售模式,但苦于缺乏必要的技术支持,电子图书馆构建工程被暂时搁置。

自2008年以来,“云计算”“云安全”“云存储”等词汇屡屡见报,基于“云端”发展的数字出版将是接下来的产业发展趋势,而云阅读式图书馆则是“云端”产业的基础性建设。在产业搭建过程中,大数据提供海量的“数据库”资源,云计算则充当操作系统提供技术支持。自带“互联网基因”的京东凭借其数据优势、技术支撑,开拓了盈利新渠道。

2014年,国际出版业巨头亚马逊公司通过对已有的图书数据资源进行整合,推出“Kindle Unlimited”电子书订阅服务。京东则采用阅读充值卡形式开展这项服务。购买“畅读卡”后,在一定期限内读者可自由阅读下载各类图书。不同于Kindle,京东电子书采用更为普及的电子书格式,一定程度缓解读者转换格式的困扰;同时,由于京东初步构建了相对独立的阅读生态系统,较之亚马逊,京东所有的生态系统兼容性更强。读者只需购买一次即可在电脑、手机、平板电脑以及京东阅读APP等多端口实现同步阅读,随时随地享受借阅服务,且不受副本量的限制。即使图书到期,只要登录账号仍可翻阅自己的图书笔记。在开发图书借阅市场之际,京东培养了潜在用户群体,同时也增强了既有用户的使用黏度。

2 大数据思维指导下的知识服务盈利模式探索

较之数字出版,大数据出版更加注重知识服务的提供与产品附加值的开发。首先,电商开始转变自身的经营思路,将数据视为核心商业资源并实现多层次开发;其次,电商以知识体系为产业发展逻辑,将其盈利重心由传统内容消费转向知识服务这一新兴的产品形态。

2.1 读者阅读行为大数据的挖掘与共享

在传统出版时代,决策的制定主要依靠出版人员的经验之谈。当下的出版业可利用大数据的预测功能,做出依托于数据分析的客观决策。通过考查整个出版流程不难发现,从内容制作、发行营销、实际消费到最后的信息反馈,各个环节都存在大量的数据,而其中最为重要的当属读者阅读行为数据,挖掘其潜在价值可从根本上改变出版业的盈利模式。

较之国内同类电商平台,京东拥有更为丰富的数据来源。随着京东在2016年推出京东阅读器(JDRead),它初步搭建了自己的用户行为数据网络,即通过阅读器、网页两大渠道来获知读者“主动”或“被动”的阅读行为数据。

在“被动信息”的采集层面,京东效仿Kindle的“Whisperync”功能收集阅读信息(阅读内容、阅读速度、符号标记、偏爱的阅读时段以及阅读完成度),同时利用京东商城中的图书频道收集读者网页浏览数据,构建本土化的读者行为数据库。

京东还通过邀请读者对图书进行评分捕捉读者的“主动信息”。亚马逊账号通过绑定社交媒体账号在一定程度上提供了分享阅读经验的机会,但这一经验极易被社交账号的动态信息所淹没。京东实现了该领域的突破。2014年,它与拇指阅读展开合作,利用拇指阅读的强社交性增强用户黏度。不同于简单的商品评价,拇指阅读可为用户提供书摘、书评、书单及交友功能。读者不再处于被动接受地位。京东电子书与拇指阅读的跨平台合作开创了一种新的经营模式。首先,拇指阅读将读者阅读的全过程分解为寻找、获取、阅读、交流互动等行为,弥补了京东用户体验的不足,实现了对读者的阅读行为的全程解构与数据提取。其次,通过引入社交因素,增强读者的参与度,进而提升用户对电商平台的黏性,培养购买习惯,实现既有用户资源的转化。现如今,京东已全面收购拇指阅读,在该团队的指导下进一步打造自有阅读品牌。

挖掘读者阅读行为的浅层意义在于指导具体的电子书营销、售卖活动,而其深层意义则在于构建数据平台并为出版产业或第三方提供预测性建议。例如,国内的Readmoo平台通过统计读者的阅读活动发布专业年度报告,而国外则催生了Nielsen BookScan等专业化数据公司。数据报告不仅能够帮助业界厘清行业发展的基本情况,了解用户需求和用户习惯,也便于研究者发现产业发展存在的问题,从而提出相应的对策。

2.2 手机应用软件的开发与应用

《第十三次全国国民阅读调查报告》显示,数字阅读发展迅速。2015年,数字阅读首次超过纸质阅读,日均时长首超1小时,成年国民手机阅读率高达60.0%,移动阅读、社交阅读成为未来的发展趋势。因此开发手机端阅读应用软件成为电商的创新赢利点。

首先,作为电商的京东在手机应用软件植入方面具有天然优势。仅需注册一个账号,读者便可实现电脑、手机端口间的随意切换,完成购买、支付、下载、阅读、收藏等一系列操作行为,并可实时同步书架信息。其次,手机阅读APP利用手机的媒介特性获得受众青睐。例如,利用手机的全媒体性,它可提供有声读物,满足受众的多感官需求;凭借手机的便捷性与全时性增强用户黏度,进而扩大电商的品牌效应;发挥手机的社交属性,实现大规模的评论分析与链接转发,实现低成本营销。

“京东阅读”APP体现了以上优势。《中国网民阅读大数据》显示,使用京东APP的读者平均每天阅读5次电子书,累积阅读时间为30分钟,70%阅读用户活跃在6点至23点,阅读行为主要发生于通勤途中。京东阅读APP迎合了读者碎片化阅读习惯,不仅巩固了阅读器使用者,满足其多媒介使用需求,更有利于开发潜在客户,实现客户资源迁移。

“京东阅读”APP顺应了电商社区化转型潮流,将社交元素与阅读活动相融合,借鉴“微博大V”与“豆瓣群组”模式,开办虚拟图书社区。手机读者打开书友的个人页面,可以看到书友的书评、笔记、已读和想读书目,并可以链接至他的个人微博、豆瓣、邮箱等社交页面,同时支持一键转发书评至朋友圈,实现读书感悟的实时分享。同时,它还开设阅读“朋友圈”实现草根阅读明星的生产制造。不同于以往的显性图书推荐,“京东阅读”APP依赖网络社群力量与用户互动,此类社会化推荐方式更能打动读者。

3 以平台商为主导的生态系统构建

大数据时代,市场主体呈现多元化趋势,可分为技术提供商、数据提供商、内容提供商、电商或社交媒体。

以出版社为代表的内容提供商在早期占据优势地位,随着互联网的普及与电子商务的发展,其他三类主体均取得长足发展。现有的技术提供商、数据提供商仍将主要精力置于产业技术领域,尚未打通内容与技术的壁垒。而电商已由配合者上升为经营主体,成为一支新兴发展力量。由于京东拥有数据库并涉足阅读器的生产与销售,因此它扮演了电商、技术提供商和数据提供商三重角色。

早期,国内经销商试图采用以阅读器为中心的Kindle模式,即以电子阅读器为核心,向上联系传统的内容提供商(作者、出版社、报社、杂志社等),横向沟通中游的虚拟运营商(亚马逊等),向下连接具体的硬件产品和内容消费者。国内的汉王、盛大文学旗下的Bambook等平台均尝试了“硬件+交易平台+内容销售”的垂直整合模式,但效果却不尽如人意。其根源在于该模式必须建立在成熟的电子书库和健全的销售渠道之上。而我国的电子书产业尚处于起步阶段,相关的制造、版权、销售和服务问题都未解决。

因此,京东依据我国电子出版业现状,对亚马逊模式进行了适度取舍,制定了符合国情的发展目标,即以数据为核心生产要素,通过对出版环节的层层渗透,初步构建出以其为主导的数据出版生态系统,推进了产业链条延伸模式向生态系统构建的转变进程。

在内容生产领域,京东利用阅读终端数据(京东商城网页、手机APP、京东阅读器)划定读者群,凭借自有平台直接出版图书或转让数据信息协助出版社开展图书定制业务;在销售领域,利用自身数据库,实现图书的精准营销与第三方广告推送;在用户服务领域,作为商家京东不仅拥有更为直接的用户反馈,更凭借其手机APP,将其互动扩展至日常生活阅读活动。

通过细化产业链分工,京东在充分发挥自身主体优势的前提下,与出版社密切联系。例如,京东与青岛出版集团进行深度合作,将现有的文化资源优势与广阔的电商销售渠道相融合,借助电商特有的数据资源,追踪用户行为,寻找数据间的关联,进而构建数据模型,指导生产经营活动,获得高额利润。

此种模式可使三方受益:作为内容生产者,可利用平台的高访问量以及大客户群为自己新增便捷的销售渠道;作为平台,则可扩大常规图书储备量,同时扩展内容品种,满足长尾市场;作为读者,通过浏览网页,即可按照自身需求购买不同的阅读产品。选择空间的增加和消费流程的简化进一步鼓励了读者的自主购买行为。

4 现有盈利模式不足之处

虽然大数据出版为电子书产业乃至整个出版业界都带来了新的机遇,但现行的经营模式仍有许多问题亟待解决。

4.1 过度依赖大数据决策,读者需求得不到切实满足

虽然拖马斯•克伦普在《数字人类学》一书中曾有这样的论断:数字的本质是人,数据挖掘就是在分析人类族群自身。但由于算法局限,大数据存在可信度问题。现有的个性化推荐方式主要表现为以下4种类型:①基于相似用户历史行为做出的图书推荐;②基于用户个人行为做出的兴趣推荐;③互补性组合搭配推荐;④人际社交关系推荐。

以上推荐方式存在不小的误差,致使读者需求得不到切实满足。首先,随着时间推移,个人品位和生活经验的变化将导致用户的阅读喜好发生变化,即使原先有效的数据信息也不再能为其商业购书行为提供依据。其次,读者对于特定类型书籍的消费需求存在上限,频繁推荐高同质化图书并不能满足读者需求,甚至会造成逆反情绪。最后,与常识相反,推荐精度并非越高越好,用户更倾向准确度稍低的推荐方式,既满足读者的认同度又可保护其隐私。以上种种问题都对现行算法提出了更高的要求。

4.2 电子书格式纷繁多样,难以实现跨平台经营

由于电子书市场经营主体众多,且各大经营主体往往出于版权保护等目的设置专属格式,致使电子书格式混乱,为读者带来极大不便,限制了电子书内容的使用和传播。同时,电子书生产厂商也不得不雇佣专业人员进行维护,加大了生产成本,不利于长远发展。

电子书格式既包括内容格式,也包括信息推荐格式。对于信息推荐格式而言,电子书“元数据”标准系统尚不完善,无法形成健全的信息搜集网络。元数据是描述出版物特征,协助消费者发现、获取图书的数据信息。图书名称、作者、内容摘要、出版日期、书号ISBN是元数据的典型代表。图书元数据完整度可在认知层面直接影响消费者决策行为。对于“元数据”的信息采集,目前各经营主体往往依据自身需求,采取自定义的方式制定元数据标准。不规范的元数据框架阻碍了各环节信息的无缝对接,延缓了出版产业的信息化进程。同名异义、同义异名、属性不一、分类不同是其常见问题。以国内主流图书销售网站京东、当当、亚马逊为例,仅图书分类一项就存在巨大差异。如果出版业无法建立统一的标准化体系,跨平台经营将难以实现。

4.3 过度的商品化可能会带来具有文化属性的书籍品位下降

出版产品本身具有双重属性,即经济性与文化性。大数据时代下,出版商和电子经销商更偏重经济属性,忽视文化属性,最明显的标志是“畅销书”这一概念的产生。对文本的评价标准不在于其思想性,而在于销售情况。对受众兴趣的过度迎合,形成偏重消遣阅读而非严肃阅读的出版导向。

伴随新媒体空间的崛起,阅读行为更多地指向了对于信息的追赶与抓取,即大数据时代所强调“信息抓取能力”,强调高“食速”而非高“品质”。例如,纯文学书籍凭借其语言风格和叙事结构的创新为学界推崇,但可能因文字晦涩为网络读者所忽视,致使书籍的专业性和市场性不可避免地产生冲突。如学者Daniel Allington发现《失落的传承》在亚马逊和专业学者之间出现了口碑两极分化的现象,从而引发学者担忧,以读者喜好为唯一导向将危害文化的健康发展。

5 结语

虽然大数据出版存在不少隐患,但不得不承认,其已经形成一股时代浪潮,重构了出版业的产业格局。作为数据出版的先行者与推动者,京东虽已开创了多项“大数据”盈利方式,但仍缺乏深度挖掘与系统运作,未来的数据盈利之路仍处于探索阶段。

本研究成果系国家新闻出版广电总局首批新闻出版业科技与标准重点实验室“新闻出版大数据用户行为跟踪与分析实验室”及“出版发行行业数据应用实验室”建设研究成果之一。

参考文献

维克托•迈尔•舍恩伯格. 大数据时代[M]. 周涛.杭州浙江人民出版社2013104,106,109,110,112.

[本文引用: 1]

张振宇周莉

“大数据出版”的理念、方法及发展路径

[J]. 出版发行研究,2015(1):14-17.

[本文引用: 1]

刘蒙之.

美国图书出版业“自出版”现象初探

[J]. 编辑之友,2012(7):123-125.

[本文引用: 1]

王宁.

数据决胜未来:京东自出版模式对传统出版企业的启示

[J]. 出版发行研究,2015(9):31-34.

万安伦郑伟陶然.

2016中国网民数字阅读终端调查

[J]. 中国编辑,2016(4):28-37.

央视新闻频道.

中国网民阅读大数据

[EB/OL].(2014-04-24)[2017-03-18]. .

URL    

托马斯•克伦普. 数字人类学[M]. 郑元者. 北京中央编译出版社200728.

Allington D.

Power to the reader or degradation of literary taste? Professional critics and Amazon customers as reviewers of The Inheritance of Loss

[J]. Language and Literature,201625(3):254-278.

肖倩董占山张聪.

图书类电子商务网站上的个性化推荐应用研究

[J]. 科技与出版,2014(8):94-97.

张新新.

新闻出版业大数据应用的思索与展望

[J].科技与出版,2016(1):4-8.

于志涛韦文杰.

大数据时代传统出版企业与电商平台的融合策略研究:以青岛出版集团为例

[J]. 科技与出版,2015(9):29-32.

于志涛韦文杰.

大数据时代数字出版产业链的变革与重构

[J]. 科技与出版,2016(2):76-79.

中国新闻出版研究院.

第十三次全国国民阅读调查主要发现

[EB/OL].(2016-04-20)[2017-03-18]. .

URL    

/