科技与出版,2017, 36(6): 80-82
doi: 10.16510/j.cnki.kjycb.2017.06.024
浅谈大数据在出版社的应用思路
闫翔
中国文联出版社,100125,北京
 
【摘要】  大数据在我国已经得到越来越多的应用,对出版社的影响日渐体现。文章介绍大数据产业在我国的发展,分析出版社拥有的数据类型,提出出版社应用大数据的思路。
【关键词】  大数据 ; 出版社 ; 应用思路

【Abstract】 

近年来,大数据一词越来越多地被提及,人们用它来描述和定义海量数据,并命名与之相关的技术发展与创新。它曾经上过《纽约时报》《华尔街日报》等知名媒体的专栏封面,也进入过政要的学习内容中,现在更成为各行各业提升自身实力、科学决策、进行新一轮竞争的必备要素。出版行业同样也不可避免地受到了大数据的影响,这必然会促使出版社的工作方式和工作内容发生改变。

1 大数据产业在我国的发展

大数据业务在我国受到普遍关注大约是在2009年前后,典型的产品和服务开始逐渐出现。大数据业务首先是在互联网企业率先应用和落地的。在这个时期,大数据一词已经被大多数人所知,但相当一部分人并不知道大数据要做什么,如何做。2012—2013年,大数据业务开始快速发展,越来越多的人开始关注大数据业务,产品越来越多,应用领域也越来越多,资本关注度逐渐升温,拥有数据的企业逐渐明白了数据的重要性,但应用、产品的同质化在增强,进入这个领域的厂商越来越多。2014年以后,大数据的应用快速发展,市场规模越来越大,新的商业模式不断出现,大数据在多个细分、专业领域有了越来越深入的应用,比如在教育、交通、消费、健康、金融等领域,成果也越来越多,同时,大数据也开始深入到普通民众的日常生活中。

2015年,我国制定了“互联网+”行动计划,大数据出现在文件中多个业务板块中;我国提出要编制软件及大数据产业“十三五”发展规划,大数据产业第一次明确出现在规划中;我国明确提出要加快推进云计算与大数据标准体系建设,发布了《关于运用大数据加强对市场主题服务和监管的若干意见》,出台了《关于积极推进“互联网+”行动的指导意见》,印发了《促进大数据发展行动纲要》。2016年,继国家发改委印发了《关于组织实施促进大数据发展重大工程的通知》后,环保部、国务院办公厅、国土资源部、国家林业局、煤工委、交通运输部、农业部均推出大数据发展意见和方案……大数据政策从全面、总体规划逐渐朝各大产业、各细分领域延伸,大数据产业发展也在逐步从理论研究走向实际应用之路。[1]

2 出版社拥有的数据类型

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对有意义的数据进行专业化处理。换言之,大数据处理的核心在于找到有意义的数据,在于对有意义数据的处理,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。因此,对于出版社来说,数据量即使达不到海量的级别,但是只要有意义的数据达到一定的量级,那么出版社就可以使用大数据技术进行分析。

出版社拥有什么样的数据呢?简单地说,可以分为两大类:内容数据和业务数据。

内容数据就是出版社拥有的有效信息网络传播权的文字、图片、音频、视频等,它们多数是来自出版社的出版物中。经过近几年数字出版工作的持续开展,多数出版社已经对历年或近几年生产的出版物的内容进行了数字化加工,产生了大量的、不同层级的碎片内容,形成了一个或多个,可以达到拥有几百万条记录、甚至更多条记录的数据库。有的出版社已经对这些数字内容进行梳理,使用知识体系对其进行标引和关联,并开始使用自然语言分析等技术进行数据挖掘。

业务数据是指出版社在业务工作中产生的数据,包括与出版物的策划、生产、销售、使用等活动有关的各种数据。这一类数据包含的内容非常多,既有与选题策划相关的竞品数据、学术数据等,也有与商品销售有关的营销数据、发货数据等。这一类型的数据有一部分是在出版社日常工作中产生的,它会随着出版社的日常经营活动不断产生,数据量会越来越大;同时,另外一部分数据会随着社会的发展和变化不断产生和变化,数据量和内容都会发生变化。出版社日常经营产生的数据是出版社拥有的核心数据,比如选题数据、作者信息、生产流程数据、图书信息数据、经销商销售数据、用户使用数据、用户评价数据等,这些数据是出版社真正自己掌握的数据,也是无法通过其他渠道获得的数据。[2]

3 出版社应用大数据的思路
3.1 改变认识

大数据环境下,出版社需要重新理解一些认识。在传统的认识中,出版社具有特色鲜明的核心业务和核心产品。在目前的情况下,大数据已经推动出版社内部在相关技术、生产流程、渠道平台、网络等方面进行融合,使其在资源分布、产品形态、商业模式等方面出现了许多新特点,和某些相关行业的界限也日渐模糊。大数据不仅是一种技术,更是一种解决思路、产业模式、运作理念、发展战略。

长期以来,出版社由于生产产品类型的特殊性,更多的是对内容的关注,对数据的关注度并不高,从ERP近几年才在出版社得到普及应用这一现象就可以印证这一情况。在需要进行决策的时候,出版社更多地依赖从业人员的信息敏感度,即使是对数据的搜集、数据的研究、数据的提炼等,也基本上是依赖人工手段来进行。而且,对于数据的应用领域也多局限于选题策划等几个有限环节中,并不能在全部生产过程中使用,更谈不上具备完备的、科学的信息采集、整理、筛选与分析体系了。

现在,出版社已经开始了数字化转型,信息系统的使用已经在出版社中得到普及,但与其他行业相比,对数据重要性的认识程度还有待提高。同时,由于大数据技术在出版行业中的应用成果与其他成熟学科相比还较少,以及大数据技术应用及出版舆情的分析起步较晚,目前还未能聚焦出版领域或相关出版事件的发展动态和趋势。目前的应用主要还是集中在营销环节,对其他环节,包括决策环节的支持还相对较少,有些研究甚至还是以理论分析为主,并未形成真实的应用。因此,出版社对数据的认识,对大数据的应用都存在一定的认识误区,有必要改变认识,加强应用研究。

同时,出版社也要认清大数据的使用功效,因为大数据有其自身的局限性,出版社的某些特质是大数据难以替代和复制的,且当下出版业的一些问题、症结也并非引入大数据后就能迎刃而解。

3.2 注重数据的采集

大数据应用的前提是要有数据,否则大数据应用的基础就不存在了。因此,要想大数据能够在出版社得到应用,数据的采集与存储必然先进行。然而目前的情形是,出版社面临的主要问题是信息不全、数据缺失以及相应的权利缺失。

对前面提到的两大类数据而言,内容数据在出版社一直以图书的形式存在,现在多数出版社已经开始进行纸质图书数字化,形成了历年的图书内容数据,形成了一些数据库;有的出版社甚至开始从内容生产的源头进行内容数字化,这样也使内容数据的采集与存储更加方便。在这个方面,出版社更需要注意的是数据权利的采集,权利的缺失可能是目前出版社面临的最大问题。对内容数据而言,权利是伴随数据使用而言的,权利的缺失也会导致内容数据不能再次使用。因此,出版社需要通过合同尽可能把相关权利进行采集,以方便内容数据的使用。

对于业务数据,出版社缺失的就比较厉害了,出版社的图书出版信息、图书销售信息等有可能就是不齐全、不完整的,当然就更不会有齐全的互联网数据,包括选题信息、用户反馈信息等数据。这里既有出版社自身实力的问题,也有相关企业不愿意分享的原因。在没有ERP系统的时候,出版社内部对于图书出版信息、图书销售数据的收集是非常困难的。目前多数出版社已经使用ERP等内部管理系统,这些系统对于出版社采集自身内部的图书出版信息、图书销售信息有很大的帮助,只要自身内部的制度建设到位并执行得力,出版社自己认真对待这些数据的获取与存储,这些数据的获得已经变得相对简单了。然而对于外部业务数据,获取的难度就比较大了。外部的企业会把这一部分信息中的核心数据当作是自己企业的机密对待,想要全部获得不太可能。因此,出版社既要抓住机会通过其他企业获得数据,也要通过行业内的数据系统获取数据,更要通过社会化系统获得外部业务数据。[3]

3.3 注重数据的使用

有了数据作基础,大数据应用就可以开展了。如果数据只存不使用,那么数据就失去了价值,即使数据有再大的价值也变得无意义了。出版社的大数据应用主要集中在选题策划、生产制作、营销推广、经营决策等方面。

在选题策划过程中,出版社既可以通过互联网等手段发布信息、征集选题,也可以通过数据为选题策划提供支撑,比如通过对读者阅读行为数据的采集和分析,掌握读者阅读行为的趋势和偏好,挖掘用户需求,进行趋势预判,获得更加精准的策划方案,这对出版社预测读者阅读兴趣、改进用户体验、优化营销策略等方面具有很大的意义。[2]

在生产制作过程中,既可以通过大数据技术,丰富传播的载体方式,加速内容信息的传播,同时也可以改变、丰富、完善加工、生产模式,让流程变为可控、可精准描述的流程,让编辑规则变为统一有序,让产品更具有个性化。比如编校过程可以充分运用大数据技术对内容进行辅助审核,帮助出版社实现部分内容的智能审核,并且随着数据的不断充实,内容审核的精准率会越来越高。

在营销推广过程中,出版社既可以使用越来越多的社交手段来丰富自己的营销推广手段,也可以使用大数据技术来增加与读者的互动、满足用户的个性化需求、提升阅读体验。比如出版社可以通过大数据技术与二维码的结合,在数据分析的基础上,根据用户需求实现信息内容的智能筛选和自动集成,可根据用户的阅读偏好、职业信息和专业领域等数据,合理确定阅读载体,实现内容信息的按需推送,提升个性化内容的比例,增强用户获取信息的便利性。

在经营决策过程中,改变过去多数依靠脑力进行决策的形式,使用数据分析作为决策的基础,让决策变得可见可读,更加心中有数。

虽然大数据应用前景广阔,但也应看到存在的风险,在正确使用大数据并获益的情况下,如何保障数据安全和数据真实性,合理规避隐私泄露等带来的危害,对于出版社来说是同等重要的。

总之,大数据时代的到来,推动着出版业向前发展,它会从技术角度深层次影响出版工作,让出版也享受技术发展带来的红利。

参考文献

[1] 中投顾问. “十三五”数据中国建设蓄势待发 [EB/OL]. [2017-04-02]..
URL    
[本文引用:1]
[2] 佚名. 大数据出版若干问题探析[J]. 编辑之友,2016(8):12-18.
[本文引用:2]
[3] 常帅. 大数据时代编辑流程中的信息采集研究[D].北京北京印刷学院2016.
[本文引用:1]
资源
PDF下载数    
RichHTML 浏览数    
摘要点击数    

分享
导出

相关文章:
关键词(key words)
大数据
出版社
应用思路


作者
闫翔