人工智能工具化初期的内容创业机会浅析
编委: 苏磊
关键词:
本文引用格式
郑奇.
人工智能的工具化包括两层含义:首先,人工智能已经能够作为有效的工具为人类服务;其次,作为工具的人工智能在短期内只能是作为工具被人类使用,而不是成为具有自主意识的个体。
为什么最近人工智能围棋出人意料地战胜了人类,人脸识别、语音识别进展巨大,却说人工智能在短期内只能作为工具被人类使用呢?是因为以上进展所基于的深度学习技术的进展来自于数学的突破,基于多层神经网络的机器学习模型,实质是对单个生物神经元的近似模拟,利用强大的计算力不停地尝试使目标函数达到最优解的解决方案。运用深度学习技术的人工智能机器无法真正理解“为什么”,也无法拥有自我意识,它们只能围绕由人类设定的目标函数进行工作。正如《慢思考》的作者特奥•康普诺利在书中所说:“我们必须看清这场信息技术革命的本质:它绝不意味着超级计算机会彻底取代人脑。”
作为工具的人工智能在计算力方面的巨大优势使得它能轻松解决很多人类难以解决的难题,例如快速翻译、识别,甚至简单的写作,棋类游戏也能战胜人类。讯飞语音、今日头条、美图等流行软件都是应用人工智能技术进行成功创业的项目。摩根大通利用AI开发了一款金融合同解析软件,经测试,原先律师和贷款人员每年需要360 000小时才能完成的工作,这款软件只需几秒就能完成。而且,不仅错误率大大降低,重要的是它还从不放假。李开复更是语出惊人:未来五秒以下的工作将全面被人工智能替代!同时,未来十年翻译、简单的新闻报道、保安、销售、客服等领域的人,将约有90%的工作会被人工智能全部或部分取代。
但大多数的人工智能内容创业项目近期都面临着巨大的困境,这是因为在“理解”和“领悟”方面,人工智能和人脑相比还有巨大的差距。因此,怎么利用人工智能的长处来打造一个有价值的工具,我们需要一个框架来进行判断。这个判断框架包含当前基于深度学习的人工智能的能力特征要素和人类需求要素、实施成本要素,然后将三者进行匹配,匹配成功的就是可行的创业方向。本文主要分析人工智能内容创业的诸多方向。
1 人工智能的能力特征
首先,关于人工智能的能力特征,Arend Hintze曾把人工智能分为四个类型:反应机器、有限的记忆、心智理论、自我意识。
1.1 只能分类的系统(ANNs/DL) Classification Only
该级别包含全连接神经网络( fully connected neural network ,FCN),卷积神经网络(convolution network,CNN)和它们之间的各种组合。这些系统把一个高维度矢量作为输入,得到单个结果,一般是对输入矢量的分类。
你可以把这些系统看成无状态函数,意味着它们的行为只是一个针对当前输入的函数。一个热门研究领域—生成模型,就属于该类别。简单来讲,这些系统凭它们自己是十分强大的。
1.2 使用记忆分类的系统Classification with Memory (CM)
这个级别包含“C层”网络中整合的记忆因素。LSTM就是一个例子:记忆单位嵌入在LSTM节点中。其他类似的变形还有,神经图灵机器(NMT)和DeepMind的可微分神经计算机(DNC)。在对行为进行计算时,这些系统会维持状态恒定。
1.3 使用知识分类的系统Classification with Knowledge (CK)
该级别与CM有些相似。但C层网络能获取的信息不是原始内存,而是符号化的知识库(symbolic knowledge base)。事实上Carlos Perez发现了三种符号化整合:①转移学习方式( transfer learning approach);②自上而下方式;③自下而上方式。第一种方式用一个符号化系统作为正则化矩阵(regularizer)。第二种方式在神经表征底层的最上层加入了符号化元素。第三种方式跟这相反,C层网络直接与符号化知识库关联。
1.4 使用有限知识的分类Classification with Imperfect Knowledge (CIK)
在这个级别,系统直接建立在CK之上,但是,它已能够使用不完美的信息做推理。这类系统的代表是Alpha Go,只是Alpha Go采用的不是CK而是CM级别的能力。正如Alpha Go,这类系统能通过与自身的对抗模拟来训练自己。
1.5 能使用有限知识协作分类的系统Collaborative Classification with Imperfect Knowledge (CCIK)
这个级别和Arend Hintze的“心智理论”类别十分近似,多个代理神经网络联合起来解决问题。这些系统被设计来完成多项目标。我们其实可以在对抗网络中运行它的原始版本:与判别器和生成网络一起学习归纳。在博弈论驱动的、能战略战术性解决多重问题的网络上应用该概念,就能得到高度灵活的系统。但是,我们现在还达不到这个水平,前面那些级别仍需要很多研究来完善。
NIPS 2016会议上,LeCun开始使用“预测学习”代替“无监督学习”,在LeCun看来,需要建立基础,我们才能在人工智能方面取得实质性进展。在我们都能够建立“预测基础层”之前,即使添加再多的能力,比如存储器、知识库和合作代理,都是没有用的。
2 人工智能对人类的内容需求的供给水平
2.1 粗浅
关于人类对内容的需求,大约分为学习、消遣这两大类,两大类中每一类又分为若干小类,如刚性学习、业余爱好学习、提升自我的学习、生活问题临时需要的学习等等。内容生产工作的传统,尤其是出版业的传统价值观偏爱经典、高质量、高水平、可读性强、有营养的内容。然而悲哀的是,人工智能由于只发展到CM级别,无法从茫茫内容之海中筛选出高质量内容,正如国家新闻出版广电总局数字出版司冯宏声副司长的观点:“人工智能不是人工智慧。知识之上,是智能与智慧。智能,是人类思维活动的解放,是可共享、可复制、具有一定逻辑性的思维活动能力。人类可以借助机器解放这部分重复性脑力劳动,这就是综合多种学科的人工智能。智慧,是人类探索未知领域的创新,用来发现与创造新的信息、沉淀数据、提炼新的知识,实现人类的进步。智慧,支持人类登上新文明阶段的台阶。”
2.2 局限
最近的研究成果显示,深度学习在图像、语音和自然语言处理等领域获得的突破性进展,为在线视频服务的推荐策略研究提供了基础。通过深度神经网络(Deep Neural Network,DNN)词向量方法,根据视频的媒资信息和用户的历史行为,将视频特征和用户特征映射在高位向量空间,在构建用户正负行为与视频向量的余弦距离模型基础上,筛选过滤对所推荐视频感兴趣的用户群,并通过移动互联网推送,相比随机方法、ContentKNN以及ItemCF等算法,在点击率方面平均分别获得106%、41%和57%的提升。无疑,这样的技术也可以用在其他内容推送上。然而,取得的效果仅仅局限在对用户兴趣的准确把握上,并没有内容质量或者用户能否获得收获等非经济关键指标的提出。
以上信息表明,人工智能技术使得内容推荐在纯经济指标上取得了巨大进步,正如Facebook等平台雇用顶级数学家,用他们的智能来提高广告点击率。但是,并没有任何证据表明,采用人工智能技术推荐的内容对人类学习和社会进步有帮助。
2.3 低级
更进一步,市场上销量最好,经济效益最好的内容往往鱼龙混杂,学习与消遣、金钱甚至虚荣开始混为一谈,低智识社会中,大量的人敢教,更多的人真敢学。尤其是新媒体时代,围绕出版业产生的周边产品如樊登读书会、罗辑思维等依靠贩卖二手知识发家,回过头反噬出版业,今日头条从各大媒体抓取信息进行推送,获得巨大广告收益,反噬新闻业。造成这种现象的根源是因为人类在学习的过程中有一个重大的bug,这就是由认知饥渴、生存危机加上懒惰和迷信权威甚至盲目制造假权威综合而成的盲从。这个bug需要通过长期的批判性思维训练而产生的独立思维能力来消除,而这正是我国教育的短板,因此造就了上述特殊现象在我国更加凸显。与这个bug相伴而生的产品还有各种“神剧”,没有任何营养但是受到追捧,销量超过大多数名著。而这种现象正是人工智能发展中的盲点,目前的人工智能技术会大力推荐此类“受欢迎内容”,助纣为虐。
百度副总裁陆复斌在2016年的百度世界大会上说:“碎片化时代,我们并不缺少高质量内容,尤其不缺少高质量内容生产能力。遗憾的是,优质内容没有触达最适合的用户,而这恰恰是百度的优势所在。”这种明显违反常理的表达是对我国内容生产现状的无所谓,对用户的不负责任。显然百度满足于用户点击率,而不是用户的收获和社会的进步,商业效益和社会效益在人工智能商业化应用上产生巨大的冲突。
2.4 无力
那么对于教育类的出版机构,“智能学习系统”前景如何呢?根据以上研究,对于确定分类的推送一定能取得好的效果,但是学习是更基于兴趣和内容质量的,推荐的准确性对提高成绩所起的作用非常有限。这也说明了为什么这样的系统在实践中并没有很受欢迎。
3 人工智能技术的成本
阿尔法狗用了1 920个CPU和280个GPU,下一场围棋,电费高达3 000美金。对于内容产业这样的“智慧产业”来说,创业成本之高也是难以想象的。极客帮创始人、CSDN总裁蒋涛认为,要投资一家实力不错的人工智能领域企业1亿美金是起价。
4 机会就在身边
面对这样的困局,我们期盼更高层级的技术进步。那么更高级的人工智能技术研发到什么阶段了,能不能进行创业方面的尝试呢?从技术上来说,李开复在ACM图灵奖五十周年中国大会上的观点非常鲜明:“即使插上量子计算的翅膀,深度学习也战胜不了生物大脑”。“人工智能奇点论的推测过于简单和跳跃,在科学上是不成立的。”这也是人工智能业界的共识。日本的智能答题机器人项目已经被放弃,而中国的同类机器人也很难取得超过人类较高水平的高分。由此可以判断,智能答题服务类的创业短期内“不靠谱”。但是更低一层的机会已经被今日头条等占据,那么,还有没有新的方向呢?
根据最新的技术发展,创业可以结合Amazon Echo这类基于环境计算的设备来寻找内容服务方向,即人工智能技术将极大拓展内容需求的新场景,内容生产者为这些场景提供高质量、新形态内容。比如根据易观智库的《中国移动电台市场年度综合报告2016》,作为行业领跑的喜马拉雅,其日活用户渗透率已经高达74.3%,这么好的DAU数据即便放在整个移动互联网领域也是不多见的。随着声控交互时代的到来,纯声控类的APP也会成为普及型的应用场景。正如上海帅醒科技创始人兼CEO张俊认为:“这就是不久的将来,声音将像水和电一样,随取随用,自由流动在每一个人的耳朵和心里。明确的人群和场景、高频应用的可能、进一步侵入住家私车,进而无处不在的潜力、明确的技术和标准门槛,这个故事看来很美好。”
更远期一些,《美丽科学》《4分钟看5500年历史》这类视频产品也将会随着视频投射、裸眼3D等技术的普及化而更具商业价值。游戏化的虚拟世界生存也指日可待,人们在虚拟世界中永生,这将使内容需求产生进一步的爆发性增长。
我们非常欣慰地看到,内容生产者只管把内容打造好,符合各种形态的需求,随着人工智能技术的普及发展,内容的应用场景越来越丰富,新的需求生生不息。“蓦然回首,那人却在灯火阑珊处”,不用去远处寻,机会就在身边。
