在阿里IT深入采访第一天中,阿里人提到最多的两件事:一是长腿欧巴李敏镐,二是马云最近一封内部邮件。3月8日,李敏镐空降杭州银泰将手机淘宝三八节的火热推向顶点;而马云的内部信件则明确了阿里的未来战略:以走向激活生产力为目的的DT(data technology)数据时代。
阿里的大数据图景
阿里的未来将由“云计算+大数据”组成。阿里正在建设一个大数据环境,让数据变成工程,围绕数据提供一整套的精细化服务。云计算使中小企业可以在阿里云上获得数据存储、数据处理服务,也可以构建自己的数据应用。阿里的大数据开放之后,线上线下的数据能够串联起来,所有人都是数据提供方,也是数据的使用者。
马云已经在整个数据应用上确定了两个方针,第一从IT到DT,从管理、控制到点燃和激发,DT就是点燃整个数据和激发整个数据的力量,被社会所用,被销售所用,为制造业所用,为消费者信用所用。第二个让阿里巴巴的数据、让阿里巴巴本身今天所有做的这些工具能够成为中国商业的基础设施,能够成为整个中国经济变革的正能量。
在阿里数据平台事业部的服务器上,攒下了超过100PB已处理过的数据,约等于1.04亿个GB,相当于4万个西雅图中央图书馆,580亿本藏书。淘宝和天猫每天会产生丰富多样的数据,阿里巴巴已经沉淀了包括交易、金融、SNS、地图、生活服务等多种类型的数据。这些数据相互关联或产生巨大的能量。
阿里大数据类型最丰富的应用是什么?在小微金融企业融资领域,由于银行无法掌握小微企业真实的经营数据,不仅导致很多企业无法拿到贷款,还因为数据类型的不足导致整个判断流程过长,阿里已经通过交易、信用、SNS等多种数据来决定是否可以发放贷款,发放多少。贷款申请人像在ATM机上取款一样,一提交货款的申请时,即时就能获贷、支用,整个流程在网上实现。
对于马云所提到“云+端”到底什么含义?阿里巴巴集团商业智能部副总裁、数据委员会会长车品觉解释:云有两个很大的功能,一个是他的计算能力,一个是他的储存能力。端是终端,手机、PC、可穿戴设备。能不能利用云的计算能力与储存能力,快速计算到端去用,非常考验云的计算能力跟储存能力。如果我们做了一个数据模型,猜到一个人在他现在行为里面,有人用了他的手机,但是用这个手机的人并不是他的。在这种情况下,能不能停止他的手机使用。就是实时能从计算得知的。但是端到云的时候,他是收集及时的数据给到云那边,让云那边能够存储关于判断刚才这件事情的能力,所以端到云、云到端的数据是流动的。端的能力在于收集,云的能力在于计算存储,是一种循环。
阿里大数据开放面临的两大问题
小微金服集团首席风险官胡晓明总结阿里目前大数据开放必须解决2个问题。第一,必须要给全球的数据开发者一个数据的工作平台,阿里分布式的存储平台和在这个平台上的算法工具,足够形成数据开发。第二还没有做好数据的脱敏,把数据的商业定义,每个标签打得足够清晰,能够让全球的数据开发者在阿里巴巴平台展开数据思维,让数据为政府所用、消费者所用、行业所用,这一点阿里还没准备好。
数据分析师车品觉对数据开放的态度是:阿里如果认可一个BU,他首先要数据开放,首先去谈这个项目的时候,必须要上报给到数据的安全小组。安全小组就会有安全的专家开始去看案例的本身是不是合理的开放,而且有没有侵犯个人的隐私以及商务的隐私。有时候虽然包括了表面上没有侵犯隐私,但是后面出现了侵犯隐私也不会给他开放的,所以我们要数据安全小组一起参与。我们会把这些案例积累在档案里面,当时我们的判断是因为这样,为什么我要判断不给,将来这种可能都成为案例,为判断做积累。
车品觉还提出了自己思考的大数据十诫:认为当下大数据有十点最需要考虑:1、好的问题,答案就在里面。2在实践中提炼数据。3让数据变成Technology,Enable更多人。4让数据跟着“人”走。5木有数据质量,神马都是浮云。6以假设数据都能获取去思考问题。7大数据安全,不是监管。8利用数据拿到更有用的数据。9建立数据的数据,才有进步。10让人做人擅长的事,让机器做机器擅长做的事。
大数据将带来四个巨大改变
比较有趣的是,在首届西湖品学大数据峰会上,小微金服集团首席风险官胡晓明并没有针对金融领域详谈大数据应用,而是分享了对大数据的宏观思考。他发现大数据带来四个巨大改变:
第一,当数据出现以后,市场经济和计划经济之间,哪个是对的,哪个是错的?在亚当斯密或者金融学这个时代,是没有数据的,没有人的行为数据,没有社会的数据,没有资金流的数据。但是,今天有了数据以后,很多经济学的一些基础理论甚至可能会被修正,原来我们所有的在商业行为当中,都是有了先生产或者先制造才会有销售行为,但今天有了互联网,我们产生了先有销售行为,才会有制造行为,他会影响到整个供应链。
第二,数据没有大小之分,数据只有是否被商业认知之分。很多人对阿里巴巴的数据垂涎欲滴,认为有大数据以后才能做。当年带领团队做小微企业信贷,我们去看消费者信用的时候,所有的金融从业者都在笑话我们。但是通过整体的大数据,已经为70多万家小微企业贷了款,整体贷款累积量是1800亿,没有见面,包括西藏的、新疆的,山东的、云南的,用的就是数据,尽管没见见面,但是我们的风险率和不良率比商业银行还要低,而且我们今天是没有抵押和担保的。我们在分析很多消费者的金融行为,目的只有一个,让数据能够产生商业价值。
第三,阿里巴巴对数据的未来看法是:要让数据激发它的活力,让数据成为一种信仰,让数据发挥它的商业价值。
第四,是关于数据的消费者的隐私保密问题。随着互联网的开放性,特别是移动互联网,数据、个人的隐私性数据,你的身份证、电话号码,你的相关的数据,甚至连密码都可能存在泄露。在数据不再隐私的情况下,怎么去保护消费者的整个资金安全、帐户安全,我们在研究这个课题。
阿里的大数据是否也有自己的困惑?集团副总裁叶鹏:面对每天产生的巨大的量,我们的心情第一是感到很欣慰,因为我们具备了那么多的数据。第二我们也感到很敬畏,因为我们真的不知道,这个当中蕴含着什么,这个当中价值怎么挖掘。
阿里巴巴平台上面,平均有超过1亿的消费者,几亿的商品数,上千万的商家。他们之间的互动,他们之间的行为、交易,是无价之宝,可以帮助商家更好地提供服务于商品。网站上面纸尿裤的销量某一个区域如果婴儿的纸尿裤量上升了,那么肯定是婴儿的出生率比较好,但是从另外一个角度讲,如果一个区域老年型的纸尿裤量逐步上升,就说明这个区域实际上已经开始步入老龄化了。站在更宏观的角度来看,很多数据实际上是可以提供很多社会和经济的价值的。包括对产业有指导意义。
作者:张宇婷