加入收藏 | 设为首页 |

拼多多陈磊:你在哪,要做什么,都将不是秘密

隐私 时间:2019-01-20 浏览:
在这里场景驱动服务,服务带来了用户,用户带来了数据,数据经过AI和计算能力的处理,优化用户体验,而体验又带来了新的用户增长。 然后他就去搭建一个平台,提

拼多多陈磊:你在哪,要做什么,都将不是秘密

内容来源2019年1月18-20日,在2019极客公园创新大会上,拼多多CTO陈磊做了以“流量时代的“分布式AI 与零售新增长”主题分享。

封图设计& 责编| 丽丽

活动笔记人工智能

本文新鲜度:★★★★★口感:口味干果

机器的学习速度高于人类?

未来,机器之间是如何沟通的?

2018年以来,“技术落地”成为人工智能领域讨论的热词。

在诸多应用场景中,电商平台拥有不同人群、地域、维度的消费数据,是AI天然可以发挥作用的主流场景之一。

从搜索式购物、效率型购物再到逛街式购物,用户消费习惯在改变,基于社交的应用场景变得更加重要。

新消费时代,电商平台该如何利用AI,有效实现技术赋能?

在2019极客公园创新大会上,拼多多CTO陈磊提及了“分布式AI”。

传统互联网平台更多采用“集中式AI”,即把所有数据汇聚,通过算法从数据里找到一定的模式,为单体消费者服务。

这种方式却面临着一些困境,比如用户对数据缺乏控制能力,数据所有权问题不够明晰等。

通过分布式AI技术,能够实现公有数据对所有用户开放,算法变得更加开源,可供所有用户监督。

这就相当于每个个体用户拥有了专属的智能代理。整个数据的决策控制逻辑将会重构。

陈磊说,未来云计算将成为像水电煤一样的公共事业部,这就使得用户重新获得了对决策的主导权。

作为技术驱动的电商平台,拼多多利用AI技术分析用户习惯,提高消费者与商品的匹配效率,实现“货找人”的AI电商应用场景。

对于拼多多的发展,陈磊表示,未来要花更多精力优化技术细节,更大层面依靠分布式AI策略。

以下是拼多多CTO陈磊的演讲实录:

大的创业场景每隔五年就会出现一次。

从2000年以来,线上商业场景一直聚焦在搜索之上,有人会说搜索场景就是“人找货”(人通过搜索的方式,去寻找自己想要的商品)

电商行业本质上就是“流量×转化率=销售额GMV”。

在这个公式下,人被简单的抽象成数字和流量,平台如果需要更多的流量,就要盘更多的货,铺更多的线上线下渠道。

自从2004年和2011年,Facebook和微信先后诞生以来,互联网的整体思维方式产生了非常明显的变化。

基于社交的商业场景不断崛起,依赖搜索进行的交易比重不断下降,本质上是因为移动互联网和社交网络的兴起。

一、整个行业会朝着后流量时代过渡

当消费者的时间以碎片化的形势呈现,兴趣就变得更加随机了。

从原本带有很强的目的性去参与搜索、进行购物,变成了兴趣使然,在碎片化的时间,在逛的过程引发了兴趣,产生了购物行为,这是一种新的使用场景。

在这种场景下,传播模式发生改变,整个行业会朝着后流量时代过渡。

在这个转变过程中,技术作为第一生产力会发生根本性的革命。

拼多多作为一家零售企业,也在不停的探索,寻找如何利用最新的技术服务消费者,提供更加匹配的服务模式,找到新的增长点。

今天的大数据流量平台由几个部分组成。

第一部分:场景。即有一个使用场景,这个场景里面有用户,用户在场景里面进行活动,然后产生数据。

因为有海量的数据聚集起来,就在平台里形成了大数据的数据仓库。通过定型的计算能力和AI算法,我们可以在数据中寻找规律。

在这里场景驱动服务,服务带来了用户,用户带来了数据,数据经过AI和计算能力的处理,优化用户体验,而体验又带来了新的用户增长。

比如,一个创业者忽然发现一个场景不错(打车、外卖、电商),消费人群非常明确,有非常具体的需求.

然后他就去搭建一个平台,提供一个服务,用户进来享受服务的同时,留下了数据轨迹,产生了数据,平台收集到这些数据就会建立几套算法,来优化产品体验。

所以,用户的数量越多,使用的时间越长,数据的积累就越丰富,后台的算法在不同的数量级上,算法的复杂程度、能力有本质的区别.

所以,算法在不断提升,消费者的体验也会更好。

换句话说,在这种模式下,大家拼的就是数据手机能力和规模,效率越高、规模越大,企业的竞争力就越强。

在庞大的数据驱动下,很多公司是试图创造一个无所不能的AI,记录每一个用户的行为模式,然后圈定模型,进行算法分析,再把分析结果返回给每个消费者。

大量用户的多维度数据记录下来后,我们就能对其过往的生活轨迹、消费轨迹、出行轨迹、衣食住行等全场景的喜好进行全面分析,能为整个零售体系提供底层的数据支持。

对于企业来说,用户已经不是单一个体,而是由多个表现组成的画像,或者是一个高维的向量。

对用户来说,企业提供的服务,比用户自我了解更精准。

最经典的就是Google CEO说过的一句话:

通过大数据的AI,我们不仅知道你在哪里,我们还在知道你要去哪儿,想要干什么。

这句话听起来很美好,但我们也看到这两年大数据的平台都会遇到一系列问题,我们来分析一下。

智能设备的数据搜集能力在不停增长,同时也意味着可能暴露更多的隐私。

开发一个APP,你在搜集数据的同时,所要承担的责任就会越来越大。

用户要求有服务,但又不能暴露他的隐私。

过去,云计算是2B的业务,是提供给企业来使用的,但如果去看过去20年或30年,整个计算框架,最早是主机,然后是小型机、服务器,服务器就进一步抽象成了虚拟机,到现在的容器服务。

现在最流行的趋势是,技术本身不需要配置服务器、存储、网络,纯粹就是一个逻辑。

你把逻辑上传到云端它就能实时计算,意味着未来云计算不是一个2B的业务,而是一个2C的业务,就是每一个个体,都可以去抓一段开源的代码,然后在网上为自己搭建一套个性化的服务。

这与刚刚前面说的,通过把大家的数据收集起来,中央进行计算就有很大的区别。

我们再看用户,现在就知道服务很了解他们,但是我不知道它为什么是这样,而且我也不知道这种了解是应用在了正确的场合,还是用在了不正确的地方。

当用户感觉对数据缺乏自主权,数据的所有权不明细,那么数据到底是归谁所有?是归用户还是互联网企业?

大家会在欧洲和美国看到,越来越多的法律在试图做这方面的界定,对互联网企业有越来越多的限制。

二、机器的深度学习能力能够超越人

大家都知道深度学习很强大,在人脸识别、语音识别方面甚至可以超越人的性能.

但也有很多问题,深度学习为什么是这样,是一个端到端的方案,中间的逻辑为什么是这样,里面是不是存在着一些不合理的因素,很难分析出来。

面对消费者多样性的消费需求,你用一个固定的模型,即使是一个深度模型去做,也很难判断到底是不是合理的。

我们的未来预期是什么?我们想到了所谓的分布式AI,在未来每一个用户个体,配备有专署的AI算法、计算资源,将会成为一个趋势。

你可以利用现成的算法,去搭建一套自己服务的体系,我们称之为“AI的代理”。

当我们输出自己的数据给这个代理后,就会自动匹配私有数据和公有数据,集成到一个AI算法里,并通过调用云资源技术计算,去产生一个满足消费者需求的结果。

在处理过程中,保证完全封闭和隐私,并不需要和大家进行交互的过程。

未来所有算法、数据和AI都能独立地展现给每个消费者,每个人都可以利用自己私有的数据,通过自己希望的方式来获得你希望的结果。

这也就意味着,整个数据和决策的控制逻辑会有一个根本性的改变,消费者在场景里可以更多的支配场景数据,深度优化决策。

三、云计算未来不是2B的业务

而是2C的业务

所以,云计算未来不是2B的业务,而是2C的业务。

每一个个体都可以去调用云资源,做一些优化我个体体验的计算。

就像水电煤一样,未来我可以输出我这个月用了多少的云计算做了哪些事情,会有一个账单,这是我们的未来。

用户重新获得了对自身服务行为的决策权利,相当于他有权利去决策我做的各种推荐、搜索结果,以便满足其真正的需求,而不是像现在这样被动的接受。

数据本身会有一个明显的分割,即公有数据和私有数据会有一个切割,公有数据意味着所有人都可以访问,是公开透明的。

私有数据是每个人自己保存,会有一个非常严密的容器保存这些数据。

从AI算法方面来说,将来算法需要给个体调用,我预期未来越来越多的AI算法会是开源的,然后公众可审核,将会更加安全和公平。

现在大数据强大的原因是它需要整合数亿人的数据,去看沟通的模式,最后再去演算。

如果每个人的数据自己保存,互相之间不透露,那么有一个问题,比如我们看深度学习的前提条件就是要有足够的样本,那怎么解决这个问题?

每一个人都有自己的数据,他并不知道自己数据的个性和共性之间的差异,怎么办?

我们有一个超前的想法,想像一下未来有一个智能代理程序,它为你做智能决策,保护你的私有数据,但同时也会和其它智能代理程序沟通,就和人一样。

比如我们去买东西,会问朋友什么东西好,最近什么东西比较流行,什么衣服比较适合我。

这是人和人之间的沟通,这种沟通的效率非常低,因为人的语言比特率非常低。

那么,未来能不能有这样一个智能算法程序?程序和程序之间可以进行通信,就好像今天的互联网、手机、电脑之间其实也是在通信,只是通信的并不是模型,而是存的数据。

我们理解未来这种智能代理人可以通过信息的交换,扩展自己的能力,通过和别的代理进行沟通,扩展自己的能力以及决策的能力。

比如,你看到一款商品上写着好友多次购买、好友好评的标签时,就会提升你的信任感和判断准确性。

所以,这种分布式AI能够帮助人以群分的消费群,以更加方便的方式互相学习,降低决策成本提高交易的效率。

当有这种分布式代理时,我们不仅能够优化个体的体验,我们甚至能够反向去优化、制造,就相当于C2M这种优化的目标。

举个例子,冬天到了,我们要买羽绒服,可能会有50个工厂生产羽绒服。

他们可能会准备半年的时间生产服装投入到市场,有一些好卖有一些不好卖。

最后就实现了优胜劣汰,但是也就意味着50家里面有1个成功了,有了利润,有49家有大量的积压、资源的浪费。