程杰高斯code Gausscode创始人兼CEO程杰:旅游大数据应用案例

2017-10-12
字体:
浏览:
文章简介:导读:3月16日,大数据行业应用高峰论坛举行,Gausscode创始人兼CEO程杰在大会上用几个实际案例阐述了他的观点,通过旅游大数据的剖析给大家提示大数据在哪些方面是不变的,是大家永远追求的目标.Gausscode创始人兼CEO程杰以下是发言实录:我是差不多在1月底讲了一个"爱情大数据",今天是讲"旅游大数据".实际上我应用的范围,现在最注重的是"汽车大数据".很多方面尽管应用的很广,像前面大家看到华院他们也是应用相当广泛.但是还有很多核心的方

导读:3月16日,大数据行业应用高峰论坛举行,Gausscode创始人兼CEO程杰在大会上用几个实际案例阐述了他的观点,通过旅游大数据的剖析给大家提示大数据在哪些方面是不变的,是大家永远追求的目标。

Gausscode创始人兼CEO程杰

以下是发言实录:

我是差不多在1月底讲了一个“爱情大数据”,今天是讲“旅游大数据”。实际上我应用的范围,现在最注重的是“汽车大数据”。很多方面尽管应用的很广,像前面大家看到华院他们也是应用相当广泛。但是还有很多核心的方向是不变的,我们要抓住哪些是不变的。

应用方面可以随着需要去变,随着时间去变,随着竞争的态势去变。但是不变的因素是核心竞争能力是不变的,所以今天想通过旅游大数据的剖析给大家提示一下哪些方面是不变的,是大家永远追求的目标。

大数据在商业方面的应用,时间价值是最重要的。经常提到应用,应用里面最难的是什么地方呢?为什么大数据往往开展不起来呢?最大的瓶颈在于数据源的碎片化,以及连接匹配的艰难。连接匹配里面不仅是包括技术上的,有的是安全上的,有的是商业互相诚信水平上的,所以有很多很多的内容。

但是为什么连接匹配的,竟然会成为这样的局面呢?往往是因为“大数据”自大了,它的量是很大,但是它没有结果“数据源”碎片化的问题。我们经常说:“1 1>2”。如果在大数据上面已经不是“1 1”了,所以“量”已经不是一个问题。

但是不同的大数据的“1 1”是相当准的,比如:人文数据可以加上很多的人,可以有很多的信息。但是人文跟行为信息的相加,这个“1 1”是远远大于这两类数据本身能够给你提供的价值。行为的数据里面又分为很多的行为,这些不同的行为数据加起来,又能给你达到一种新的境界,应用是以前达不到的。

所以核心竞争力就在于大家能够想到,是什么样的数据我们必须把它找来,而且把它做一个简单的加法,这个简单加法往往是超过指数级的。

最典型的,我叫作“现代大数据碎片化导致的盲人摸象”。什么意思呢?大家经常会讲“信号和超声比例”,数据的收集是相当有目的性的人为行为,就是我要去收集这个数据。最简单的就是销售、交易数据。所以每一个数据点,如果要去衡量它价值的话,价值的密度是相当高的。

也就是说,同样一个数据可能几个“1”,几个“0”组成的这样的数据,它里面的信息相当大。但是大数据往往收集并不是有很大的应用目的在里面,它有一定的目的,但是其实它应用的目的,往往超过搜集这些数据当时的动机。所以很多的数据点的价值密度相当低,但是量很大,所以使得看上去价值也很大。

我今天会讲到很多“数据连接”的问题。比如:不同渠道的数据连接,不同设备的数据连接,不同时间点上同一个消费者的画像的连接。因为很多,所以我只能选一个方面。所以我选了跨媒体跨设备跨渠道的数据连接的价值。现在消费者使用的媒体很多,但是往往已经离开了我们传统的比较熟悉的媒体——报纸、电视、杂志。

现在用的更多的是手机、网络、社交媒体和视频这些主流的媒体,通过那些数字的媒体和有关的设备来传播信息的。这个价值链在哪里呢?跨很多很多行业。

这里从广播、电视行业到零售、快速消费品、汽车、电信、金融、保险、技术行业,几乎是跨很多行业的一个普遍的现象是什么呢?如果你能够把这些不同的媒体、不同的渠道综合起来使用,做你的广告宣传的话,你能得到的回报是远远超过你用单一的媒体、单一的渠道能够达到的广告效益。从百分之三千多到百分之三百这样的比率,细节我不讲。

在这样一个连接上面,我们要做哪些事呢?其实是两个步骤:一个是前部的,一个是后面。前面最讲究的是数据的连接,后面讲究的,数据的连接在应用的时候要保证一致性。也就是说,通过数据连接,使得本来不连接起来的,时间、设备和媒体曝光的场景都通过数据把它连接了。

所谓的“连接”,也就是说你的内容是一致的。比如:降5%。你不会说这里是5%,这里10%,这里不降价,这里降的比原来还高。所以同样的内容,在过去达不到这种一致性。

一个是由于不同媒体的使用,关注的焦点不一样,另外是不知道这个用户到底是谁。跨了一个渠道、媒体、设备以后,你感到不是原来那个人了。原来可能在某一个媒体里面感到是高价值的用户,我要有特殊的方式和优惠的目标。

但是换了一个设备以后,不是这个人了,感到是低价值。这里是老顾客,那里变成一个新的顾客了。所以不一致的原因是在于数据没有打通,没有连接。所以达到高效的跨设备、跨媒体应用的这种成功的,必须在前端就要做到数据的连接。

这是一个大的目标。

这里我会反复讲到两个公司,这两个公司里面我都是主管数据分析和营销应用的。很多媒体都想跟特定的个人沟通,但是这个“个人”并不是想像的那么容易。个人会有多少信息呢?

随着时间、场景的变化,个人给你的信息是不一样的。比如:在这里某年某月用某个地址买了4个商品,花了550美元。他的名字叫Franny Davis,到这里忽然变成了Franklin。在你的系统里面就搞乱了,你就不知道是谁了。

很多时候不仅是结婚会发生,离婚、换工作、搬家也会发生。所以使得这个人在不同的时间,你始终觉得琢磨不透。造成很大的后果,新顾客还是老顾客你不知道。这个人到底是和另外一个人是一家人,还是两个不相关的人?第三个人,就是说这是高价值的还是低价值的?到底她买了多少?因为如果我这次买的,收集到了算在她的名下,另外买的算在另外一个人的名上,两个人都变成低价值,其实加起来就变成高价值了。

其实这种现象是相当普遍的。

ADARA也是我参与的一个公司,现在差不多有6年的历史,这个方面获得了一个成功,主要是在垂直的行业里面。有很多的航空公司把你从这里飞到那里,有很多的酒店,尤其是现在提到的酒店,都是国际的连锁酒店。也有很多线上旅行社和提供搜寻的网站,还有很多其它的有关旅游方面服务的公司。

碎片化是什么意思呢?作为一个旅行人。一方面,你使用这个航空公司,使用这个酒店经常会换的,一会儿走这边、一会儿走那边。另外即使你常住的酒店和常飞的飞机都是同一个公司的话,你在搜索航班、比较价格的时候,也会在不同的网站上去看。

所以所有的这些行为,其实在数据记录的时候,都是记录不同的数据库,都是不同的人。有的是同样的名字是可以连接在一起,有的是个手机号,有的是个Email地址,有的是匿名的,所以很多东西都混杂在一起很难连接。

ADARA通过差不多三年的努力,联合了全世界差不多80多个公司,而且这些公司不是小的。航空公司里面,美国最大的四家有三家被连起来了,酒店也有很多大家熟悉的品牌,万豪、希尔顿等等。这些数据不是单独的凑在一起,在数据的管理上面ADARA内部必须有防火墙,每一家的公司数据都是单独的。

你可以想像到,有很多的用户是共同的。比如:我用这个航空公司,也用那个航空公司;我用这个航空公司,也用这个酒店等等。ADARA用技术的手段,通过匿名的方法把不同公司的数据点连接在一起。

所以我就知道,比如:你今年飞了10次,一半是非的达美,一半是飞了联合,对于他们来说,他们只看到各自飞了5次,但是对于ADARA是知道飞了10次。而且几次是商旅,买哪家的等都可以查到。

下面讲的是3亿数据点,总的来说已经积累到了差不多几十个亿的数据,这三个亿相对来说是比较稳定的一个数据。每个数据点里面有23条数据,包括你每一次,比如:你到航空公司搜寻“什么时候走,什么时候回,从哪儿走到哪儿去,一个人走还是几个人走,是一等仓还是经济仓”这些数据实时的到ADARA的服务器,然后产生有价值的服务。

这个大数据是怎么样的?每一个数据的价值在哪个位置,能动性把它实现商业价值。有一个点不在里面,我讲一下,每一天我们的服务器在全世界组里,不包括中国,中国还没有。

全世界组里是15个亿的各种各类广告实时的竞拍这样一个机会,也就是说我们知道一个消费者在什么时间,在一个网站出现,这时候可以有一个跟他广告对接的机会。

这个机会送到我们是100毫秒的机会反应,其实只有50毫秒再加上网站的延迟。我们从3亿里面找到,找到以后还要知道这是商旅还是一般休闲旅行的人,一般去的是哪些目的地,用的什么酒店,然后根据这个广告的位置确定,这个广告让哪一家公司做。

是给万豪酒店做还是希尔顿酒店做等,决定以后我们要提出一个价格,要出多少钱竞争得到广告交流的位置。所有的这些东西都是几十个毫秒,所以大量的数据、快速的反应,能够把这些平时积累的数据洞察反映到一个广告决策上。

在差不多十五亿里面,一般每一天选择是3400万个广告。这3400万广告的影响方,影响很多很多人,90万的人在一天里面是在飞,有7千万个人,他们在有各种各样的事件搜寻或者是定票或者是飞行,有1800万人在准备他们下一次去哪里旅游,所以很多很多的信息在里面。最简单的数据连接了以后,我们达到了一个什么洞察呢?这个洞察就是这几件事情之间的顺序。

消费者在寻找旅游的时候跟购买其它的东西一样,有几个阶段。每个阶段做一个不同的事情,这个时候作为营销者要获取不同的数据做出最好的沟通。这里面有发现、梦想、找寻,然后做深入研究,到最后的比较价格、比较方便、比较内容,到最后的定票、定房、定车。

这些阶段里面都有很详细的内容,而这些内容应用又使得我们知道,我们必须要有这样的数据。而我们谈的瓶颈,就在于这些数据不在你的手里。你有一部分,人家有一部分,怎么能够打通。

有了这些数据之后,我们要全时数据洞察、展现,而且要全时沟通。用更多的媒体,各种媒体的目的达到的效率也是不一样的,也需要数据全面和一致性,才能够使得这些东西按照你逻辑的安排一步一步的进入消费者心理的考虑。

这里有一个简单的例子,有一个注册公司,他想通过ADARA的服务能够提升他的受众覆盖面,让更多的人知道它销售促销的活动,也让更多的人能够反映而且转换过来,去定他的车。这里面最重要的事情,就是我们跟Facebook结合起来。

问题是什么呢?他怎么旅游的?什么时候旅游,去哪里,几个人去?这些Facebook里面没有。这里连接相当困难,通过手机、其它的方面,还要保持始终数据是匿名的。通过这个连接,达到了几个效果。

第一个,就是有一个竞争量。就是说在很多的受众层面,如果你不用Facebook,光是用这些传统的网站包括谷歌、雅虎其它的一些网站,我们能够在短期内接触到33万个有目标的受众。但是在Facebook里面,基本上有10万个受众只出现在Facebook里面。

当然,不是说他们不出现在其它媒体,是其它媒体很难找到他们,在Facebook里面比较容易找到,因为他们花的时间比较多。所以找寻到了差不多30%的增加的目标受众这样的覆盖面。

第二个是什么呢?不光是受众,受众只不过是听你讲话而已,你希望他们响应。在其它的媒体里面我们得到1369人点击了广告做决定,在Facebook做295个做了点击。比例是差不多的,也就是说差不多是0.3%的人做了响应,但是这些也是有提升的。

第三个很重要的是什么呢?有多少人最后买你的东西了?真的是由于你在Facebook上或者其它媒体上做了广告点击就考虑了,就定了这个车。Facebook上的贡献是275,其它的媒体是783,这里面的比率相对来说就很震撼。你看前面是295个点击的,有275个就定车了;而783是从很大的一部分点击的人里面有这样的一个行为。

总结一下,我刚才说的一加一要大于二。大数据并没有解决这个问题,因为大数据是同类数据积累,而不是不同类数据积累。或者是就算是不同类的数据积累,他们也没有连接。因为没有连接,大家知道云聚变是必须要连接才能发生一些作用。这里也是,1 1要找出好的物质结合起来产生新的物质、产生新的能量。我总结了几个方面:

1.第一方和第三方数据连接。

第一方就是自己的客户,第三方数据就是有关这些客户在外部的行为。比如:银联可能告诉你他的信用卡支付在哪个方面,电信可能告诉你他们的媒体行为。

2.第三方和第三方数据的加强。

比如:有手机的经纬度移动数据,电影的买票数据,很多都是第三方数据,它们不直接用在汽车、不直接用在零售。

3.第一方和第一方数据连接。

这是最困难,也是最有价值的。也就是说,这全部是顾客数据。这种连接是最困难的,而往往最困难的地方,你的回报也是最高的。这方面的连接,已经形成了一个力量。这个力量就使我们会有一个大数据市场,大数据市场允许大家用各种的方式,至少透明,我有什么样的数据。

大家的考虑在于有这么多数据以后,怎么从介绍里面看到机会。这个机会就是这个数据加上另外一个数据,能够形成新的能量,所有的数据单独的都不能够发出这样的效率。今天我就讲这样一个比较永恒的,比较稳定的在大数据聚变的情况下不变的真理。