李曦大数据 高峰话题三:大数据对数据中心架构的新挑战
主持人:大数据很多是来自视频,不知道视频对数据的挖掘,尤其是安全方面,国家对这方面也是监管很严格的。
吴亚洲:咱们自己的视频还是在采用传统和技术相结合的方式,现在视频是有音频指纹的,但精确的校验还是通过人工的审核,通过几道防控的方法在做。笔触更精确的图象识别,前不久看到有一些公司已经有这方面的突破性的进展,甚至对于每一祯画面里的物品做到更好的识别,这些识别将来会产生非常多的应用领域。
我们认为在大数据,尤其是我之前提到比较喜欢看的是数据分析方面的东西。我觉得其实最大的挑战一个是李总说的结构化、非结构化的数据怎么串起来的问题。
因为大数据在分析领域跟以前相比更多的解决的是相关性分析的问题,相对更多一点,虽然不绝对。之前你的分析更多的是聚焦分析,我在实验室下,我去观察这个样本,我去测它的大小,到多少个微米或者怎么样的级别,大数据更多的是相关性。有一个最基本的问题,我们要问问自己我理解这个数据它是什么含义没有,它们之间的关联是什么。
主持人:数据的属性是什么。
吴亚洲:对,还是一句题外话,据说季羡林去世的时候有人悼念他。其实他讲了一句话,是说年轻的时候相信真理越辨越明,到了人生后半段的时候发现未必如此。就算数据分析来讲,我们到底怎么理解它,这件事也是非常难于说清楚的。
最核心的挑战在于数据的收集、存储、计算。最核心的问题在于你怎么去定义它,你怎么认知它,它是你以为的那样吗?我们做了很多数据的分析,后来反反复复咀嚼这个数据之后,发现一开始的结论跟后来的结论是不一样的,有很多类似的事情发生。最关键的是在这儿,有了这些数据我们是不是认真的分析和对待它,真正的发现它的价值。这应该是我们共同面临的一个挑战。
主持人:因为时间的关系我们最后一个问题,其实数据都有它的DNA,但这DNA是什么,目前每个人的定义不一样。各位能不能对大数据的前景做个展望。
吴亚洲:我们不会因为大数据时代的到来或者云计算时代的到来态度就会发生变化,因为乐视是一个跨界的视频企业。它是造盒子的,现在在预约和采购了,它是要造超级电视的,需要把自己的产权价值放大,多屏应用的企业。从认知论的角度来讲,我们现在还处于对用户的尊重和了解的社会主义的初级阶段。
光有努力是不够的,还有条件成熟的问题。因此,我的展望是大数据也好,云计算也好,它只是工具。我们要更加的去尊重用户,了解用户的习惯,适时、适度的而不过度的为他提供他应该享受到的服务。
这应该是我们乐视人记在内心的宗旨,因此大数据能不能做到这一点,我相信它会贡献很多的价值。我觉得这是大数据和数据分析给乐视未来带来的贡献,否则的话我不需要大数据。
李曦-京东
李曦:大数据最重要的是我们怎么把它的价值释放出来。如果把数据当做是一个金矿的话,大家越来越有共识,确实数据是有价值的。过程中肯定有做工具的人,肯定有去挖金的人,而且还有下游的各个层次的消费者。从我的角度,我觉得首先整个业界应该想一下怎么能够比较安全的在不涉及用户隐私的情况下来开放数据。
京东已经是利用数据做了很多事情,但是人再多也是有限的,而且智慧是无限的。如果把数据开放出来,让大家在这上面做大数据分析,甚至能够给我提供更好的推荐算法,这也能够促进我们的整个大数据分析领域的发展。
因为没有数据你是做不了验证的,做不了机械学习。所以在这方面希望业界有越来越多的共识,能够把数据拿出来,新浪可以把微博的用户信息进行分享,当然是在不侵犯用户隐私的情况下。这是一点。
另外一点,它的推动应该说是由有场景的大数据分析开始。美国有一家公司去年上市的,专门做数据的挖掘,最终的场景是怎么把运维的效率提升。我觉得应该会有越来越多的特殊场景所需要的应用驱动的各种各样垂直的大数据分析的数据出现。最终我是希望大数据就像水电一样,变成云计算那样的计算能力、存储能力,大数据的分析能力也应该是一种服务,也是基于下面数据的开放,做建模做数据挖掘的人怎么做起来。
主持人:让数据会讲话,为每个个人和用户服务。
康楠-联通
康楠:生态链我们处在低端,我认为数据就是车,我们就是高速公路。车越来越多,造成拥堵,我们做的事情一个是使路越来越宽,二是智能管道,也就是说它的调度,数据流的调度是科学合理的,是推向于前端的。包括我们未来可能要规划数据中心间的高速交换网络,这个高速交换网络实际上也是互联网客户帮我们买了单,他们要租用这个,我们顺道把跨省际高速的交换速率公路给建好了。
本身从大数据的角度来说,对于我们未来流量经营方式的转型,因为运营商只能做流量经营的转变,应该说未来是一个非常好的前景,其实就是上网流量贡献的问题。有了大数据,有了大数据的交互,我们流量经营会做的更好。我们先把智能管道搞明白,把它的流量经营模式搞精细,一旦大数据时代到来,我们的数据业务能成把我们原来的传统业务做升级和替换,我们认为就可以了,平滑的升级到了下一代,是高附加值的。
主持人:希望高速度收费站的收费再降一点。
康楠:这个肯定会,因为随着网络技术的发展,尤其是设备制造商技术一旦更迭以后,也是大幅度的下降了设备的投入。未来包括4G和光网络上,传统的IP网上我们都会继续加大投入,使它形成很大的规模效应。我们运营商最擅长的就是规模效应,使它更廉价、更便宜、更有竞争力,保障更到位就可以了。
周林-搜狐
周林:大数据时代现在还缺些什么?刚才童剑也说了一个是安全问题。安全问题、隐私问题其实在大数据时代是必然面临的一个问题。既然是大数据整个行业要起来,那么必须要有一个行业的标准,数据交换的标准,隐私是最基础的安全性的问题。
我们首先应该把隐私相关的安全法规或者是行业法规给制定出来,哪些东西在数据交换中是可以被交换的,哪些不能被交换。从各个公司的大数据分析之外要形成一个单独的大数据行业的话,首先行业相关的法规,数据交换的规则,隐私的保护,价值链的形成,都是需要相对应的法规和行规去规范的。
这是我觉得大数据时代中国还欠缺的一点,现在大家谈的大数据都是自己内部的数据挖掘,而没有达到横向的行业性质的数据时代。
讲到大数据时代的时候,除了行业链条的形成之外,还需要的是大家在整个平台内形成一个比较有层次性的数据的产生方、挖掘方,还有商业价值攫取角色的存在。现在国内各个数据分析平台也好,各种平台也好,都没有把自己的定位和能力发挥出来,也需要在这个行业形成的过程中制定好行业链条上的各个利益分配。大数据其实还没有到来,因为这个行业还没有形成。
主持人:中国是先做,做的过程中不断的有一些规矩。我们在做灰色,还是灰白、灰黑,个人有个人的看法。
董剑-新浪
童剑:大数据对于我们互联网公司来说,一部分是用户产品体验的提升,一部分是实现公司商业价值的提升。从未来几年展望来看,前面的几位嘉宾都说了,我看到的一点是更多的应用。刚才亚洲也说到了技术上我们还有很大的距离,对数据的理解,对用户行为属性的理解,其实我们的技术上做的还是比较有限的。接下来几年这方面应该有一些继续的提升。
随着移动互联网和O2O模式的发展,首先用户会有更多的时间能够随时的去访问这些数据。这样基于大数据的产品或者应用,可能会跟用户的生活越来越紧密。也许几年以后,你的手机应用能让你在一家餐厅吃饭的时候,能够为你推荐在这里你经常来愿意点的菜,能够为你推荐更适合你的口味的菜,离我们的生活会越来越近。
主持人:受惠于每个人,而不是全是企业。非常感谢五位嘉宾的精彩发言,谢谢各位。