大数据——大价值、... 谈谈大数据及大数据的价值
第一部分:我先通俗的解释下什么是大数据
小到一个店家,大到一个国家,都在讲大数据。不过,真正搞清楚什么是大数据的人可能真不那么多。其实,故名思议,大数据肯定体现在“大”上,可数据是一个比较抽象的东西,我们该怎么去描述数据的“大”呢?这里面就涉及到一些专业领域的东西了。
世界著名咨询机构麦肯锡曾对“大数据”给出一个明确的定义:大数据就是 一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和低价值密度四大特征。
我们应该怎么去理解这句话呢,首先,我们知道,在大数据出现之前,我们对数据的日常处理分析常常使用的是诸如sqlsever/oracle/mysql等传统关系数据库,处理T级别的数据量已经是这些数据库的极限,面对PB/EB/ZB级的数据量那就更无能为力了。
那是不是以前就没有这么大的数据量呢,也不是,早在20世纪80年代,未来学家 阿尔文托夫勒 就将大数据称作“第三次浪潮的华彩乐章”,只不过当时由于数据处理能力有限,所以大数据一直没有发展起来,直到2005年,提供大数据基础能力的Hadoop项目诞生,从技术层面上搭建了一个对结构化和复杂数据快速、可靠分析变为现实的平台。
从这个时候开始,“大数据”才逐步成为互联网信息技术行业的高频热词而为人们所熟知。
从这点上,我们可以看出,技术的发展不仅在改变人们的生活,其本身也在推进着更高级的技术的诞生。话说回来,“大数据”是不是只是一种规模大的数据集合就够了呢,显然不是的,还必须具备前面所说的4V特征。
先说说海量的数据规模,前面说到处理PB/EB/ZB级的数据量,正是大数据优势所在,处理PB级数据,以前是不可能的事情,但在大数据时代,将会是一个常态,这是一个什么概念呢,一部高清电影约4g,1PB=1024*1024g,大数据瞬时处理1PB的数据量,就相当于瞬时处理26万部的高清电影容量。
其次,是“快速的数据流传”,怎么说呢,所有数据都有时效的,商业业务决策也是有时效的,如果不快速处理,快速得到结果,那么就很可能会失去商机,所以,我们也在一直强调利用大数据做实时分析。
再次,“多样的数据类型”又是什么呢,在大数据走进大众之前,传统的数据处理工具,往往处理的是标准的结构化的数据,也就是存在我们的数据库表格中的数据。
针对非结构化的数据,比如文本、语音、视频、图像等等,这是大数据要经常面对的事情。最后,“低价值密度”,这个概念有点抽象,怎么去理解呢,大数据就是一个海量的数据,在大海中捞金子,这金子就是我们的宝藏。但我们把这块金子经过一系列的分析处理过程之后,我们就能确定是在某一平方米的水域,那么这个密度就会高很多了,这块金子就分布在这一平方米中,在这一块区域去捞金子那么就容易得多了。
以上,就是我对什么是大数据及大数据的4个特征的的通俗理解。
第二部分:理解大数据的价值
大数据的核心价值,从业务角度出发,主要有如下的3点:
a.数据辅助决策:为企业提供基础的数据统计报表分析服务。分析师能够轻易获取数据产出分析报告指导产品和运营,产品经理能够通过统计数据完善产品功能和改善用户体验,运营人员可以通过数据发现运营问题并确定运营的策略和方向,管理层可以通过数据掌握公司业务运营状况,从而进行一些战略决策;
b.数据驱动业务:通过数据产品、数据挖掘模型实现企业产品和运营的智能化,从而极大的提高企业的整体效能产出。最常见的应用领域有基于个性化推荐技术的精准营销服务、广告服务、基于模型算法的风控反欺诈服务征信服务,等等
c.数据对外变现:通过对数据进行精心的包装,对外提供数据服务,从而获得现金收入。市面上比较常见有各大数据公司利用自己掌握的大数据,提供风控查询、验证、反欺诈服务,提供导客、导流、精准营销服务,提供数据开放平台服务,等等
但在实践中,我更加喜欢把数据的价值分为两个方面,一个方面是给企业创造营收,另一个方面就是给企业节省成本。整体梳理的框架如下,请大家参考:
除了上面我对数据价值的理解外,阿里前数据委员会主席车品觉老师从数据的应用价值出发,归纳出如下的5类数据价值,也有一定的道理,大家可以作为参考: