怀进鹏的学术水平 中科院怀进鹏:大数据及大数据的科学与技术问题
2013年6月5日,“第五届中国云计算大会”在北京国家会议中心隆重举行。本届大会以“大数据大宽带推动云计算应用与创新”为主题,历时3天,来自全球云计算领域的180多位专家讲师参加了大会,全面突出了此次大会“国际性、行业性、社交性、全面性及专业性”的五大特色。
中国电子学会云计算专家委员会候任主任委员、中国科学院院士怀进鹏在6日的大会上发表了名为《大数据及大数据的科学与技术问题 》的主题演讲,怀进鹏分享了他对大数据的一些认识,及对未来发展的一些思考。
以下为现场实录:
非常高兴有机会和各位嘉宾一起分享我对大数据这方面的理解和认识。也许有些内容太技术或者理论化,我尽可能简单一些。
大数据已经成为非常热闹的一件事情,我这次主要跟各位交流当前互联网大数据以及对未来问题的一些思考。
信息技术从应用来看有一个信息流,从获取、传输到计算存储,到最后的使用。在过去的发展过程当中,摩尔定律催生了微电子的快速发展,实际上是通过预测来进一步推动技术的变革。还有一个是吉尔德定律,讲的是主干网带宽每六个月增加1倍,每比特的费用将趋于零。
在计算和存储方面,在过去二十年里,计算速度和存储容量由于微电子的发展,CPU的性能提高了3500倍,但内存和硬盘的价格却下降了4.5万倍和360万倍。在这样的带宽逐渐变得越来越廉价的时候,通讯的带宽远远超过摩尔定律的时候,单机就进入了网络计算,离线就进入了在线时代。这是一个非常非常大的变化。
云能给我们带来什么,为什么要使用云
为什么要有云,为什么会有这样的大数据?当我们上网获取信息资源变得越来越低成本的时候,现在通讯带宽发展进一步超越摩尔定律的时候,就使得互联网的应用进入了第二次价值挖掘。单机进入网络、离线进入在线,使得终端方面的维护和系统的维护开始进入了新的时代。我们不需要知道服务方在哪里,只需要关注我们需要获取的服务和相应的资源。
由于互联网的应用,特别是web2.0,不仅从过去技术单向交流的方式开始进入了双向交流的时代,也进一步加速了互联网的发展和新能力的创造。
过去互联网模式走过三个典型的时代,主机时代到网络计算时代再到现在的云计算。我们全当把它叫做虚拟的网络计算环境,我们是从封闭可控的平台进入了开放和没有集中控制的网络环境。到最终未来的发展当中,在宽带不断发展、微电子的价格不断下降,而资源获取能力增强的时候,就出现了计算模式的新变化。我的理解这是一种计算模式由于带宽和成本的不断变化所导致的新的一种计算模式的变化。
如果说过去我们理解在八十年代出现了第一次计算机变革,那是由于PC时代造成的,也就是软件第一次成为商品,开始通过购买copyright作为看不见的商品在市场上流行。
到九十年代出现互联网有效规模的应用,就成为信息获取和信息交换的平台。
第三次的时候,是不是这种计算模式正在推动我们进入新的前所未有的从量的积累到质的变化的时代,我们都在拭目以待。
对于任何一个IT领域的技术和产品,时间的开放窗口并不长,比如像PC、手机和互联网,一旦形成技术的标准或一定规模的成熟,对于追随者就再也没有机会了,或者只能处于它的旁观者。
这几年出现了很多非常热,也非常有效的方式:
1. 先谈云计算,它对我们在如此高速的互联网发展过程中,对提升高端计算的利用率和应用性、提升低端计算的事务处理能力和服务的能力,都会有重要变化。也许这种计算模式会进一步加深我们对这方面的理解。
2. 第二类,也是由于交互行为的技术支持,社会网络或者社交网络也有了很大的变化,大家都很清楚,像Facebook、人人网,以及现在的上网规模,都在不断变化。
3. 这里面还有另一类,就是我们生产控制系统、嵌入式系统、传感器所传递的系统,给我们带来了很多新的更重要的一类应用模式。当然,科学计算永远是大数据产生的基础。
但是,不论是从商业、工业,还是科学计算以及现在我们说的社会计算,给我们带来了新的问题,就是互联网二次价值的开发和新的挑战会在哪里?云计算作为一种计算模式,正在引领我们实实在在地发挥着作用,云计算背后要处理在现实应用当中或者是实际需求中的问题,人们提出大数据也是其中一个选择。