大江程涛 程涛:利用时空大数据一体化思维 将大数据“钻石矿”真正变成钻石
摘要: 空间大数据崛起给我们带来的是时空大数据,不只是告诉位置,也不只是告诉时间,更重要是有了内涵和内容。
6月13日,第六届WGDC大会在北京国家会议中心隆重开幕。大会由空间信息产业创新创业服务平台泰伯主办,秉承不断引领和促进空间信息技术创新与变革的宗旨,WGDC已走过六个年头,如今已成为全球最具前瞻性的跨界创新风向标。
在本届大会主会场上,英国伦敦大学学院大数据分析实验室(SpaceTimeLab)创始人兼主任、泰伯研究院顾问委员程涛教授做了特邀演讲。
以下为英国伦敦大学学院时空分析实验室(SpaceTimeLab)创始人兼主任、泰伯研究院顾问委员程涛教授的特邀演讲(内容未经本人审核):
各位来宾、各位领导大家早上好!非常荣幸今天能有机会来跟大家交流我自己对时空大数据的看法,所以非常感谢泰伯研究院给我这样的机会。
当时给我的题目是"空间大数据的崛起带来什么?"刚才朋德局长和百度的刘先生介绍了现在发生了什么?而且展望了未来?可不可以回过去看一看,空间大数据发展的阶段,在这个阶段给空间大数据提出了什么样的核心问题?怎么样解决这些问题?通过一些实例给大家示范,最后谈谈我的看法。
大家都在提"一带一路",用这张图回味一下,实际上空间信息没有时是用一张图描绘信息。这张郑和下西洋图非常漂亮非常简约,但是非常直观和实用。在整个行程中经过了山脉和河流,这是在1225年,祖先非常聪明。
第二张图是1854年,最早的一张图,给大家讲GPS时都会说这是最早的空间分析的例子。这张图1854年伦敦布罗德街有一批霍乱病人,后来发现这些人都是饮用了伦敦在这条街一口井的水,所以找到霍乱病源,把这口井关闭了。这是在没有计算机时代,但是那个时候地图已经为我们提供信息和服务。
在80年代计算机技术迅速的发展,提一下在1974年现在GPS的鼻祖叫Roger Tomlinson,他利用计算机技术做博士论文,所以标志着计算机时代的地理信息来临。那个时候专注于信息的位置。20年代初移动时代智慧手机,这个时候大量产生了很多的轨迹数据,这时不仅有XYTS,还有Mobile GIS,更多服务于个人的位置和导航。
现在大家讲物联网,物联网概念也就短短几年诞生,社交媒体大量出现。这个时候关注信息不光是位置,有了时间,更多是内容,还有很多的不同影像,带给我们的问题实际上,刚才朋德局长讲了很多,从空间信息到时空信息,时空大数据。
从规则数据到了不规则数据,这些内容怎么提取不规则信息?其实是非常难挑战的问题。使用数据提供个人化、智能化的位置服务,现在讲数字城市的概念也变成了智慧城市,什么是智慧?这个社会的核心就是智能的问题。
智能是复杂的分析复杂的优化复杂的可视化,帮助我们做更好的工作。基于这样的问题,基于这些挑战我在2012年伦敦形成了时空实验室,我们有了时空信息,但是没有时空分析的手段和方法,更没有这样的理念,基于这样的理念我的实验室就要研究数据中的预算、模拟、分类、画像、可视化,目的是服务于政府,服务于社会,服务于人。
有这样的问题,怎么样解决呢?我觉得是这样几点,我们的理念第一是复杂性的理念,现实社会非常复杂。第一件事情用时空一体化的分析和建模;第二,基于道路网络的表示和分析;在时空算法上面,大家都想机器学习,其实机器学习不是今天才有的,机器学习人工智能在七八十年代就开始,只是应用重新被发现,我们利用机器学习方法时,本身也来源于传统的统计方法。
在整个分析时,现在讲AR就完全抛弃了传统的统计,在方法论中两者都要应用。
要把大数据变成一个应用,其实是多学科结合的过程。在我的实验室我有地理信息,我以前是学测量的,学地理信息遥感到地理信息,现在做时空大数据,我有地理信息、数学、犯罪学、交通、计算机等方向,这样才使功能应用于社会。
这次回国摩拜单车确实很火,刚才朋德局长讲了摩拜单车有什么样的问题,怎么样利用大数据让共享单车运行更加的顺畅,我们提出了算法研究共享单车有序平衡运营的问题。现在有了很多的自行车,自行车是绿色出行的趋势。但是有更多的车到了路边上,整个的路面交通影响是什么样?整个的网络,在伦敦很少有四个车道,自己有的数据,而且也与全球最大的自行车搜集数据平台,与他们和伦敦交通局共同合作解决这个问题。
交通出行地铁也是很重要的问题,伦敦附近的巴士也很方便,也有其他的线路也很便捷,他们觉得没有成效。我们想想让活动更加有成效呢?我们也可以分析出行的行为,找到那些可以有变通的人群,他们可能有其他的出行时间和其他的出行工具和出行路线,这个才使我们的目标更有效。
刚才刘总也讲到人群画像的问题,他们的数据非常丰富。我觉得人群画像相对而言信息更丰富。我们拿到的数据只是公交卡四点的数据,根据这四点的数据可以做到很多的工作,也可以对人群进行画像,可以找到他是哪一类人群?在地铁上有多少人是带着孩子上车,有多少人是使用残疾服务?这些才更有效,对分析它的商业用地,分析广告都非常有效。
根据人群的画像,也可以做到地铁画像。这个浅蓝色表示高级一点的人群,在这个地方怎么部署你的商业策略?连到我商业智慧的问题,我知道这几天阿里的车网非常火,说可以不用信用的额度去租车,我觉得非常好的趋势。
这个图说明什么问题?有四个颜色。这是中国城放的四个图。刚才讲到广告是很赚钱的一门数据,怎么样让广告更有效?有人觉得今天大会场这么多人是发广告最佳时期。可是现在大家关注的是大数据,关注会议的内容,到了中午时间大家关注吃饭。所以广告要针对正确的人正确的地点和时间。
还有减灾防灾,这个是意大利的一个省,根据滑坡的数据预测滑坡风险什么时候出现,风险在什么地方?
这是我最想讲的智能出行,我最近完成的一个项目。与英国警察局合作,这个是利用昨天犯罪数据和今天犯罪数据来预测哪些犯罪的热点?我们利用网络来做,网络预测的更精准,我们开发了一套系统,这套系统他们在应用。第一是预测的问题;第二,不只给你图,还告诉你怎么样去巡逻,巡逻才更有效,巡逻完了到底有没有效还有评估过程。我觉得智能,智能不仅仅告诉你明天会发生什么?而且告诉你怎么去应对?我的数据反馈给你,这才叫智能。
大家知道英国脱欧很火,相关的问题是移民的问题。在英国的一个项目6000条船,红色的,左下角三条船,这三条船告诉我确认带有移民的船。他们的要求能不能从六千条船里面找出来,还有哪些船是有嫌疑的。我们利用机器学习和人工智能找出来有九条船。
还有反恐维稳的事情,利用社交媒体找出来突发事件。这个突发事件不是预先告诉什么事情发生?通过分析你的数据,可以找到这一天有哪些足球比赛?有哪些火车的延误等等,很小的事情,可能你事先不预知的,这才是智能。
空间大数据给我们带来什么?空间大数据崛起给我们带来的是时空大数据,不只是告诉位置,也不只是告诉时间,更重要是有了内涵和内容。这为城市智能化和个人的位置服务提供了非常好的机遇,刚才李局长和百度都讲了很多,我个人认为在反恐、金融、游戏、教育、政务、旅游等等,各行各业任何与个性化相关的服务都大有所为。
利用时空大数据一体化的思维,将大数据"钻石矿"真正变成钻石,把数据变成价值。
最后,我用一句朱熹的诗来总结,我们能做到"等闲识得数据面,万紫千红总是春"。谢谢大家!