朱婧浙江大学 5位长江学者聚浙大 用大数据厚数据讲好中国故事

2018-03-02
字体:
浏览:
文章简介:浙江大学"大数据与厚数据发展前瞻"高端研讨会现场 通讯员 黄骏 摄浙江在线3月13日讯(浙江在线记者 曾杨希 通讯员 吴意云)从政府到企业,从街头到高校,一个人人都在讨论.使用或研究大数据.与以信息"广度"著称的大数据相对应,如今,越来越多的人开始关注到以信息"深度"见长的厚数据.什么是厚数据?大数据和厚数据有什么关系?两者能帮人们解决什么问题?3月12日上午,浙江大学"大数据与厚数据发展前瞻"高端研讨会在杭州举行.来自清华.

浙江大学“大数据与厚数据发展前瞻”高端研讨会现场 通讯员 黄骏 摄

浙江在线3月13日讯(浙江在线记者 曾杨希 通讯员 吴意云)从政府到企业,从街头到高校,一个人人都在讨论、使用或研究大数据。与以信息“广度”著称的大数据相对应,如今,越来越多的人开始关注到以信息“深度”见长的厚数据。

什么是厚数据?大数据和厚数据有什么关系?两者能帮人们解决什么问题?3月12日上午,浙江大学“大数据与厚数据发展前瞻”高端研讨会在杭州举行。来自清华、北大、复旦、暨南大学等高校的5位长江特聘教授和知名学者,阿里巴巴等知名互联网企业高管,以及浙大“大数据 人文社科创新团队”的首席科学家、人文社会科学部分学院和研究机构的学者等五十余位代表参加了会议。  

专家介绍,大数据是数据规模超出了常规数据库工具获取、存储、管理和分析能力的数据集;厚数据是记录个体行为及其前后关联信息的集合,可通过抽样调查的方式获得。大数据与厚数据具有不可替代性、互补性和验证性。

清华大学社会科学学院党委书记、经济学研究所所长刘涛雄分享了清华大学iCPI团队应用大数据技术分析宏观经济波动的案例。

刘涛雄介绍,在该项目中,项目组运用来自互联网的大数据和相关技术手段,参照国家统计局CPI篮子,利用计算机程序每日定时采集并计算指数。让原来按月度公布的居民消费价格指数升级到每日公布,帮助研究者和决策者即时追踪和预测宏观经济运行的微观细节。

“阿里巴巴的生态构筑在阿里云的技术平台之上,核心就是数据。”阿里巴巴安全部总监连斌以阿里巴巴为例,在会上分享了大数据在安全领域的应用。

连斌说:“以打假为例,我们打假的‘三大策略’之一为线上风控,通过信息流、行为流、资金流、交易流、物流等数据研究,获得制假贩假的行为特征,把每个城市处罚过的账号所在的经纬度刻画出来,发现被处罚账户的地点一般集中在城市一个区域的一个中心,这个中心往往就是制假贩假窝点或者假货集散市场。”

为了印证通过线上大数据研究得到的结果,阿里巴巴曾经派出100多位“密探”前往重点区域、市场走访。“通过线下走访,我们得到了不同假货市场的不同特征,发现了中国假货市场的现状。同时,也把发现的线索移送给执法机关和司法机关。这也是大数据和厚数据的结合。”连斌说。

“我们也做了一个调查,内容为《电商对农村农户的影响》。这个项目基于我们本身抽样调查了不少村里农户的详细数据,比如收益、就业等,这就是厚数据。”长江学者特聘教授、浙江大会社会科学研究基础平台主任甘犁在作《用大数据和抽样调查厚数据来解读中国经济》主题演讲时举例。

他介绍,这个项目中,当把抽样调查获得的厚数据与淘宝提供的大数据相结合,在村级层面上匹配了637个村庄共14000户家庭。通过这种匹配方式,科研团队得到了农村电商发展往中西部辐射、丰富了农民的“钱袋子”、缓解了“留守”之痛、促进了家庭创业等结论。

“目前,中国是比较缺乏基础数据的。要描述社会与国家,除了大数据,用抽样调查的方式获得厚数据很重要。学术界可以把两者结合起来发现变化,讲述中国故事。”甘犁表示。