杨凯生大数据 工行原行长杨凯生:强调大数据的重要性 不能丢掉小数据
中国工商银行原行长、银监会特邀顾问杨凯生认为,一些互联网金融公司出现问题,除了常说的法规不够健全、监管不够有力、投资者的教育欠缺等原因外,还有一个原因,就是大家对互联网,对大数据技术的理解和认识存在着一定的偏差。
杨凯生强调在大数据时代更要注意处理好碎片化信息和完整性数据的关系,处理好结构性数据和非结构性数据的关系,作为企业包括银行还要处理好客户个性化意识和社会化共同需求的关系。
杨凯生称,互联网思维有另一层含义,即互联网、大数据技术的发展和进步给人类提供的是从更宽视野、更多维度、更全方位来认知问题和分析问题的工具和方法。
杨凯生表示,有的机构掌握了一定量的客户信息数据,就以为掌握了大数据,而忽视了对数据分析工具和方法论的研究,这在金融业务中就有可能影响对风险的识别和防控,造成风险的积聚和扩散。
同时,有人总以为在一个样本范围内得出了结论,就等同于掌握了对某个问题全部的规律性认识。其实在一个范围内的结论(即便是正确的结论)也不一定能够简单外推,这就是在所谓机器学习中需要严格防止的模型"过度拟合"问题。
模型越是复杂、需要纳入的变量越是多,就越容易出现这样的问题,这也正是在金融风险管控中必须注意的"模型风险"问题。
杨凯生认为,强调大数据的重要性,不能丢掉小数据。传统的小数据有经典的数理模型,有比较成熟的数据分析统计理论、方法,数据挖掘的技术早就成形。
但是大数据到今天为止,管理理论、分析方法都还处在快速发展更迭的阶段,并没有十分的成形。大数据数量越大,噪音相应也就越大,甚至往往是数据大幅增加的时候,它的噪音的增长幅度要快于数据量的增长幅度,因而大数据的挖掘成本是比较高。
杨凯生指出,大数据更容易反映出一些相关关系,而小数据通过分析比较容易直接得出因果关系,大数据和小数据各有特点,各有它的长处、短处,在许多情况下相关关系并不能简单地取代因果关系。
杨凯生强调,只有把小数据分析方法的完备性、准确性和大数据的多维性、即时性融合起来,才能对管理真正带来一种质的改变。