李德毅驾驶脑 中国工程院李德毅院士最新演讲:无人驾驶的核心在驾驶脑
近日在浙江余姚举办的中国第三届机器人峰会上,中国工程院李德毅院士分享了他在无人驾驶研究领域的最近进展,明确指出无人驾驶的核心在驾驶脑,跟汽车厂商正在做的东西分工明确,而且这个“脑”的驾驶活动更多的是技巧,记忆和经验,而不是知识、推理和计算。
历史机遇的又一个崛起可能就是人工智能。我今年72岁了,以一个“70后”的身份,我谈谈创业创新四个要素。我问过许多同行,他们认为技术很重要;我又问更年轻的同行,他们告诉我是资金更重要,没有钱什么都办不成;还有人告诉我团队很重要,还有人告诉我思想很重要,那么我想今天报告谈一下我的看法。
先讲第一个问题,大家都以为在国外留学,然后到Facebook这样的国外公司呆一阵子,再到中国创业就很容易,其实不对,你是有人傲人的经历,是有核心的技术,但是不是可以下海了呢?
没有成果载体的创业公司必死无疑。
我下一张片子是我的观点,有点吓人。请大家看看这个话,创业成员固然有各自傲人的工作经历和核心技术,但整个团队如果没有明确的,由核心技术汇聚而成的,独创独有的成果载体,没有耀眼的创新亮点,而只是把公司办成了攻克难题的研究所,苦苦挣扎,技术长期不孵化不出产品来,这样的公司必死无疑。比如,10个搞互联网 9个人要死,20个人搞人工智能 十几个要死。
你要搞清楚你要知道你要的是技术,还是核心技术,还是技术的成果?我主张要有技术的成果。
我在讲智能的时候讲三大智能,我们习惯说计算智能,感知智能和认知智能。刚才我参观了余姚研究所,我说,机器已经超过人的计算,我们现在的重点要搞交互智能, 记忆智能。
我家里用坏三台扫地机,我觉得现在不用为好。不实惠。你们不相信可以用用看,第一扫不干净,第二该扫的地方老是不扫。怎么办?所以,我现在做什么呢?我不做先视后觉,这是常规的,我做的是视而不觉,边视边觉,先觉后视。
我做的是要用已有的认知,借助当前的感知。我的驾驶脑数据流程图,余凯说值一千万,我把这个送给余姚同志们,看看你们能不能做出来,我的驾驶脑一个瞬间记忆池,还有态势记忆池、还有决策记忆池。
如果我们用到扫地机机器人上,以后它天天这样扫也是很好的机器人,这是不同的记忆能力不同的认知。驾驶活动更多的是技巧,记忆和经验,而不是知识、推理和计算。驾驶脑的差异,反映是个人的智力和运动协调能力的差异,世界上没有两个完全相同的驾驶脑。
这才叫机器人。我们想将来车上跑的驾驶脑也是一样的。真正开车的不是汽车本身,而是驾驶员,人的认知,要把脑和机器融合在一起才行。所以我们主张在我们机器人里面,有一个调试总线扩展为自学总线,可以学习人是怎么开车的。然后机器人开车时候扮演的角色,主要是通过学习的东西消化吸收,深入学习,变成了自己的行为。
这张图也很好,你们拿手机照一照。
人工驾驶的时候,三路机器视觉,图像一路,GPS一路、雷达一路,这三路视觉形成了现在的驾驶态势图,驾驶员通过生活视觉的认知,形成了对方向盘、油门刹车的控制。把当前驾驶态势和一个认知组成一个队,把这个队放在深度学习的神经网络里面去,让它学习,形成驾驶记忆。
如果开十天这个数据量也不小,如果整天从办公室到家,从家到办公室,到11天可以了,机器人说——我可以开了。当机器人开车的时候,驾驶员不在了,它就可以搜索这个图,把对应的认知拿出来去开车。驾驶就是这么简单,这怎么能够让车厂做呢?这是驾驶员的事。所以车厂只能做自动驾驶。这个深入学习,可以是长时期的学习,统计学习和进化学习。
人真正的学习在错误中学习的,说到我们怎么样防止驾驶过程当中的事故,同时我们有负学习,让开车的时候遇到这样那样的险情,做出错误的动作,我们通过神经网络,生成事故记忆棒,把这个做好了,下一次开车的时候,人没有了,也可以驾驶,又发生了错误的,又有一个学习过程,这是负学习的。
这跟Alphago的学习机制很类似。因此我们的机器人,整个框图是双驾双控的架构。
当因深度学习正站在全球人工智能的分口,普通把卷积神经网络用于点云图像识别、完成感知阶段的自学习,而我们另辟蹊径,把卷积神经网用于形式化之后的、基于可用路权的驾驶态势图和反映驾驶操作全部内容的认知箭头形成的图对上,用于认知阶段的深度学习,大大减少、简化了实时处理的数据量。
因此之所以在比赛中拿比较好的成绩,主要是我们对认知的形势化,把瞬间记忆大数据“缩水”,即在感知理解之后迁移到工作记忆区,进行深度学习。
创新创业的四要素
下面谈谈创新创业的四要素这个问题。
第一个问题。我们讲技术,就要讲这个技术有什么创新的亮点。
第二个问题,讲资金,就要讲资金的注入点。大家都愁搞不到钱,特别是年轻人,我愁的更好跟你相反,我愁的是有钱怎么花出去,现在最大的困难是钱花不出去,没有订单,没有批量生产,你有钱有什么用?又不能腐败。所以真的有能耐是把钱花出来的才是真正新的企业。有人在项目路演的时候说,我给50%股权要一千万资金投入,我说你这个讲得太粗糙了,你应该讲细一点,给你一千万你要怎么花,你有本事花出来就有人给你钱。
第三个问题,讲市场就要讲卖点。
我觉得我们学者不像人家西方。做一个围棋赚多少钱,FaceBook升值多快?Alphago以4:1战胜9段围棋高手李世石,那个广告赚翻了。我们中国也干过这样事,2011年我们用北邮围棋程序Lingo跟人比赛对余斌,并让两个子,在中央电视台直播一下进行比赛,2:0战胜了余斌。可是我们是发展中国家,没有什么影响,没有赚到钱,也没有赚到广告费。
所以Alphago胜利后,我提出四个问题让大家想一想。
深度学习的四个局限
我认为人机大战本身人在前面机器在后面或者机器在前面人在后面无休止的较量,Alphago也好,深度学习也好有很大局限性,我们围棋手跟机器下棋有上当的感觉,因为他比我们做了测试。这个时候我们提出深度学习的四大局限性。
其中,第一,太多的学习参数具有随意性,该怎么样就是怎么样,现在不是了。第二不能保证算法的收敛性,第三缺少反馈机制,第四大量案例也不具有累计性,就是时间累计性没有。
这样的情况下,深度学习不是人工智能的重点。我们设想一下,如果我们现在让不同的Alphago对弈会怎么样。因此我觉得更有刺激的不应该是Alphago程序,因为做出一个围棋机器手很难,现在是人抓住这个子在走,做一个围棋机器人更难,相对地,我认为汽车动作很灵敏了,更有刺激性的是人是机器人和赛车手的比赛,这样比赛更加激动人心。
自动驾驶的魅力在哪里呢?我们觉得不是跟市场争时间?我们希望它的车子更加敏捷、灵活,但是我们要做的是驾驶脑。我们卖点是驾照,我们驾驶脑卖驾照!卖的是驾龄,卖的是路熟。驾龄驾照替代不了,路熟,地图替代不了,所以驾驶脑将来场景很可观。
最后用一张图结束,它的市场第一桶金在哪里?