刘威理博士 腾讯AI Lab 刘威博士:人才是人工智能发展的关键
在2017年腾讯媒体 峰会上,来自腾讯AI Lab首席视觉科学家刘威博士带来了人工智能在图像、视频、AR等多个领域取得的最新进展。
在会后,刘威博士接受了腾讯科技的专访,进一步阐述了他对人工智能的理解和期望。
一、视觉人工智能正在走向更高维度
图片的美化、处理,可能是现在我国全民自拍的时代,最为普及的图像视觉应用。但在刘威博士看来,今天市场上对图片类产品,比较多的还是聚焦于底层数据处理,例如改变一张图片的色彩饱和度、对比度、光照等,对真正的人工智能(基于深度学习)技术使用比较少。而对海量图像/视频数据的更高维的处理,应该要利用人工智能深度学习技术,来识别、分析、理解图片。
“我放上一张菜肴的照片,机器能识别出来这是什么,同时还能用理性的语言去描述它。”
在高维视觉计算方面,刘威博士谈到,人工智能还处于一个成长期的初级阶段。目前在深度学习驱动的视觉计算领域,工业界做得比较出色的,是在垂直领域的图像识别,例如人脸识别、文字识别等。在这些垂直领域,AI的识别能力一定程度上超过了人的识别能力;而在其他一般的图像识别领域,如图像描述生成,AI的识别能力仍然远逊于人。
二、AI Lab承载了科研和工程两大责任
在腾讯AI Lab里,刘威带领的视觉AI团队,承载着两个方向的责任,一方面是科学性的、前沿研究方向的探索,另一方面,是工程性的、在高纬度技术能力上,为业务和产品提供新的科技能力。
“要么做有意义的事情,idea非常创新;要么做非常需要的事情,给内部业务创新提供科技支撑。”目前,腾讯AI Lab视觉AI团队,已经有9项技术创新,应用到腾讯的各条产品线,包括图像滤镜、图像清晰度提升、人脸识别、图像描述生成、视频滤镜、视频识别、AR等多项原创的有自主知识产权的技术。
例如在市场上图片滤镜已经很多的情况下,刘威博士和团队针对视频滤镜进行了技术储备,并最终将这个能力成功移植到腾讯的相关产品上,为用户提供了更好的体验。
“目前,从业务方提出需求,到原创技术创新,再到落地于产品,我们只需要6个月的周期。随着团队人员的发展,我们未来有信心将这样的业务创新流程缩短到3个月。”刘威对团队的效率非常满意。
这样的业务创新速度,一方面是由于团队在AI领域的人才和技术积累,另一方面,创新的视野与前瞻也非常重要。“经常的情况是,业务方提出一个非常紧迫的需求,我们AI Lab集中资源进行攻关,提前一周甚至一个月就做好了。”这种技术和视野的前置能力,在某种程度上,是AI Lab同时服务于科技创新和业务创新的连接器。
“做引领者,做实践者,做贡献者。”在刘威博士看来,一个开放的AI生态中,这三点非常重要。
三、Cross over,跨界颠覆
利用深度学习,可以帮助一个陌生的领域,实现技术突破。“就像AlphaGo一样,甚至我不需要太了解你的行业知识,通过优秀的网络设计和学习训练,会让很多过去难以攻克的问题,被深度学习解决。”
而当AlphaGo进化到Zero的时候,我们会发现,它根本不需要了解和围棋相关的深入的专业知识,只需要知道下棋规则,就可以超越原来行业的全部积累。
当然,人工智能的跨界颠覆目前还不是万能的。对于一些边界条件不够清晰,目标性还不够明确的领域,目前还有很多需要探索的空白地带。但随着量子计算机的发展,未来强大的算力,有可能解决极度复杂的参数构建的系统走向。
四、技术突破也可能让科学家失业
很多人担心AI等新的技术,是否会导致某些行业的从业者失业。在刘威博士看来,新技术可能会改变很多事情,如果讨论技术变革带来的失业问题,那可能是固守一些传统知识或体系,不愿改变并学习的人。
例如量子计算机的出现,很可能从根本上改变计算这整个科技脉络的根基,那么很大一部分计算机科学家(也包括我们自己),其研究模式和研究方法,都可能会失效。所以,不断的学习,是人机协同发展的关键。
五、人才是人工智能发展的关键
和其他领域不同的是,人工智能对算法和数据的依赖同样重要。而这两个能力,在过去一直是分开的。算法科学家很多在高校和研究所里,而海量的数据在科技公司里。
这两者的结合正在加速,我们会看到,越来越多的科技公司和高校合作,很多科学家学者也选择加入科技公司,来实现人工智能在学术科研和工程发展方向上的融合。
自腾讯组建AILab以来,已经在全部的人工智能顶级国际学术会议上,发表过多篇论文。这在过去是不可想象的,用刘威博士的话说,“这就是人才的力量”。