吴恩达李飞飞 吴恩达来了 李彦宏的技术质变还有多远
中新网5月20日电 5月16日,前“谷歌大脑”项目的发起人吴恩达(Andrew Ng)加盟百度,担任百度首席科学家。这一消息被华尔街日报、时代周刊网站、福布斯、MIT Technology Review等广泛报道。
时代周刊网站所用的文章标题是《Chinese Search Giant Baidu Moves into Google's Backyard》,在美国媒体看来这是一次极具象征意义的引援,比前谷歌Android产品管理副总裁Hugo Barra加入小米更具震撼效果, Hugo更像Android领域的一位布道师,而Andrew却是全球人工智能研究的执牛耳者,在2013年入选《时代》杂志年度全球最有影响力100人,成为16位科技界代表之一。
吴恩达在学术界的地位,很像14年前的李彦宏。当年最早投资百度的诚实合伙投资公司的投资人斯科特·沃尔切克问了李彦宏一个问题:“在你看来,全球搜索引擎技术领域排前三位的人都是谁?”李彦宏未加思索答出三个人的名字,其中就有Infoseek公司的CTO威廉·张。
而斯科特与威廉·张早就相熟,随即把这个问题也提给了威廉·张,威廉·张的回答是,李彦宏在搜索引擎技术方面可以排进全世界前三名。后来斯科特把同样的问题抛给其他搜索引擎领域的专家,李彦宏同样在不同版本的三人名单中。
14年过去,李彦宏创立了百度成为中文搜索引擎领域的绝对王者,同时搜索引擎也成为家喻户晓、不可或缺的网络工具,而Andrew所擅长的人工智能、深度学习,开始逐步进入人们的视野,精通搜索引擎的李彦宏或许希望依仗吴恩达开启一场新的人工智能技术的革命。
有趣的是,故事里这位威廉·张,也就是李彦宏在Infoseek期间的老板,后来成为了百度的首席科学家,今天,吴恩达接过了威廉·张 曾经的位置,技术的接力棒从搜索引擎交到了人工智能的手里。
李彦宏不是一个喜欢指点江山、夸夸其谈的人。但在近期少有的几个场合,李彦宏都多多少少提到了他对技术在互联网发展历程中的作用的独特看法。例如在百度大数据峰会上,作为最先提出“互联网思维”的人,他曾提到,“中国的互联网到现在已有20年的发展历程,互联网正在颠覆各种各样的传统产业,首先是颠覆了媒体,后来颠覆了零售,再往后是旅游,再往后是金融。
某种意义上讲,过去这几年互联网在中国的发展,是互联网正在改变中国。”然后他话锋一转,表示“但是未来会发生的一件事就是技术会改变互联网” 。
虽然并列BAT三巨头,但李彦宏与马云、马化腾相比,却有完全不同的思路。整个2014年上半年,二马O2O、视频、电商领域你来我往、圈占地盘、风生水起,以致百度的竞争对手开始散播着百度已在三巨头中掉队的观点。然而在李彦宏看来,技术才是决定互联网未来胜负的关键,因为百度的成功正是网络信息查询方式从分类目录向搜索引擎的技术质变过程中奠定的基础。
当年的雅虎曾经拥有最为庞大的网站分类目录,人们只要采用类似图书馆目录的方式按图索骥就能找到所需的网站,但如同你只能找到一本可能有用的书,却无法定位你所需要的信息在这本书的哪章哪节哪页,在网络信息呈现爆炸式增长的时候,人们需要更新的技术来解决信息查询的问题。
这时候,谷歌用蜘蛛、索引和算法,把整个互联网搬到自己的服务器硬盘上,给了人们全新的信息搜索体验,搜索引擎也自此成为互联网的信息交换中心。鲜为人知的是,在谷歌创新搜索引擎技术的背后,也借鉴了李彦宏在1997年2月申请了专利——“超链分析技术”,正是这一专利一改互联网搜索杂乱无章、信息冗余的局面,使搜索效果大幅提升。
无论谷歌还是百度,都是十五年前这场技术质变的获益者,也无怪于这两家公司都对技术创新抱有宗教般的信仰和坚持。
然而技术的质变并不是经常发生,驱动这些年互联网发展的主要动力更多来自模式创新。即使十五年来我们已经从56k的modem拨号上网发展到百兆千兆的光纤接入,上网的设备也从空调机房里的PC扩展到各式手持设备和智能终端,但发生变化的仅仅是人们与信息的交互方式,我们只是将技术应用延展到电子商务、社交网络、LBS与O2O、音视频传输等更广泛的领域,技术和算法本身并未发生革命性的变化。
要理解这种区别,我们可以把算法理解为一个黑箱,即使他的设计者也不能完全确定每次输入所对应的输出结果是什么(搜索引擎就是典型的例子),而模式更侧重逻辑和流程,从网上购买一件商品,或者给朋友发一段语音,目标和结果都是确定的,持续改善的只是中间的交互过程和使用体验。
人们在谈到BAT各自擅长的领域时,往往提到百度的技术、腾讯的产品和阿里的运营,后两者主要属于模式的范畴,而百度则在技术领域独自前行。当马云和马化腾在为中国互联网的地盘你争我夺时,李彦宏在冷静地等待下一次技术变革的到来,因为他已闻到了技术风暴来临前的气息。
正如他在百度大数据峰会上的表态,“技术创新是一个从量变到质变的过程。并行计算能力不断提升和云存储等技术产品成本的不断降低,使大数据真正走到了技术变革的临界点。”
吴恩达的到来,正是李彦宏加速并把握这次技术变革的重要一步。而在此之前的一年,百度已经在深度学习领域进行积累。仅在人才领域就网罗了此次为引入吴恩达牵线搭桥的知名机器学习专家余凯、Facebook前资深科学家徐伟,美国新泽西州立大学统计学教授张潼,和异构计算专家、AMD异构系统前首席软件架构师吴韧等。
而2013年百度在研发方面的投入达人民币41.07亿元,相比2012年增长78.2%,比百度年营业收入的增幅高了近一倍,占全年总营收的比例接近13%,表明李彦宏坚定地将百度打造为一家“技术驱动型”公司的决心。
巨大的研发投入,也让百度在人工智能和深度学习方面已有小成。例如百度翻译目前可以实现18种不同语言方向的翻译,但这个团队甚至没有人精通阿拉伯、泰语等小语种,完全是通过机器学习和海量数据积累所实现的。
同时将借助百度在图像识别方面技术突破,百度翻译的实物识别和拍照翻译也达到了令人震惊的水平。这些成果在一定程度上也是吸引吴恩达加盟百度的重要因素。
李彦宏的技术背景,让他比同行们看得更远。作为搜索引擎的百度可以抓取整个互联网的信息,而百度近年来在移动云和LBS方面的投入,让百度的数据获取能力极大提升,LBS开放平台每天响应的定位请求已经与搜索次数不相上下,Baidu inside平台与智能穿戴设备的结合令数据种类更为多样化,移动应用分发和轻应用也成为新的数据来源。
在如此巨大的数据存量及增量面前,百度率先发布大数据引擎,将包括开放云、数据工厂、百度大脑三大组件在内的核心大数据能力开放,通过大数据引擎向外界提供大数据存储、分析及挖掘的技术能力。李彦宏所描绘的这一前景,正是吸引着吴恩达及其同行们先后加入百度,同时也需要他们的力量将其实现。
或许在李彦宏看来,上一次技术质变正是搜索算法取代人工目录,完成了互联网信息搜索的巨大变革,而他是以关键参与者的角色见证并推动了那场质变。那么下一场变革即将来临,而此次他是以“预言者”和“布局者”的身份提前洞察到了这一趋势,并且为百度储备了雄厚的人才与技术基础。
过去十年百度技术的核心是“搜索算法”,解决的是在“结构化”的海量数据中找到人们所需要信息的位置(即网站的地址),那么今天百度在技术布局则聚焦在“人工智能”方面,要让机器学会学习,在“无法标记”的海量数据中自主建立理解需求、解决问题的逻辑方法。
过去搜索算法的更新升级仍然完全依赖于人的作用,而现在人工智能将实现机器算法的自主完善,技术的发展速度将因此得以极大加强。
人工智能和深度学习将从底层结构上改变互联网的技术基础,惠及的不仅是搜索引擎,如语音和图像识别技术的质变将改变人机交互方式,自然语言技术的质变会模糊不同语种间的界限,诸如无人汽车、智能机器人、智慧城市等无非是更聪明的机器带给人们的千万种不同应用中微不足道的一个分支而已。
李彦宏在过去十五年里用技术成就了搜索引擎,在未来的数年中,他可能会用人工智能彻底颠覆技术,造就另一个完全不同的百度,从而让技术更深刻地改变互联网。