百度大脑震撼发布 掀开互联网时代下一幕
那么,什么才是“核心中的核心”?其实,通过李彦宏的演讲,以及今天举办的各大分论坛,我们都不难发现,无论当前人工智能的实际应用意义有多大,各个业务线负责人已经把人工智能与旗下业务进行了结合,并作为对外推介的重点。
李彦宏的定调与各个业务部门负责人的表态,也意味着,未来百度将在人工智能领域重点发力。那么,李彦宏一而再,再而三强调的“百度大脑”到底是什么呢?
李彦宏定调人工智能
按照李彦宏的说法,目前,百度大脑主要分为三个部分:
一是计算方法。包括超大规模的神经网络、万亿级的参数、千亿样本和千亿特征训练;
二是计算能力。包括数十万台服务器构成了“百度大脑”的实体,几年前百度便开始自建中国最大的GPU集群;
三是数据。全网的网页数据、十多年来累积的搜索数据,以及百亿级的图像、视频、定位数据等。
在此基础上,百度大脑拥有四种能力,即:自然语言的处理、语音识别、图像识别处理以及用户画像等能力。
一是语音识别能力。目前,百度语音识别准确率能够达到97%,已经可以用于客服和销售方面,帮助这些语音相关的行业实现提高。语音合成方面,则可以做到原音复现,李彦宏现场以张国荣声音合成举例,合成了张国荣的国语声音,李彦宏还称,目前可以通过50句话的录制,让每一个人都能拥有属于自己的声音模型。
据悉,百度大脑由三部分组成,超大规模神经网络和超大计算能力(数十万台服务器、中国最大GPU群)以及超大的数据量。而在公布的百度人工智能四大前沿能力——语音、图像、自然语言理解和用户画像中,无疑,自然语言理解是大众最感兴趣的部分。
通过李彦宏的展示,百度大脑这强大语言信息处理能力便生活活地出现在大众的面前,也许一时半会还用上不,但是在如今这个全球化的世界,语言的交流已经是无避免的,不管是百度提供的翻译功能,还是聊天提示功能,都将大大提高相当一部分人的社交能力。
在百度世界大会中间,李彦宏展示了一段中国出租车司机和外国乘客的对话。两人都不会外语,出租车司机说中文,通过百度可以翻译成外语,让外国乘客听懂。外国乘客说英文,百度也可以准确翻译成中文。这背后是百度的语音识别和语音合成功能在支持。他展示了语音识别和语音合成的技术,百度的语音识别可以比较准确地识别出一段营销电话中销售员和客户的对话,同时百度用语音合成技术合成了张国荣向现场观众问候的话。
在去年的百度世界大会上,李彦宏曾展示通过度秘订到咖啡,今年他展示了度秘独立解说奥运篮球比赛决赛,度秘的语速比半月前它与著名篮球评论员杨毅合作解说奥运篮球比赛有所加快,较为流畅。