蜻蜓FM总裁钟文明:高晓松、蒋勋等高段位主播无法被AI取代
7月5日,百度AI开发者大会(Baidu Create 2017)在北京国家会议中心召开,并在会上正式发布被誉为“中国版的Alexa”的DuerOS开放平台。
在下午的唤醒万物·对话式人工智能分论坛的圆桌环节中,百度度秘事业部总经理景鲲与蜻蜓FM总裁钟文明、小鱼在家创始人宋晨枫、TCL副总裁李昕、高通技术副总裁李维昕,以及“科幻界的诺贝尔奖”雨果奖得主郝景芳一起纵论智能语音行业,大家都期待DuerOS能让设备越来越智能,为广大用户带来真正“动口不动手”的智能生活体验。
其间,蜻蜓FM总裁钟文明作为DuerOS的生态合作伙伴亦是国内首家成立的音频平台表示,人工智能(AI)时代,只会简单播音的主播极有可能被人工智能替代。
钟文明认为,通过TTS(文本转语言(TextToSpeech))语音合成技术,精品音频内容的生产会变得更加简单。“比如,我们采用语音合成的技术,TTS技术,让策划写好节目文字,然后通过TTS技术直接转化成语音播放,而且还可以选择不同人的声音,比如可以选择景鲲的声音来讲人工智能,还可以选择景芳的声音来给你讲《北京折叠》。”
但他同时也指出,现阶段的人工智能还无法替代一些高级知识分子生产内容,例如上文所述的度秘事业部总经理景鲲、《北京折叠》作者郝景芳,包括平台最近推出的独家节目《矮大紧指北》的主播高晓松,都因此独特的创造力,在人工智能时代也能一枝独秀。
对于这一观点,正在撰写有关人工智能新小说的郝景芳也表示了认可。她曾经做过的调查结果显示,标准化、程式化的工作其实都容易被人工智能取代,这一原则不因是白领、金领或是蓝领而改变。
而关于不容易被替代的工作,她认为应当是具有创新性的。“这个工作的性质就是要无中生有,你不能参照以前的这种大数据统计出来的结果,必须要想出一个新的方案。”
主持人景鲲(百度度秘事业部总经理):我想问一下钟总,高晓松现在的节目《矮大紧指北》做得不错,我知道现在对话式人工智能后面其实都要有内容,蜻蜓FM一直是有非常丰富有声资源的一个企业,所以在这波浪潮下,从您的内容产业来看,会带给蜻蜓什么样的一个机会,对内容产生会有什么样的影响,想听一下您的想法。
蜻蜓FM总裁钟文明:谢谢景鲲兄。蜻蜓FM实际上是中国第一家网络电台,但到今天,我们的内容已经远远不止电台内容了,现在电台内容可能只占我们内容的三分之一不到,刚刚你说的高晓松《矮大紧指北》就已经不是电台内容了,在传统电台里面是没有的。所以,我们做的这条跑道其实是整个音频,音频跟人工智能有紧密的关系,甚至可以说非常非常重要的关系,因为音频是人工智能的入口。基于这个认识,从蜻蜓FM创立第一天开始,我们就一直在做音频和人工智能的探索,可能有几点,我给大家做个分享。
第一点,在内容生产的这个环节,我们一直在想,我们现在有数万名签约主播,大家听上去这个数字挺丰富的,但对于我们做内容平台的来讲,这实际上是很累的一件事儿,因为你要跟一个个主播做对接,做审核,还要做客服。所以,我们在想,能不能变成只服务一万名主播,或者变成服务三千名主播,其余的都交给人工智能来解决。比如,我们采用语音合成的技术,TTS技术,让策划写好节目文字,然后通过TTS技术直接转化成语音播放,而且还可以选择不同人的声音,比如可以选择景鲲的声音来讲人工智能,还可以选择景芳的声音来给你讲《北京折叠》。这是第一个我们做的探索。
第二个探索,就是在内容运营这一块,我们也有探索。比如说我们蜻蜓FM可以早上的时候给你推天气预报,上班的时候给你推路况信息,例如近期航班非常不稳定,我们可以实时告知你,中午给你推中国之声的新闻,我们有跟中央人民广播电台深度合作,下午就给你推高晓松的《矮大紧指北》,傍晚的时候给你小孩推送《凯叔讲故事》,睡前给你推《蒋勋细说红楼梦》。总而言之,我们要做中产阶级的音频版生活方式,满足大家的个性化需求。
第三点,我们的内容分发。我们音频这条跑道,目前整个行业的月活才一个亿,大家能感受这个数字吗,视频是十个亿,我们整个在手机端的渗透率可能10%到20%,我相信未来能到50%。但是更大的在哪里,更大的在我们今天所说的汽车、家居。虽然在手机上我们的渗透率目前是不如视频的,但是我们相信,在人工智能时代,在车载、家居上面,音频的渗透率一定会超过视频。
所以,我们过去五六年一直在做这些探索,如果这些探索能够实现的话,我相信,我们的用户体验一定会更加美好,我们这条跑道的商业价值一定会爆发式增长。在蜻蜓FM,我们有一个口号,叫“男人听了更成功,女人听了更放松,小孩听了更优秀,老人听了更健康”,我们在做的这个梦想,也一定会实现。
但是,我们也知道这个梦想不是一件小事,是个大事,大事肯定不是一个人干的,它肯定需要一帮人、一群人,one team,one dream。因为,在实现美好梦想的路上,往往会存在很多挑战,需要大家一起去应对。
比如说第一个,我们在内容生产这块,虽然我们想让人工智能技术、TTS技术帮助我们生产主播的内容,但是,我们也知道,“语音识别相对容易,语义理解相对困难”,像高晓松这种,像景鲲这种高段位的音频内容,是没有办法通过TTS技术来完全模拟的,这是第一个。
第二个,我们内容的个性化推荐,我们的数据还是不够的,我们需要更大的大数据,我们还需要更好地深度学习算法,这些也是需要大家的。
第三个,在内容分发这块,不瞒大家讲,今天市场上所有的汽车厂商,包括一些硬件厂商我们都有合作,而且合作很多年,但目前为止的效果是较为有限的,大部分是雷声大雨点小。原因在哪里,因为各自为标准,各自为战,完全不是一盘棋。所以,今天DuerOS的出现,对于我们这个产业的发展是非常非常的重要,因为它有可能把整个产业体系撬动起来,以后我们不用对那么多人了,我们只对它一家,它去对其他人,这样整个产业一下子就活了。所以基于这一点,我们深刻理解到,我们只做我们擅长的东西,其他的东西都交给产业链上更擅长的合作伙伴,我们蜻蜓会以一个开放的心态,伸开双臂,敞开胸怀跟大家去合作,不贪多,这是我们做事的风格。我觉得有机会,也有挑战,也需要大家的帮助。
主持人景鲲(百度度秘事业部总经理):好,谢谢钟总。我再问一个问题,其实今天我们发布了DuerOS之后,不论我们原有的合作伙伴,已经在做的合作伙伴,马上有好多信息过来,好多设备,包括台灯、电扇都要智能,喂,电扇你给我打开,调到哪个档位。所以钟总我想问一下,随着这样很多的设备都要语音对话,那音频是很自然的后面一个默认的数据源,内容提供方。所以现在这股风吹来,您觉得会比原来智能硬件吹得更大吗?从您的内容提供方角度来讲,这个机会您觉得怎么样?
蜻蜓FM总裁钟文明:我们都是移动互联网的受益者,尤其是2011年成立的蜻蜓,享受了很大一波互联网红利。但是到今天,在人工智能时代,外部环境发生变化了,我认为人工智能时代,我们的机会有可能会比移动互联网时代更大。
因为音频有几个很重要的特征,一是语音的交互性,语音交互在人工智能时代的便利性一定会凸显,甚至可能超过眼睛看等其他交互方式。二是伴随性,伴随性就是说可以一心两用,你做其他事情的时候可以听音频,比如开车的时候、跑步的时候、工作的时候,这种伴随性,我们叫“平行的时空”,使得其渗透率的空间可以非常大。三是独占性,音频不仅伴随,在某些场景下还独占,我们叫“独占的世界”,比如说你开车的时候、跑步的时候,《今日头条》再牛也打不进,腾讯视频再牛也打不进,这些场景没办法你只能听不能看。所以,在人工智能时代,音频内容的使用场景和机会是有可能超过视频的,这个机会可能非常大,未来音频市场的空间,我认为可能不是十倍、一百倍,甚至可能是一千倍。