语音是如何发展起来的？ | 京东智能探秘智能语音进化论-罗盘报中文网

本篇文章1076字，读完约3分钟

高速公路。本报讯(记者李楠)9月28日，“迎接未来——智能语音进化理论”主题分享活动在京东京东京东+智能茶馆成功举行。此次分享活动邀请了玲珑科技首席科学家唐博士、平台事业部商务总监、北京小鱼儿科技合伙人兼销售市场副总裁李传刚、北京方正信息科技有限公司数字外设事业部总经理于彬、京东智能市场总监李等行业大咖啡

语音是如何发展起来的？ | 京东智能探秘智能语音进化论

语音识别是如何发展的？

语音识别在我们的生活中发挥着越来越重要的作用，被应用于地图导航、智能交互等领域。玲珑科技首席科学家唐博士为观众回顾了语音识别的过去。他说最早的语音识别是20世纪50年代贝尔实验室的奥德里系统，它能识别10个英语数字；在接下来的60年里，语音识别开始被研究。当时，在小词汇量中识别孤立词和支持一些命令词的识别是比较成熟的；70年代和80年代之后，出现了两大进步。语音识别中存在许多技术问题，其中两个是语音模型和语言模型的建立。20世纪90年代初，卡内基梅隆大学的李开复博士领导了狮身人面像系统的开发；1997年，ibm推出了第一个商业语音识别系统viavoice。可以说，20世纪90年代是语音识别技术发展的第一个高潮。此后，大量公司在这一领域投资，如微软、nuance、英特尔、摩托罗拉、诺基亚、sun和dragon。

语音是如何发展起来的？ | 京东智能探秘智能语音进化论

什么是语音合成？

语音是如何合成的？它是如何发展的？唐博士说，语音合成有三个标准，第一是可懂度，第二是自然，第三是情感。目前，语音合成的水平可以是自然的，但机械的味道并不那么强烈。现在主要的突破方向是进一步研究和探索情感。关于语音合成的发展时间，唐博士认为它始于20世纪50年代，最早的方法是使用参数合成；二十世纪七八十年代，人们发明了各种共振峰合成器，这种方法的优点是占用资源少，缺点是可懂度低。20世纪90年代，波形拼接方法被提出；随后，引入hmm模型对语音库进行训练，大大减小了语音库的规模，形成了一种可训练的语音合成方法。自2014年以来，人们开始在参数语音合成中使用深层神经网络。最新的报告，deepmind，提出了使用深度神经网络的语音合成质量的自然性，声称质量提高了50%。

语音是如何发展起来的？ | 京东智能探秘智能语音进化论

如何理解智能语音？

经过语音识别和语音合成，唐博士讲解了智能语音的相关知识，以供大家注意。他认为聪明的言语需要从两个方面来理解。一方面，智能因素被添加到语音技术中。另一方面，语音识别技术与自然语言理解相结合。语音识别只能把语音变成文字。要理解单词背后的含义，我们需要自然语言理解。因此，目前，如果我们想制作语音产品，光有语音识别技术是不够的，还需要自然语言理解，也就是能听懂你说的话。这就是所谓的智能语音。

来源：罗盘报中文网

标题：语音是如何发展起来的？ | 京东智能探秘智能语音进化论

地址：http://www.lzn4.com/lpbxw/12226.html