本篇文章1076字,读完约3分钟

高速公路。本报讯(记者李楠)9月28日,“迎接未来——智能语音进化理论”主题分享活动在京东京东京东+智能茶馆成功举行。此次分享活动邀请了玲珑科技首席科学家唐博士、平台事业部商务总监、北京小鱼儿科技合伙人兼销售市场副总裁李传刚、北京方正信息科技有限公司数字外设事业部总经理于彬、京东智能市场总监李等行业大咖啡

语音是如何发展起来的? | 京东智能探秘智能语音进化论

语音识别是如何发展的?

语音识别在我们的生活中发挥着越来越重要的作用,被应用于地图导航、智能交互等领域。玲珑科技首席科学家唐博士为观众回顾了语音识别的过去。他说最早的语音识别是20世纪50年代贝尔实验室的奥德里系统,它能识别10个英语数字;在接下来的60年里,语音识别开始被研究。当时,在小词汇量中识别孤立词和支持一些命令词的识别是比较成熟的;70年代和80年代之后,出现了两大进步。语音识别中存在许多技术问题,其中两个是语音模型和语言模型的建立。20世纪90年代初,卡内基梅隆大学的李开复博士领导了狮身人面像系统的开发;1997年,ibm推出了第一个商业语音识别系统viavoice。可以说,20世纪90年代是语音识别技术发展的第一个高潮。此后,大量公司在这一领域投资,如微软、nuance、英特尔、摩托罗拉、诺基亚、sun和dragon。

语音是如何发展起来的? | 京东智能探秘智能语音进化论

什么是语音合成?

语音是如何合成的?它是如何发展的?唐博士说,语音合成有三个标准,第一是可懂度,第二是自然,第三是情感。目前,语音合成的水平可以是自然的,但机械的味道并不那么强烈。现在主要的突破方向是进一步研究和探索情感。关于语音合成的发展时间,唐博士认为它始于20世纪50年代,最早的方法是使用参数合成;二十世纪七八十年代,人们发明了各种共振峰合成器,这种方法的优点是占用资源少,缺点是可懂度低。20世纪90年代,波形拼接方法被提出;随后,引入hmm模型对语音库进行训练,大大减小了语音库的规模,形成了一种可训练的语音合成方法。自2014年以来,人们开始在参数语音合成中使用深层神经网络。最新的报告,deepmind,提出了使用深度神经网络的语音合成质量的自然性,声称质量提高了50%。

语音是如何发展起来的? | 京东智能探秘智能语音进化论

如何理解智能语音?

经过语音识别和语音合成,唐博士讲解了智能语音的相关知识,以供大家注意。他认为聪明的言语需要从两个方面来理解。一方面,智能因素被添加到语音技术中。另一方面,语音识别技术与自然语言理解相结合。语音识别只能把语音变成文字。要理解单词背后的含义,我们需要自然语言理解。因此,目前,如果我们想制作语音产品,光有语音识别技术是不够的,还需要自然语言理解,也就是能听懂你说的话。这就是所谓的智能语音。

来源:罗盘报中文网

标题:语音是如何发展起来的? | 京东智能探秘智能语音进化论

地址:http://www.lzn4.com/lpbxw/12226.html