近年来人工智能系统在语音和图像识别领域已有较成熟的算法,但在嘈杂环境下的声音辨识能力相对较弱。此次研究人员利用视觉和声音的自然同步,在原有数据库中导入大量视频信息,结合新算法对声音识别系统进行测试。在10个不同声音测试中,该系统获得了92%的正确率,在50个声音测试中准确率为74%,而人类在相同样本测试中的正确率分别为96%和81%。未来该系统将改善用户在户外使用语音识别的体验。
研究人员表示,该系统应用潜力巨大,比如无人驾驶汽车系统搭载该声音识别技术后,当听到救护车声音,无人驾驶汽车能更早选择新的路线规划。另外手机安装该系统后,用户到电影院后该系统通过周围声音环境判断电影是否开始放映,并自动切换成静音模式。该声音识别系统将在本周召开的国际神经信息处理系统大会(NIPS)上进行展示。
作为人工智能最重要的技术之一,国外语音识别技术的准确率已基本达到人类的水平。微软旗下最新语音识别系统的识别错误率仅为5.9%,这和专业速记员将对话转录成文字的最低错误率一致。而微软也在一年前将语音识别系统的深度学习算法进行开源,使其他人工智能产品通过该算法拥有语音识别技术。海外市场调研机构预计,未来几年全球语音识别市场规模有望突破百亿美元。
国内的语音识别技术也在快速发展。11月底搜狗和百度分别召开发布会表示,旗下语音识别系统正确率已达到97%左右,同时有不少智能语音产品支持不同地区的方言识别。《2016年互联网趋势报告》显示,近几年用户通过语音搜索的使用量大幅提升,使用语音的本质是解放双手,而目前全球语音识别系统依然存在场景辨识率低等问题。随着场景声音辨识技术的加速完善,语音识别技术有望迎来拐点,未来发展空间将进一步扩大。
- VR视频终端问题仍待解决 获用户认知仍需时日
- 免费流量背后存黑色产业链 三大运营商每年损失或
- 第三季度支付体系运行情况:业务金额是GDP总量
- 手机不实名今起双停 两个月后将销号
- 厂商急功近利质量存瑕疵 智能手机沦为快消品
- 新无线电条例为新兴产业破障 将严惩伪基站等电信
- 老华为人眼中5G前路:2020年商用太激进 技
- 一带一路空间信息走廊建设提速 卫星通信产业链迎
- 苹果拿走手机行业九成利润 安卓手机商里华为最赚
免责声明:
1、本网转载文章目的在于传递更多信息,我们不对其准确性、完整性、及时性、有效性和适用性等作任何的陈述和保证。本文仅代表作者本人观点,并不代表本网赞同其观点和对其真实性负责。
2、中国产业信息研究网一贯高度重视知识产权保护并遵守中国各项知识产权法律。如涉及作品内容、版权和其它问题,请马上与本网联系更正或删除,可在线反馈、可电邮(link@china1baogao.com)、可电话(0755-28749841)。