|

谁更懂汉语?抢夺汽车语音入口,本土企业能否逆袭歪果仁

智驾时代·2015-04-30 08:22
0 0 0

文AutoR智驾 李令宜 肖波

汽车智能化已成为不可阻挡的潮流,在上海车展上,奔驰雪佛兰奥迪等众多企业推出了于基于自动驾驶技术的概念车型。汽车正在进入一个重新定义的时代,不过无论是车联网时代还是自动驾驶时代,在苹果手机推动的触控技术革命之后,智能语音技术已成为最被看好的人机交互方式。

对于汽车,语音识别之所以不可或缺,一个主要原因,相比触控交互方式,语音识别可以最小程度地干挠司机,将极大的保障行车安全。

就语音技术而言,语音识别已经进入2.0时代,苹果Siri,微软Cortana、Google Now、科大讯飞灵犀语音助手、百度语音助手等等大量的独立语音助手面世。2105年伊始,Facebook 收购语音识别公司 Wit.ai 。在智能手机、智能电视、智能家居、车联网等领域,语音交互也已成为标配。

在全球,语音识别也被认为是人工智能获得突破的重要一步,尽管还有很多问题,可以说,今天各大巨头在语音领域的布局已基本成型。

在这样的背景下,语音技术取得突破,2014年1月,Intel 的可穿戴设备部门主管 Mike Bell 称,Intel 和第三方机构合作研发的可以在 Intel 移动处理器上运行的语音识别软件,已经能够做到不将用户发出的语音传回云端,而直接在本地进行语音识别。

以色列公司Beyond Verbal 创建的算法甚至可以通过识别音域变化,分析出像愤怒、焦虑、幸福或满足等情绪,心情、态度的细微差别也能被识别,以此进行情绪辨认。

不过就整体而言,语音技术在车载领域的高壁垒依然难以突破

在今年春节期间,一位操着山东话口音的大汉驾车行驶在高速上,想通过语音导航确认一条路线,结果二人在十多分钟的对话过程中,山东大汉破口大骂,精神崩溃,而提供服务的安吉星则怒而罢工。

安吉星成立于1995年,做为车联网企业的先锋称霸美国多年,其软件版本迭代已达八代,为何还会让回家的山东大汉的体验如此糟糕?

这就涉及一个老生常谈的问题,谁更懂汉语?

这个问题在当年百度和谷歌抢夺中国搜索市场时曾经有过激烈的交锋。

汉语语音识别与英语语音识别存在哪些不同?

有评论指出,中文的语音识别和英语的语音识别基本上是两种概念。由于中文的复杂性,同一个拼音不同的声调代表着不同的很多字,而在不同的语境内使用不同的字和语气,甚至包括隐语之类的修辞手法,相比而言在英文中是比较少的。

而如果细化到中国繁多的近千种方言,其间差别甚大,基于标准普通话的语音识别系统在识别带有方言口音的普通话时,识别率会大幅下降。

因为汉语的这些特点,而在车辆行驶过程中,车内噪音干挠将极大的影响语音软件的识别度。

此外语音技术在车载导航中的应用还存在两大难点:一是语音识别的技术水平,二是对众多口音和方言的支持、对车内曝音环境的适应和处理,以及符合用户使用习惯的自由说。

在车辆使用过程中,发送机的运转声、空调噪音、国外环境的噪声和风噪等各类噪音会对车内的语音识别效果形成的影响尤为巨大。

而当前语音识别技术面临的最大问题是无法拥有智能逻辑,例如当你发问“今天北京天气如何?”系统能够准确地展示北京的天气信息,但当你紧接着问“那上海呢?”,系统则无法理解这句话,这就是系统缺乏逻辑辨别能力的表现。

当前,车载语音识别技术的语言识别能力虽然有所增强,但这是因为系统将语音数据上传到云端数据库进行分析后得出的结果,要在本地实现精确识别还是比较困难,这需要庞大的语音数据库支持。

而过分依赖云系统也并非长久之计,特别是国内现在的网络普及情况并不理想,信号基站数量也不充足,例如用户在进入隧道之前发出语音指令,此时车辆进入了隧道,基于云端分析的语音识别系统很有可能无法识别指令。

整体而言,在车载领域,我们可以将现今世界上针对汉语市场的语音软件分成国内与国外两大流派。

因为汉语独特的特点,这成为中国厂商打响汉语语音识别保卫站的独特优势。

相比国外巨头,在国内语音识别技术的发展也相当迅速,目前已形成了以BAT和科大讯飞为主的第一线阵营,以及众多新兴的像云之声、搜狗语音、出门问问、捷通华声、紫冬语音、YY、思必驰等相关语音服务。

目前语音识别领域的基本格局是,一批企业在专注于技术研发和语音识别平台的搭建,如科大讯飞等。不过,这部分企业现在也在向技术应用市场拓展。另一批企业则专心于延伸应用的开发推广,如京东、阿里等,它们关心的纯粹是技术背后的应用市场。

争抢车内语音入口,这一市场的激烈程度丝毫不亚于手机制造领域。

随着中国企业的努力,中国公司推出的语音识别系统正在中文识别领域占据优势。

近日在同样的环境下我们对国内外的两款语音识别软件进行的对比测试形象的说明了这一点(不了避免引发不必要的误会我们隐去了相关品牌的名字)。

【国外N公司车载语音系统】


【评语】


在设定导航测试过程中,在“目的地搜索、地址查询、上海市、区号、街道名”等信息的语音交互方面,用时将近2分钟,经过多次重复,系统终于明白了测试者的目的地。

而在语音拨打电话号码测试过程中,经过多次测试,测试者无奈放弃,结果是语音拨号失败。

对于互联网功能的其他体验如听歌、收听收音机、看新闻,天气预报和查股票等功能测试的结果同样是失败。

以上相关项目的测试共耗时6分50秒的视频,用户体验包括:郁闷、抓狂和哭笑不得。

【科大讯飞车载语音系统】

【评语】

在测试员发出“导航到海洋大厦”的指令后,在8秒种之内,导航系统完成了目的地定位,并推荐了5条行车路线。


在发出“寻找附近的停车场”指令后,5秒钟之内导航推送了6个停车场供选择。在语音拨打电话环节,导航系统轻易实现了人名查找电话并一次拨打号码成功。


娱乐运用方面,这一系统表现也相对出色,1分钟之内,选歌曲、换调频、查新闻、预报天气和股票咨询全部OK。同样项目的测试,国内语音系统在2分40秒之内即完成测试,相与来自国外的系统测试时间缩短了一半还多。

此前有消息称由宝马中国研发中心牵头组织的宝马全球中文语音技术测试结果公布,中国智能语音技术提供商科大讯飞全面领先国外公司。

本次上海车展期间,宝马互联驾驶中心还向媒体展示了基于科大讯飞语音技术的互联驾驶平台演示系统,双方更多合作呼之欲出”。除了宝马,根据科大讯飞此前发布的公告,公司车载语音应用已经和主流车厂达成了合作,涵盖奥迪,奔驰,通用,福特,上汽,广汽,北汽,长城长安,吉利,江淮奇瑞海马东南等。

语音识别市场正在高速增长,据《2014中国智能语音产业发展白皮书》显示,智能语音技术在移动互联网、呼叫中心、智能家居、汽车电子等领域的应用逐步深入,带动智能语音产业规模持续快速增长。2013年,全球智能语音产业规模达到33.7亿美元。其中,中国智能语音产业规模达到16.9亿元,同比增长95.6%。到2014年,中国语音产业规模达到了30.6亿元,占全球智能语音产业规模的比重从2013年的8.4%增长到10.7%。再加上相关应用市场,语音识别市场的蛋糕不可谓不大。

这势必导致国外巨头加大对汉语识别领域的投入,而谁能在车内更好的识别汉语正在成为一个新的战场,这个战场与我国庞大的汽车保有量相关,占据车内语音识别领域则有可能在这一领域称王。

点赞|0 收藏|0
免责声明:牛车网是广大网友共同参与的一家汽车行业网络交流平台,任何组织或者个人(包括专家)均可在牛车网旗下WEB网站或者APP移动端发布文章和帖子,其内容无法一一证实,所以牛车网对这些内容不承担责任。如果网站内容中存在版权和真实性等问题,请及时与我们联系,我们会在第一时间调查并做相应的删除处理。server@niuche.com
推荐文章
参与讨论

登录牛车网

还没有账户,去注册 第三方登录: