中国企业报 :“芝麻开门”成现实 声纹识别尚存噪音等环境制约 2017-8

在智能化普及的今天,传统的身份验证已不能满足当下的需求。国内多家从事智能语音的企业纷纷推出相关声纹识别产品,为金融、社保、安防多领域提供了更加安全、便捷的身份验证方式。

但目前声纹技术还处于新技术的爬升期,SpeakIn势必可赢科技COO易鹏宇告诉《中国企业报》记者,环境噪音、多人对话等因素都影响识别的准确度。

“听声辨人”功能

将成标配

近几年,声纹识别技术逐步成熟,成为进行身份识别和保障身份安全的“黑科技”。北京得意音通技术有限责任公司董事长、清华大学语音和语言技术中心主任郑方对《中国企业报》记者表示,“听声辨人”功能将成为未来人机交互系统的“标配”。

科大讯飞针对安全领域推出InterVeri(iFlytek Speaker Verifier)声纹识别系统,通过对说话者语音和数据库中登记的声纹作比较,对用户进行身份校验和鉴别,可用于远程控制的非接触式生物识别技术。

除了科大讯飞,国内另一家领先的声纹解决方案提供商SpeakIn,以声纹识别为落脚点,重点布局公安、智能硬件、社保和金融领域。据记者了解,SpeakIn与腾讯合作,为Qrobot小Q机器人第二代提供的声纹识别方案,可准确识别用户身份,并提供个性化服务。

同样专注于声纹识别,得意音通研制的“声密保”专利解决方案,通过对动态密码及请求人身份的双重识别,实现对移动支付的双重验证,该产品已在中国银联及中国建设银行、兰州银行等银行的移动端得到应用。

作为国内在手机银行中应用声纹识别技术的商业银行。中国建设银行信息技术管理部总经理金磐石对《中国企业报》记者表示,自推出该功能以来,手机银行客户数逐步增加,目前使用声纹认证的客户已超过了百万。

声纹识别

优势凸显

声纹识别系统是根据人声的特质来自动识别说话人的身份的系统,在与指掌纹、虹膜、人脸、DNA识别的比较发现,声纹识别在采集便利性、成本、造假难度以及远程识别方面都有良好表现。

郑方认为,声纹识别有以下优点:一是安全性强。由于声音的低隐私性,不会出现一旦被窃取就"一丢百丢"的情况。二是高适用性和低成本。相较于其他生物特征识别技术,声纹识别采集设备简单,传输带宽窄。三是功能可扩展性强。声音信号里包含了身份信息、内容指令和情感状态等信息,能用一句话解决所有问题。

易鹏宇向《中国企业报》记者表示,声纹识别还具有自然交互的特点,从人机交互的“说什么”进一步明确到“谁在说”,能够让硬件提供更加个性化的内容和服务。同时,声纹语料收集的方式也更为自然,不需要特定说话或摆动作。此外,物联网正在蓬勃发展,对于没有屏幕和键盘或是屏幕非常小的硬件,语音是目前最合理的操作入口,也是最适合大范围在物联网场景下使用的验证方式和服务入口。

多因素制约下

新技术仍需探索

基于目前技术的发展,声纹识别仍存在声音的易变性、周边环境的不稳定性、用户认知、使用习惯等方面的问题亟须解决。

易鹏宇认为,目前的困难主要来自两方面,一是在技术上,声纹识别还处于新技术的爬升期,如环境噪音、多人对话等因素都影响识别的准确度。二是行业使用场景上,要针对不同行业的特点进行方案设计和产品研发,将AI和产业深度结合。

另外,不同的环境以及人在不同的情况下,识别效果也存在差别。受环境噪音影响可导致重复多次验证。金磐石认为,要创新技术措施,降低噪音对声纹识别的干扰;另外,深度整合环境检测技术。

此外,对语音背后“说话人”的微妙态度和意图的理解等也是非常重要的问题,郑方表示,对意图的理解,解决起来要比语音识别、语义理解都要困难得多。当前另一个困难是用户认知和使用习惯的培养,这是任何新的变革性技术在开始阶段都普遍面临的问题。

首页    媒体报道    2017    中国企业报 :“芝麻开门”成现实 声纹识别尚存噪音等环境制约 2017-8
收藏
创建时间:2021-11-24 18:03