核心产品

每个人的指纹都是唯一的,与此类似,每个人的声纹也是唯一的。

声纹识别(Voiceprint recognition),也称说话人识别(Speaker recognition),就是根据人的声音特征,“闻声知人”。声纹识别有两方面:

(1)说话人辨认(Speaker Identification):用以判断某段语音是若干人中的哪一个所说的;

(2)说话人确认(Speaker Verification):用以确认某段语音是否是指定的某个人所说的。

“声纹识别”技术具有以下特征:

1.文本和语言无关性。用户训练系统和系统对用户的声音进行鉴别和确认,可以是完全不同的文本,完全不同的语言。比如,在用户在系统注册声音时,可以使用中文说一段文学章节,而识别时用户可以用英文谈论计算机的发展方向。

2.对语音长度没有特殊要求。用户训练系统,让其记住其声纹,只需要几秒种(如8秒)的声音;而在识别时,系统只要获得被测试人几秒(如4秒)的声音,就可以进行声纹识别。在某些情况下,比如待识别人语音很难获取时,系统可以通过一秒一秒不断累积的渐进方式,来判断说话人的身份。随着被测试者说的话的累积长度不断增加,系统识别的准确性越来越高。

3.很高的精度。“声纹识别”技术的辨认和确认准确度都很高,可以到达接近100%的准确率。

4.模型小。存储每个人声纹的存储<5KB。

5.操作点调整方便。在实际应用中,为了保证高准确率和低错误率,需要设定"不确定"部分,一般地讲,"准确率+不确定率+错误率=100%"。这种设定,可以保证100%的准确接收和100%的正确拒绝。但不同应用对系统会有不同的要求,有的希望绝对正确的接受而可以允许少部分的错误,有的则希望绝对正确的拒绝而可以低一点的准确率。“声纹识别”技术允许开发者方便地调整这些操作点参数。

6.开集识别模式(即具备拒识功能)。

7.支持上层并行调用。

8.高效率与高准确度下的可靠性与灵活性。

9.每个声纹模型可单独地、分布式存储,适合于基于数据库的大型应用。

10.支持基于高斯混合模型-通用背景模型(GMM-UBM)的声纹识别。

“声纹识别”开发工具包括一组使用简便的API函数和一组用于提高系统性能的优化工具。

应用范围:

说话人辨认:刑侦破案、罪犯跟踪、国防监听、个性化应用等等。
说话人确认:证券交易、银行交易、公安取证、个人电脑声控锁、汽车声控锁、身份证、信用卡等。

应用举例--得意通行证(d-Ear Passport):

结合得意关键词检出技术和得意身份证技术,目的是双保险地防止有人恶意窃取声纹信息。
应用举例如下。在银行开户时,要求他/她“书面”给出一些问题和答案(不必录音),如母亲的姓名、自己的生日、宠物、汽车牌照等等他人不易知道、自己无需记忆的“问题/答案”对,当然越多越安全。然后要求他/她说几秒钟的话,以记录声纹。
当用户需要用过电话进行交易时,系统“随机”地从用户地问题集中选出两三个进行提问,根据用户的回答,系统既可判断其声纹,又可判断其答案。可有效防止有的人把其声音录下来再放音,或模仿他说话。

d-Ear Passport可以省掉用户记密码的苦恼,降低密码被窃取的风险。   


地址:北京市海淀区双清路77号院4号楼9层
邮编:100084
电话:+86-10-8289-3532
传真:+86-10-8289-6692

版权所有@北京得意音通技术有限责任公司 2002-2017. 京ICP备 05032314号 京公网安备