新闻中心

清华-得意音通声纹处理联合实验室研制出最先进的录音检测技术

2016-09-30

    

如果用以保证安全的措施具有安全漏洞,那么这个安全措施本身就是令人不安的!

为了解决身份认证问题,生物特征识别技术被认为是解决方案的未来之星。但是,近期有关指纹、人脸和虹膜等分别被假冒攻击的报道让人有些担忧。2016年,西班牙巴塞罗那举办了MWC2016世界移动通信大会,在会上《华尔街日报》记者利用软胶模轻松解锁iPhone指纹密码;2016年,美国斯坦福大学研发的人脸跟踪软件Face2Face攻破“人脸”识别;2015年,著名的混沌计算机俱乐部的安全研究员Jan Starbug接受采访时称仅需用通过谷歌搜索找到的高清晰度图像,就可以使用一些虹膜扫描工具进行攻击……科研工作人员投入大量精力研究活体检测技术以对抗这些攻击,并且取得一些可喜的进步,但是往往因活体检测成本太高而无法在近期达到实用化程度。

生物特征分为两类,一类是生理特征,诸如指纹、人脸、虹膜等;一类是行为特征,诸如声纹、签名、姿势等。在防假冒攻击方面,属于行为特征的声纹具有天然的优势。

声音信号具有“形简意丰”的特点。它简单得仅是一维信号,但丰富得包含口音、语种、语义、情感、性别、说话人等各种信息。

20160930-1.jpg

综合利用对这些信息的识别技术,可以有效地提供防录音、防录音拼接、防胁迫等的解决方案。

语音假冒被认为是声纹识别的一大挑战。语音假冒的种类包括人类模仿语音、机器合成语音、机器模拟语音、录音重放等,其中公认最难检测的是录音重放,因为重放语音本来就是那个人的语音。

近期,清华大学-得意音通声纹处理联合实验室经过攻关,综合利用信号处理、听觉模型、模式识别等一系列人工智能技术,成功研制出最先进的录音检测技术。在一个含有65人,涉及当今大部分主流手机型号,共计3万多次的录音攻击及检测实验中,录音检测的等错误率低至3.95%。该录音检测技术是基于动态码的“得意声密保”方案的一次升级,更加安全和可靠,真正做到“别人即使窃取了密码也无法闯入”。

清华大学-得意音通声纹处理联合实验室未来的计划是充分利用语音“形简意丰”的先天优势,充分利用清华大学语音和语言技术中心30多年积累的先进的语音和语言处理技术及人工智能技术,实现“统一语音平台”,以一句话解决所有问题,包括:理解用户指令(利用语音识别技术知道用户要做什么)、识别用户身份(利用声纹识别技术确认用户身份)、确认用户是否受到胁迫(利用情感检测技术判断用户是否受到胁迫)、判断用户是否被录音假冒(利用录音检测技术阻止录音假冒闯入)等,以在提高系统安全度的同时提升用户体验。


地址:北京市海淀区双清路77号院4号楼9层
邮编:100084
电话:+86-10-8289-3532
传真:+86-10-8289-6692

版权所有@北京得意音通技术有限责任公司 2002-2017. 京ICP备 05032314号 京公网安备