新闻中心

全网首解 | 语音反欺诈有哪些“道”与“术”?

2019-10-16

    

电信诈骗套路多多,网络黑产悄悄蔓延,尤其是在金融行业已形成黑色产业链。从今年360金融研究院发布的《2018智能反欺诈洞察报告》了解到,2018年360手机卫士接到的诈骗举报投诉案件中,金融诈骗损失金额占比高达35%,报案量在全部诈骗类型中占比14.9%。

                           

10月9日,中国人工智能产业发展联盟(AIIA)2019年第三次全体大会——安全工作组会议成功举办,专题探讨人工智能技术在电信网络诈骗中的滥用与防范。得意音通作为声纹领域唯一的AIIA理事单位,与腾讯、百度、科大讯飞等企业一道受邀参加。创始人郑方博士分享了声纹识别技术如何防范语音类诈骗,同时他认为:反欺诈是个复杂任务,从根本上解决问题,不止需要声纹识别技术,更需多技术融合。得到了与会单位的响应。


据腾讯发布的《电信网络诈骗治理研究报告》(2019年上半年)显示,互联网恶意账号是电信诈骗的源头,诈骗行为人利用大量账号资源用于提供网络身份并隐藏真实身份。“虚假身份”、“闻声不见人”是电信诈骗的两大显著特点。

 
针对上述特点,“形简意丰”的语音及其派生技术成为了电信防欺诈的重要突破口。首先就是可以助力真实身份的核实。已有研究表明在某些特定环境下声纹可以用来作为有效证据。美国联邦调查局曾对2,000例与声纹相关的案件进行统计,利用声纹作为证据只有0.31%的错误率。


那么是不是只要在电话信道中加入声纹识别技术就能有效防止电信诈骗了呢?其实不然。虽然声纹识别是有效防止电信欺诈的主力军,但也不能hold住所有场景。下面举几个典型诈骗案例:

微信图片_20191012163158.jpg

假冒案例


A:我是B,请给我打钱。

欺诈方法:模仿、录音、合成/转换。

欺诈人获取了张某的账户及密码,利用合成语音或张某的录音拼接重放,假冒张某欺骗他人,进行金融交易。

鉴定方法:声纹比对+活体检测。

对于案例中的“假冒”现象郑方博士从技术角度进行了解答。常见的“假声音”有语音模仿、语音合成、语音转换、录音重放,前两种对于声纹识别并不具有太多的威胁,因为计算机比人耳要灵敏的多,模仿与合成还无法做到完全一样,合成/转换的语音中都存在一些非自然的特性,使用时还需要重放操作,所以检测录音重放是防假冒的重点。清华—得意团队研发的防录音攻击算法,在国际自动说话人验证欺骗和对策挑战赛ASVspoof 2019中夺得冠军,等错误率低于0.5%。

结论:A是坏人!

前提假设:未获授权冒用他人身份者视为欺诈人。

命中率:很高


声纹复用案例

A:现在我是B
A:现在我是C
A:现在我是D
欺诈方法:身份复用。
欺诈人使用自己的声音和盗取获得的他人身份信息进行注册,以他人名义进行信贷交易。
鉴定方法:声纹辨认。
这种情况会使欺诈人留下自己的声音痕迹,银行机构可以把该声纹信息列入黑名单,通过声纹辨认技术防止该诈骗分子再次进行欺诈。
结论:A是坏人。
前提假设:主动进行多人身份宣称的视为欺诈人。
命中率:高


微信图片_20191012163153.jpg

变声案例

A:我其实不是A……
欺诈方法:变声。
欺诈人得知自已被列入了银行的声纹黑名单,便盗用他人信息,注册新帐号,在需要语音通话时掩盖自己的真实声音。
鉴定方法:语音信号综合检测。
“变声案例”中诈骗人为了不让系统发现,掩蔽了自己本来的声音,这种方式可以让他拥有多个身份。针对这种“心机”做法,银行如果只依靠声纹辨认技术可能无法发现,导致很多人会莫名其妙的背上了贷款。郑方博士提到可以利用信号处理技术,通过频谱分析等手段检测出声纹掩蔽,再重建欺诈人的声纹,加入黑名单中,这样才能解决这一类案例。
结论1:A在闹着玩。
结论2:A是坏人。
前提假设:主动进行声纹掩蔽的大概率是欺诈人。
命中率:较高



微信图片_20191017111131.jpg

诱导案例

骗子:“我是XX医院医生,你的父亲出了车祸在我院救治,请速来缴费”
欺诈方法:话术诱导/欺骗。
真实的案例中,诈骗人大多会构建场景,进行脚本设计,比如说“XX朋友/亲人出车祸了、急需钱!”或伪装成公检法、运营商人员先拿你涉嫌“洗钱”、“发送诈骗信息”等话术唬住你。如果你不信,诈骗分子甚至能给你发来身份证明、公函等。一旦吓住你,他们就会套路你把账户里的钱转到“监管账户”进行“审查”。
鉴定方法:语音识别+语义分析理解。
语音内容中会包含诱导性词句,这时就需要利用语音识别/语义理解技术去发现和甄别。清华—得意团队在所承担的973项目的子课题中,实现在复杂的互联网环境中对言语信息进行处理和深度理解,这样的技术可以对诱导信息进行检测和预警。
前提假设:说话内容中存在诱导词的大概率是欺诈人。



微信图片_20191017111137.jpg


“动情”案例

骗子:你的银行账户涉嫌违法洗黑钱!
被骗人:我没有做违法的事情啊?是不是搞错了?
欺诈方法:话术诱导/欺骗。
(与诱导案例中欺诈方法相同)
鉴定方法:情感识别检测。
在欺诈事件中,被害人听到欺诈人虚构的“被害”事件后,声音中会有明显的情绪波动,比如紧张、害怕、焦虑等;同样地,欺诈人在实施过程中声音也会有情绪的变化,例如紧张、恍惚等,这些都会导致声音中的韵律异常,情感识别技术可以用来进行判断。早在2017年多模态情感识别竞赛中,清华-得意情感计算团队便夺得音频情感识别子任务单项第一的优异成绩。
前提假设:对话双方均存在心理波动异常的大概率是欺诈电话。

对付狡猾的欺诈人,反欺诈策略必须针锋相对。对于变声、假冒(模仿、合成/转换、录音重放或录音拼接重放的“假声音”)、诱导、威胁等各种电信欺诈手段,我们在应用声纹识别技术时必须融合多项技术来综合提高反欺诈能力。


简言之

语音反欺诈≠电话信道声纹识别

 

正如郑方博士所说:要综合利用声纹识别、语音识别、情感识别、语义分析和理解、信号处理等技术寻找声音中的线索,才能最大程度防范欺诈事件的发生。


愿天下无诈!


地址:北京市海淀区双清路77号院4号楼9层
邮编:100084
电话:+86-10-8289-3532
传真:+86-10-8289-6692

版权所有@北京得意音通技术有限责任公司 2002-2017. 京ICP备 05032314号 京公网安备