36氪:基于"声密保3.0",「得意音通」想借声纹识别技术解决身份认证问题 2017-7

随着移动互联网的发展,智能设备的普及使得各种网上活动变得越来越便捷;而在改变了人们的生活方式的同时,也使得安全问题面临前所未有的挑战。在这过程中,解决远程身份认证也便成了重中之重的问题,亟待借助人工智能的最新技术防护安全。

7月31日,在清华《人工智能与信息安全》前沿论坛上,得意音通信息技术研究院宣布正式成立。其中,清华大学以知识产权入股,得意音通投资清华大学语音和语言技术中心,双方会在声密保相关核心发明专利上加大投入,同时也会参与信息安全、公共安全等技术领域标准的共同制定,真正实现“产、学、研”一体化。据悉,该研究院成立的主要定位包含两方个方向,即:

其一,基于声纹及其他生物特征识别技术相融合的身份认证技术;

其二,基于声纹及其他语音和语言技术的舆情分析与安全预警;

得意音通,成立于2002年4月,是一家声纹识别技术研发商,其三大核心技术包括声纹识别(VPR)技术、自动语音识别(ASR)技术以及中文自然语言理解(CNLU)技术。公司通过为软件开发商、系统集成商、硬件生产商等提供应用编程接口(API)和软件开发工具包(SDK)或提供定制的软件系统,以为客户提供相关的解决方案和声纹识别云服务。目前,基于 “声密保SDK、声纹识别VPR” 产品内核,可广泛应用于日常生活、金融、社保领域,产品包括声纹考勤、手机声纹锁、声纹门禁系统、社区矫正系统等。据悉,公司已于2015年9月获得北汽集团3000万的A+轮投资。

此次论坛上,得意音通也着重介绍了公司的声密保3.0技术。据得意音通副总经理兼首席架构师肖永明表示,该声纹身份认证技术具有功能性全、性能强、运行稳定等特点,具体可体现在4方面:

  • 安全性,能够防止手机丢失、借助播放录音等方面带来的安全隐患问题;

  • 稳定性,在压力测试持续超3300万次的事务请求下,失败或故障次数为0;

  • 伸缩性,通过多方面的分布式并行处理,能够根据具体需求灵活调整,支持的用户规模可从几个人到20亿;

  • 可持续性,鉴于变化的常态性,为了保证用户的安全,公司除了利用深厚的研发能力,也会尝试跟用户间建立某种程度的捆绑关系;

而之所以能做到几点,肖永明表示,一方面是源于声纹自身包含的固定与变化且内容丰富的特性,能够提供广阔的产品研究空间;另一方面,团队在声纹识别领域具有15年的技术积累,掌握了多重安全手段的灵活组合技术,且具有全面的专利保护。

至于如何这些将技术、服务更好的推向市场,肖永明则表示,对于企业而言,传统的一次性买断模式虽然具有相对独占性,但一次性资金投入压力较大,同时也很难分享最新研究成果;相比之下,得意音通在产品销售模式上,更偏向于采取新的服务模式,其具有较好的共享性,也可以使企业在一次性投入较小的情况下,分享最新的研究成果。据悉,目前公司已经跟建行、银联、中国金融认证中心、贵阳银行兰州银行、公安部、国家信息中心、北汽集团、中国移动等都有相关的深度合作。

事实上,在身份认证识别领域,基于生物特征的识别技术包含了人脸识别、指纹识别、声纹识别、虹膜识别等。而得意音通之所以会专注于声纹识别方向,一方面是基于声纹识别本身的特性,即其交互性强、无死角、形简意丰的独特特点,如口音、语种、语音、情感、性别、声纹等不同维度;另一方面,远程场景下的虹膜、指纹、人脸等其他生物特征识别技术存在防攻击能力弱且成本高的问题,相比之下,语音技术是纯算法实现、零额外成本,且更容易实现一句话解决 “从语音识别到意图理解再到身份确认” 的所有问题。

但即便如此,声纹识别的应用也仍然会面临一些挑战。技术角度,会受到特定领域、特定应用等局限性影响;用户角度,对新技术的应用往往会存在置信度的问题,出于多重保险考虑,短期内主演还是会以多种识别技术融合进行组合认证;而要想实现从1:1到1:N等更多领域的应用,给用户带来更好的体验等都还有很长的路要走。

本文由「荔枝」原创出品, 转载或内容合作请点击 转载说明 ;违规转载必究。

寻求报道 。

首页    媒体报道    2017    36氪:基于"声密保3.0",「得意音通」想借声纹识别技术解决身份认证问题 2017-7
收藏
创建时间:2021-11-24 16:19