随着我国科技发展,人们的生活也越来越快节奏,这个改变促进了更多智能高效的产品的发展,比如智能家居。其中智能家居有很多新型技术,比如:指纹识别、虹膜识别、人脸识别和声纹识别等等。今天让我们跟随智能家居厂家的脚步一起来认识一下声纹识别吧。
首先让我们来看看声纹识别原理。声纹是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官—舌、齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。这也使得声纹识别也可以称为身份认证的一种方式。
其中声纹识别过程包括:语音信号处理、声纹特征提取、声纹建模、声纹比对、判别决策等。
声纹识别技术的关键在于对各种声学特征参数进行处理,并确定模式匹配方法,主要的模式匹配方法包括:
1、多项式分类器方法:有较高的精度,但模型存储和计算量都比较大;
2、VQ聚类方法(如LBG):效果比较好,算法复杂度也不高,和HMM方法配合起来更可以收到更好的效果;
3、模板匹配方法:利用动态时间弯折( DTW )以对准训练和测试特征序列,主要用于固定词组的应用(通常为文本相关务);
4、神经网络方法:有很多种形式,如多层感知、径向基函数( RBF )等,可以显式训练以区分说话人和其背景说话人,其训练量很大,且模型的可推广性不好;
5、最近邻方法:训练时保留所有特征矢量,识别时对每个矢量都找到训练矢量中最近的K个,据此进行识别,通常模型存储和相似计算的量都很大;
此外还有概率统计方法、动态时间规整方法、矢量量化方法等等。
在对声纹识别有了初步了解之后,相信大家一定很好奇声纹识别有哪些优缺点。声纹识别的优势在于:
1、声纹辨认和确认的算法复杂度低;
2、声纹提取方便,可在不知不觉中完成,因此使用者的接受程度也高;
3、适合远程身份确认,只需要一个麦克风或电话、 手机就可以通过网路(通讯网络或互联网络)实现远程登录;
4、配合一些其他措施 ,如通过语音识别进行内容鉴别等,可以提高准确率。这些优势使得声纹识别的应用越来越受到系统开发者和用户青睐;
5、获取语音的识别成本低廉,使用简单, 一个麦克风即可,在使用通讯设备时更无需额外的录音设备。
当然,声纹识别的应用有一些缺点 ,比如同一个人的声音具有易变性,易受身体状况、年龄、情绪等的影响;比如不同的麦克风和信道对识别性能有影响;比如环境噪音对识别有干扰;又比如混合说话人的情形下人的声纹特征不易提取等等。
目前,声纹识别技术的市场应用并不广泛,,但并非这项技术本身不成熟,而是由于实际商业应用场景的复杂性,很可能导致身份识别产生较大误差。
首先,说话人的语音声学特征不可避免地具有发展性和变异性,既便是同一个人,即便采集到的两段语音内容都是相同的,但是在不同的时期或特殊的情境下,由于情绪、语速、疲劳程度等原因,声纹特征也不尽一致。
其次,声纹特征提取是在现实环境中进行的,如何降噪以及去混响依然是声纹识别的一大难题。在外部环境中,各种噪音都会通过录音设备采集进来,这些噪音会在一定程度上混淆或者淹没说话人信息,使得声纹系统无法获取准确的说话人声纹特征。因此,应用声纹识别技术的产品大多适合在相对安静的场合使用。在未来,声纹识别技术也还有很长一段路要走。