电信科学 ›› 2021, Vol. 37 ›› Issue (5): 91-99.doi: 10.11959/j.issn.1000-0801.2021108

• 专题:通信与AI融合 • 上一篇    下一篇

采用完整局部二进制模式的伪装语音检测

徐剑1, 简志华1, 于佳祺1, 金易帆2, 游林2, 汪云路2   

  1. 1 杭州电子科技大学通信工程学院,浙江 杭州 310018
    2 杭州电子科技大学网络空间安全学院,浙江 杭州 310018
  • 修回日期:2021-05-01 出版日期:2021-05-20 发布日期:2021-05-01
  • 作者简介:徐剑(1995− ),男,杭州电子科技大学通信工程学院硕士生,主要研究方向为语音处理和语音伪装检测
    简志华(1978− ),男,博士,杭州电子科技大学通信工程学院副教授、硕士生导师,主要研究方向为语音转换、伪装语音检测、声纹识别等
    于佳祺(1997− ),男,杭州电子科技大学通信工程学院硕士生,主要研究方向为语音伪装检测、特征提取与分析
    金易帆(1996− ),男,杭州电子科技大学网络空间安全学院硕士生,主要研究方向为语音伪装检测、声纹识别
    游林(1966− ),男,博士,杭州电子科技大学网络空间安全学院教授、硕士生导师,主要研究方向为生物信息处理、信息安全、密码学等
    汪云路(1980− ),女,博士,杭州电子科技大学网络空间安全学院讲师,主要研究方向为音频信息处理、信息隐藏
  • 基金资助:
    国家自然科学基金资助项目(61201301);国家自然科学基金资助项目(61772166)

Completed local binary pattern based speech anti-spoofing

Jian XU1, Zhihua JIAN1, Jiaqi YU1, Yifan JIN2, Lin YOU2, Yunlu WANG2   

  1. 1 School of Communication Engineering, Hangzhou Dianzi University, Hangzhou 310018, China
    2 School of Cyberspace Security, Hangzhou Dianzi University, Hangzhou 310018, China
  • Revised:2021-05-01 Online:2021-05-20 Published:2021-05-01
  • Supported by:
    The National Natural Science Foundation of China(61201301);The National Natural Science Foundation of China(61772166)

摘要:

针对基于局部二进制模式(LBP)的伪装语音检测算法在检测语音转换的欺骗攻击时效果较差的情况,提出了一种基于完整局部二进制模式(CLBP)的伪装语音检测方法。利用变量Q变换(VQT)生成语音信号的语谱图并应用完整局部二进制模式提取语谱图中的纹理特征向量,再用该纹理特征向量训练真/伪语音分类器,实现伪装语音检测。实验结果表明,所提方法在检测语音转换的欺骗攻击时效果更好,并且当变量Q变换的附加参数γ值为50时,由完整局部二进制模式特征向量训练的基于径向基核函数的支持向量机具有最佳的伪装语音检测性能。

关键词: 说话人证实, 伪装检测, 完整局部二进制模式, 变量Q变换

Abstract:

In view of the fact that the disguised speech detection algorithm based on local binary pattern (LBP) is not effective in detecting the spoofing attack from voice conversion, an anti-spoofing method based on completed local binary pattern (CLBP) was proposed.In this method, the spectrogram of speech signals is generated by the variable Q transformation (VQT) and used to train the true/spoofed speech classifier, so as to perform the detection of disguised speech.The experimental results demonstrate that the proposed anti-spoofing method based on the CLBP in the detection of voice conversion deception is better than the LBP-based algorithm, and when the parameter γ in VQT is set to 50, the detection system based on CLBP and SVM-RBF has the best performance for anti-spoofing the disguise speech.

Key words: speaker verification, anti-spoofing, CLBP, VQT

中图分类号: 

No Suggested Reading articles found!