电信科学 ›› 2018, Vol. 34 ›› Issue (2): 46-57.doi: 10.11959/j.issn.1000-0801.2018041

• 研究与开发 • 上一篇    下一篇

基于卷积神经网络的电子变调语音检测算法

徐宏伟,严迪群,阳帆,王让定,金超,向立   

  1. 宁波大学,浙江 宁波 315211
  • 修回日期:2017-10-02 出版日期:2018-02-01 发布日期:2018-02-13
  • 作者简介:徐宏伟(1990-),男,宁波大学信息科学与工程学院硕士生,主要研究方向为多媒体通信与信息安全等。|严迪群(1979-),男,博士,宁波大学信息科学与工程学院副教授、硕士生导师,主要研究方向为多媒体通信、信息安全、基于深度学习的数字语音取证等。|阳帆(1991-),男,宁波大学信息科学与工程学院硕士生,主要研究方向为多媒体通信与信息安全等。|王让定(1962-),男,博士,宁波大学高等技术研究院教授、博士生导师,主要研究方向为多媒体通信与取证、信息隐藏与隐写分析、智能抄表及传感网络技术等。|金超(1990-),男,宁波大学信息科学与工程学院博士生,主要研究方向为多媒体通信与信息安全等。|向立(1994-),男,宁波大学信息科学与工程学院硕士生,主要研究方向为多媒体通信与信息安全等。
  • 基金资助:
    国家自然科学基金资助项目(61300055);国家自然科学基金资助项目(61672302);浙江省自然科学基金资助项目(LZ15F020002);浙江省自然科学基金资助项目(LY17F020010);宁波市自然科学基金资助项目(2017A610123)

Detection algorithm of electronic disguised voice based on convolutional neural network

Hongwei XU,Diqun YAN,Fan YANG,Rangding WANG,Chao JIN,Li XIANG   

  1. Ningbo University,Ningbo 315211,China
  • Revised:2017-10-02 Online:2018-02-01 Published:2018-02-13
  • Supported by:
    The National Natural Science Foundation of China(61300055);The National Natural Science Foundation of China(61672302);Natural Science Foundation of Zhejiang Province of China(LZ15F020002);Natural Science Foundation of Zhejiang Province of China(LY17F020010);Natural Science Foundation of Ningbo City of China(2017A610123)

摘要:

提出了一种基于梅尔倒谱系数统计特征和卷积神经网络的电子变调语音检测算法。首先提取待测语音的梅尔倒谱系数及其差分系数,并将上述系数的统计特征进行有针对性的构造,作为卷积神经网络的输入。从卷积核尺寸、卷积核个数以及池化层尺寸等方面,对24种不同网络结构进行了测试评估,最终确定了可有效用于变调检测的卷积神经网络结构。实验结果表明,所提出的算法能够有效地检测出电子变调的痕迹,并可准确估计出电子变调语音经过的具体伪造操作,为电子变调语音的检测提供了一种新的方法。

关键词: 电子变调语音, 卷积神经网络, 梅尔倒谱系数

Abstract:

An electronic disguised voice detection algorithm based on the statistical features of MFCC and the convolution neural network was proposed.Firstly,the statistical features of MFCC were extracted and reconstructed as the input of convolution neural network.Considering the convolution kernel size,the number of convolution kernels and the pooling size,24 different network structures were evaluated in this work.Finally,the convolution neural network structure which could be effectively used for electronic disguised voice detection was determined.The experimental results show that the proposed algorithm can effectively detect the trace of electronic disguising.Meanwhile,the specific forgery operation of the electronic disguised voice can also be estimated.

Key words: electronic disguised voice, convolutional neural network, MFCC

中图分类号: 

No Suggested Reading articles found!