自编码器及其应用综述

doi:10.11959/j.issn.1000-436x.2021160

[1]

HINTON

G E

, SALAKHUTDINOV

R R

.

Reducing the dimensionality of data with neural networks

[J]. Science, 2006,313(5786): 504-507.

[本文引用: 1]

[2]

BENGIO

Y

, COURVILLE

A

, VINCENT

P

.

Representation learning:a review and new perspectives

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013,35(8): 1798-1828.

[本文引用: 1]

[3]

SCHOLKOPF

B

, PLATT

J

, HOFMANN

T

.

Greedy layer-wise training of deep networks

[J]. Advances in Neural Information Processing Systems, 2007,19: 153-160.

[本文引用: 1]

[4]

袁非牛, 章琳, 史劲亭 ,等.

自编码神经网络理论及应用综述

[J]. 计算机学报, 2019,42(1): 203-230.

[本文引用: 1]

YUAN

F N

, ZHANG

L

, SHI

J T

,et al.

Theories and applications of auto-encoder neural networks:a literature survey

[J]. Chinese Journal of Computers, 2019,42(1): 203-230.

[本文引用: 1]

[5]

RUMELHART

D E

, HINTON

G E

, WILLIAMS

R J

.

Learning representations by back-propagating errors

[J]. Nature, 1986,323(6088): 533-536.

[本文引用: 2]

[6]

BOURLARD

H

, KAMP

Y

.

Auto-association by multilayer perceptrons and singular value decomposition

[J]. Biological Cybernetics, 1988,59(4/5): 291-294.

[本文引用: 2]

[7]

SALAKHUTDINOV

R

, HINTON

G

.

Deep boltzmann machines

[C]// Proceedings of the Twelfth International Conference on Artificial Intelligence and Statistics. Clearwater Beach:MLRP, 2009: 448-455.

[本文引用: 1]

[8]

FISCHER

A

, IGEL

C

.

Training restricted Boltzmann machines:an introduction

[J]. Pattern Recognition, 2014,47(1): 25-39.

[本文引用: 2]

[9]

GOODFELLOW

I

, POUGET-ABADIE

J

, MIRZA

M

,et al.

Generative adversarial nets

[C]// Proceedings of the Advances in Neural Information Processing Systems. Massachusetts:MIT Press, 2014: 2672-2680.

[本文引用: 1]

[10]

NG

A

.

Sparse autoencoder

[J]. CS294A Lecture Notes, 2011,72(1): 1-19.

[本文引用: 2]

[11]

VINCENT

P

, LAROCHELLE

H

, LAJOIE

I

,et al.

Stacked denoising autoencoders:learning useful representations in a deep network with a local denoising criterion

[J]. Journal of Machine Learning Research, 2010,11(12): 3371-3408.

[本文引用: 2]

[12]

RIFAI

S

, VINCENT

P

, MULLER

X

,et al.

Contractive auto-encoders:explicit invariance during feature extraction

[C]// Proceedings of the 28th International Conference on Machine Learning. Bellevue:Omnipress, 2011: 833-840.

[本文引用: 1]

[13]

KINGMA

D P

, WELLING

M

.

Auto-encoding variational bayes

[J]. arXiv Preprint,arXiv:1312.6114, 2013.

[本文引用: 2]

[14]

MIAN

P

, JIE

J

, ZHU

L

,et al.

Radar HRRP recognition based on discriminant deep autoencoders with small training data size

[J]. Electronics Letters, 2016,52(20): 1725-1727.

[本文引用: 2]

[15]

FENG

B

, CHEN

B

, LIU

H W

.

Radar HRRP target recognition with deep networks

[J]. Pattern Recognition, 2017,61: 379-393.

[本文引用: 2]

[16]

LI

Y C

, MA

R

, JIAO

R H

.

A hybrid malicious code detection method based on deep learning

[J]. International Journal of Security and Its Applications, 2015,9(5): 205-216.

[本文引用: 2]

[17]

JAVAID

A

, NIYAZ

Q

, SUN

W Q

,et al.

A deep learning approach for network intrusion detection system

[C]// Proceedings of the 9th EAI International Conference on Bio-inspired Information and Communications Technologies. New York:ACM Press, 2016: 21-26.

[本文引用: 2]

[18]

ZHANG

Y Y

, GAO

L

, LI

X Y

,et al.

A novel data-driven fault diagnosis method based on deep learning

[C]// International Conference on Data Mining and Big Data. Berlin:Springer, 2017: 442-452.

[本文引用: 2]

[19]

LU

C

, WANG

Z Y

, QIN

W L

,et al.

Fault diagnosis of rotary machinery components using a stacked denoising autoencoder-based health state identification

[J]. Signal Processing, 2017,130: 377-388.

[本文引用: 2]

[20]

ZHANG

J

, YU

J

, TAO

D C

.

Local deep-feature alignment for unsupervised dimension reduction

[J]. IEEE Transactions on Image Processing, 2018,27(5): 2420-2432.

[本文引用: 1]

[21]

WANG

J L

, HOU

B

, JIAO

L C

,et al.

POL-SAR image classification based on modified stacked autoencoder network and data distribution

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2020,58(3): 1678-1695.

[本文引用: 1]

[22]

LIU

C

, TANG

L X

, LIU

J Y

.

A stacked autoencoder with sparse Bayesian regression for end-point prediction problems in steelmaking process

[J]. IEEE Transactions on Automation Science and Engineering, 2020,17(2): 550-561.

[本文引用: 1]

[23]

KOHONEN

T

, HONKELA

T

.

Kohonen network

[J]. Scholarpedia, 2007,2(1): 1568.

[本文引用: 1]

[24]

胡铭菲, 刘建伟, 左信 .

深度生成模型综述

[J]. 自动化学报, 2020,41: 1-35.

[本文引用: 1]

HU

M F

, LIU

J W

, ZUO

X

.

Survey on deep generative model

[J]. Acta Automatica Sinica, 2020,41: 1-35.

[本文引用: 1]

[25]

翟正利, 梁振明, 周炜 ,等.

变分自编码器模型综述

[J]. 计算机工程与应用, 2019,55(3): 1-9.

[本文引用: 1]

ZHAI

Z L

, LIANG

Z M

, ZHOU

W

,et al.

Research overview of variational auto-encoders models

[J]. Computer Engineering and Applications, 2019,55(3): 1-9.

[本文引用: 1]

[26]

MASCI

J

, MEIER

U

, CIREŞAN

D

,et al.

Stacked convolutional auto-encoders for hierarchical feature extraction

[C]// Lecture Notes in Computer Science. Berlin:Springer, 2011: 52-59.

[本文引用: 1]

[27]

KASUN

L L C

, ZHOU

H

, HUANG

G B

,et al.

Representational learning with extreme learning machine for big data

[J]. IEEE Intelligent Systems, 2013,28(6): 31-34.

[本文引用: 1]

[28]

XIE

J

, FANG

Y

, ZHU

F

,et al.

Deepshape:deep learned shape descriptor for 3D shape matching and retrieval

[C]// 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway:IEEE Press, 2015: 1275-1283.

[本文引用: 2]

[29]

LI

R

, WANG

X D

, LEI

L

,et al.

L₂₁-norm based loss function and regularization extreme learning machine

[J]. IEEE Access, 2019,7: 6575-6586.

[本文引用: 1]

[30]

MAKHZANI

A

, SHLENS

J

, JAITLY

N

,et al.

Adversarial autoencoders

[J]. arXiv Preprint,arXiv:1511.05644, 2015.

[本文引用: 1]

[31]

MAJUMDAR

A

.

Graph structured autoencoder

[J]. Neural Networks, 2018,106: 271-280.

[32]

FAN

F L

, SHAN

H M

, KALRA

M K

,et al.

Quadratic autoencoder (Q-AE) for low-dose CT denoising

[J]. IEEE Transactions on Medical Imaging, 2020,39(6): 2035-2050.

[33]

JOO

W

, LEE

W

, PARK

S

,et al.

Dirichlet variational autoencoder

[J]. Pattern Recognition, 2020,107: 107514-2050.

[34]

CHEN

S

, WU

M

.

Attention collaborative autoencoder for explicit recommender systems

[J]. Electronics, 2020,9(10): 1716.

[35]

YUAN

X F

, WANG

Y L

, YANG

C H

,et al.

Stacked isomorphic autoencoder based soft analyzer and its application to sulfur recovery unit

[J]. Information Sciences, 2020,534: 72-84.

[本文引用: 1]

[36]

WANG

X D

, LI

R

, WANG

J

,et al.

One-dimension hierarchical local receptive fields based extreme learning machine for radar target HRRP recognition

[J]. Neurocomputing, 2020,418: 314-325.

[本文引用: 1]

[37]

ZHAO

F X

, LIU

Y X

, HUO

K

,et al.

Radar HRRP target recognition based on stacked autoencoder and extreme learning machine

[J]. Sensors, 2018,18(2): 173.

[本文引用: 1]

[38]

CHEN

X Y

, PENG

X Y

, LI

J B

,et al.

Sparse autoencoder based manifold analyzer model of multi-angle target feature

[J]. IEEE Access, 2020,8: 153250-153263.

[本文引用: 1]

[39]

KANG

M

, JI

K F

, LENG

X G

,et al.

Synthetic aperture radar target recognition with feature fusion based on a stacked autoencoder

[J]. Sensors, 2017,17(12): 192-197.

[本文引用: 1]

[40]

DENG

S

, DU

L

, LI

C

,et al.

SAR automatic target recognition based on euclidean distance restricted autoencoder

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017,10(7): 3323-3333.

[本文引用: 1]

[41]

DONG

G G

, LIAO

G S

, LIU

H W

,et al.

A review of the autoencoder and its variants:a comparative perspective from target recognition in synthetic-aperture radar images

[J]. IEEE Geoscience and Remote Sensing Magazine, 2018,6(3): 44-68.

[本文引用: 1]

[42]

GUO

J

, WANG

L

, ZHU

D Y

,et al.

Compact convolutional autoencoder for SAR target recognition

[J]. IET Radar,Sonar ＆ Navigation, 2020,14(7): 967-972.

[本文引用: 1]

[43]

MISHRA

P

, VARADHARAJAN

V

, TUPAKULA

U

,et al.

A detailed investigation and analysis of using machine learning techniques for intrusion detection

[J]. IEEE Communications Surveys ＆ Tutorials, 2019,21(1): 686-728.

[本文引用: 1]

[44]

AL-QATF

M

, YU

L S

, AL-HABIB

M

, ,et al.

Deep learning approach combining sparse autoencoder with SVM for network intrusion detection

[J]. IEEE Access, 2018,6: 52843-52856.

[本文引用: 1]

[45]

CAO

V L

, NICOLAU

M

, MCDERMOTT

J

.

Learning neural representations for network anomaly detection

[J]. IEEE Transactions on Cybernetics, 2019,49(8): 3074-3087.

[本文引用: 1]

[46]

CHOUHAN

N

, KHAN

A

, KHAN

H U R

.

Network anomaly detection using channel boosted and residual learning based deep convolutional neural network

[J]. Applied Soft Computing, 2019,83: 105612.

[本文引用: 1]

[47]

LOPEZ-MARTIN

M

, CARRO

B

, SANCHEZ-ESGUEVILLAS

A

, .

Variational data generative model for intrusion detection

[J]. Knowledge and Information Systems, 2019,60(1): 569-590.

[本文引用: 1]

[48]

IERACITANO

C

, ADEEL

A

, MORABITO

F C

,et al.

A novel statistical analysis and autoencoder driven intelligent intrusion detection approach

[J]. Neurocomputing, 2020,387: 51-62.

[本文引用: 1]

[49]

TANG

C F

, LUKTARHAN

N

, ZHAO

Y X

.

SAAE-DNN:deep learning method on intrusion detection

[J]. Symmetry, 2020,12(10): 1695.

[本文引用: 1]

[50]

樊红卫, 张旭辉, 曹现刚 ,等.

智慧矿山背景下我国煤矿机械故障诊断研究现状与展望

[J]. 振动与冲击, 2020,39(24): 194-204.

[本文引用: 1]

FAN

H W

, ZHANG

X H

, CAO

X G

,et al.

Research status and prospect of fault diagnosis of China’s coal mine machines under background of intelligent mine

[J]. Journal of Vibration and Shock, 2020,39(24): 194-204.

[本文引用: 1]

[51]

WEN

L

, GAO

L

, LI

X Y

.

A new deep transfer learning based on sparse auto-encoder for fault diagnosis

[J]. IEEE Transactions on Systems,Man,and Cybernetics:Systems, 2019,49(1): 136-144.

[本文引用: 1]

[52]

LI

K

, XIONG

M

, LI

F C

,et al.

A novel fault diagnosis algorithm for rotating machinery based on a sparsity and neighborhood preserving deep extreme learning machine

[J]. Neurocomputing, 2019,350: 261-270.

[本文引用: 1]

[53]

YU

J B

.

A selective deep stacked denoising autoencoders ensemble with negative correlation learning for gearbox fault diagnosis

[J]. Computers in Industry, 2019,108: 62-72.

[本文引用: 1]

[54]

ZHAO

D F

, LIU

S L

, GU

D

,et al.

Enhanced data-driven fault diagnosis for machines with small and unbalanced data based on variational auto-encoder

[J]. Measurement Science and Technology, 2020,31(3): 035004.

[本文引用: 1]

[55]

YU

J B

, ZHOU

X K

.

One-dimensional residual convolutional autoencoder based feature learning for gearbox fault diagnosis

[J]. IEEE Transactions on Industrial Informatics, 2020,16(10): 6347-6358.

[本文引用: 1]

[56]

GAO

W

, QIAO

S P

, WAI

R J

,et al.

A newly designed diagnostic method for mechanical faults of high-voltage circuit breakers via SSAE and IELM

[J]. IEEE Transactions on Instrumentation and Measurement, 2021,70: 1-13.

[本文引用: 1]

[57]

许卓斌, 郑海山, 潘竹虹 .

基于改进自编码器的文本分类算法

[J]. 计算机科学, 2018,45(6): 208-210,240.

[本文引用: 2]

XU

Z B

, ZHENG

H S

, PAN

Z H

.

Improved autoencoder based classification algorithm for text

[J]. Computer Science, 2018,45(6): 208-210,240.

[本文引用: 2]

[58]

JIANG

M Y

, LIANG

Y C

, FENG

X Y

,et al.

Text classification based on deep belief network and softmax regression

[J]. Neural Computing and Applications, 2018,29(1): 61-70.

[本文引用: 1]

[59]

LI

Q

, LI

P F

, MAO

K Z

,et al.

Improving convolutional neural network for text classification by recursive data pruning

[J]. Neurocomputing, 2020,414: 143-152.

[本文引用: 1]

[60]

冀俊忠, 庞皓明, 杨翠翠 ,等.

基于多隐层极限学习机的文本分类方法

[J]. 北京工业大学学报, 2019,45(6): 534-545.

[本文引用: 1]

JI

J Z

, PANG

H M

, YANG

C C

,et al.

Text classification method based on multi-layer extreme learning machine

[J]. Journal of Beijing University of Technology, 2019,45(6): 534-545.

[本文引用: 1]

[61]

XU

W D

, TAN

Y

.

Semisupervised text classification by variational autoencoder

[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020,31(1): 295-308.

[本文引用: 1]

[62]

DONOHO

D L

.

Compressed sensing

[J]. IEEE Transactions on Information Theory, 2006,52(4): 1289-1306.

[本文引用: 1]

[63]

WANG

M D

, XIAO

D

, XIANG

Y

.

Low-cost and confidentiality-preserving multi-image compressed acquisition and separate reconstruction for Internet of multimedia things

[J]. IEEE Internet of Things Journal, 2021,8(3): 1662-1673.

[本文引用: 1]

[64]

RAVISHANKAR

S

, BRESLER

Y

.

MR image reconstruction from highly undersampled k-space data by dictionary learning

[J]. IEEE Transactions on Medical Imaging, 2011,30(5): 1028-1041.

[本文引用: 1]

[65]

TAO

L

, JIANG

X

, LIU

X Z

,et al.

Multiscale supervised kernel dictionary learning for SAR target recognition

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2020,58(9): 6281-6297.

[本文引用: 1]

[66]

QIN

C

, SCHLEMPER

J

, CABALLERO

J

,et al.

Convolutional recurrent neural networks for dynamic MR image reconstruction

[J]. IEEE Transactions on Medical Imaging, 2019,38(1): 280-290.

[本文引用: 1]

[67]

张帅勇, 刘美琴, 姚超 ,等.

分级特征反馈融合的深度图像超分辨率重建

[J]. 自动化学报, 2020,46: 1-12.

[本文引用: 1]

ZHANG

S Y

, ZHANG

M Q

, YAO

C

,et al.

Hierarchical feature feedback network for depth super-resolution reconstruction

[J]. Acta Automatica Sinica, 2020,46: 1-12.

[本文引用: 1]

[68]

TAN

C C

, ESWARAN

C

.

Reconstruction and recognition of face and digit images using autoencoders

[J]. Neural Computing and Applications, 2010,19(7): 1069-1079.

[本文引用: 1]

[69]

MEHTA

J

, MAJUMDAR

A

.

RODEO:robust DE-aliasing autoencoder for real-time medical image reconstruction

[J]. Pattern Recognition, 2017,63: 499-510.

[本文引用: 1]

[70]

ZHOU

W Z

, DU

H Q

, MEI

W B

,et al.

Efficient structurally-strengthened generative adversarial network for MRI reconstruction

[J]. Neurocomputing, 2021,422: 51-61.

[本文引用: 1]

[71]

DABIRI

S

, LU

C T

, HEASLIP

K

,et al.

Semi-supervised deep learning approach for transportation mode identification using GPS trajectory data

[J]. IEEE Transactions on Knowledge and Data Engineering, 2020,32(5): 1010-1023.

[本文引用: 1]

[72]

YUAN

X

, GU

Y

, WANG

Y

,et al.

A deep supervised learning framework for data-driven soft sensor modeling of industrial processes

[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020,31(11): 4737-4746.

[本文引用: 1]

[73]

LIU

Z

, LI

J G

, SHEN

Z Q

,et al.

Learning efficient convolutional networks through network slimming

[C]// 2017 IEEE International Conference on Computer Vision (ICCV). Piscataway:IEEE Press, 2017: 2755-2763.

[本文引用: 1]

[74]

XIANG

Q

, WANG

X D

, SONG

Y F

,et al.

One-dimensional convolutional neural networks for high-resolution range profile recognition via adaptively feature recalibrating and automatically channel pruning

[J]. International Journal of Intelligent Systems, 2021,36(1): 332-361.

[本文引用: 1]

[75]

王晓丹, 来杰, 李睿 ,等.

多层去噪极限学习机

[J]. 吉林大学学报(工学版), 2020,50(3): 1031-1039.

[本文引用: 1]

WANG

X D

, LAI

J

, LI

R

,et al.

Multilayer denoising extreme learning machine

[J]. Journal of Jilin University (Engineering and Technology Edition), 2020,50(3): 1031-1039.

[本文引用: 1]

[76]

LI

S

, KAWALE

J

, FU

Y

.

Deep collaborative filtering via marginalized denoising auto-encoder

[C]// Proceedings of the 24th ACM International on Conference on Information and Knowledge Management. New York:ACM Press, 2015: 811-820.

[本文引用: 1]

[77]

LAMATA

L

, ALVAREZ-RODRIGUEZ

U

, MARTÍN-GUERRERO

J D

,et al.

Quantum autoencoders via quantum adders with genetic algorithms

[J]. Quantum Science and Technology, 2018,4(1): 014007.

[本文引用: 1]

[78]

SUN

Y N

, XUE

B

, ZHANG

M J

,et al.

A particle swarm optimization-based flexible convolutional autoencoder for image classification

[J]. IEEE Transactions on Neural Networks and Learning Systems, 2019,30(8): 2295-2309.

[本文引用: 1]

[79]

GLOROT

X

, BENGIO

Y

.

Understanding the difficulty of training deep feedforward neural networks

[C]// Proceedings of the Thirteenth International Conference on Artificial Intelligence and Statistics. New York:ACM Press, 2010: 249-256.

[本文引用: 1]

[80]

HE

K M

, ZHANG

X Y

, REN

S Q

,et al.

Delving deep into rectifiers:surpassing human-level performance on ImageNet classification

[C]// 2015 IEEE International Conference on Computer Vision (ICCV). Piscataway:IEEE Press, 2015: 1026-1034.

[本文引用: 1]

Reducing the dimensionality of data with neural networks

1

2006

... 深度学习作为机器学习领域的研究热点，自被Hinton 等^[1]提出后，便深刻影响着机器学习的发展走向.深度学习通过构建多层神经网络模型，逐层提取样本的高级抽象特征，而后通过分类器或回归算法完成抽象特征到期望输出的映射.与浅层神经网络相比，深度学习模型的多层网络结构拥有更强的特征提取能力，避免了传统机器学习算法需要人工选取特征的局限^[2]，同时采用贪婪预训练方式，逐层初始化网络参数，加快了网络收敛速度^[3].深度学习模型的优异性能得益于其复杂的网络结构，而复杂的网络结构则需要大量样本进行训练.然而在有监督学习模式下，大量样本标签的人工标注是非常困难的，这促进了无监督深度学习模型的发展^[4].典型的深度无监督学习模型有自编码器（AE, autoencoder）^[5-6]、受限波尔兹曼机（RBM, restricted Boltzmann machine）^[7-8]与生成对抗网络（GAN, generative adversarial network）^[9]. ...

Representation learning:a review and new perspectives

1

2013

... 深度学习作为机器学习领域的研究热点，自被Hinton 等^[1]提出后，便深刻影响着机器学习的发展走向.深度学习通过构建多层神经网络模型，逐层提取样本的高级抽象特征，而后通过分类器或回归算法完成抽象特征到期望输出的映射.与浅层神经网络相比，深度学习模型的多层网络结构拥有更强的特征提取能力，避免了传统机器学习算法需要人工选取特征的局限^[2]，同时采用贪婪预训练方式，逐层初始化网络参数，加快了网络收敛速度^[3].深度学习模型的优异性能得益于其复杂的网络结构，而复杂的网络结构则需要大量样本进行训练.然而在有监督学习模式下，大量样本标签的人工标注是非常困难的，这促进了无监督深度学习模型的发展^[4].典型的深度无监督学习模型有自编码器（AE, autoencoder）^[5-6]、受限波尔兹曼机（RBM, restricted Boltzmann machine）^[7-8]与生成对抗网络（GAN, generative adversarial network）^[9]. ...

Greedy layer-wise training of deep networks

1

2007

... 深度学习作为机器学习领域的研究热点，自被Hinton 等^[1]提出后，便深刻影响着机器学习的发展走向.深度学习通过构建多层神经网络模型，逐层提取样本的高级抽象特征，而后通过分类器或回归算法完成抽象特征到期望输出的映射.与浅层神经网络相比，深度学习模型的多层网络结构拥有更强的特征提取能力，避免了传统机器学习算法需要人工选取特征的局限^[2]，同时采用贪婪预训练方式，逐层初始化网络参数，加快了网络收敛速度^[3].深度学习模型的优异性能得益于其复杂的网络结构，而复杂的网络结构则需要大量样本进行训练.然而在有监督学习模式下，大量样本标签的人工标注是非常困难的，这促进了无监督深度学习模型的发展^[4].典型的深度无监督学习模型有自编码器（AE, autoencoder）^[5-6]、受限波尔兹曼机（RBM, restricted Boltzmann machine）^[7-8]与生成对抗网络（GAN, generative adversarial network）^[9]. ...

自编码神经网络理论及应用综述

1

2019

... 深度学习作为机器学习领域的研究热点，自被Hinton 等^[1]提出后，便深刻影响着机器学习的发展走向.深度学习通过构建多层神经网络模型，逐层提取样本的高级抽象特征，而后通过分类器或回归算法完成抽象特征到期望输出的映射.与浅层神经网络相比，深度学习模型的多层网络结构拥有更强的特征提取能力，避免了传统机器学习算法需要人工选取特征的局限^[2]，同时采用贪婪预训练方式，逐层初始化网络参数，加快了网络收敛速度^[3].深度学习模型的优异性能得益于其复杂的网络结构，而复杂的网络结构则需要大量样本进行训练.然而在有监督学习模式下，大量样本标签的人工标注是非常困难的，这促进了无监督深度学习模型的发展^[4].典型的深度无监督学习模型有自编码器（AE, autoencoder）^[5-6]、受限波尔兹曼机（RBM, restricted Boltzmann machine）^[7-8]与生成对抗网络（GAN, generative adversarial network）^[9]. ...

自编码神经网络理论及应用综述

1

2019

... 深度学习作为机器学习领域的研究热点，自被Hinton 等^[1]提出后，便深刻影响着机器学习的发展走向.深度学习通过构建多层神经网络模型，逐层提取样本的高级抽象特征，而后通过分类器或回归算法完成抽象特征到期望输出的映射.与浅层神经网络相比，深度学习模型的多层网络结构拥有更强的特征提取能力，避免了传统机器学习算法需要人工选取特征的局限^[2]，同时采用贪婪预训练方式，逐层初始化网络参数，加快了网络收敛速度^[3].深度学习模型的优异性能得益于其复杂的网络结构，而复杂的网络结构则需要大量样本进行训练.然而在有监督学习模式下，大量样本标签的人工标注是非常困难的，这促进了无监督深度学习模型的发展^[4].典型的深度无监督学习模型有自编码器（AE, autoencoder）^[5-6]、受限波尔兹曼机（RBM, restricted Boltzmann machine）^[7-8]与生成对抗网络（GAN, generative adversarial network）^[9]. ...

Learning representations by back-propagating errors

2

1986

... 深度学习作为机器学习领域的研究热点，自被Hinton 等^[1]提出后，便深刻影响着机器学习的发展走向.深度学习通过构建多层神经网络模型，逐层提取样本的高级抽象特征，而后通过分类器或回归算法完成抽象特征到期望输出的映射.与浅层神经网络相比，深度学习模型的多层网络结构拥有更强的特征提取能力，避免了传统机器学习算法需要人工选取特征的局限^[2]，同时采用贪婪预训练方式，逐层初始化网络参数，加快了网络收敛速度^[3].深度学习模型的优异性能得益于其复杂的网络结构，而复杂的网络结构则需要大量样本进行训练.然而在有监督学习模式下，大量样本标签的人工标注是非常困难的，这促进了无监督深度学习模型的发展^[4].典型的深度无监督学习模型有自编码器（AE, autoencoder）^[5-6]、受限波尔兹曼机（RBM, restricted Boltzmann machine）^[7-8]与生成对抗网络（GAN, generative adversarial network）^[9]. ...

... 自编码器作为典型的无监督深度学习模型，旨在通过将网络的期望输出等同于输入样本，实现对输入样本的抽象特征学习.Rumelhart等^[5]最早提出了自编码器的概念，Bourlard 等^[6]对其进行了详细的阐释.随着深度学习得到空前的关注，AE 也被广泛研究与改进^[10-13].为获得高维且稀疏的抽象特征表示，Ng^[10]通过在隐含层输出中引入稀疏性限制，迫使网络使用较少神经节点提取有效特征，提出了稀疏自编码器（SAE, sparse autoencoder）.Vincent等^[11]提出了去噪自编码器（DAE, denoising autoencoder）.DAE 在 AE 中引入退化过程，运用添加噪声后的样本重构无噪声样本，使提取的抽象特征不易受噪声影响，具有更强的稳健性.为抑制输入样本中的微小扰动，Rifai等^[12]提出了收缩自编码器（CAE, contractive autoencoder）.CAE通过在 AE 损失函数中添加收缩正则化项，以达到局部空间收缩效果.Kingma等^[13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

Auto-association by multilayer perceptrons and singular value decomposition

2

1988

... 深度学习作为机器学习领域的研究热点，自被Hinton 等^[1]提出后，便深刻影响着机器学习的发展走向.深度学习通过构建多层神经网络模型，逐层提取样本的高级抽象特征，而后通过分类器或回归算法完成抽象特征到期望输出的映射.与浅层神经网络相比，深度学习模型的多层网络结构拥有更强的特征提取能力，避免了传统机器学习算法需要人工选取特征的局限^[2]，同时采用贪婪预训练方式，逐层初始化网络参数，加快了网络收敛速度^[3].深度学习模型的优异性能得益于其复杂的网络结构，而复杂的网络结构则需要大量样本进行训练.然而在有监督学习模式下，大量样本标签的人工标注是非常困难的，这促进了无监督深度学习模型的发展^[4].典型的深度无监督学习模型有自编码器（AE, autoencoder）^[5-6]、受限波尔兹曼机（RBM, restricted Boltzmann machine）^[7-8]与生成对抗网络（GAN, generative adversarial network）^[9]. ...

... 自编码器作为典型的无监督深度学习模型，旨在通过将网络的期望输出等同于输入样本，实现对输入样本的抽象特征学习.Rumelhart等^[5]最早提出了自编码器的概念，Bourlard 等^[6]对其进行了详细的阐释.随着深度学习得到空前的关注，AE 也被广泛研究与改进^[10-13].为获得高维且稀疏的抽象特征表示，Ng^[10]通过在隐含层输出中引入稀疏性限制，迫使网络使用较少神经节点提取有效特征，提出了稀疏自编码器（SAE, sparse autoencoder）.Vincent等^[11]提出了去噪自编码器（DAE, denoising autoencoder）.DAE 在 AE 中引入退化过程，运用添加噪声后的样本重构无噪声样本，使提取的抽象特征不易受噪声影响，具有更强的稳健性.为抑制输入样本中的微小扰动，Rifai等^[12]提出了收缩自编码器（CAE, contractive autoencoder）.CAE通过在 AE 损失函数中添加收缩正则化项，以达到局部空间收缩效果.Kingma等^[13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

Deep boltzmann machines

1

2009

... 深度学习作为机器学习领域的研究热点，自被Hinton 等^[1]提出后，便深刻影响着机器学习的发展走向.深度学习通过构建多层神经网络模型，逐层提取样本的高级抽象特征，而后通过分类器或回归算法完成抽象特征到期望输出的映射.与浅层神经网络相比，深度学习模型的多层网络结构拥有更强的特征提取能力，避免了传统机器学习算法需要人工选取特征的局限^[2]，同时采用贪婪预训练方式，逐层初始化网络参数，加快了网络收敛速度^[3].深度学习模型的优异性能得益于其复杂的网络结构，而复杂的网络结构则需要大量样本进行训练.然而在有监督学习模式下，大量样本标签的人工标注是非常困难的，这促进了无监督深度学习模型的发展^[4].典型的深度无监督学习模型有自编码器（AE, autoencoder）^[5-6]、受限波尔兹曼机（RBM, restricted Boltzmann machine）^[7-8]与生成对抗网络（GAN, generative adversarial network）^[9]. ...

Training restricted Boltzmann machines:an introduction

2

2014

... 深度学习作为机器学习领域的研究热点，自被Hinton 等^[1]提出后，便深刻影响着机器学习的发展走向.深度学习通过构建多层神经网络模型，逐层提取样本的高级抽象特征，而后通过分类器或回归算法完成抽象特征到期望输出的映射.与浅层神经网络相比，深度学习模型的多层网络结构拥有更强的特征提取能力，避免了传统机器学习算法需要人工选取特征的局限^[2]，同时采用贪婪预训练方式，逐层初始化网络参数，加快了网络收敛速度^[3].深度学习模型的优异性能得益于其复杂的网络结构，而复杂的网络结构则需要大量样本进行训练.然而在有监督学习模式下，大量样本标签的人工标注是非常困难的，这促进了无监督深度学习模型的发展^[4].典型的深度无监督学习模型有自编码器（AE, autoencoder）^[5-6]、受限波尔兹曼机（RBM, restricted Boltzmann machine）^[7-8]与生成对抗网络（GAN, generative adversarial network）^[9]. ...

... DAE 加入退化过程的自然原理是人眼在看物体时，如果物体某一小部分被遮住了，人眼依然能将其识别出来.该现象说明人所带有的“生物”自编码器所提取的特征更具有代表性与稳健性，对于输入中含有一定噪声的样本数据，它经过编码、解码后仍能得到纯净无噪的样本.这要求自编码器不仅要有编码功能，还要有去噪作用^[8].然而，即使样本中含有噪声，AE 却只能重构含有噪声的输入样本.所以，对原始样本进行适当的退化处理，再让自编码器重构原始样本，这样所提取的特征更本质、更抗干扰^[11]. ...

Generative adversarial nets

1

2014

... 深度学习作为机器学习领域的研究热点，自被Hinton 等^[1]提出后，便深刻影响着机器学习的发展走向.深度学习通过构建多层神经网络模型，逐层提取样本的高级抽象特征，而后通过分类器或回归算法完成抽象特征到期望输出的映射.与浅层神经网络相比，深度学习模型的多层网络结构拥有更强的特征提取能力，避免了传统机器学习算法需要人工选取特征的局限^[2]，同时采用贪婪预训练方式，逐层初始化网络参数，加快了网络收敛速度^[3].深度学习模型的优异性能得益于其复杂的网络结构，而复杂的网络结构则需要大量样本进行训练.然而在有监督学习模式下，大量样本标签的人工标注是非常困难的，这促进了无监督深度学习模型的发展^[4].典型的深度无监督学习模型有自编码器（AE, autoencoder）^[5-6]、受限波尔兹曼机（RBM, restricted Boltzmann machine）^[7-8]与生成对抗网络（GAN, generative adversarial network）^[9]. ...

Sparse autoencoder

2

2011

... 自编码器作为典型的无监督深度学习模型，旨在通过将网络的期望输出等同于输入样本，实现对输入样本的抽象特征学习.Rumelhart等^[5]最早提出了自编码器的概念，Bourlard 等^[6]对其进行了详细的阐释.随着深度学习得到空前的关注，AE 也被广泛研究与改进^[10-13].为获得高维且稀疏的抽象特征表示，Ng^[10]通过在隐含层输出中引入稀疏性限制，迫使网络使用较少神经节点提取有效特征，提出了稀疏自编码器（SAE, sparse autoencoder）.Vincent等^[11]提出了去噪自编码器（DAE, denoising autoencoder）.DAE 在 AE 中引入退化过程，运用添加噪声后的样本重构无噪声样本，使提取的抽象特征不易受噪声影响，具有更强的稳健性.为抑制输入样本中的微小扰动，Rifai等^[12]提出了收缩自编码器（CAE, contractive autoencoder）.CAE通过在 AE 损失函数中添加收缩正则化项，以达到局部空间收缩效果.Kingma等^[13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

... [10]通过在隐含层输出中引入稀疏性限制，迫使网络使用较少神经节点提取有效特征，提出了稀疏自编码器（SAE, sparse autoencoder）.Vincent等^[11]提出了去噪自编码器（DAE, denoising autoencoder）.DAE 在 AE 中引入退化过程，运用添加噪声后的样本重构无噪声样本，使提取的抽象特征不易受噪声影响，具有更强的稳健性.为抑制输入样本中的微小扰动，Rifai等^[12]提出了收缩自编码器（CAE, contractive autoencoder）.CAE通过在 AE 损失函数中添加收缩正则化项，以达到局部空间收缩效果.Kingma等^[13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

Stacked denoising autoencoders:learning useful representations in a deep network with a local denoising criterion

2

2010

... 自编码器作为典型的无监督深度学习模型，旨在通过将网络的期望输出等同于输入样本，实现对输入样本的抽象特征学习.Rumelhart等^[5]最早提出了自编码器的概念，Bourlard 等^[6]对其进行了详细的阐释.随着深度学习得到空前的关注，AE 也被广泛研究与改进^[10-13].为获得高维且稀疏的抽象特征表示，Ng^[10]通过在隐含层输出中引入稀疏性限制，迫使网络使用较少神经节点提取有效特征，提出了稀疏自编码器（SAE, sparse autoencoder）.Vincent等^[11]提出了去噪自编码器（DAE, denoising autoencoder）.DAE 在 AE 中引入退化过程，运用添加噪声后的样本重构无噪声样本，使提取的抽象特征不易受噪声影响，具有更强的稳健性.为抑制输入样本中的微小扰动，Rifai等^[12]提出了收缩自编码器（CAE, contractive autoencoder）.CAE通过在 AE 损失函数中添加收缩正则化项，以达到局部空间收缩效果.Kingma等^[13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

... DAE 加入退化过程的自然原理是人眼在看物体时，如果物体某一小部分被遮住了，人眼依然能将其识别出来.该现象说明人所带有的“生物”自编码器所提取的特征更具有代表性与稳健性，对于输入中含有一定噪声的样本数据，它经过编码、解码后仍能得到纯净无噪的样本.这要求自编码器不仅要有编码功能，还要有去噪作用^[8].然而，即使样本中含有噪声，AE 却只能重构含有噪声的输入样本.所以，对原始样本进行适当的退化处理，再让自编码器重构原始样本，这样所提取的特征更本质、更抗干扰^[11]. ...

Contractive auto-encoders:explicit invariance during feature extraction

1

2011

... 自编码器作为典型的无监督深度学习模型，旨在通过将网络的期望输出等同于输入样本，实现对输入样本的抽象特征学习.Rumelhart等^[5]最早提出了自编码器的概念，Bourlard 等^[6]对其进行了详细的阐释.随着深度学习得到空前的关注，AE 也被广泛研究与改进^[10-13].为获得高维且稀疏的抽象特征表示，Ng^[10]通过在隐含层输出中引入稀疏性限制，迫使网络使用较少神经节点提取有效特征，提出了稀疏自编码器（SAE, sparse autoencoder）.Vincent等^[11]提出了去噪自编码器（DAE, denoising autoencoder）.DAE 在 AE 中引入退化过程，运用添加噪声后的样本重构无噪声样本，使提取的抽象特征不易受噪声影响，具有更强的稳健性.为抑制输入样本中的微小扰动，Rifai等^[12]提出了收缩自编码器（CAE, contractive autoencoder）.CAE通过在 AE 损失函数中添加收缩正则化项，以达到局部空间收缩效果.Kingma等^[13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

Auto-encoding variational bayes

2

2013

... 自编码器作为典型的无监督深度学习模型，旨在通过将网络的期望输出等同于输入样本，实现对输入样本的抽象特征学习.Rumelhart等^[5]最早提出了自编码器的概念，Bourlard 等^[6]对其进行了详细的阐释.随着深度学习得到空前的关注，AE 也被广泛研究与改进^[10-13].为获得高维且稀疏的抽象特征表示，Ng^[10]通过在隐含层输出中引入稀疏性限制，迫使网络使用较少神经节点提取有效特征，提出了稀疏自编码器（SAE, sparse autoencoder）.Vincent等^[11]提出了去噪自编码器（DAE, denoising autoencoder）.DAE 在 AE 中引入退化过程，运用添加噪声后的样本重构无噪声样本，使提取的抽象特征不易受噪声影响，具有更强的稳健性.为抑制输入样本中的微小扰动，Rifai等^[12]提出了收缩自编码器（CAE, contractive autoencoder）.CAE通过在 AE 损失函数中添加收缩正则化项，以达到局部空间收缩效果.Kingma等^[13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

... [13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

Radar HRRP recognition based on discriminant deep autoencoders with small training data size

2

2016

... 自编码器作为典型的无监督深度学习模型，旨在通过将网络的期望输出等同于输入样本，实现对输入样本的抽象特征学习.Rumelhart等^[5]最早提出了自编码器的概念，Bourlard 等^[6]对其进行了详细的阐释.随着深度学习得到空前的关注，AE 也被广泛研究与改进^[10-13].为获得高维且稀疏的抽象特征表示，Ng^[10]通过在隐含层输出中引入稀疏性限制，迫使网络使用较少神经节点提取有效特征，提出了稀疏自编码器（SAE, sparse autoencoder）.Vincent等^[11]提出了去噪自编码器（DAE, denoising autoencoder）.DAE 在 AE 中引入退化过程，运用添加噪声后的样本重构无噪声样本，使提取的抽象特征不易受噪声影响，具有更强的稳健性.为抑制输入样本中的微小扰动，Rifai等^[12]提出了收缩自编码器（CAE, contractive autoencoder）.CAE通过在 AE 损失函数中添加收缩正则化项，以达到局部空间收缩效果.Kingma等^[13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

... 对于 HRRP 识别，Mian 等^[14]将稀疏自编码器应用于小样本识别中，通过堆栈稀疏自编码器（SSAE, stacked SAE）逐层提取样本抽象特征， softmax 分类器完成类别标签的映射与网络参数的迭代微调，实现了小训练样本条件下的目标HRRP识别，并验证了自编码器的特征提取性能优于PCA等传统方法.Feng等^[15]为突破传统浅层模型特征提取能力的局限，通过引入平均像正则化项，提出了矫正自编码器及其深度模型.矫正自编码器将HRRP与其平均像之间的马氏距离作为正则化项添加到AE损失函数中，迫使特征提取过程考虑HRRP的结构相似性与振幅波动性，使提取的抽象特征能够有效缓解斑纹效应与异常值影响.为保持 SAE对 HRRP 识别的泛化性能，提升训练速度，Zhao等^[37]将SAE与ELM相结合，提出了SAE-ELM方法.该方法首先通过SAE逐层提取抽象特征，而后使用 ELM 完成分类，不需要参数的迭代微调，极大减少了训练时间.为实现多角度HRRP目标的角度特征提取与分析，Chen等^[38]首先采用SSAE逐层提取低维抽象特征，然后通过流形学习，利用低维空间映射完成目标角度特征的提取与可视化，并分别在仿真与实测数据上验证了该方法的有效性. ...

Radar HRRP target recognition with deep networks

2

2017

... 自编码器作为典型的无监督深度学习模型，旨在通过将网络的期望输出等同于输入样本，实现对输入样本的抽象特征学习.Rumelhart等^[5]最早提出了自编码器的概念，Bourlard 等^[6]对其进行了详细的阐释.随着深度学习得到空前的关注，AE 也被广泛研究与改进^[10-13].为获得高维且稀疏的抽象特征表示，Ng^[10]通过在隐含层输出中引入稀疏性限制，迫使网络使用较少神经节点提取有效特征，提出了稀疏自编码器（SAE, sparse autoencoder）.Vincent等^[11]提出了去噪自编码器（DAE, denoising autoencoder）.DAE 在 AE 中引入退化过程，运用添加噪声后的样本重构无噪声样本，使提取的抽象特征不易受噪声影响，具有更强的稳健性.为抑制输入样本中的微小扰动，Rifai等^[12]提出了收缩自编码器（CAE, contractive autoencoder）.CAE通过在 AE 损失函数中添加收缩正则化项，以达到局部空间收缩效果.Kingma等^[13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

... 对于 HRRP 识别，Mian 等^[14]将稀疏自编码器应用于小样本识别中，通过堆栈稀疏自编码器（SSAE, stacked SAE）逐层提取样本抽象特征， softmax 分类器完成类别标签的映射与网络参数的迭代微调，实现了小训练样本条件下的目标HRRP识别，并验证了自编码器的特征提取性能优于PCA等传统方法.Feng等^[15]为突破传统浅层模型特征提取能力的局限，通过引入平均像正则化项，提出了矫正自编码器及其深度模型.矫正自编码器将HRRP与其平均像之间的马氏距离作为正则化项添加到AE损失函数中，迫使特征提取过程考虑HRRP的结构相似性与振幅波动性，使提取的抽象特征能够有效缓解斑纹效应与异常值影响.为保持 SAE对 HRRP 识别的泛化性能，提升训练速度，Zhao等^[37]将SAE与ELM相结合，提出了SAE-ELM方法.该方法首先通过SAE逐层提取抽象特征，而后使用 ELM 完成分类，不需要参数的迭代微调，极大减少了训练时间.为实现多角度HRRP目标的角度特征提取与分析，Chen等^[38]首先采用SSAE逐层提取低维抽象特征，然后通过流形学习，利用低维空间映射完成目标角度特征的提取与可视化，并分别在仿真与实测数据上验证了该方法的有效性. ...

A hybrid malicious code detection method based on deep learning

2

2015

... 自编码器作为典型的无监督深度学习模型，旨在通过将网络的期望输出等同于输入样本，实现对输入样本的抽象特征学习.Rumelhart等^[5]最早提出了自编码器的概念，Bourlard 等^[6]对其进行了详细的阐释.随着深度学习得到空前的关注，AE 也被广泛研究与改进^[10-13].为获得高维且稀疏的抽象特征表示，Ng^[10]通过在隐含层输出中引入稀疏性限制，迫使网络使用较少神经节点提取有效特征，提出了稀疏自编码器（SAE, sparse autoencoder）.Vincent等^[11]提出了去噪自编码器（DAE, denoising autoencoder）.DAE 在 AE 中引入退化过程，运用添加噪声后的样本重构无噪声样本，使提取的抽象特征不易受噪声影响，具有更强的稳健性.为抑制输入样本中的微小扰动，Rifai等^[12]提出了收缩自编码器（CAE, contractive autoencoder）.CAE通过在 AE 损失函数中添加收缩正则化项，以达到局部空间收缩效果.Kingma等^[13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

... Li等^[16]提出一种将AE与深度置信网络相结合的入侵检测方法，该方法首先采用AE进行特征降维，然后采用深度置信网络对降维后的数据进行分类.相较于传统深度置信网络，该方法的检测准确率得到一定提升.Javaid等^[17]与Al-qatf等^[44]将SAE应用于入侵检测中，2 种方法首先采用独热编码处理符号特征，然后通过SAE进行层次化抽象特征提取，最后分别使用 softmax 分类器与支持向量机（SVM, support vector machine）完成类别映射.2种方法均在NSL-KDD数据集上进行实验，通过准确率、精准率、召回率与F值等指标的变化，验证算法有效性.为改进AE与VAE中的抽象特征表示，迫使抽象特征向原点聚集，Cao 等^[45]通过增加 AE损失函数中的抽象特征L₂范数正则化项，重构VAE损失函数中的KL散度项，提出了缩小自编码器与狄拉克变分自编码器，并将其应用于异常检测中.Chouhan等^[46]将堆栈自编码器与改进的卷积网络相结合，提出了一种新的入侵检测方法.该方法将多个堆栈自编码器用于原始特征空间到抽象特征空间的转换，得到多个不同的抽象特征空间，并采用信道增强方法将不同的抽象特征空间进行叠加，而后代入改进的卷积神经网络中进行分类，完成异常行为的检测.对于入侵检测数据集中存在的类别不平衡问题，通过将类别标签作为VAE的额外输入， Lopez-martin 等^[47]提出了一种新的变分生成模型，并将其用于少数类的生成中，有效提升了检测准确率.通过将统计分析方法与自编码器相结合， Ieracitano等^[48]提出了一种新的入侵检测方法.该方法先后采用异常值分析剔除异常值、最小最大归一化统一数值范围、独热编码数值化符号特征，而后通过数值0的比例进行特征剔除，接着将剩余特征分别通过AE与softmax分类器完成特征降维与分类.Tang等^[49]为进一步提升特征提取能力，通过在输入层与隐含层间新增用于计算特征注意力向量的注意力机制层，将注意力机制引入AE中，提出了注意力自编码器（AAE, attention autoencoder），并将堆栈注意力自编码器（SAAE, stacked AAE）与深度神经网络（DNN, deep neural network）相结合应用于入侵检测中. ...

A deep learning approach for network intrusion detection system

2

2016

... 自编码器作为典型的无监督深度学习模型，旨在通过将网络的期望输出等同于输入样本，实现对输入样本的抽象特征学习.Rumelhart等^[5]最早提出了自编码器的概念，Bourlard 等^[6]对其进行了详细的阐释.随着深度学习得到空前的关注，AE 也被广泛研究与改进^[10-13].为获得高维且稀疏的抽象特征表示，Ng^[10]通过在隐含层输出中引入稀疏性限制，迫使网络使用较少神经节点提取有效特征，提出了稀疏自编码器（SAE, sparse autoencoder）.Vincent等^[11]提出了去噪自编码器（DAE, denoising autoencoder）.DAE 在 AE 中引入退化过程，运用添加噪声后的样本重构无噪声样本，使提取的抽象特征不易受噪声影响，具有更强的稳健性.为抑制输入样本中的微小扰动，Rifai等^[12]提出了收缩自编码器（CAE, contractive autoencoder）.CAE通过在 AE 损失函数中添加收缩正则化项，以达到局部空间收缩效果.Kingma等^[13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

... Li等^[16]提出一种将AE与深度置信网络相结合的入侵检测方法，该方法首先采用AE进行特征降维，然后采用深度置信网络对降维后的数据进行分类.相较于传统深度置信网络，该方法的检测准确率得到一定提升.Javaid等^[17]与Al-qatf等^[44]将SAE应用于入侵检测中，2 种方法首先采用独热编码处理符号特征，然后通过SAE进行层次化抽象特征提取，最后分别使用 softmax 分类器与支持向量机（SVM, support vector machine）完成类别映射.2种方法均在NSL-KDD数据集上进行实验，通过准确率、精准率、召回率与F值等指标的变化，验证算法有效性.为改进AE与VAE中的抽象特征表示，迫使抽象特征向原点聚集，Cao 等^[45]通过增加 AE损失函数中的抽象特征L₂范数正则化项，重构VAE损失函数中的KL散度项，提出了缩小自编码器与狄拉克变分自编码器，并将其应用于异常检测中.Chouhan等^[46]将堆栈自编码器与改进的卷积网络相结合，提出了一种新的入侵检测方法.该方法将多个堆栈自编码器用于原始特征空间到抽象特征空间的转换，得到多个不同的抽象特征空间，并采用信道增强方法将不同的抽象特征空间进行叠加，而后代入改进的卷积神经网络中进行分类，完成异常行为的检测.对于入侵检测数据集中存在的类别不平衡问题，通过将类别标签作为VAE的额外输入， Lopez-martin 等^[47]提出了一种新的变分生成模型，并将其用于少数类的生成中，有效提升了检测准确率.通过将统计分析方法与自编码器相结合， Ieracitano等^[48]提出了一种新的入侵检测方法.该方法先后采用异常值分析剔除异常值、最小最大归一化统一数值范围、独热编码数值化符号特征，而后通过数值0的比例进行特征剔除，接着将剩余特征分别通过AE与softmax分类器完成特征降维与分类.Tang等^[49]为进一步提升特征提取能力，通过在输入层与隐含层间新增用于计算特征注意力向量的注意力机制层，将注意力机制引入AE中，提出了注意力自编码器（AAE, attention autoencoder），并将堆栈注意力自编码器（SAAE, stacked AAE）与深度神经网络（DNN, deep neural network）相结合应用于入侵检测中. ...

A novel data-driven fault diagnosis method based on deep learning

2

2017

... 自编码器作为典型的无监督深度学习模型，旨在通过将网络的期望输出等同于输入样本，实现对输入样本的抽象特征学习.Rumelhart等^[5]最早提出了自编码器的概念，Bourlard 等^[6]对其进行了详细的阐释.随着深度学习得到空前的关注，AE 也被广泛研究与改进^[10-13].为获得高维且稀疏的抽象特征表示，Ng^[10]通过在隐含层输出中引入稀疏性限制，迫使网络使用较少神经节点提取有效特征，提出了稀疏自编码器（SAE, sparse autoencoder）.Vincent等^[11]提出了去噪自编码器（DAE, denoising autoencoder）.DAE 在 AE 中引入退化过程，运用添加噪声后的样本重构无噪声样本，使提取的抽象特征不易受噪声影响，具有更强的稳健性.为抑制输入样本中的微小扰动，Rifai等^[12]提出了收缩自编码器（CAE, contractive autoencoder）.CAE通过在 AE 损失函数中添加收缩正则化项，以达到局部空间收缩效果.Kingma等^[13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

... Zhang等^[18]与Lu等^[19]分别将AE与DAE应用于滚动轴承故障诊断中，使用其深度结构实现振动信号的抽象特征提取，克服了传统人工特征提取的局限，极大提升了故障诊断准确率.为实现特征的自动提取，克服训练样本与测试样本间的差异性， Wen 等^[51]将 SAE 与迁移学习相结合，提出了基于深度迁移学习的故障诊断方法.该方法将训练样本与测试样本均采用SAE逐层提取样本抽象，并在网络损失函数中加入最大平均差异正则化项，最小化训练和测试样本抽象特征之间的差异，使提取的抽象特征能同时有效表征训练与测试样本.在常用故障诊断数据集上的实验表明，该方法的预测准确率高于深度置信网络、SVM 等算法.Li 等^[52]将稀疏与邻域原理应用于ELM-AE中，通过在损失函数中增加稀疏与邻域正则化项，更新隐含层输出权值的最小二乘法，迫使抽象特征保留样本的全局与局部流形结构，提升其可区分性，并与 ELM 及其深度模型进行对比分析，验证了所提方法在故障诊断上的有效性.为提取含噪声振动信号的有效故障特征，Yu^[53]提出了一种基于负相关学习的选择性堆栈去噪自编码器集成模型.该模型首先将 bagging 算法应用于堆栈去噪自编码器（SDAE, stacked DAE）中，通过bootstrap采样训练样本，使用不同的采样样本进行SDAE抽象特征提取，然后利用负相关学习进行微调，构建分类器，最后采用粒子群算法对SDAE进行选择性集成，得到稳定性与泛化性能最优的模型.Zhao等^[54]为解决故障样本少所导致的类不平衡问题，将VAE引入故障诊断框架中，通过增扩少数类的振动信号样本，构建出类别平衡的训练样本，并代入 CNN 中进行分类.实验结果表明，与真实信号相比，VAE生成的振动信号具有相似的时频特性，能够促进诊断准确率的提升.Yu 等^[55]为提升对一维振动信号的特征提取能力，将一维卷积自编码器应用于齿轮故障诊断中，并引入残差学习对其进行改进.Gao等^[56]提出了一种基于半监督堆栈自编码器与集成极限学习机相结合的高压开关故障诊断方法.该方法首先采用自适应噪声完备经验模态分解对针对信号进行处理，得到时频能量矩阵，然后对能量矩阵采用半监督堆栈自编码器进行自动特征提取，接着采用集成极限学习机建立两级分类器，第一级用于正常或异常状态识别，第二级用于异常状态的具体故障类型识别.在验证实验中，该方法的分类准确率可达到99.5%. ...

Fault diagnosis of rotary machinery components using a stacked denoising autoencoder-based health state identification

2

2017

... 自编码器作为典型的无监督深度学习模型，旨在通过将网络的期望输出等同于输入样本，实现对输入样本的抽象特征学习.Rumelhart等^[5]最早提出了自编码器的概念，Bourlard 等^[6]对其进行了详细的阐释.随着深度学习得到空前的关注，AE 也被广泛研究与改进^[10-13].为获得高维且稀疏的抽象特征表示，Ng^[10]通过在隐含层输出中引入稀疏性限制，迫使网络使用较少神经节点提取有效特征，提出了稀疏自编码器（SAE, sparse autoencoder）.Vincent等^[11]提出了去噪自编码器（DAE, denoising autoencoder）.DAE 在 AE 中引入退化过程，运用添加噪声后的样本重构无噪声样本，使提取的抽象特征不易受噪声影响，具有更强的稳健性.为抑制输入样本中的微小扰动，Rifai等^[12]提出了收缩自编码器（CAE, contractive autoencoder）.CAE通过在 AE 损失函数中添加收缩正则化项，以达到局部空间收缩效果.Kingma等^[13]提出了变分自编码器（VAE, variational autoencoder），并将其用于数据生成.凭借训练过程简单、多层堆栈容易、泛化性能优秀的特点，AE及其改进算法被成功应用于目标识别^[14-15]、入侵检测^[16-17]与故障诊断^[18-19]等领域. ...

... Zhang等^[18]与Lu等^[19]分别将AE与DAE应用于滚动轴承故障诊断中，使用其深度结构实现振动信号的抽象特征提取，克服了传统人工特征提取的局限，极大提升了故障诊断准确率.为实现特征的自动提取，克服训练样本与测试样本间的差异性， Wen 等^[51]将 SAE 与迁移学习相结合，提出了基于深度迁移学习的故障诊断方法.该方法将训练样本与测试样本均采用SAE逐层提取样本抽象，并在网络损失函数中加入最大平均差异正则化项，最小化训练和测试样本抽象特征之间的差异，使提取的抽象特征能同时有效表征训练与测试样本.在常用故障诊断数据集上的实验表明，该方法的预测准确率高于深度置信网络、SVM 等算法.Li 等^[52]将稀疏与邻域原理应用于ELM-AE中，通过在损失函数中增加稀疏与邻域正则化项，更新隐含层输出权值的最小二乘法，迫使抽象特征保留样本的全局与局部流形结构，提升其可区分性，并与 ELM 及其深度模型进行对比分析，验证了所提方法在故障诊断上的有效性.为提取含噪声振动信号的有效故障特征，Yu^[53]提出了一种基于负相关学习的选择性堆栈去噪自编码器集成模型.该模型首先将 bagging 算法应用于堆栈去噪自编码器（SDAE, stacked DAE）中，通过bootstrap采样训练样本，使用不同的采样样本进行SDAE抽象特征提取，然后利用负相关学习进行微调，构建分类器，最后采用粒子群算法对SDAE进行选择性集成，得到稳定性与泛化性能最优的模型.Zhao等^[54]为解决故障样本少所导致的类不平衡问题，将VAE引入故障诊断框架中，通过增扩少数类的振动信号样本，构建出类别平衡的训练样本，并代入 CNN 中进行分类.实验结果表明，与真实信号相比，VAE生成的振动信号具有相似的时频特性，能够促进诊断准确率的提升.Yu 等^[55]为提升对一维振动信号的特征提取能力，将一维卷积自编码器应用于齿轮故障诊断中，并引入残差学习对其进行改进.Gao等^[56]提出了一种基于半监督堆栈自编码器与集成极限学习机相结合的高压开关故障诊断方法.该方法首先采用自适应噪声完备经验模态分解对针对信号进行处理，得到时频能量矩阵，然后对能量矩阵采用半监督堆栈自编码器进行自动特征提取，接着采用集成极限学习机建立两级分类器，第一级用于正常或异常状态识别，第二级用于异常状态的具体故障类型识别.在验证实验中，该方法的分类准确率可达到99.5%. ...

Local deep-feature alignment for unsupervised dimension reduction

1

2018

... 研究者通常将多个AE进行级联，构建堆栈自编码器，采用逐层贪婪训练方式，将上一级AE的隐含层输出作为下一级AE的输入，进行层次化特征提取，使最终提出的特征更具代表性，且维数通常较低^[20].堆栈自编码器通常具有对称的多隐含层结构，对应于解码与编码过程，但被应用于分类或回归问题时，一般将解码部分舍去，将最终的编码用于分类^[21]或回归^[22]. ...

POL-SAR image classification based on modified stacked autoencoder network and data distribution

1

2020

... 研究者通常将多个AE进行级联，构建堆栈自编码器，采用逐层贪婪训练方式，将上一级AE的隐含层输出作为下一级AE的输入，进行层次化特征提取，使最终提出的特征更具代表性，且维数通常较低^[20].堆栈自编码器通常具有对称的多隐含层结构，对应于解码与编码过程，但被应用于分类或回归问题时，一般将解码部分舍去，将最终的编码用于分类^[21]或回归^[22]. ...

A stacked autoencoder with sparse Bayesian regression for end-point prediction problems in steelmaking process

1

2020

... 研究者通常将多个AE进行级联，构建堆栈自编码器，采用逐层贪婪训练方式，将上一级AE的隐含层输出作为下一级AE的输入，进行层次化特征提取，使最终提出的特征更具代表性，且维数通常较低^[20].堆栈自编码器通常具有对称的多隐含层结构，对应于解码与编码过程，但被应用于分类或回归问题时，一般将解码部分舍去，将最终的编码用于分类^[21]或回归^[22]. ...

Kohonen network

1

2007

... 除AE以外，基于神经网络的无监督学习算法还包括 RBM、GAN 与自组织映射（SOM, self-organization mapping）^[23].表1归纳了上述无监督学习算法的目的、实现方式与特点. ...

深度生成模型综述

1

2020

... 作为特殊的自编码器，变分自编码器并非判别式模型，而属于生成模型.VAE旨在通过对样本分布的学习，采用估计分布近似逼近样本真实分布，进而由估计分布生成原始样本的类似样本^[24].VAE结构如图4所示. ...

深度生成模型综述

1

2020

... 作为特殊的自编码器，变分自编码器并非判别式模型，而属于生成模型.VAE旨在通过对样本分布的学习，采用估计分布近似逼近样本真实分布，进而由估计分布生成原始样本的类似样本^[24].VAE结构如图4所示. ...

变分自编码器模型综述

1

2019

... 图4中，

Z

为隐变量，

μ

与

σ

为隐变量

Z

的均值与标准差，

Q (Z | X)

与

P (X | Z)

分别为编码过程与解码过程学习到的条件分布，对应识别与生成模型^[25].其中，为使 VAE 具有样本生成能力，而非确定的映射过程，隐变量

Z

需为随机变量，且为简化计算，通常假设隐变量

Z

服从多元正态分布，即

P (Z) \sim N (0, I)

.

Q (Z | X)

为近似后验分布，旨在逼近未知的真实先验分布

P (Z | X)

，通常假设为正态分布.而

P (X | Z)

需被提前定义，针对二值与实值样本，通常分别选择伯努利分布与正态分布. ...

变分自编码器模型综述

1

2019

... 图4中，

Z

为隐变量，

μ

与

σ

为隐变量

Z

的均值与标准差，

Q (Z | X)

与

P (X | Z)

分别为编码过程与解码过程学习到的条件分布，对应识别与生成模型^[25].其中，为使 VAE 具有样本生成能力，而非确定的映射过程，隐变量

Z

需为随机变量，且为简化计算，通常假设隐变量

Z

服从多元正态分布，即

P (Z) \sim N (0, I)

.

Q (Z | X)

为近似后验分布，旨在逼近未知的真实先验分布

P (Z | X)

，通常假设为正态分布.而

P (X | Z)

需被提前定义，针对二值与实值样本，通常分别选择伯努利分布与正态分布. ...

Stacked convolutional auto-encoders for hierarchical feature extraction

1

2011

... 传统自编码器通常采用全连接层，这会造成图像空间信息的损失，而卷积自编码器（CoAE, convolutional autoencoder）^[26]受卷积神经网络启发，采用卷积层与池化层取代全连接层，以更好地保留图像的空间信息.在CoAE中，编码过程由卷积层和池化层（下采样层）组成，解码过程由上采样层和卷积层组成，其中上采样层为池化层的逆过程. ...

Representational learning with extreme learning machine for big data

1

2013

... 传统自编码器需要误差的反向传播，通过迭代微调修改网络参数，这使其易陷入局部最优，且需要较多的训练时间.为克服局部最优问题并减少训练时间，极限学习机-自编码器（ELM-AE, extreme learning machine autoencoder）^[27]将极限学习机（ELM, extreme learning machine）与AE相结合，随机赋值隐含层输入权值与偏置，并通过求取隐含层输出权值的最小二乘解，完成网络训练，使网络参数不需要迭代微调，极大增加了网络训练速度，而且最小二乘解为全局最优解，保证了算法的泛化性能. ...

Deepshape:deep learned shape descriptor for 3D shape matching and retrieval

2

2015

... 除上述算法以外，研究者还提出了其他自编码器改进算法^[28-35]，包括区分自编码器^[28]、L₂₁范数自编码器^[29]、对抗自编码器^[30]等.表2归纳总结了上述自编码器改进算法的出发点与改进方式. ...

... [28]、L₂₁范数自编码器^[29]、对抗自编码器^[30]等.表2归纳总结了上述自编码器改进算法的出发点与改进方式. ...

L₂₁-norm based loss function and regularization extreme learning machine

1

2019

... 除上述算法以外，研究者还提出了其他自编码器改进算法^[28-35]，包括区分自编码器^[28]、L₂₁范数自编码器^[29]、对抗自编码器^[30]等.表2归纳总结了上述自编码器改进算法的出发点与改进方式. ...

Adversarial autoencoders

1

2015

... 除上述算法以外，研究者还提出了其他自编码器改进算法^[28-35]，包括区分自编码器^[28]、L₂₁范数自编码器^[29]、对抗自编码器^[30]等.表2归纳总结了上述自编码器改进算法的出发点与改进方式. ...

Graph structured autoencoder

0

2018

Quadratic autoencoder (Q-AE) for low-dose CT denoising

0

2020

Dirichlet variational autoencoder

0

2020

Attention collaborative autoencoder for explicit recommender systems

0

2020

Stacked isomorphic autoencoder based soft analyzer and its application to sulfur recovery unit

1

2020

... 除上述算法以外，研究者还提出了其他自编码器改进算法^[28-35]，包括区分自编码器^[28]、L₂₁范数自编码器^[29]、对抗自编码器^[30]等.表2归纳总结了上述自编码器改进算法的出发点与改进方式. ...

One-dimension hierarchical local receptive fields based extreme learning machine for radar target HRRP recognition

1

2020

... 目标识别作为机器学习技术的热点应用领域，一直备受关注，而提升目标识别性能的关键是有效的特征提取与分类.随着传感器性能的增强，其能够获取的目标信息及其种类也在增加，这使传统人工特征提取方式难以深入挖掘目标的潜在本质特征，进而影响目标识别性能^[36].而以自编码器为代表的深度学习技术能够实现目标特征的自动提取，摆脱人工提取的局限，有利于目标识别性能的提升.自编码器在目标识别上的应用，根据数据源种类的不同，大致可分为基于自编码器的高分辨距离像（HRRP, high resolution range profile）识别与合成孔径雷达（SAR, synthetic aperture radar）图像识别. ...

Radar HRRP target recognition based on stacked autoencoder and extreme learning machine

1

2018

... 对于 HRRP 识别，Mian 等^[14]将稀疏自编码器应用于小样本识别中，通过堆栈稀疏自编码器（SSAE, stacked SAE）逐层提取样本抽象特征， softmax 分类器完成类别标签的映射与网络参数的迭代微调，实现了小训练样本条件下的目标HRRP识别，并验证了自编码器的特征提取性能优于PCA等传统方法.Feng等^[15]为突破传统浅层模型特征提取能力的局限，通过引入平均像正则化项，提出了矫正自编码器及其深度模型.矫正自编码器将HRRP与其平均像之间的马氏距离作为正则化项添加到AE损失函数中，迫使特征提取过程考虑HRRP的结构相似性与振幅波动性，使提取的抽象特征能够有效缓解斑纹效应与异常值影响.为保持 SAE对 HRRP 识别的泛化性能，提升训练速度，Zhao等^[37]将SAE与ELM相结合，提出了SAE-ELM方法.该方法首先通过SAE逐层提取抽象特征，而后使用 ELM 完成分类，不需要参数的迭代微调，极大减少了训练时间.为实现多角度HRRP目标的角度特征提取与分析，Chen等^[38]首先采用SSAE逐层提取低维抽象特征，然后通过流形学习，利用低维空间映射完成目标角度特征的提取与可视化，并分别在仿真与实测数据上验证了该方法的有效性. ...

Sparse autoencoder based manifold analyzer model of multi-angle target feature

1

2020

... 对于 HRRP 识别，Mian 等^[14]将稀疏自编码器应用于小样本识别中，通过堆栈稀疏自编码器（SSAE, stacked SAE）逐层提取样本抽象特征， softmax 分类器完成类别标签的映射与网络参数的迭代微调，实现了小训练样本条件下的目标HRRP识别，并验证了自编码器的特征提取性能优于PCA等传统方法.Feng等^[15]为突破传统浅层模型特征提取能力的局限，通过引入平均像正则化项，提出了矫正自编码器及其深度模型.矫正自编码器将HRRP与其平均像之间的马氏距离作为正则化项添加到AE损失函数中，迫使特征提取过程考虑HRRP的结构相似性与振幅波动性，使提取的抽象特征能够有效缓解斑纹效应与异常值影响.为保持 SAE对 HRRP 识别的泛化性能，提升训练速度，Zhao等^[37]将SAE与ELM相结合，提出了SAE-ELM方法.该方法首先通过SAE逐层提取抽象特征，而后使用 ELM 完成分类，不需要参数的迭代微调，极大减少了训练时间.为实现多角度HRRP目标的角度特征提取与分析，Chen等^[38]首先采用SSAE逐层提取低维抽象特征，然后通过流形学习，利用低维空间映射完成目标角度特征的提取与可视化，并分别在仿真与实测数据上验证了该方法的有效性. ...

Synthetic aperture radar target recognition with feature fusion based on a stacked autoencoder

1

2017

... 对于SAR图像识别，Kang等^[39]提出了基于堆栈自编码器的 SAR 目标识别特征融合算法，该方法首先提取 SAR 图像的基线特征与纹理特征，而后将通过零成分分析法降维后的特征代入堆栈自编码器中进行抽象特征提取与融合，最后采用softmax 分类器完成抽象特征到类别标签的映射.为提升AE在小样本条件下的特征提取能力，Deng等^[40]将暗含样本类别信息的欧氏距离约束添加到AE 中，迫使其提取的抽象特征具有更强的类间可区分性，并将 Dropout 正则化技术应用到改进 AE的深度模型中，防止出现过拟合现象.Dong 等^[41]首先综合分析了自编码器及其改进算法，然后通过具体的 SAR 图像识别实验，验证了自编码器进行提取特征的有效性，分析了不同参数对AE泛化性能的影响，并比较了堆栈自编码器与其他典型算法的分类性能.为提升 SAR 图像的特征提取性能，增强抽象特征的类内聚集性，Guo等^[42]通过对卷积自编码器施加紧凑性约束，提出了紧凑卷积自编码器.该方法将类内样本距离正则化项添加到损失函数中，同时最小化重构误差与类内样本距离，以生成更具区分性的抽象特征，并通过在MSTAR数据集上的实验证实了方法的有效性. ...

SAR automatic target recognition based on euclidean distance restricted autoencoder

1

2017

... 对于SAR图像识别，Kang等^[39]提出了基于堆栈自编码器的 SAR 目标识别特征融合算法，该方法首先提取 SAR 图像的基线特征与纹理特征，而后将通过零成分分析法降维后的特征代入堆栈自编码器中进行抽象特征提取与融合，最后采用softmax 分类器完成抽象特征到类别标签的映射.为提升AE在小样本条件下的特征提取能力，Deng等^[40]将暗含样本类别信息的欧氏距离约束添加到AE 中，迫使其提取的抽象特征具有更强的类间可区分性，并将 Dropout 正则化技术应用到改进 AE的深度模型中，防止出现过拟合现象.Dong 等^[41]首先综合分析了自编码器及其改进算法，然后通过具体的 SAR 图像识别实验，验证了自编码器进行提取特征的有效性，分析了不同参数对AE泛化性能的影响，并比较了堆栈自编码器与其他典型算法的分类性能.为提升 SAR 图像的特征提取性能，增强抽象特征的类内聚集性，Guo等^[42]通过对卷积自编码器施加紧凑性约束，提出了紧凑卷积自编码器.该方法将类内样本距离正则化项添加到损失函数中，同时最小化重构误差与类内样本距离，以生成更具区分性的抽象特征，并通过在MSTAR数据集上的实验证实了方法的有效性. ...

A review of the autoencoder and its variants:a comparative perspective from target recognition in synthetic-aperture radar images

1

2018

... 对于SAR图像识别，Kang等^[39]提出了基于堆栈自编码器的 SAR 目标识别特征融合算法，该方法首先提取 SAR 图像的基线特征与纹理特征，而后将通过零成分分析法降维后的特征代入堆栈自编码器中进行抽象特征提取与融合，最后采用softmax 分类器完成抽象特征到类别标签的映射.为提升AE在小样本条件下的特征提取能力，Deng等^[40]将暗含样本类别信息的欧氏距离约束添加到AE 中，迫使其提取的抽象特征具有更强的类间可区分性，并将 Dropout 正则化技术应用到改进 AE的深度模型中，防止出现过拟合现象.Dong 等^[41]首先综合分析了自编码器及其改进算法，然后通过具体的 SAR 图像识别实验，验证了自编码器进行提取特征的有效性，分析了不同参数对AE泛化性能的影响，并比较了堆栈自编码器与其他典型算法的分类性能.为提升 SAR 图像的特征提取性能，增强抽象特征的类内聚集性，Guo等^[42]通过对卷积自编码器施加紧凑性约束，提出了紧凑卷积自编码器.该方法将类内样本距离正则化项添加到损失函数中，同时最小化重构误差与类内样本距离，以生成更具区分性的抽象特征，并通过在MSTAR数据集上的实验证实了方法的有效性. ...

Compact convolutional autoencoder for SAR target recognition

1

2020

... 对于SAR图像识别，Kang等^[39]提出了基于堆栈自编码器的 SAR 目标识别特征融合算法，该方法首先提取 SAR 图像的基线特征与纹理特征，而后将通过零成分分析法降维后的特征代入堆栈自编码器中进行抽象特征提取与融合，最后采用softmax 分类器完成抽象特征到类别标签的映射.为提升AE在小样本条件下的特征提取能力，Deng等^[40]将暗含样本类别信息的欧氏距离约束添加到AE 中，迫使其提取的抽象特征具有更强的类间可区分性，并将 Dropout 正则化技术应用到改进 AE的深度模型中，防止出现过拟合现象.Dong 等^[41]首先综合分析了自编码器及其改进算法，然后通过具体的 SAR 图像识别实验，验证了自编码器进行提取特征的有效性，分析了不同参数对AE泛化性能的影响，并比较了堆栈自编码器与其他典型算法的分类性能.为提升 SAR 图像的特征提取性能，增强抽象特征的类内聚集性，Guo等^[42]通过对卷积自编码器施加紧凑性约束，提出了紧凑卷积自编码器.该方法将类内样本距离正则化项添加到损失函数中，同时最小化重构误差与类内样本距离，以生成更具区分性的抽象特征，并通过在MSTAR数据集上的实验证实了方法的有效性. ...

A detailed investigation and analysis of using machine learning techniques for intrusion detection

1

2019

... 入侵检测旨在通过分析网络数据分组中的协议类型、服务类型以及持续时间等特征，识别其中的恶意攻击行为，为应对非法入侵提供预警，保障网络安全^[43].然而，随着大数据、云计算等技术的突飞猛进，网络安全威胁日益复杂，问题复杂度不断升高，数据维度不断增加，这使传统机器学习方法难以有效提取特征，存在学习效率低、误报率高的现象，而自编码器高效的特征提取能力，有利于发现潜在安全威胁，为解决复杂的入侵检测问题提供可能. ...

Deep learning approach combining sparse autoencoder with SVM for network intrusion detection

1

2018

... Li等^[16]提出一种将AE与深度置信网络相结合的入侵检测方法，该方法首先采用AE进行特征降维，然后采用深度置信网络对降维后的数据进行分类.相较于传统深度置信网络，该方法的检测准确率得到一定提升.Javaid等^[17]与Al-qatf等^[44]将SAE应用于入侵检测中，2 种方法首先采用独热编码处理符号特征，然后通过SAE进行层次化抽象特征提取，最后分别使用 softmax 分类器与支持向量机（SVM, support vector machine）完成类别映射.2种方法均在NSL-KDD数据集上进行实验，通过准确率、精准率、召回率与F值等指标的变化，验证算法有效性.为改进AE与VAE中的抽象特征表示，迫使抽象特征向原点聚集，Cao 等^[45]通过增加 AE损失函数中的抽象特征L₂范数正则化项，重构VAE损失函数中的KL散度项，提出了缩小自编码器与狄拉克变分自编码器，并将其应用于异常检测中.Chouhan等^[46]将堆栈自编码器与改进的卷积网络相结合，提出了一种新的入侵检测方法.该方法将多个堆栈自编码器用于原始特征空间到抽象特征空间的转换，得到多个不同的抽象特征空间，并采用信道增强方法将不同的抽象特征空间进行叠加，而后代入改进的卷积神经网络中进行分类，完成异常行为的检测.对于入侵检测数据集中存在的类别不平衡问题，通过将类别标签作为VAE的额外输入， Lopez-martin 等^[47]提出了一种新的变分生成模型，并将其用于少数类的生成中，有效提升了检测准确率.通过将统计分析方法与自编码器相结合， Ieracitano等^[48]提出了一种新的入侵检测方法.该方法先后采用异常值分析剔除异常值、最小最大归一化统一数值范围、独热编码数值化符号特征，而后通过数值0的比例进行特征剔除，接着将剩余特征分别通过AE与softmax分类器完成特征降维与分类.Tang等^[49]为进一步提升特征提取能力，通过在输入层与隐含层间新增用于计算特征注意力向量的注意力机制层，将注意力机制引入AE中，提出了注意力自编码器（AAE, attention autoencoder），并将堆栈注意力自编码器（SAAE, stacked AAE）与深度神经网络（DNN, deep neural network）相结合应用于入侵检测中. ...

Learning neural representations for network anomaly detection

1

2019

... Li等^[16]提出一种将AE与深度置信网络相结合的入侵检测方法，该方法首先采用AE进行特征降维，然后采用深度置信网络对降维后的数据进行分类.相较于传统深度置信网络，该方法的检测准确率得到一定提升.Javaid等^[17]与Al-qatf等^[44]将SAE应用于入侵检测中，2 种方法首先采用独热编码处理符号特征，然后通过SAE进行层次化抽象特征提取，最后分别使用 softmax 分类器与支持向量机（SVM, support vector machine）完成类别映射.2种方法均在NSL-KDD数据集上进行实验，通过准确率、精准率、召回率与F值等指标的变化，验证算法有效性.为改进AE与VAE中的抽象特征表示，迫使抽象特征向原点聚集，Cao 等^[45]通过增加 AE损失函数中的抽象特征L₂范数正则化项，重构VAE损失函数中的KL散度项，提出了缩小自编码器与狄拉克变分自编码器，并将其应用于异常检测中.Chouhan等^[46]将堆栈自编码器与改进的卷积网络相结合，提出了一种新的入侵检测方法.该方法将多个堆栈自编码器用于原始特征空间到抽象特征空间的转换，得到多个不同的抽象特征空间，并采用信道增强方法将不同的抽象特征空间进行叠加，而后代入改进的卷积神经网络中进行分类，完成异常行为的检测.对于入侵检测数据集中存在的类别不平衡问题，通过将类别标签作为VAE的额外输入， Lopez-martin 等^[47]提出了一种新的变分生成模型，并将其用于少数类的生成中，有效提升了检测准确率.通过将统计分析方法与自编码器相结合， Ieracitano等^[48]提出了一种新的入侵检测方法.该方法先后采用异常值分析剔除异常值、最小最大归一化统一数值范围、独热编码数值化符号特征，而后通过数值0的比例进行特征剔除，接着将剩余特征分别通过AE与softmax分类器完成特征降维与分类.Tang等^[49]为进一步提升特征提取能力，通过在输入层与隐含层间新增用于计算特征注意力向量的注意力机制层，将注意力机制引入AE中，提出了注意力自编码器（AAE, attention autoencoder），并将堆栈注意力自编码器（SAAE, stacked AAE）与深度神经网络（DNN, deep neural network）相结合应用于入侵检测中. ...

Network anomaly detection using channel boosted and residual learning based deep convolutional neural network

1

2019

... Li等^[16]提出一种将AE与深度置信网络相结合的入侵检测方法，该方法首先采用AE进行特征降维，然后采用深度置信网络对降维后的数据进行分类.相较于传统深度置信网络，该方法的检测准确率得到一定提升.Javaid等^[17]与Al-qatf等^[44]将SAE应用于入侵检测中，2 种方法首先采用独热编码处理符号特征，然后通过SAE进行层次化抽象特征提取，最后分别使用 softmax 分类器与支持向量机（SVM, support vector machine）完成类别映射.2种方法均在NSL-KDD数据集上进行实验，通过准确率、精准率、召回率与F值等指标的变化，验证算法有效性.为改进AE与VAE中的抽象特征表示，迫使抽象特征向原点聚集，Cao 等^[45]通过增加 AE损失函数中的抽象特征L₂范数正则化项，重构VAE损失函数中的KL散度项，提出了缩小自编码器与狄拉克变分自编码器，并将其应用于异常检测中.Chouhan等^[46]将堆栈自编码器与改进的卷积网络相结合，提出了一种新的入侵检测方法.该方法将多个堆栈自编码器用于原始特征空间到抽象特征空间的转换，得到多个不同的抽象特征空间，并采用信道增强方法将不同的抽象特征空间进行叠加，而后代入改进的卷积神经网络中进行分类，完成异常行为的检测.对于入侵检测数据集中存在的类别不平衡问题，通过将类别标签作为VAE的额外输入， Lopez-martin 等^[47]提出了一种新的变分生成模型，并将其用于少数类的生成中，有效提升了检测准确率.通过将统计分析方法与自编码器相结合， Ieracitano等^[48]提出了一种新的入侵检测方法.该方法先后采用异常值分析剔除异常值、最小最大归一化统一数值范围、独热编码数值化符号特征，而后通过数值0的比例进行特征剔除，接着将剩余特征分别通过AE与softmax分类器完成特征降维与分类.Tang等^[49]为进一步提升特征提取能力，通过在输入层与隐含层间新增用于计算特征注意力向量的注意力机制层，将注意力机制引入AE中，提出了注意力自编码器（AAE, attention autoencoder），并将堆栈注意力自编码器（SAAE, stacked AAE）与深度神经网络（DNN, deep neural network）相结合应用于入侵检测中. ...

Variational data generative model for intrusion detection

1

2019

... Li等^[16]提出一种将AE与深度置信网络相结合的入侵检测方法，该方法首先采用AE进行特征降维，然后采用深度置信网络对降维后的数据进行分类.相较于传统深度置信网络，该方法的检测准确率得到一定提升.Javaid等^[17]与Al-qatf等^[44]将SAE应用于入侵检测中，2 种方法首先采用独热编码处理符号特征，然后通过SAE进行层次化抽象特征提取，最后分别使用 softmax 分类器与支持向量机（SVM, support vector machine）完成类别映射.2种方法均在NSL-KDD数据集上进行实验，通过准确率、精准率、召回率与F值等指标的变化，验证算法有效性.为改进AE与VAE中的抽象特征表示，迫使抽象特征向原点聚集，Cao 等^[45]通过增加 AE损失函数中的抽象特征L₂范数正则化项，重构VAE损失函数中的KL散度项，提出了缩小自编码器与狄拉克变分自编码器，并将其应用于异常检测中.Chouhan等^[46]将堆栈自编码器与改进的卷积网络相结合，提出了一种新的入侵检测方法.该方法将多个堆栈自编码器用于原始特征空间到抽象特征空间的转换，得到多个不同的抽象特征空间，并采用信道增强方法将不同的抽象特征空间进行叠加，而后代入改进的卷积神经网络中进行分类，完成异常行为的检测.对于入侵检测数据集中存在的类别不平衡问题，通过将类别标签作为VAE的额外输入， Lopez-martin 等^[47]提出了一种新的变分生成模型，并将其用于少数类的生成中，有效提升了检测准确率.通过将统计分析方法与自编码器相结合， Ieracitano等^[48]提出了一种新的入侵检测方法.该方法先后采用异常值分析剔除异常值、最小最大归一化统一数值范围、独热编码数值化符号特征，而后通过数值0的比例进行特征剔除，接着将剩余特征分别通过AE与softmax分类器完成特征降维与分类.Tang等^[49]为进一步提升特征提取能力，通过在输入层与隐含层间新增用于计算特征注意力向量的注意力机制层，将注意力机制引入AE中，提出了注意力自编码器（AAE, attention autoencoder），并将堆栈注意力自编码器（SAAE, stacked AAE）与深度神经网络（DNN, deep neural network）相结合应用于入侵检测中. ...

A novel statistical analysis and autoencoder driven intelligent intrusion detection approach

1

2020

... Li等^[16]提出一种将AE与深度置信网络相结合的入侵检测方法，该方法首先采用AE进行特征降维，然后采用深度置信网络对降维后的数据进行分类.相较于传统深度置信网络，该方法的检测准确率得到一定提升.Javaid等^[17]与Al-qatf等^[44]将SAE应用于入侵检测中，2 种方法首先采用独热编码处理符号特征，然后通过SAE进行层次化抽象特征提取，最后分别使用 softmax 分类器与支持向量机（SVM, support vector machine）完成类别映射.2种方法均在NSL-KDD数据集上进行实验，通过准确率、精准率、召回率与F值等指标的变化，验证算法有效性.为改进AE与VAE中的抽象特征表示，迫使抽象特征向原点聚集，Cao 等^[45]通过增加 AE损失函数中的抽象特征L₂范数正则化项，重构VAE损失函数中的KL散度项，提出了缩小自编码器与狄拉克变分自编码器，并将其应用于异常检测中.Chouhan等^[46]将堆栈自编码器与改进的卷积网络相结合，提出了一种新的入侵检测方法.该方法将多个堆栈自编码器用于原始特征空间到抽象特征空间的转换，得到多个不同的抽象特征空间，并采用信道增强方法将不同的抽象特征空间进行叠加，而后代入改进的卷积神经网络中进行分类，完成异常行为的检测.对于入侵检测数据集中存在的类别不平衡问题，通过将类别标签作为VAE的额外输入， Lopez-martin 等^[47]提出了一种新的变分生成模型，并将其用于少数类的生成中，有效提升了检测准确率.通过将统计分析方法与自编码器相结合， Ieracitano等^[48]提出了一种新的入侵检测方法.该方法先后采用异常值分析剔除异常值、最小最大归一化统一数值范围、独热编码数值化符号特征，而后通过数值0的比例进行特征剔除，接着将剩余特征分别通过AE与softmax分类器完成特征降维与分类.Tang等^[49]为进一步提升特征提取能力，通过在输入层与隐含层间新增用于计算特征注意力向量的注意力机制层，将注意力机制引入AE中，提出了注意力自编码器（AAE, attention autoencoder），并将堆栈注意力自编码器（SAAE, stacked AAE）与深度神经网络（DNN, deep neural network）相结合应用于入侵检测中. ...

SAAE-DNN:deep learning method on intrusion detection

1

2020

... Li等^[16]提出一种将AE与深度置信网络相结合的入侵检测方法，该方法首先采用AE进行特征降维，然后采用深度置信网络对降维后的数据进行分类.相较于传统深度置信网络，该方法的检测准确率得到一定提升.Javaid等^[17]与Al-qatf等^[44]将SAE应用于入侵检测中，2 种方法首先采用独热编码处理符号特征，然后通过SAE进行层次化抽象特征提取，最后分别使用 softmax 分类器与支持向量机（SVM, support vector machine）完成类别映射.2种方法均在NSL-KDD数据集上进行实验，通过准确率、精准率、召回率与F值等指标的变化，验证算法有效性.为改进AE与VAE中的抽象特征表示，迫使抽象特征向原点聚集，Cao 等^[45]通过增加 AE损失函数中的抽象特征L₂范数正则化项，重构VAE损失函数中的KL散度项，提出了缩小自编码器与狄拉克变分自编码器，并将其应用于异常检测中.Chouhan等^[46]将堆栈自编码器与改进的卷积网络相结合，提出了一种新的入侵检测方法.该方法将多个堆栈自编码器用于原始特征空间到抽象特征空间的转换，得到多个不同的抽象特征空间，并采用信道增强方法将不同的抽象特征空间进行叠加，而后代入改进的卷积神经网络中进行分类，完成异常行为的检测.对于入侵检测数据集中存在的类别不平衡问题，通过将类别标签作为VAE的额外输入， Lopez-martin 等^[47]提出了一种新的变分生成模型，并将其用于少数类的生成中，有效提升了检测准确率.通过将统计分析方法与自编码器相结合， Ieracitano等^[48]提出了一种新的入侵检测方法.该方法先后采用异常值分析剔除异常值、最小最大归一化统一数值范围、独热编码数值化符号特征，而后通过数值0的比例进行特征剔除，接着将剩余特征分别通过AE与softmax分类器完成特征降维与分类.Tang等^[49]为进一步提升特征提取能力，通过在输入层与隐含层间新增用于计算特征注意力向量的注意力机制层，将注意力机制引入AE中，提出了注意力自编码器（AAE, attention autoencoder），并将堆栈注意力自编码器（SAAE, stacked AAE）与深度神经网络（DNN, deep neural network）相结合应用于入侵检测中. ...

智慧矿山背景下我国煤矿机械故障诊断研究现状与展望

1

2020

... 机械故障诊断通过对获取的机械运行状态信息进行分析比较，旨在及时发现机器异常或故障，从而减少故障或事故的发生^[50].传统故障诊断方法基于对振动信号的分析与处理，通过经验知识进行特征提取与选择，并选择浅层分类器完成故障类别的判定.然而，随着现代化机电设备发展，传感器数量增多、采样频率升高、数据量加大，且振动信号的非线性、非高斯分布性等特性凸显，传统方法难以实现故障的快速准确判断，这促使包括自编码器在内的深度学习技术应用于故障诊断中. ...

智慧矿山背景下我国煤矿机械故障诊断研究现状与展望

1

2020

... 机械故障诊断通过对获取的机械运行状态信息进行分析比较，旨在及时发现机器异常或故障，从而减少故障或事故的发生^[50].传统故障诊断方法基于对振动信号的分析与处理，通过经验知识进行特征提取与选择，并选择浅层分类器完成故障类别的判定.然而，随着现代化机电设备发展，传感器数量增多、采样频率升高、数据量加大，且振动信号的非线性、非高斯分布性等特性凸显，传统方法难以实现故障的快速准确判断，这促使包括自编码器在内的深度学习技术应用于故障诊断中. ...

A new deep transfer learning based on sparse auto-encoder for fault diagnosis

1

2019

... Zhang等^[18]与Lu等^[19]分别将AE与DAE应用于滚动轴承故障诊断中，使用其深度结构实现振动信号的抽象特征提取，克服了传统人工特征提取的局限，极大提升了故障诊断准确率.为实现特征的自动提取，克服训练样本与测试样本间的差异性， Wen 等^[51]将 SAE 与迁移学习相结合，提出了基于深度迁移学习的故障诊断方法.该方法将训练样本与测试样本均采用SAE逐层提取样本抽象，并在网络损失函数中加入最大平均差异正则化项，最小化训练和测试样本抽象特征之间的差异，使提取的抽象特征能同时有效表征训练与测试样本.在常用故障诊断数据集上的实验表明，该方法的预测准确率高于深度置信网络、SVM 等算法.Li 等^[52]将稀疏与邻域原理应用于ELM-AE中，通过在损失函数中增加稀疏与邻域正则化项，更新隐含层输出权值的最小二乘法，迫使抽象特征保留样本的全局与局部流形结构，提升其可区分性，并与 ELM 及其深度模型进行对比分析，验证了所提方法在故障诊断上的有效性.为提取含噪声振动信号的有效故障特征，Yu^[53]提出了一种基于负相关学习的选择性堆栈去噪自编码器集成模型.该模型首先将 bagging 算法应用于堆栈去噪自编码器（SDAE, stacked DAE）中，通过bootstrap采样训练样本，使用不同的采样样本进行SDAE抽象特征提取，然后利用负相关学习进行微调，构建分类器，最后采用粒子群算法对SDAE进行选择性集成，得到稳定性与泛化性能最优的模型.Zhao等^[54]为解决故障样本少所导致的类不平衡问题，将VAE引入故障诊断框架中，通过增扩少数类的振动信号样本，构建出类别平衡的训练样本，并代入 CNN 中进行分类.实验结果表明，与真实信号相比，VAE生成的振动信号具有相似的时频特性，能够促进诊断准确率的提升.Yu 等^[55]为提升对一维振动信号的特征提取能力，将一维卷积自编码器应用于齿轮故障诊断中，并引入残差学习对其进行改进.Gao等^[56]提出了一种基于半监督堆栈自编码器与集成极限学习机相结合的高压开关故障诊断方法.该方法首先采用自适应噪声完备经验模态分解对针对信号进行处理，得到时频能量矩阵，然后对能量矩阵采用半监督堆栈自编码器进行自动特征提取，接着采用集成极限学习机建立两级分类器，第一级用于正常或异常状态识别，第二级用于异常状态的具体故障类型识别.在验证实验中，该方法的分类准确率可达到99.5%. ...

A novel fault diagnosis algorithm for rotating machinery based on a sparsity and neighborhood preserving deep extreme learning machine

1

2019

... Zhang等^[18]与Lu等^[19]分别将AE与DAE应用于滚动轴承故障诊断中，使用其深度结构实现振动信号的抽象特征提取，克服了传统人工特征提取的局限，极大提升了故障诊断准确率.为实现特征的自动提取，克服训练样本与测试样本间的差异性， Wen 等^[51]将 SAE 与迁移学习相结合，提出了基于深度迁移学习的故障诊断方法.该方法将训练样本与测试样本均采用SAE逐层提取样本抽象，并在网络损失函数中加入最大平均差异正则化项，最小化训练和测试样本抽象特征之间的差异，使提取的抽象特征能同时有效表征训练与测试样本.在常用故障诊断数据集上的实验表明，该方法的预测准确率高于深度置信网络、SVM 等算法.Li 等^[52]将稀疏与邻域原理应用于ELM-AE中，通过在损失函数中增加稀疏与邻域正则化项，更新隐含层输出权值的最小二乘法，迫使抽象特征保留样本的全局与局部流形结构，提升其可区分性，并与 ELM 及其深度模型进行对比分析，验证了所提方法在故障诊断上的有效性.为提取含噪声振动信号的有效故障特征，Yu^[53]提出了一种基于负相关学习的选择性堆栈去噪自编码器集成模型.该模型首先将 bagging 算法应用于堆栈去噪自编码器（SDAE, stacked DAE）中，通过bootstrap采样训练样本，使用不同的采样样本进行SDAE抽象特征提取，然后利用负相关学习进行微调，构建分类器，最后采用粒子群算法对SDAE进行选择性集成，得到稳定性与泛化性能最优的模型.Zhao等^[54]为解决故障样本少所导致的类不平衡问题，将VAE引入故障诊断框架中，通过增扩少数类的振动信号样本，构建出类别平衡的训练样本，并代入 CNN 中进行分类.实验结果表明，与真实信号相比，VAE生成的振动信号具有相似的时频特性，能够促进诊断准确率的提升.Yu 等^[55]为提升对一维振动信号的特征提取能力，将一维卷积自编码器应用于齿轮故障诊断中，并引入残差学习对其进行改进.Gao等^[56]提出了一种基于半监督堆栈自编码器与集成极限学习机相结合的高压开关故障诊断方法.该方法首先采用自适应噪声完备经验模态分解对针对信号进行处理，得到时频能量矩阵，然后对能量矩阵采用半监督堆栈自编码器进行自动特征提取，接着采用集成极限学习机建立两级分类器，第一级用于正常或异常状态识别，第二级用于异常状态的具体故障类型识别.在验证实验中，该方法的分类准确率可达到99.5%. ...

A selective deep stacked denoising autoencoders ensemble with negative correlation learning for gearbox fault diagnosis

1

2019

... Zhang等^[18]与Lu等^[19]分别将AE与DAE应用于滚动轴承故障诊断中，使用其深度结构实现振动信号的抽象特征提取，克服了传统人工特征提取的局限，极大提升了故障诊断准确率.为实现特征的自动提取，克服训练样本与测试样本间的差异性， Wen 等^[51]将 SAE 与迁移学习相结合，提出了基于深度迁移学习的故障诊断方法.该方法将训练样本与测试样本均采用SAE逐层提取样本抽象，并在网络损失函数中加入最大平均差异正则化项，最小化训练和测试样本抽象特征之间的差异，使提取的抽象特征能同时有效表征训练与测试样本.在常用故障诊断数据集上的实验表明，该方法的预测准确率高于深度置信网络、SVM 等算法.Li 等^[52]将稀疏与邻域原理应用于ELM-AE中，通过在损失函数中增加稀疏与邻域正则化项，更新隐含层输出权值的最小二乘法，迫使抽象特征保留样本的全局与局部流形结构，提升其可区分性，并与 ELM 及其深度模型进行对比分析，验证了所提方法在故障诊断上的有效性.为提取含噪声振动信号的有效故障特征，Yu^[53]提出了一种基于负相关学习的选择性堆栈去噪自编码器集成模型.该模型首先将 bagging 算法应用于堆栈去噪自编码器（SDAE, stacked DAE）中，通过bootstrap采样训练样本，使用不同的采样样本进行SDAE抽象特征提取，然后利用负相关学习进行微调，构建分类器，最后采用粒子群算法对SDAE进行选择性集成，得到稳定性与泛化性能最优的模型.Zhao等^[54]为解决故障样本少所导致的类不平衡问题，将VAE引入故障诊断框架中，通过增扩少数类的振动信号样本，构建出类别平衡的训练样本，并代入 CNN 中进行分类.实验结果表明，与真实信号相比，VAE生成的振动信号具有相似的时频特性，能够促进诊断准确率的提升.Yu 等^[55]为提升对一维振动信号的特征提取能力，将一维卷积自编码器应用于齿轮故障诊断中，并引入残差学习对其进行改进.Gao等^[56]提出了一种基于半监督堆栈自编码器与集成极限学习机相结合的高压开关故障诊断方法.该方法首先采用自适应噪声完备经验模态分解对针对信号进行处理，得到时频能量矩阵，然后对能量矩阵采用半监督堆栈自编码器进行自动特征提取，接着采用集成极限学习机建立两级分类器，第一级用于正常或异常状态识别，第二级用于异常状态的具体故障类型识别.在验证实验中，该方法的分类准确率可达到99.5%. ...

Enhanced data-driven fault diagnosis for machines with small and unbalanced data based on variational auto-encoder

1

2020

... Zhang等^[18]与Lu等^[19]分别将AE与DAE应用于滚动轴承故障诊断中，使用其深度结构实现振动信号的抽象特征提取，克服了传统人工特征提取的局限，极大提升了故障诊断准确率.为实现特征的自动提取，克服训练样本与测试样本间的差异性， Wen 等^[51]将 SAE 与迁移学习相结合，提出了基于深度迁移学习的故障诊断方法.该方法将训练样本与测试样本均采用SAE逐层提取样本抽象，并在网络损失函数中加入最大平均差异正则化项，最小化训练和测试样本抽象特征之间的差异，使提取的抽象特征能同时有效表征训练与测试样本.在常用故障诊断数据集上的实验表明，该方法的预测准确率高于深度置信网络、SVM 等算法.Li 等^[52]将稀疏与邻域原理应用于ELM-AE中，通过在损失函数中增加稀疏与邻域正则化项，更新隐含层输出权值的最小二乘法，迫使抽象特征保留样本的全局与局部流形结构，提升其可区分性，并与 ELM 及其深度模型进行对比分析，验证了所提方法在故障诊断上的有效性.为提取含噪声振动信号的有效故障特征，Yu^[53]提出了一种基于负相关学习的选择性堆栈去噪自编码器集成模型.该模型首先将 bagging 算法应用于堆栈去噪自编码器（SDAE, stacked DAE）中，通过bootstrap采样训练样本，使用不同的采样样本进行SDAE抽象特征提取，然后利用负相关学习进行微调，构建分类器，最后采用粒子群算法对SDAE进行选择性集成，得到稳定性与泛化性能最优的模型.Zhao等^[54]为解决故障样本少所导致的类不平衡问题，将VAE引入故障诊断框架中，通过增扩少数类的振动信号样本，构建出类别平衡的训练样本，并代入 CNN 中进行分类.实验结果表明，与真实信号相比，VAE生成的振动信号具有相似的时频特性，能够促进诊断准确率的提升.Yu 等^[55]为提升对一维振动信号的特征提取能力，将一维卷积自编码器应用于齿轮故障诊断中，并引入残差学习对其进行改进.Gao等^[56]提出了一种基于半监督堆栈自编码器与集成极限学习机相结合的高压开关故障诊断方法.该方法首先采用自适应噪声完备经验模态分解对针对信号进行处理，得到时频能量矩阵，然后对能量矩阵采用半监督堆栈自编码器进行自动特征提取，接着采用集成极限学习机建立两级分类器，第一级用于正常或异常状态识别，第二级用于异常状态的具体故障类型识别.在验证实验中，该方法的分类准确率可达到99.5%. ...

One-dimensional residual convolutional autoencoder based feature learning for gearbox fault diagnosis

1

2020

... Zhang等^[18]与Lu等^[19]分别将AE与DAE应用于滚动轴承故障诊断中，使用其深度结构实现振动信号的抽象特征提取，克服了传统人工特征提取的局限，极大提升了故障诊断准确率.为实现特征的自动提取，克服训练样本与测试样本间的差异性， Wen 等^[51]将 SAE 与迁移学习相结合，提出了基于深度迁移学习的故障诊断方法.该方法将训练样本与测试样本均采用SAE逐层提取样本抽象，并在网络损失函数中加入最大平均差异正则化项，最小化训练和测试样本抽象特征之间的差异，使提取的抽象特征能同时有效表征训练与测试样本.在常用故障诊断数据集上的实验表明，该方法的预测准确率高于深度置信网络、SVM 等算法.Li 等^[52]将稀疏与邻域原理应用于ELM-AE中，通过在损失函数中增加稀疏与邻域正则化项，更新隐含层输出权值的最小二乘法，迫使抽象特征保留样本的全局与局部流形结构，提升其可区分性，并与 ELM 及其深度模型进行对比分析，验证了所提方法在故障诊断上的有效性.为提取含噪声振动信号的有效故障特征，Yu^[53]提出了一种基于负相关学习的选择性堆栈去噪自编码器集成模型.该模型首先将 bagging 算法应用于堆栈去噪自编码器（SDAE, stacked DAE）中，通过bootstrap采样训练样本，使用不同的采样样本进行SDAE抽象特征提取，然后利用负相关学习进行微调，构建分类器，最后采用粒子群算法对SDAE进行选择性集成，得到稳定性与泛化性能最优的模型.Zhao等^[54]为解决故障样本少所导致的类不平衡问题，将VAE引入故障诊断框架中，通过增扩少数类的振动信号样本，构建出类别平衡的训练样本，并代入 CNN 中进行分类.实验结果表明，与真实信号相比，VAE生成的振动信号具有相似的时频特性，能够促进诊断准确率的提升.Yu 等^[55]为提升对一维振动信号的特征提取能力，将一维卷积自编码器应用于齿轮故障诊断中，并引入残差学习对其进行改进.Gao等^[56]提出了一种基于半监督堆栈自编码器与集成极限学习机相结合的高压开关故障诊断方法.该方法首先采用自适应噪声完备经验模态分解对针对信号进行处理，得到时频能量矩阵，然后对能量矩阵采用半监督堆栈自编码器进行自动特征提取，接着采用集成极限学习机建立两级分类器，第一级用于正常或异常状态识别，第二级用于异常状态的具体故障类型识别.在验证实验中，该方法的分类准确率可达到99.5%. ...

A newly designed diagnostic method for mechanical faults of high-voltage circuit breakers via SSAE and IELM

1

2021

... Zhang等^[18]与Lu等^[19]分别将AE与DAE应用于滚动轴承故障诊断中，使用其深度结构实现振动信号的抽象特征提取，克服了传统人工特征提取的局限，极大提升了故障诊断准确率.为实现特征的自动提取，克服训练样本与测试样本间的差异性， Wen 等^[51]将 SAE 与迁移学习相结合，提出了基于深度迁移学习的故障诊断方法.该方法将训练样本与测试样本均采用SAE逐层提取样本抽象，并在网络损失函数中加入最大平均差异正则化项，最小化训练和测试样本抽象特征之间的差异，使提取的抽象特征能同时有效表征训练与测试样本.在常用故障诊断数据集上的实验表明，该方法的预测准确率高于深度置信网络、SVM 等算法.Li 等^[52]将稀疏与邻域原理应用于ELM-AE中，通过在损失函数中增加稀疏与邻域正则化项，更新隐含层输出权值的最小二乘法，迫使抽象特征保留样本的全局与局部流形结构，提升其可区分性，并与 ELM 及其深度模型进行对比分析，验证了所提方法在故障诊断上的有效性.为提取含噪声振动信号的有效故障特征，Yu^[53]提出了一种基于负相关学习的选择性堆栈去噪自编码器集成模型.该模型首先将 bagging 算法应用于堆栈去噪自编码器（SDAE, stacked DAE）中，通过bootstrap采样训练样本，使用不同的采样样本进行SDAE抽象特征提取，然后利用负相关学习进行微调，构建分类器，最后采用粒子群算法对SDAE进行选择性集成，得到稳定性与泛化性能最优的模型.Zhao等^[54]为解决故障样本少所导致的类不平衡问题，将VAE引入故障诊断框架中，通过增扩少数类的振动信号样本，构建出类别平衡的训练样本，并代入 CNN 中进行分类.实验结果表明，与真实信号相比，VAE生成的振动信号具有相似的时频特性，能够促进诊断准确率的提升.Yu 等^[55]为提升对一维振动信号的特征提取能力，将一维卷积自编码器应用于齿轮故障诊断中，并引入残差学习对其进行改进.Gao等^[56]提出了一种基于半监督堆栈自编码器与集成极限学习机相结合的高压开关故障诊断方法.该方法首先采用自适应噪声完备经验模态分解对针对信号进行处理，得到时频能量矩阵，然后对能量矩阵采用半监督堆栈自编码器进行自动特征提取，接着采用集成极限学习机建立两级分类器，第一级用于正常或异常状态识别，第二级用于异常状态的具体故障类型识别.在验证实验中，该方法的分类准确率可达到99.5%. ...

基于改进自编码器的文本分类算法

2

2018

... 文本分类旨在通过文档的标题、关键词、正文等特征信息，对其所属类别进行判定，从而代替人工完成文本信息的分类管理.随着深度学习技术的发展，AE、CNN等算法已逐步应用于文本分类中^[57,58,59]. ...

... 许卓斌等^[57]为提升AE在词嵌入中的效果，通过在AE隐含层中加入全局调整函数，实现特征的合并，增强特征向量的稀疏性，并在20 News Groups数据集上验证了该改进方法的有效性.为提升高维度文本的特征提取能力，减少训练时间，冀俊忠等^[60]提出了基于ELM-AE的文本分类方法.该方法首先利用ELM-AE对高维度文本进行特征降维，而后通过堆栈ELM-AE实现文本抽象特征的层次化提取，并计算输出层权值的最小二乘解进行文本分类.Xu等^[61]针对半监督文本分类问题，提出了一种半监督序列变分自编码器.该方法通过将未标记样本的类别标签作为离散潜变量，最大化样本的似然变分下界，从而隐式推导出未标记样本的潜在类别分布，并通过解决序列解码器的自回归问题，使其能够应用于文本分类. ...

基于改进自编码器的文本分类算法

2

2018

... 文本分类旨在通过文档的标题、关键词、正文等特征信息，对其所属类别进行判定，从而代替人工完成文本信息的分类管理.随着深度学习技术的发展，AE、CNN等算法已逐步应用于文本分类中^[57,58,59]. ...

... 许卓斌等^[57]为提升AE在词嵌入中的效果，通过在AE隐含层中加入全局调整函数，实现特征的合并，增强特征向量的稀疏性，并在20 News Groups数据集上验证了该改进方法的有效性.为提升高维度文本的特征提取能力，减少训练时间，冀俊忠等^[60]提出了基于ELM-AE的文本分类方法.该方法首先利用ELM-AE对高维度文本进行特征降维，而后通过堆栈ELM-AE实现文本抽象特征的层次化提取，并计算输出层权值的最小二乘解进行文本分类.Xu等^[61]针对半监督文本分类问题，提出了一种半监督序列变分自编码器.该方法通过将未标记样本的类别标签作为离散潜变量，最大化样本的似然变分下界，从而隐式推导出未标记样本的潜在类别分布，并通过解决序列解码器的自回归问题，使其能够应用于文本分类. ...

Text classification based on deep belief network and softmax regression

1

2018

... 文本分类旨在通过文档的标题、关键词、正文等特征信息，对其所属类别进行判定，从而代替人工完成文本信息的分类管理.随着深度学习技术的发展，AE、CNN等算法已逐步应用于文本分类中^[57,58,59]. ...

Improving convolutional neural network for text classification by recursive data pruning

1

2020

... 文本分类旨在通过文档的标题、关键词、正文等特征信息，对其所属类别进行判定，从而代替人工完成文本信息的分类管理.随着深度学习技术的发展，AE、CNN等算法已逐步应用于文本分类中^[57,58,59]. ...

基于多隐层极限学习机的文本分类方法

1

2019

... 许卓斌等^[57]为提升AE在词嵌入中的效果，通过在AE隐含层中加入全局调整函数，实现特征的合并，增强特征向量的稀疏性，并在20 News Groups数据集上验证了该改进方法的有效性.为提升高维度文本的特征提取能力，减少训练时间，冀俊忠等^[60]提出了基于ELM-AE的文本分类方法.该方法首先利用ELM-AE对高维度文本进行特征降维，而后通过堆栈ELM-AE实现文本抽象特征的层次化提取，并计算输出层权值的最小二乘解进行文本分类.Xu等^[61]针对半监督文本分类问题，提出了一种半监督序列变分自编码器.该方法通过将未标记样本的类别标签作为离散潜变量，最大化样本的似然变分下界，从而隐式推导出未标记样本的潜在类别分布，并通过解决序列解码器的自回归问题，使其能够应用于文本分类. ...

基于多隐层极限学习机的文本分类方法

1

2019

... 许卓斌等^[57]为提升AE在词嵌入中的效果，通过在AE隐含层中加入全局调整函数，实现特征的合并，增强特征向量的稀疏性，并在20 News Groups数据集上验证了该改进方法的有效性.为提升高维度文本的特征提取能力，减少训练时间，冀俊忠等^[60]提出了基于ELM-AE的文本分类方法.该方法首先利用ELM-AE对高维度文本进行特征降维，而后通过堆栈ELM-AE实现文本抽象特征的层次化提取，并计算输出层权值的最小二乘解进行文本分类.Xu等^[61]针对半监督文本分类问题，提出了一种半监督序列变分自编码器.该方法通过将未标记样本的类别标签作为离散潜变量，最大化样本的似然变分下界，从而隐式推导出未标记样本的潜在类别分布，并通过解决序列解码器的自回归问题，使其能够应用于文本分类. ...

Semisupervised text classification by variational autoencoder

1

2020

... 许卓斌等^[57]为提升AE在词嵌入中的效果，通过在AE隐含层中加入全局调整函数，实现特征的合并，增强特征向量的稀疏性，并在20 News Groups数据集上验证了该改进方法的有效性.为提升高维度文本的特征提取能力，减少训练时间，冀俊忠等^[60]提出了基于ELM-AE的文本分类方法.该方法首先利用ELM-AE对高维度文本进行特征降维，而后通过堆栈ELM-AE实现文本抽象特征的层次化提取，并计算输出层权值的最小二乘解进行文本分类.Xu等^[61]针对半监督文本分类问题，提出了一种半监督序列变分自编码器.该方法通过将未标记样本的类别标签作为离散潜变量，最大化样本的似然变分下界，从而隐式推导出未标记样本的潜在类别分布，并通过解决序列解码器的自回归问题，使其能够应用于文本分类. ...

Compressed sensing

1

2006