网络与信息安全学报 ›› 2020, Vol. 6 ›› Issue (6): 1-12.doi: 10.11959/j.issn.2096-109x.2020072
张颖君(1982- ),女,山西太原人,博士,中国科学院软件研究所副研究员,主要研究方向为网络信息安全|刘尚奇 (1971- ),男,湖南桃江人,北京市公安局网络安全保卫总队高级工程师,主要研究方向为网络安全|杨牧(1984- ),男,北京人,北京市公安局网络安全保卫总队工程师,主要研究方向为网络安全|张海霞(1981- ),女,河北石家庄人,博士,中国科学院软件研究所高级工程师,主要研究方向为网络信息安全|黄克振(1988- ),男,山东德州人,中国科学院软件研究所工程师,主要研究方向为网络信息安全
Yingjun ZHANG1(),Ushangqi LI2,Mu YANG2,Haixia ZHANG1,Kezhen HUANG1
Supported by:
张颖君,刘尚奇,杨牧,张海霞,黄克振. 基于日志的异常检测技术综述[J]. 网络与信息安全学报, 2020, 6(6): 1-12.
Yingjun ZHANG,Ushangqi LI,Mu YANG,Haixia ZHANG,Kezhen HUANG. Survey on anomaly detection technology based on logs[J]. Chinese Journal of Network and Information Security, 2020, 6(6): 1-12.
日志模板示例 Table 1 Log template samples"
Eid | Name | Message | Frequency | Parameters |
1 | server.ZooKeeperServer | Server environment | 2 |,user.home=/home/hadoop |
2 | server.NIOServerCnxnFactory | binding to port | 1 | |
3 | server.NIOServerCnxnFactory | Accepted socket connection | 1 | |
4 | server.ZooKeeperServer | Client attempting to establish new | 1 | |
session | ||||
5 | server.ZooKeeperServer | Established session | 1 | 0x1621970549a0000 |
… | … | … | … |
日志自动化解析典型方法对比 Table 2 Comparison of typical methods for automatic log analysis"
名称 | 类别 | 使用算法 | 模式 | 准确性 | 时间复杂度 | 效率 |
CFG[ | 代码分析 | AST,CFG | 离线 | ++ | O(n3) | +++ |
PCA[ | 代码分析 | AST | 在线 | +++ | O(n) | +++ |
CLSTR[ | 机器学习 | IPLoM | 离线 | ++ | O(n) | +++ |
LKE[ | 机器学习 | Clustering | 离线 | ++ | O(n2) | + |
Logram[ | 自然语言处理 | n-gram | 在线 | +++ | O(n) | +++ |
NLog[ | 自然语言处理 | POS | 离线 | ++ | O(n) | +++ |
Spell[ | 经典算法 | LCS | 在线 | +++ | O(n) | +++ |
Drain[ | 经典算法 | 解析树 | 在线 | +++ | O(n) | +++ |
日志异常检测方法对比 Table 3 Comparison of log anomaly detection methods"
名称 | 分类 | 使用的算法 | 模式 | 准确率 | 召回率 |
AClog[ | 监督学习 | SVM,LCS | 离线 | 92.4% | 80% |
IM[ | 监督学习 | K-prototype,kNN | 离线 | 89% | 85% |
LogClass[ | 监督学习 | PU,SVM | 在线 | 99.048% | 99.988% |
LogCluster[ | 无监督学习 | 聚类算法 | 在线 | 60% | 36.2% |
MCL[ | 无监督学习 | PCA | 在线 | 99.8% | / |
LACT[ | 无监督学习 | TCA,NLP | 离线 | 97.08% | 95.45% |
CausalConvLSTM[ | 深度学习 | CNN,LSTM | 离线 | 89.59% | 99.72% |
DeepLog[ | 深度学习 | LSTM | 在线 | 95% | 96% |
LogGAN[ | 深度学习 | LSTM | 离线 | 100% | 35.6% |
LogRobust[ | 深度学习 | Bi-LSTM | 在线 | 98% | 100% |
