电信科学 ›› 2019, Vol. 35 ›› Issue (5): 32-42.doi: 10.11959/j.issn.1000-0801.2019142

• 专题:智能通信技术及应用 • 上一篇    下一篇

基于神经网络的图像视频编码

贾川民,赵政辉,王苫社,马思伟   

  1. 北京大学,北京 100871
  • 修回日期:2019-05-08 出版日期:2019-05-20 发布日期:2019-05-21
  • 作者简介:贾川民(1993- ),男,北京大学博士生,主要研究方向为图像视频编码与处理。|赵政辉(1993- ),男,北京大学博士生,主要研究方向为图像视频编码与处理。|王苫社(1981- ),男,博士,北京大学助理研究员,主要研究方向为视频编码与视频处理。|马思伟(1979- ),男,博士,北京大学教授、博士生导师,主要研究方向为视频编码与处理。
  • 基金资助:
    国家自然科学基金资助项目(61632001);国家重点基础研究发展计划(“973”计划)基金资助项目(2015CB351800);北京大学高性能计算平台资助项目

Neural network based image and video coding technologies

Chuanmin JIA,Zhenghui ZHAO,Shanshe WANG,Siwei MA   

  1. Peking University,Beijing 100871,China
  • Revised:2019-05-08 Online:2019-05-20 Published:2019-05-21
  • Supported by:
    The National Natural Science Foundation of China(61632001);The National Key Technology R&D Program(973 Program)(2015CB351800);Peking University High Performance Computing Platform

摘要:

深度神经网络近年来在人工智能领域进展显著,并引发广泛深入研究神经网络的热潮,近期基于神经网络的图像视频编码也成为热点研究问题之一。系统梳理了基于神经网络的图像视频编码技术及进展,对基于多层感知机、随机神经网络、卷积神经网络、循环神经网络、生成对抗网络等框架的图像压缩,以及基于深度学习的各类视频编码工具进行了综述介绍,同时对神经网络编码的未来发展趋势进行了分析与展望。

关键词: 神经网络, 深度学习, 卷积神经网络, 图像压缩, 视频编码

Abstract:

Deep neural networks have achieved tremendous success in artificial intelligence,which makes the broad and in-depth research of neural network resurge in recent years.Recently,the neural network based image and video coding has become one of the front-edge topics.A systematic and comprehensive review of neural network based image and video coding approaches based on network structure and coding modules were provided.The development of neural network based image compression,e.g.multi-layer perceptron,random neural network,convolutional neural network,recurrent neural network and generative adversarial network based image compression methods and neural network based video compression tools were introduced respectively.Moreover,the future trends in neural network based compression were also envisioned and discussed.

Key words: neural network, deep learning,CNN, image compression, video coding

中图分类号: 

[1] 曹 宁,胡建荣,马银松. 基于光流估计的整帧恢复算法[J]. 通信学报, 2007, 28(5): 22 -140 .
[2] 侯亚飞,HAMAMURA Masanori,张世永. 新型排列组合高压缩多载波调制系统[J]. 通信学报, 2007, 28(1): 11 -74 .
[3] 钱志鸿,刘 丹. 蓝牙技术数据传输综述[J]. 通信学报, 2012, 33(4): 20 -151 .
[4] 曾 斌,魏 军,姚 路. 传感器网络中继节点扩展部署的优化算法研究[J]. 通信学报, 2012, 33(4): 21 -162 .
[5] 闫玺玺,马兆丰,杨义先,钮心忻. 基于身份的电子文档域密钥分发算法及协议[J]. 通信学报, 2012, 33(5): 2 -20 .
[6] 朱义勇,李永贵. 基于自适应广义特征值分解的盲分离算法[J]. 通信学报, 2007, 0(08A): 13 -66 .
[7] 韩 松,顾国昌. 无线ad hoc网络容量分析方法研究[J]. 通信学报, 2007, 0(08A): 14 -73 .
[8] 王巍1,李锐光2,周渊2,杨武1. 基于用户与节点规模的微博突发话题传播预测算法[J]. 通信学报, 2013, 34(Z1): 11 -91 .
[9] 黄永明,杜颖钢,余 辉,杨绿溪. 有限回程开销多小区分布式协作波束成形技术[J]. 通信学报, 2012, 33(8): 17 -146 .
[10] 谭庆丰,刘培鹏,时金桥,王 啸,郭 莉. UGC3:一种抵御审查的隐蔽通信方法[J]. 通信学报, 2012, 33(8): 19 -161 .