电信科学 ›› 2022, Vol. 38 ›› Issue (1): 61-72.doi: 10.11959/j.issn.1000-0801.2022014

• 研究与开发 • 上一篇    下一篇

基于图像描述算法的离线盲人视觉辅助系统

陈悦1, 郭宇1,2, 谢圆琰1, 米振强1   

  1. 1 北京科技大学计算机与通信工程学院,北京 100083
    2 北京科技大学顺德研究生院,广东 佛山 528399
  • 修回日期:2021-11-19 出版日期:2022-01-20 发布日期:2022-01-01
  • 作者简介:陈悦(1998- ),女,北京科技大学计算机与通信工程学院硕士生,主要研究方向为计算机视觉与人工智能
    郭宇(1992- ),男,博士,北京科技大学计算机与通信工程学院讲师,主要研究方向为无线传感器网络、云计算、多机器人系统
    谢圆琰(1996- ),女,北京科技大学计算机与通信工程学院博士生,主要研究方向为云机器人、服务科学与云计算
    米振强(1983- ),男,博士,北京科技大学计算机与通信工程学院副教授,主要研究方向为服务计算、多机器人系统、移动环境中的点云计算

Offline visual aid system for the blind based on image captioning

Yue CHEN1, Yu GUO1,2, Yuanyan XIE1, Zhenqiang MI1   

  1. 1 School of Computer &Communication, University of Science and Technology Beijing, Beijing 100083, China
    2 Shunde Graduate School, University of Science and Technology Beijing, Foshan 528399, China
  • Revised:2021-11-19 Online:2022-01-20 Published:2022-01-01

摘要:

摘 要:针对现有盲人视觉辅助设备存在的不便,探讨了基于模型剪枝的图像描述模型在便携式移动设备上运行的方法。回顾了图像描述模型和剪枝模型技术,重点提出了一种针对图像描述模型的改进剪枝算法。结果表明,在保证准确性的前提下,剪枝后的图像描述模型可以大幅降低工作时的处理时间和消耗的电源容量,能够随时随地快速准确地对环境信息进行描述及语音播报。

关键词: 视觉辅助系统, 图像描述模型, 模型压缩和加速, 模型剪枝算法

Abstract:

In view of the inconveniences of existing visual aid systems for the blind, the method of running the image captioning model on portable mobile devices based on model pruning was discussed.Model pruning techniques and image captioning models were reviewed.An improved model pruning algorithm for image captioning model was proposed.Experimental results show that, on the premise of ensuring accuracy, the image captioning model after pruning can greatly reduce processing time and power consumption capacity, and can quickly and accurately describe environmental information and voice broadcast anytime and anywhere.

Key words: visual assisted system, image captioning model, model compression and acceleration, model pruning algorithm

中图分类号: 

No Suggested Reading articles found!