大数据 ›› 2021, Vol. 7 ›› Issue (5): 131-149.doi: 10.11959/j.issn.2096-0271.2021053

• 专栏:数据驱动的优化 • 上一篇    下一篇

强化学习在资源优化领域的应用

王金予, 魏欣然, 石文磊, 张佳   

  1. 微软亚洲研究院,北京 100080
  • 出版日期:2021-09-15 发布日期:2021-09-01
  • 作者简介:王金予(1994- ),女,微软亚洲研究院创新孵化组算法工程师,主要研究方向为多智能体强化学习、时间序列预测,关注线性规划、人工智能技术在以物流为主的资源优化领域的应用
    魏欣然(1996- ),女,微软亚洲研究院机器学习组研究员,主要研究方向为多智能体强化学习与细粒度分类,关注人工智能技术在零售、物流、能源等实际场景的应用
    石文磊(1994- ),男,微软亚洲研究院机器学习组研究员,主要研究方向为强化学习、不完全信息博弈等,在INFOCOM、AAMAS等国际会议上发表多篇文章
    张佳(1989- ),男,微软亚洲研究院机器学习组高级研究员,主要研究方向为多智能体强化学习与神经网络领域,专注于利用人工智能技术解决物流、环境、能源等领域的问题,在KDD、AAAI、AAMAS、WINE等国际会议上发表多篇文章

Applications of reinforcement learning in the field of resource optimization

Jinyu WANG, Xinran WEI, Wenlei SHI, Jia ZHANG   

  1. Microsoft Research Asia, Beijing 100080, China
  • Online:2021-09-15 Published:2021-09-01

摘要:

资源优化问题广泛存在于社会、经济的运转中,积累了海量的数据,给强化学习技术在这一领域的应用奠定了基础。由于资源优化问题覆盖广泛,从覆盖广泛的资源优化问题中划分出3类重要问题,即资源平衡问题、资源分配问题和装箱问题。并围绕这3类问题总结强化学习技术的最新研究工作,围绕各研究工作的问题建模、智能体设计等方面展开详细阐述。

关键词: 强化学习, 资源优化, 多智能体系统

Abstract:

Resource optimization is an important problem that widely exists in the social operation and economic development.There is massive data accumulated in this field which has laid the foundation for more and more application of reinforcement learning.Due to the wide coverage of resource optimization problems, three important problems from the wide range of resource optimization problems were categorized and chosen, namely resource balancing problem, resource allocation problem, and bin packing problem.The problem formulation and the reinforcement learning agent modeling of these three types of problems were introduced in detail.

Key words: reinforcement learning, resource optimization, multi-agent system

中图分类号: 

No Suggested Reading articles found!