大数据 ›› 2021, Vol. 7 ›› Issue (5): 100-110.doi: 10.11959/j.issn.2096-0271.2021051

• 专栏:数据驱动的优化 • 上一篇    下一篇

基于样本的优化

张智杰1,2, 孙晓明1,2, 张家琳1,2, 陈卫3   

  1. 1 中国科学院计算技术研究所,北京 100086
    2 中国科学院大学,北京 100049
    3 微软亚洲研究院,北京 100080
  • 出版日期:2021-09-15 发布日期:2021-09-01
  • 作者简介:张智杰(1995- ),男,中国科学院计算技术研究所博士生,主要研究方向为次模优化、公平分配等
    孙晓明(1978- ),男,中国科学院计算技术研究所研究员,主要研究方向为量子计算、算法复杂性、社会网络近似算法、通信复杂性、判定树复杂性、组合数学等
    张家琳(1983- ),女,中国科学院计算技术研究所研究员,主要研究方向为理论计算机科学、量子计算、近似算法、在线算法、算法博弈论
    陈卫(1968- ),男,博士,微软亚洲研究院高级研究员,中国科学院计算技术研究所客座研究员,中国计算机学会大数据专家委员会和理论计算机科学专业委员会委员,IEEE Fellow,《大数据》期刊编委。主要研究方向为在线学习和优化、社交和信息网络、网络博奕论和经济学、分布式计算、容错等
  • 基金资助:
    国家自然科学基金资助项目(61832003);国家自然科学基金资助项目(61872334);中国科学院先导研究专项资助项目(XDA27000000)

Optimization from samples

Zhijie ZHANG1,2, Xiaoming SUN1,2, Jialin ZHANG1,2, Wei CHEN3   

  1. 1 Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100086, China
    2 University of Chinese Academy of Sciences, Beijing 100049, China
    3 Microsoft Research Asia, Beijing 100080, China
  • Online:2021-09-15 Published:2021-09-01
  • Supported by:
    The National Natural Science Foundation of China(61832003);The National Natural Science Foundation of China(61872334);The Strategic Priority Research Program of Chinese Academy of Sciences(XDA27000000)

摘要:

基于样本的优化研究的是如何通过用于学习目标函数的样本数据直接优化目标函数。首先介绍这一问题的数学模型——样本优化模型,以及这个模型下的不可近似性结果;然后介绍若干方法和样本优化模型的变种,以绕过这个模型下的不可近似性结果,使得优化成为可能;接着着重介绍其中一个变种——结构化样本优化模型,并详细阐述该模型下的最大覆盖问题和影响力最大化问题的优化算法;最后总结全文,并展望这一问题的未来研究方向。

关键词: 基于样本的优化, 数据驱动的优化, 结构化样本, 最大覆盖问题, 影响力最大化问题

Abstract:

Optimization from samples studies how one can optimize objective functions from the sample data that one uses to learn them.Firstly, the mathematical model of this problem-optimization from samples model, as well as the inapproximability results under this model, was introduced.Secondly, some approaches and variants of OPS were introduced, in order to circumvent the impossibility results and make optimization possible.Thirdly, one of the variants-the optimization from structured samples model was focused on, and the algorithms for maximum coverage and influence maximization problem under it were introduced in details.Finally, the paper was concluded, and some future research directions for the problem were proposed.

Key words: optimization from samples, data-driven optimization, structured sample, maximum coverage problem, influence maximization problem

中图分类号: 

No Suggested Reading articles found!