大数据 ›› 2023, Vol. 9 ›› Issue (1): 23-37.doi: 10.11959/j.issn.2096-0271.2023004

• 专题:元宇宙与大数据 • 上一篇    下一篇

节奏舞者:基于关键动作转换图和有条件姿态插值网络的3D舞蹈生成方法研究

贺亚运, 彭俊清, 王健宗, 肖京   

  1. 平安科技(深圳)有限公司,广东 深圳 518063
  • 出版日期:2023-01-15 发布日期:2023-01-01
  • 作者简介:贺亚运(1990- ),男,平安科技(深圳)有限公司资深算法工程师,主要研究方向为人工智能、声纹识别、元宇宙虚拟人等
    彭俊清(1973- ),男,国家认证计算机系统架构设计师,平安科技(深圳)有限公司资深经理,高级人工智能算法研究员,在IT行业耕耘多年,精通架构设计、云平台和AI系统建设,发表多篇论文,获得多项专利授权
    王健宗(1983- ),男,博士,平安科技(深圳)有限公司副总工程师,美国佛罗里达大学人工智能博士后,中国计算机学会(CCF)杰出会员,深圳市计算机学会理事,深圳市地方级领军人才,《大数据》期刊编委,曾任美国莱斯大学电子与计算机工程系研究员,主要研究方向为隐私计算、元宇宙、边缘计算和量子计算。曾获得中国专利奖优秀奖、深圳市科技进步奖、CCF科学技术奖、《麻省理工科技评论》中国2022年隐私计算科技创新人物称号等
    肖京(1972- ),男,博士,平安集团首席科学家,深圳市政协委员,深圳市决策咨询委员会委员,CCF深圳分部副主席,广东省人工智能与机器人学会副理事长,上海市科协人工智能专业委员会委员,深圳市人工智能行业协会会长。先后在爱普生美国研究院及美国微软公司担任高级研发管理职务。发表学术论文249篇,美国授权专利101项,中国授权专利155项,参与及承担国家级项目11项,获吴文俊人工智能科学技术进步奖一等奖、上海市科学技术进步奖一等奖、中国专利优秀奖、广东省专利优秀奖,以及吴文俊人工智能“杰出贡献奖”
  • 基金资助:
    广东省重点领域研发计划“新一代人工智能”重大科技专项(2021B0101400003)

Rhythm dancer: 3D dance generation by keymotion transition graph and pose-interpolation network

Yayun HE, Junqing PENG, Jianzong WANG, Jing XIAO   

  1. Ping An Technology (Shenzhen) Co., Ltd., Shenzhen 518063, China
  • Online:2023-01-15 Published:2023-01-01
  • Supported by:
    The Key Research and Development Program of Guangdong Province(2021B0101400003)

摘要:

3D舞蹈是元宇宙中虚拟人的一种重要表现形式,它将音乐与舞蹈进行有机结合,大大增强了元宇宙中相关应用的趣味性。之前的工作通常把3D舞蹈生成简单视作一个序列生成任务,但是生成的舞蹈动作质量较差且与音乐的契合度较低。受人类学习舞蹈过程的启发,提出了一种新颖的3D舞蹈框架——“节奏舞者”来解决上述问题。该框架首先使用VQ-VAE-2对舞蹈进行分层编码量化,可有效改善舞蹈生成质量;然后使用节奏点上的关键动作编码建立关键动作转换图,既可保证生成的舞蹈动作与音乐节拍的契合度,又可增加舞蹈动作的多样性。为了确保关键动作之间平滑自然地连接,提出了一个姿态插值网络来学习关键动作之间的转换动作。通过大量实验证明,该框架避免了长序列生成的不稳定和不可控问题,实现了舞蹈动作与音乐节奏的高度契合,达到了当前最优效果。

关键词: 3D舞蹈, 元宇宙, 舞蹈生成, 深度学习

Abstract:

3D dance is an indispensable form of virtual humans in the metaverse.It organically combines music and dance art, which greatly increases the interest in the metaverse.Previous work usually treats it as a simple sequence generation task, but it is difficult to match the dance movements with the music beat perfectly and the quality of long sequence dance generation is difficult to be guaranteed.Inspired by the process by which humans learn to dance, a novel 3D dance framework “Rhythm Dancer”to solve the above problems was proposed.The framework first uses VQ-VAE-2 to encode and quantify the dances in a hierarchical way, which effectively improves the quality of dance generation.Then, a key movement transition map was created using the core dance movements on the rhythm points, which not only ensures that the generated dance movements fit with the music beat, but also increases the diversity of dance movements.To ensure smooth and natural connections between the core dance moves, a poseinterpolation network was proposed to learn the transition movements between key moves.Extensive experiments demonstrate that the framework not only avoids the instability and uncontrollability problems of long sequence generation, but also achieves a higher match between dance movements and music rhythms, reaching state-of-the-art results.

Key words: 3D dance, metaverse, dance generation, deep learning

中图分类号: 

No Suggested Reading articles found!