大数据 ›› 2023, Vol. 9 ›› Issue (4): 3-15.doi: 10.11959/j.issn.2096-0271.2023040

• 专题:跨域数据管理 • 上一篇    

跨空间域数据管理分布式共识算法:现状、挑战和展望

李伟明1, 李彤1,2, 张大方1, 戴隆超1,2, 柴云鹏1,2   

  1. 1 中国人民大学信息学院,北京 100872
    2 数据工程与知识工程教育部重点实验室,北京 100872
  • 出版日期:2023-07-01 发布日期:2023-07-01
  • 作者简介:李伟明(1999- ),男,中国人民大学信息学院硕士生,主要研究方向为分布式共识协议
    李彤(1989- ),男,博士,中国人民大学信息学院副教授,主要研究方向为新一代互联网体系结构、跨域数据管理和大数据
    张大方(1998- ),男,中国人民大学信息学院硕士生,主要研究方向为分布式共识协议
    戴隆超(1996- )男,中国人民大学信息学院硕士生,主要研究方向为跨域数据管理和大数据
    柴云鹏(1983- ),男,博士,中国人民大学信息学院教授、博士生导师,中国人民大学理工学科建设处副处长、计算机科学与技术系主任,主要研究方向为数据库管理系统、存储系统、云计算
  • 基金资助:
    国家自然科学基金资助项目(61972402);国家自然科学基金资助项目(61972275);国家自然科学基金资助项目(62202473);中国人民大学建设世界一流大学(学科)基金资助项目

Distributed consensus algorithms for crossdomain data management: state-of-the-art, challenges and perspectives

Weiming LI1, Tong LI1,2, Dafang ZHANG1, Longchao DAI1,2, Yunpeng CHAI1,2   

  1. 1 School of Information, Renmin University of China, Beijing 100872, China
    2 Key Laboratory of Data Engineering and Knowledge Engineering, Beijing 100872, China
  • Online:2023-07-01 Published:2023-07-01
  • Supported by:
    The National Natural Science Foundation of China(61972402);The National Natural Science Foundation of China(61972275);The National Natural Science Foundation of China(62202473);Fund for Building World-Class Universities (Disciplines) of Renmin University of China

摘要:

随着数字经济的飞速发展,以及“全国一体化数据中心”和“东数西算”等基础设施的不断完善,数据要素流通的大趋势使数据服务逐步由面向单一空间域的数据管理转变为面向跨空间域的数据管理。跨域数据管理需要通过分布式共识算法使数据一致。然而,已有的分布式共识算法仅考虑单数据中心的情况,没有考虑跨数据中心之间的网络通信的不确定性,从而在跨空间域场景下面临日志同步时延大、系统吞吐量低下等问题。系统地梳理了跨空间域下的分布式共识算法的现状以及面临的新挑战,并针对解决这些挑战的技术路线进行了展望。

关键词: 跨空间域数据管理, 分布式共识算法, 日志复制, 领导者选举

Abstract:

With the exponential growth of data and the company's cross-domain disaster recovery requirements, companies increasingly need to manage data across spatial domains.Cross-domain data management requires a distributed consensus algorithm to make the data consistent.However, the existing distributed consensus algorithms only consider the situation of a single data center, and do not consider the uncertainty of network communication between data centers, so they face long log synchronization delays and low system throughput in cross-space region scenarios and other issues.The current status and new challenges of distributed consensus algorithms in the cross-space domain were sorted out systematically, and the technical route to solve these challenges was looked forward.

Key words: cross-domain data management, distributed consensus algorithm, log replication, leader election

中图分类号: 

No Suggested Reading articles found!