大数据 ›› 2019, Vol. 5 ›› Issue (4): 89-99.doi: 10.11959/j.issn.2096-0271.2019034

• 研究 • 上一篇    下一篇

基于RDMA和NVM的大数据系统一致性协议研究

吴昊1,2,陈康1,2,武永卫1,2,郑纬民1,2   

  1. 1 清华大学计算机科学与技术系,北京 100084
    2 北京信息科学与技术国家研究中心,北京 100084
  • 出版日期:2019-07-15 发布日期:2019-08-09
  • 作者简介:吴昊(1992- ),男,清华大学计算机科学与技术系硕士生,主要研究方向为分布式系统。|陈康(1976- ),男,清华大学计算机科学与技术系副教授,中国计算机学会(CCF)会员,主要研究方向为分布式系统、存储系统等。|武永卫(1974- ),男,清华大学计算机科学与技术系教授,CCF高级会员,主要研究方向为并行和分布式处理、云计算和存储等。|郑纬民(1946- ),男,清华大学计算机科学与技术系教授、博士生导师,CCF会士,主要研究方向为计算机架构、操作系统、存储和分布式计算等。
  • 基金资助:
    国家重点研发计划基金资助项目(2016YFB1000504);国家自然科学基金资助项目(61433008);国家自然科学基金资助项目(61373145);国家自然科学基金资助项目(61572280);国家自然科学基金资助项目(1435216);中国博士后科学基金资助项目(2018M630162)

Research on the consensus of big data systems based on RDMA and NVM

Hao WU1,2,Kang CHEN1,2,Yongwei WU1,2,Weimin ZHENG1,2   

  1. 1 Department of Computer Science and Technology,Tsinghua University,Beijing 100084,China
    2 Beijing National Research Center for Information Science and Technology,Beijing 100084,China
  • Online:2019-07-15 Published:2019-08-09
  • Supported by:
    National Key Research and Development Program of China(2016YFB1000504);The National Natural Science Foundation of China(61433008);The National Natural Science Foundation of China(61373145);The National Natural Science Foundation of China(61572280);The National Natural Science Foundation of China(1435216);China Postdoctoral Science Foundation(2018M630162)

摘要:

分布式的存储系统以及计算系统是构造大数据处理系统的基础。系统的高可用性是任何一个分布式系统的基石,高可用技术一般依赖于一致性协议。讨论了经典的非拜占庭的分布式一致性协议以及新技术发展下的RDMA通信协议与NVM存储介质,通过RDMA和NVM的结合获得了更高性能的高可用系统。改进了一致性协议,使其能够更好地利用RDMA与NVM的特性。实现的系统在保证系统数据一致和可用的同时,有效地提高了协议实现的性能。实验表明,相比于现有的系统,实现的系统能够得到40%的性能提高。

关键词: 大数据, 分布式系统, 一致性协议, 远程内存直接访问, 非易失存储器

Abstract:

Distributed storage systems and computing systems are the foundation for constructing big data processing systems.High availability of the system is the cornerstone of any distributed system.High-availability technologies generally rely on consensus protocols.The classic non-Byzantine distributed consensus protocol was discussed,as well as the RDMA communication protocol and NVM storage media under the development of new technologies to achieve higher performance high availability systems by combining them.The consensus protocol to make the better use of the features of RDMA and NVM was modified.The implemented system effectively improves the performance of the protocol while ensuring the consistency and availability of the system data.Experiments show that the system implemented in this paper can achieve 40% performance improvement compared to existing systems.

Key words: big data, distributed system, consensus protocol, RDMA, NVM

中图分类号: 

No Suggested Reading articles found!