大数据 ›› 2021, Vol. 7 ›› Issue (2): 123-146.doi: 10.11959/j.issn.2096-0271.2021017

• 专题:高性能计算虚拟数据空间 • 上一篇    下一篇

GVDS:面向广域高性能计算环境的虚拟数据空间

肖利民1,2, 宋尧1,2, 秦广军3, 周汉杰1,2, 王超波1,2, 韦冰1,2, 魏巍4, 霍志胜1,2   

  1. 1 北京航空航天大学计算机学院,北京 100191
    2 软件开发环境国家重点实验室,北京 100191
    3 北京联合大学智慧城市学院,北京 100101
    4 西安理工大学计算机科学与工程学院,陕西 西安 710048
  • 出版日期:2021-03-15 发布日期:2021-03-01
  • 作者简介:肖利民(1970- ),男,博士,北京航空航天大学计算机学院教授、博士生导师,计算机科学技术系主任,计算机系统结构研究所副所长,中国计算机学会(CCF)大数据专家委员会委员、高性能计算专业委员会常务委员、容错计算专业委员会委员,中国电子学会云计算专家委员会委员,国家计算机科学技术名词审定委员会委员,国家科技基础条件平台专家组成员,工业和信息化部电子科学技术委员会委员,中国工程院中国信息与电子工程科技发展战略研究中心专家委员会特聘专家。主要研究方向为计算机体系结构、计算机软件系统、高性能计算、云计算、虚拟化技术等。先后获得国家科技进步奖二等奖、北京市科学技术奖一等奖、中国科学院科技进步奖一等奖、原信息产业部信息产业重大技术发明奖、科技部国家重点新产品奖等国家级和省部级科技奖励。
    宋尧(1994- ),男,北京航空航天大学计算机学院博士生,主要研究方向为高性能计算、分布式存储、分布式调度系统、存算联动调度等。
    秦广军(1977- ),男,博士,北京联合大学智慧城市学院讲师,CCF会员,主要研究方向为高性能计算、存储系统、大数据和机器学习等。作为项目骨干参与了国家863计划项目、国家重点研发计划项目、国家自然科学基金项目、北京市自然科学基金项目等。
    周汉杰(1995- ),男,北京航空航天大学计算机学院硕士生,主要研究方向为分布式文件系统、高性能计算、网络安全等。
    王超波(1997- ),男,北京航空航天大学计算机学院硕士生,主要研究方向为分布式文件系统、高性能计算、软件工程等。
    韦冰(1990- ),男,北京航空航天大学计算机学院博士生,主要研究方向为网络存储、数据容错、大数据处理、分布式计算等。
    魏巍(1975-),男,博士,西安理工大学计算机科学与工程学院副教授,IEEE、CCF高级会员,FGCS、AHSWN、IEICE、KSII等期刊编委会成员,IEEE TPDS、TVT、TIP、TMC、TWC、JNCA和其他多个Elsevier期刊的定期审稿人。作为首席研究员和技术成员,主持了多项研究项目。主要研究方向为无线网络、无线传感器网络应用、图像处理、移动计算、分布式计算、普适计算、物联网、传感器数据云等。
    霍志胜(1983- ),男,博士,北京航空航天大学计算机学院助理研究员,作为项目主持人和项目骨干,主持和参与了博士后基金面上项目、国家重点研发计划项目、国家自然科学基金面上项目等。主要研究方向为大数据存储、分布式存储系统、分布式/并行文件系统等。
  • 基金资助:
    国家重点研发计划资助项目(2018YFB0203901)

GVDS: a global virtual data space for wide-area high-performance computing environments

Limin XIAO1,2, Yao SONG1,2, Guangjun QIN3, Hanjie ZHOU1,2, Chaobo WANG1,2, Bing WEI1,2, Wei WEI4, Zhisheng HUO1,2   

  1. 1 School of Computer Science and Engineering, Beihang University, Beijing 100191, China
    2 State Key Laboratory of Software Development Environment, Beijing 100191, China
    3 Smart City College, Beijing Union University, Beijing 100101, China
    4 School of Computer Science and Engineering, Xi’an University of Technology, Xi’an 710048, China
  • Online:2021-03-15 Published:2021-03-01
  • Supported by:
    The National Key Research and Development Program of China(2018YFB0203901)

摘要:

广域高性能计算环境是支撑科技创新和社会经济发展的核心信息基础设施。然而,在广域高性能计算环境中,异构存储资源在地理位置上的分散分布导致无法发挥广域存储资源的聚合效应,难以满足对广域分布数据的统一管理和高效访问需求。为此,提出了虚拟数据空间构建方法及数据访问性能优化方法,并实现了一个面向广域高性能计算环境的全局虚拟数据空间(GVDS)。GVDS可聚合广域分布的异构存储资源,形成统一的虚拟数据空间,有效支撑用户以统一访问模式高效访问广域分散的异构存储资源,实现广域环境中分布数据的跨域共享和协同处理。测试结果表明,与国际领先的面向广域高性能计算环境的OneData、GFFS等存储系统相比,GVDS实现了相当的功能,且数据访问性能明显提升。

关键词: 全局虚拟数据空间, 广域高性能计算环境, 高效数据访问, 异构存储资源

Abstract:

The wide-area high-performance computing environment is the core information infrastructure to support technology innovation, economic development, and national defense.However, heterogeneous storage resources are geographically distributed in wide-area high-performance computing environments, resulting in the barriers between applications and data.The requirements of unified data management and efficient data access cannot be met.A method of establishing virtual data space and a data access optimization method was presented, and a global virtual data space (GVDS) for wide-area high-performance computing environments to satisfy the requirements was implemented.GVDS aggregates geographically distributed and heterogeneous storage resources, creating a unified virtual data space to provide unified and efficient data access.Sharing and collaborative processing of geographically distributed data were achieved in widearea environments.The experimental results indicate that compared with the state-of-the-art wide-area storage system in the field of high-performance computing, such as OneData and GFFS, GVDS has similar functions and improves the read bandwidth significantly.

Key words: global virtual data space, wide-area high-performance computing environment, efficient data access, heterogeneous storage resource

中图分类号: 

No Suggested Reading articles found!