编辑部公告

  • 2021年第2期专题:高性能计算虚拟数据空间




    高性能计算环境是支撑国家科技创新、经济发展的核心基础设施。目前国家高性能计算环境的总计算能力已突破200 PFlops,总存储容量超过160 PB。但是各节点广域分散,计算与存储资源难以统筹使用。本专题从虚拟数据空间系统构建、分布式系统高效缓存、国家高性能计算环境对虚拟数据空间的运行支撑以及面向非易失内存的MPI-IO接口优化等多个角度出发,探索了构建高性能计算虚拟数据空间的过程中面临的机遇和挑战以及相应的解决方案,希望能够引起广大读者的兴趣,并起到抛砖引玉的作用。

    秦广军等人撰写的《面向国家高性能计算环境的虚拟数据空间系统》建立了一套可用于构建广域全局虚拟数据空间的完整技术体系,并研发了一个可运行于国家高性能计算环境的虚拟数据空间软件系统。该系统在国家高性能计算环境中进行了实验性部署,通过3类典型大型应用的验证结果表明,该系统可有效地聚合广域分散存储资源,满足大型应用的数据空间需求。

    肖利民等人撰写的《GVDS:面向广域高性能计算环境的虚拟数据空间》提出了虚拟数据空间构建方法及数据访问性能优化方法,并实现了一个面向广域高性能计算环境的全局虚拟数据空间GVDS。测试结果表明,与当时最优的面向广域高性能计算环境的存储系统相比,GVDS在实现了相当功能的同时,数据访问性能明显提升。

    杨青霖等人撰写的《分布式存储系统中的数据高效缓存方法》针对典型分布式存储系统存在的写放大、I/O路径过长、响应时延较高等问题,提出了一种基于SSD的分布式存储系统中的数据高效缓存方法。该方法采用读写旁路和懒惰缓存的缓存管理策略、兼顾最近访问时间和历史访问频率的缓存替换策略,并自适应地调整主动回刷脏数据的速率,从而显著提升了存储系统的读写性能。

    牛北方等人撰写的《国家高性能计算环境的虚拟数据空间运行支撑技术研究》研究了国家高性能环境节点部署技术。该技术通过模块化方式将虚拟数据空间系统与国家高性能计算环境进行深度融合,将其功能补充到国家高性能计算环境中,并通过统一的虚实空间用户管理框架,实现跨域统一、透明安全的存储服务和对大型计算应用的支撑。

    邓镇龙等人撰写的《面向非易失内存的MPI-IO接口优化》针对非易失内存对MPI-IO接口进行了优化,从分布式缓存、持久性元数据以及进程间数据传输策略三方面着手,使应用可以被有效管理,利用非易失内存设备保持缓存数据的一致性。实验结果证明,优化后的接口为应用带来了数十倍的读写性能提升。

    由于篇幅有限,本专题无法涵盖高性能计算虚拟数据空间建设的各个核心方法和关键技术,希望本专题收录的研究和探索能够引起学术界和工业界的关注,共同推动国家高性能计算环境的完善和发展。 



    张广艳(1976- ),男,博士,清华大学计算机系长聘副教授、博士生导师,主要从事大数据存储与分析的理论和方法研究,包括大数据计算、存储系统与分布式处理等方面。研究得到了国家杰出青年科学基金项目、国家重点研发计划项目、国家973项目和国家863项目等的支持。近年来提出了大规模存储系统构建及访问的方法与关键技术,有效提高了存储系统的性能、扩展性和可用性。发表学术论文40余篇,其中在FASTUSENIX ATCACM TOSIEEE TCIEEE TPDS等计算机系统领域高水平国际会议和期刊发表论文20余篇。近五年以第一发明人获得美国发明专利授权1项、中国发明专利授权7项。

  • 发布日期: 2021-03-29    浏览: 940
下载排行
点击排行