大数据 ›› 2018, Vol. 4 ›› Issue (3): 24-36.doi: 10.11959/j.issn.2096-0271.2018027

• 专题:生物医疗大数据 • 上一篇    下一篇

生物效应大数据评估聚类算法的并行优化

彭绍亮1,2,杨顺云2,孙哲1,程敏霞1,崔英博2,王晓伟2,李非3,伯晓晨3,廖湘科2   

  1. 1 湖南大学信息科学与工程学院&国家超级计算长沙中心,湖南 长沙 410082
    2 国防科技大学计算机学院,湖南 长沙 410073
    3 中国人民解放军军事医学科学院,北京 100850
  • 出版日期:2018-05-15 发布日期:2018-05-30
  • 作者简介:彭绍亮(1979-),男,博士,国家超级计算长沙中心(湖南大学)教授、副主任,长期从事高性能计算、大数据、生物信息等技术研究工作,并担任国防科技大学“天河”生命科学方向负责人,华大基因研究院“特聘教授”。已在国际权威斯刊发表学术论文百余篇,出版专著6本,单篇论文他引次数高达1 213次。曾参与“天河”系列超级计算机应用软件研发工作,参与国家“973” 计划项目、“863” 计划项目、军队重大型号项目等13项,获军队科技进步奖一等奖1项,2016年荣立三等功。|杨顺云(1992-),男,国防科技大学计算机学院硕士生,主要研究方向为生物医药高性能计算。|孙哲(1995-),女,湖南大学信息科学与工程学院硕士生,主要研究方向为计算生物学。|程敏霞(1995-),女,湖南大学信息科学与工程学院硕士生,主要研究方向为计算生物学。|崔英博(1989-),男,国防科技大学计算机学院博士生,主要研究方向为并行计算、生物信息、生物计算。|王晓伟(1980-),男,国防科技大学计算机学院博士后,主要研究方向为大数据库和数据挖掘、生物信息学。|李非(1981-),男,博士,中国人民解放军军事医学科学院副研究员,主要研究方向为大数据、计算生物学、生物信息学。|伯晓晨(1973-),男,中国人民解放军军事医学科学院研究员、博士生导师、科技处处长,主要研究方向为新一代测序技术、系统生物学等。|廖湘科(1963-),男,中国工程院院士,“天河一号”超级计算机项目总指挥、常务副总设计师,“天河二号”超级计算机项目总指挥、总设计师,国防科技大学计算机学院院长。主要研究方向为大数据、高性能计算等。
  • 基金资助:
    国家重点研发计划基金资助项目(2017YFB0202603);国家重点研发计划基金资助项目(2017YFC1311003);国家重点研发计划基金资助项目(2016YFC1302500);国家重点研发计划基金资助项目(2016YFB0200400);国家重点研发计划基金资助项目(2017YFB0202104);国家自然科学基金资助项目(61772543);国家自然科学基金资助项目(U1435222);国家自然科学基金资助项目(61625202);国家自然科学基金资助项目(61272056);化学生物传感与计量学国家重点实验室基金项目(2016B090918122);化学生物传感与计量学国家重点实验室基金项目

Parallel optimization for clustering algorithm of large-scale biological effect evaluation

Shaoliang PENG1,2,Shunyun YANG2,Zhe SUN1,Minxia CHENG1,Yingbo CUI2,Xiaowei WANG2,Fei LI3,Xiaochen BO3,Xiangke LIAO2   

  1. 1 College of Computer Science and Electronic Engineering &National Supercomputer Centre in Changsha,Hunan University,Changsha 410082,China
    2 Department of Computer Science,National University of Defense Technology,Changsha 410073,China
    3 Academy of Military Medical Sciences,Beijing 100850,China
  • Online:2018-05-15 Published:2018-05-30
  • Supported by:
    The National Key Research and Development Program of China(2017YFB0202603);The National Key Research and Development Program of China(2017YFC1311003);The National Key Research and Development Program of China(2016YFC1302500);The National Key Research and Development Program of China(2016YFB0200400);The National Key Research and Development Program of China(2017YFB0202104);The National Natural Science Foundation of China(61772543);The National Natural Science Foundation of China(U1435222);The National Natural Science Foundation of China(61625202);The National Natural Science Foundation of China(61272056);Guangdong Provincial Department of Science and Technology(2016B090918122);The Funds of State Key Laboratory of Chemo/Biosensing and Chemometrics

摘要:

生物效应评估通过测定和分析生物制剂刺激各种人体细胞后的数字化转录组反应,能够快速确定相关的检测标识物和治疗靶标。基于潜在生物制剂作用下的细胞反应大数据,推测突发生物效应模式。综合考虑了MPI、OpenMP两级并行加速,移植优化了基因探针富集分析(GSEA)比对算法和聚类算法,使用不同的数据量和并行度验证了优化后算法潜在的良好可扩展性和快速处理海量生物信息数据的能力。

关键词: GSEA, 聚类, MPI, OpenMP

Abstract:

The biological assessment,including matching algorithm,is realized by measuring and analyzing the human cells’ transcription reaction after stimulated by biological agents,to quickly determine the relevant detection markers and treatment targets.Similarly,the big data strategy was used to estimate the sudden biological effect model.MPI,OpenMP two-level parallel acceleration was considered,transplantation and optimization of the GSEA alignment algorithm and clustering algorithm were used.The potential scalability and the ability of dealing with massive data by testing different scales of data and parallelisms were improved.

Key words: GSEA, clustering, MPI, OpenMP

中图分类号: 

No Suggested Reading articles found!