通信学报 ›› 2018, Vol. 39 ›› Issue (4): 13-20.doi: 10.11959/j.issn.1000-436x.2018052

• 学术论文 • 上一篇    下一篇

并行社区发现算法的可扩展性研究

刘强1(),贾焰1,方滨兴1,2,周斌1,胡玥1,黄九鸣1   

  1. 1 国防科技大学计算机学院,湖南 长沙 410073
    2 北京邮电大学计算机学院,北京 100876
  • 修回日期:2017-12-02 出版日期:2018-04-01 发布日期:2018-04-29
  • 作者简介:刘强(1981-),男,江苏句容人,国防科技大学博士生,主要研究方向为社交网络分析、数据挖掘、复杂网络等。|贾焰(1960-),女,四川成都人,国防科技大学教授、博士生导师,主要研究方向为社交网络分析、信息安全等。|方滨兴(1960-),男,江西万年人,中国工程院院士,北京邮电大学教授、博士生导师,主要研究方向为社交网络分析、信息安全等。|周斌(1971-),男,江西南昌人,国防科技大学教授、博士生导师,主要研究方向为社交网络分析、信息安全等。|胡玥(1993-),女,陕西宝鸡人,国防科技大学硕士生,主要研究方向为社交网络分析。|黄九鸣(1981-),男,福建安溪人,国防科技大学讲师,主要研究方向为社交网络分析、信息安全等。
  • 基金资助:
    国家重点研发计划基金资助项目(2017YFB0803303);国家自然科学基金资助项目(61502517);国家自然科学基金资助项目(61472438)

Research on the scalability of parallel community detection algorithms

Qiang LIU1(),Yan JIA1,Binxing FANG1,2,Bin ZHOU1,Yue HU1,Jiuming HUANG1   

  1. 1 College of Computer,National University of Defense Technology,Changsha 410073,China
    2 College of Computer,Beijing University of Posts and Telecommunications,Beijing 100876,China
  • Revised:2017-12-02 Online:2018-04-01 Published:2018-04-29
  • Supported by:
    The National Key Research and Development Program of China(2017YFB0803303);The National Natural Science Foundation of China(61502517);The National Natural Science Foundation of China(61472438)

摘要:

社交网络中往往蕴含着大量用户和群体信息,如话题演化模式、群体聚集效应以及信息传播规律等,对这些信息的挖掘成为社交网络分析的重要任务。社交网络的群体聚集效应作为社交网络的一种特征模式,表现为社交网络的社区结构特性。社区结构的发现已成为其他社交网络分析任务的基础和关键。随着在线社交网络用户数量的急剧增长,传统的社区发现手段已经难以适应,从而催生了并行社区发现技术的发展。对当前主流并行社区发现方法Louvain算法和标签传播算法在超大规模数据集上的可扩展性进行了研究,指出了各自的优缺点,为后续应用提供参考。

关键词: 社区发现, 并行算法, 可扩展性

Abstract:

The social network often contains a large amount of information about users and groups,such as topic evolution mode,group aggregation effect,the law of information dissemination and so on.The mining of these information has become an important task for social network analysis.As one characteristic of the social network,the group aggregation effect is characterized by the community structure of the social network.The discovery of community structure has become the basis and key point of other social network analysis tasks.With the rapid growth of the number of online social network users,the traditional community detection methods have been difficult to be used,which contributes to the development of parallel community detection technology.The current mainstream parallel community detection methods,including Louvain algorithm and label propagation algorithm,were tested in the large-scale data sets,and corresponding advantages and disadvantages were pointed out so as to provide useful information for later applications.

Key words: community detection, parallel algorithm, scalability

中图分类号: 

No Suggested Reading articles found!