网络与信息安全学报 ›› 2016, Vol. 2 ›› Issue (8): 74-83.doi: 10.11959/j.issn.2096-109x.2016.00076

• 学术论文 • 上一篇    

Larbin体系结构的研究与优化

王璇1,2,霍义霞1,慈云飞1,史国振1,李莉1,2()   

  1. 1 北京电子科技学院信息安全系,北京 100070
    2 西安电子科技大学计算机学院,陕西 西安 710000
  • 修回日期:2016-08-02 出版日期:2016-08-01 发布日期:2017-06-04
  • 作者简介:王璇(1991-),女,山东菏泽人,西安电子科技大学硕士生,主要研究方向为多核调度。|霍义霞(1991-),女,河北廊坊人,北京电子科技学院硕士生,主要研究方向为网络安全。|慈云飞(1989-),男,安徽池州人,北京电子科技学院硕士生,主要研究方向为访问控制和信息安全。|史国振(1974-),男,河南济源人,博士,北京电子科技学院副教授、硕士生导师,主要研究方向为网络与系统安全、嵌入式安全。|李莉(1974-),女,山东青岛人,西安电子科技大学博士生,北京电子科技学院副教授、硕士生导师,主要研究方向为网络与系统安全、嵌入式系统安全应用。
  • 基金资助:
    国家重点研发计划基金资助项目(2016YFB0800304);北京市自然科学基金资助项目(4152048);江苏省自然科学基金资助项目(BK20150787);北京电子科技学院2016年春蕾计划基金资助项目(2016CL04)

Study and optimization on system architectures of Larbin

Xuan WANG1,2,Yi-xia HUO1,Yun-fei CI1,Guo-zhen SHI1,Li LI1,2()   

  1. 1 School of Information Security,Beijing Electronic Science and Technology Institute,Beijing 100070,China
    2 School of Computer,Xidian University,Xi'an 710000,China
  • Revised:2016-08-02 Online:2016-08-01 Published:2017-06-04
  • Supported by:
    The National Key Research Programof China(2016YFB0800304);he Natural Science Foundation of Beijing(4152048);The Natural Science Foundation of Jiangsu Province(BK20150787);2016 Spring Buds Project of Beijing Electronic Science&Technology Institute(2016CL04)

摘要:

网络爬虫是搜索引擎的重要组成部分,其性能直接影响搜索引擎的准确性和及时性。Larbin是一个高效、简单、功能比较完善的开源爬虫框架,基于此,介绍了几种典型的开源爬虫框架,并对其进行多维度比较;对Larbin体系结构进行详细的介绍;然后指出Larbin在程序结构和流程方面存在的不足,提出对应的优化方案;测试结果表明,改进后的方案在速度和性能方面都有所提高。

关键词: 搜索引擎, 网络爬虫, Larbin, 开源, 优化

Abstract:

Web crawler is an important part of the search engine,its performance will directly affect the accuracy and timeliness of the search engine.Larbin is an efficient and simple open source crawler with relatively perfect in functions.Several typical open-source crawler were firstly introduced and a multi-dimensional comparison was made among them.Then,the system architecture and working mechanism of Larbin were given in detail.Its short-comings in the program structure and process were pointed out,and improved programs were proposed.Experimen-tal results show that improved program is better in speed and performance.

Key words: search engine, Web crawler, Larbin, open source, optimization

中图分类号: 

No Suggested Reading articles found!