大数据 ›› 2020, Vol. 6 ›› Issue (4): 18-29.doi: 10.11959/j.issn.2096-0271.2020030

• 专题:大数据异构并行系统 • 上一篇    下一篇

大规模异构数据并行处理系统的设计、实现与实践

夏正勋,罗圣美,孙元浩,唐剑飞,张燕   

  1. 星环信息科技(上海)有限公司,上海 200233
  • 出版日期:2020-07-15 发布日期:2020-07-18
  • 作者简介:夏正勋(1979- ),男,星环信息科技(上海)有限公司高级研究员,主要研究方向为大数据、数据库、人工智能、流媒体处理技术等|罗圣美(1971- ),男,博士,星环信息科技(上海)有限公司大数据研究院院长,主要研究方向为大数据、并行计算、云存储、人工智能等|孙元浩(1976- ),男,星环信息科技(上海)有限公司创始人,从2009年开始研究大数据技术,2013年创立公司,并开始新一代大数据技术的自主研发|唐剑飞(1986- ),男,星环信息科技(上海)有限公司大数据技术标准研究员,主要研究方向为大数据、数据库、图计算等|张燕(1985- ),女,星环信息科技(上海)有限公司大数据技术研究员,主要研究方向为大数据、人工智能等

Design,implementation and practice of parallel processing system for a large-scale heterogeneous data

Zhengxun XIA,Shengmei LUO,Yuanhao SUN,Jianfei TANG,Yan ZHANG   

  1. Transwarp Information Technology (Shanghai) Co.,Ltd.,Shanghai 200233,China
  • Online:2020-07-15 Published:2020-07-18

摘要:

随着互联网和物联网应用的快速发展,数据处理模式从结构化逐渐扩展到结构化、半结构化和非结构化混合的异构数据处理模式。设计了一种大规模异构数据并行处理系统,在统一的平台功能视图基础上,采用统一的资源管理框架,实现对结构化、JSON/XML、图数据、文档数据等多种异构数据进行存储和查询,采用统一的开发语言,实现跨数据类型和数据存储引擎的并行计算,满足多业务应用开发的需要,并通过实际的商业部署,验证了系统的可行性。

关键词: 并行系统, 异构数据, 统一架构

Abstract:

With the rapid development of Internet and IoT applications,data processing has gradually expanded from structured to structured,semi-structured and unstructured hybrid heterogeneous data processing mode.A large-scale heterogeneous data parallel processing system was designed.Based on the functional view of a unified platform,the unified resource management framework was adopted to store and query a variety of heterogeneous data,including structured,JSON/XML,graph data,document data,etc.Adopting a unified database language,the parallel computing across data types and database engines was realized,and the needs of multi business application development were met.The feasibility of the system is verified by standard evaluation environment and commercial deployment.

Key words: parallel system, heterogeneous data, unified architecture

中图分类号: 

No Suggested Reading articles found!