%A 李远宁,刘森,张诗军,陈丰,王志英 %T 分布式数据质量管理系统在电力企业的实践和应用 %0 Journal Article %D 2016 %J 电信科学 %R 10.11959/j.issn.1000-0801.2016104 %P 169-174 %V 32 %N 4 %U {https://www.infocomm-journal.com/dxkx/CN/abstract/article_157242.shtml} %8 2016-04-20 %X

随着企业信息化水平和企业精细化管理要求的不断提高,企业对数据管理的需求也随之增强,如何提高企业数据质量更是需要重点解决的问题。针对电力企业数据质量管理面临的挑战,创新提出了分布式数据质量管理解决方案。针对集中式数据质量系统的性能瓶颈,在研究数据质量系统特点并借鉴国内外对大数据的解决方案后,提出了基于Hadoop分布式处理框架的解决方案。利用Hadoop集群,可以把缺陷数据从Oracle中抽离,分散存储在集群里多台服务器上,以有效提高磁盘I/O性能和数据分析性能。