阐述了ISO 8000数据质量标准产生的背景,将ISO 8000与已有的产品质量标准ISO 9000进行对比,分析了实施ISO 8000可以为企业带来的优势,并举例介绍了ISO 8000的应用方式。分析了我国数据质量现状,并对我国在金融和医疗领域实施ISO 8000 数据质量标准提出了实施建议。旨在帮助我国在大数据、数据质量等前沿研究和工业领域找到国际化标准契合点,推进大数据和数据质量建设。
金融大数据标准规范体系涉及的内容广泛而多元化。通过对国内外金融大数据标准规范体系进行调研和比较分析,发现国内金融大数据标准规范一部分是引标修订而来,而另一部分则具有中国金融市场的特征。在此基础上,提出了完善中国金融大数据标准的一系列建议,为实现对金融大数据进行相应标准化操作提供了一定参考。
信用评分是市场交易的基础,以大数据分析与挖掘为支撑的现代信用评分系统在当今全球经济发展中起着不可估量的作用。各行业与领域的信用评分系统将成为实现我国“十三五”规划中国家大数据战略的首要目标。主要介绍了金融信用评分系统的发展、相关技术、应用案例,并对大数据信用评分的发展进行了展望。
大数据征信能够满足缺乏或没有信贷记录人群的金融需求,是传统征信的有益补充。发展好大数据征信对于实现普惠金融,促进我国社会信用体系建设有着重要的意义。阐述了美国和我国大数据征信的发展现状,总结了大数据征信的特点,探讨了我国大数据征信存在的不足以及面临的挑战。最后提出相应的对策及建议。
利用中国人民银行企业征信系统的数据,基于信贷视角回顾了近10年我国产业结构调整路径,并分析了产业结构调整和信贷供给之间的关联性;然后用信贷发生额建立产业变动指数,对各经济区域产业间信贷资源的调整情况进行了实证分析。研究发现,信贷结构调整与产业结构调整之间存在同步性,但在调整的过程中,部分产业和部分区域缺乏足够的信贷支持力度。研究还表明利用征信数据可以为实现我国产业结构调整和信贷资源分配提供决策支持。
相较于个人信用风险评估,银行关于企业信用风险评估的资料具有更多的文本信息且标准化程度更高,然而文本信息中蕴含的大量关于企业信用风险的增量信息却没有得到有效利用。通过对我国上市公司年报以及网民评论的文本进行分析,探索了文本大数据对企业信用风险评估的作用。研究发现,年报管理层讨论与分析的风险提示内容、独立董事意见中关于关联交易的非正式感情表达以及网民关于公司风险的评论对于企业信用风险评估都具有明显的增量信息。
智慧城市建设的重心已由传统IT系统和信息资源共享建设,转变为数据的深度挖掘利用和数据资产的运营流通。大数据中心是数据资产管理和利用的实体基础,其核心驱动引擎是大数据平台及各类数据挖掘与分析系统。讨论了智慧城市大数据中心建设的功能架构,围绕城市多源异构数据处理的实际需要,对数据中心大数据平台的架构进行了拆分讲解,并以视频大数据处理为例,阐述了数据中心中大数据平台的运转流程。
手机基站定位数据蕴含丰富的时空信息。设计了一种基于电信每次呼叫测量数据的可视分析方法,给出了基于每次呼叫测量数据的基站定位方法,提取手机用户的出行轨迹,对凝聚层次聚类算法进行改进,可以高效率地对轨迹进行聚类,利用流向图和热力图表示轨迹聚类结果和手机用户在某时刻的整体分布。将该方法应用于上海电信手机基站定位数据,取得了良好的效果。
大数据能力开放平台依托中国联通大数据生产平台优势,构建总部数据域大数据对外合作平台,打造一个内外合作、共存、共赢可持续发展的绿色生态系统。开放平台从能力接入、资源隔离、运营、安全、数据服务等方面以租户的形式全方位多角度地给省公司及合作伙伴提供平台服务,满足内外部的存储计算能力、数据服务、平台工具能力需求,通过开放平台释放中国联通总部积累的大数据红利。
交通流数据具有数据海量、存储和交互速率快等特征,因此其数据的采集、存储及检索成为了车辆远程监控平台中的关键问题。采用LVS集群技术进行数据采集负载均衡,队列缓存处理I/O时延,HBase进行分布式数据存储;针对Hadoop实时在线数据处理不足的问题,整合ElasticSearch并构建了分层索引。通过关键技术的设计和实现,车辆监控由400辆扩展到上万辆,PB级数据在线查询速度提升了10~20倍,验证了方案的高效性。
从设立数据保护条款必要性等方面论证提出,《中华人民共和国民法总则(草案二次审议稿)》第124条相对其他规定,更为合理。一方面,从体系科学的角度来看,符合知识产权特征的数据已被纳入知识产权体系,并无必要将其创设为新的知识产权客体;另一方面,随着大数据产业发展,保护数据极具产业基础与时代意义,但在制度设计上,应着重考察大数据产业基础、《中华人民共和国民法总则》条文设计与既有法律体系协调以及法律实施效果等多重因素。