Wind power is an important indicator of the generating performance of wind turbines,which is of great significance to the operation and management of wind farms.The wind-speed and power data were collected through the monitoring and control (SCADA) system installed in the wind farm.There are a lot of noises in the original data,which brings great challenges to the subsequent application research.Based on the spatial distribution characteristics of wind-speed and power data,wind-speed and power data was divided into three categories,the data preprocessing method bin algorithm was improved,and the method and process of abnormal data identification and cleaning based on district bin(dbin) algorithm were proposed.The experimental results show that the dbin algorithm proposed in this paper is more efficient than the traditional algorithm in identifying abnormal data,and has strong universality.
Keywords:wind turbines
;
wind-speed and power
;
dbin
;
supervisory control and data acquisition
WANG Xin. Wind speed-power data cleaning of wind turbine based on improved bin algorithm. Chinese Journal of Intelligent Science and Technology[J], 2020, 2(1): 62-71 doi:10.11959/j.issn.2096-6652.202007
1 引言
随着社会经济的不断发展,传统能源的短缺问题已成为制约当今社会经济发展的首要问题。风能作为可再生的清洁能源,储量巨大、分布广泛,且开发利用成本较低,是可再生能源中最具开发前景的一种能源[1]。风能作为一种成熟的技术,在过去的几十年中得到了快速的发展。但是在风力发电过程中,风具有高度随机性和波动性,风速-功率也会变化,这对电力系统有一定的影响。通过风力发电机组输出功率和风速得到的风速-功率曲线可以对风电机组的发电性能做出有效的评估,同时,风速-功率曲线也是预测风电场风速-功率的重要指标[2]。通常,风电机组运行的风速-功率数据是通过安装在风电场的监视控制与数据采集(supervisory control and data acquisition,SCADA)系统采集得到的,但是,SCADA系统采集到的运行数据中存在大量的异常数据。产生异常数据的原因主要有3种。一是风机多位于风能资源丰富的区域,其运行环境较为恶劣[3],例如戈壁、荒野、高山等都会对风机造成一定的影响,导致传感器易产生故障,风电机组因检修故障计划停机也可能造成测量数据偏离正常值。二是由于SCADA系统的控制终端与风电场距离较远,数据传输过程中会产生噪声及外界电磁干扰,使运行数据产生异常。三是弃风限电[4]现象,弃风限电是当地电网接纳能力不足和风电不稳定等导致的部分风机暂停的现象。弃风限电会导致风电机组的输出功率长期维持在一个较低的水平,即使风速超过额定风速,输出功率也会低于额定功率,这就会造成原始数据中存在大量的异常数据,这些异常数据会直接影响预测模型的建模精度。因此,为了提高运行数据的数据质量,有必要对SCADA系统采集到的运行数据进行数据清洗[5],以提高运行数据的质量。
bin 算法[17]用于对监测数据进行平滑处理,其基本原理是:在切入风速(Vmin)与切出风速(Vmax)之间划出若干个风速区间,将所有数据点按照其风速大小归入各个风速区间,然后对各区间内的数据点进行统计分析,得出各个监测参数的统计值,最终以这些风速区间内监测参数的统计值代替原始数据进行后续的数据分析工作。1 号风机数据拟合结果如图3所示。
表1记录了dbin算法、bin算法、SVR算法、BP算法对3个机组的数据删除率和清洗效率。bin算法能够去除异常数据,但风功率为额定功率时出现拟合不准的现象,会导致正常数据被删除,且其数据删除率达到了75.4%;BP算法和SVR算法对第二类异常数据的识别效果不佳,数据删除率分别为66.8%和56.7%,且SVR算法的处理时间较长;dbin算法对数据的清洗效果最好,能对所有类型的异常数据进行有效识别,且清洗后的数据更加符合标准风速-功率曲线的分布特征。此算法对各类异常数据的删除率均在40.9%左右,耗时约为3.4( s 这与异常数据的多少有关),清洗效率较高,具有较高的可行性。
风速-功率数据中通常包含大量异常数据,这些异常数据会直接影响预测模型的建模精度,因而对电力系统有一定的影响。本文依据标准风速-功率曲线,提出了基于dbin算法的数据清洗方案,并与传统的 bin 算法、BP 算法、SVR 算法进行了对比。实例表明,基于dbin算法的清洗流程能够有效识别异常数据,效率较高。
The authors have declared that no competing interests exist.
... 随着社会经济的不断发展,传统能源的短缺问题已成为制约当今社会经济发展的首要问题.风能作为可再生的清洁能源,储量巨大、分布广泛,且开发利用成本较低,是可再生能源中最具开发前景的一种能源[1].风能作为一种成熟的技术,在过去的几十年中得到了快速的发展.但是在风力发电过程中,风具有高度随机性和波动性,风速-功率也会变化,这对电力系统有一定的影响.通过风力发电机组输出功率和风速得到的风速-功率曲线可以对风电机组的发电性能做出有效的评估,同时,风速-功率曲线也是预测风电场风速-功率的重要指标[2].通常,风电机组运行的风速-功率数据是通过安装在风电场的监视控制与数据采集(supervisory control and data acquisition,SCADA)系统采集得到的,但是,SCADA系统采集到的运行数据中存在大量的异常数据.产生异常数据的原因主要有3种.一是风机多位于风能资源丰富的区域,其运行环境较为恶劣[3],例如戈壁、荒野、高山等都会对风机造成一定的影响,导致传感器易产生故障,风电机组因检修故障计划停机也可能造成测量数据偏离正常值.二是由于SCADA系统的控制终端与风电场距离较远,数据传输过程中会产生噪声及外界电磁干扰,使运行数据产生异常.三是弃风限电[4]现象,弃风限电是当地电网接纳能力不足和风电不稳定等导致的部分风机暂停的现象.弃风限电会导致风电机组的输出功率长期维持在一个较低的水平,即使风速超过额定风速,输出功率也会低于额定功率,这就会造成原始数据中存在大量的异常数据,这些异常数据会直接影响预测模型的建模精度.因此,为了提高运行数据的数据质量,有必要对SCADA系统采集到的运行数据进行数据清洗[5],以提高运行数据的质量. ...
基于大数据的风电场风能资源及其利用情况评估
1
2018
... 随着社会经济的不断发展,传统能源的短缺问题已成为制约当今社会经济发展的首要问题.风能作为可再生的清洁能源,储量巨大、分布广泛,且开发利用成本较低,是可再生能源中最具开发前景的一种能源[1].风能作为一种成熟的技术,在过去的几十年中得到了快速的发展.但是在风力发电过程中,风具有高度随机性和波动性,风速-功率也会变化,这对电力系统有一定的影响.通过风力发电机组输出功率和风速得到的风速-功率曲线可以对风电机组的发电性能做出有效的评估,同时,风速-功率曲线也是预测风电场风速-功率的重要指标[2].通常,风电机组运行的风速-功率数据是通过安装在风电场的监视控制与数据采集(supervisory control and data acquisition,SCADA)系统采集得到的,但是,SCADA系统采集到的运行数据中存在大量的异常数据.产生异常数据的原因主要有3种.一是风机多位于风能资源丰富的区域,其运行环境较为恶劣[3],例如戈壁、荒野、高山等都会对风机造成一定的影响,导致传感器易产生故障,风电机组因检修故障计划停机也可能造成测量数据偏离正常值.二是由于SCADA系统的控制终端与风电场距离较远,数据传输过程中会产生噪声及外界电磁干扰,使运行数据产生异常.三是弃风限电[4]现象,弃风限电是当地电网接纳能力不足和风电不稳定等导致的部分风机暂停的现象.弃风限电会导致风电机组的输出功率长期维持在一个较低的水平,即使风速超过额定风速,输出功率也会低于额定功率,这就会造成原始数据中存在大量的异常数据,这些异常数据会直接影响预测模型的建模精度.因此,为了提高运行数据的数据质量,有必要对SCADA系统采集到的运行数据进行数据清洗[5],以提高运行数据的质量. ...
基于风能可利用率的风电场运维水平评价方法
1
2019
... 随着社会经济的不断发展,传统能源的短缺问题已成为制约当今社会经济发展的首要问题.风能作为可再生的清洁能源,储量巨大、分布广泛,且开发利用成本较低,是可再生能源中最具开发前景的一种能源[1].风能作为一种成熟的技术,在过去的几十年中得到了快速的发展.但是在风力发电过程中,风具有高度随机性和波动性,风速-功率也会变化,这对电力系统有一定的影响.通过风力发电机组输出功率和风速得到的风速-功率曲线可以对风电机组的发电性能做出有效的评估,同时,风速-功率曲线也是预测风电场风速-功率的重要指标[2].通常,风电机组运行的风速-功率数据是通过安装在风电场的监视控制与数据采集(supervisory control and data acquisition,SCADA)系统采集得到的,但是,SCADA系统采集到的运行数据中存在大量的异常数据.产生异常数据的原因主要有3种.一是风机多位于风能资源丰富的区域,其运行环境较为恶劣[3],例如戈壁、荒野、高山等都会对风机造成一定的影响,导致传感器易产生故障,风电机组因检修故障计划停机也可能造成测量数据偏离正常值.二是由于SCADA系统的控制终端与风电场距离较远,数据传输过程中会产生噪声及外界电磁干扰,使运行数据产生异常.三是弃风限电[4]现象,弃风限电是当地电网接纳能力不足和风电不稳定等导致的部分风机暂停的现象.弃风限电会导致风电机组的输出功率长期维持在一个较低的水平,即使风速超过额定风速,输出功率也会低于额定功率,这就会造成原始数据中存在大量的异常数据,这些异常数据会直接影响预测模型的建模精度.因此,为了提高运行数据的数据质量,有必要对SCADA系统采集到的运行数据进行数据清洗[5],以提高运行数据的质量. ...
基于风能可利用率的风电场运维水平评价方法
1
2019
... 随着社会经济的不断发展,传统能源的短缺问题已成为制约当今社会经济发展的首要问题.风能作为可再生的清洁能源,储量巨大、分布广泛,且开发利用成本较低,是可再生能源中最具开发前景的一种能源[1].风能作为一种成熟的技术,在过去的几十年中得到了快速的发展.但是在风力发电过程中,风具有高度随机性和波动性,风速-功率也会变化,这对电力系统有一定的影响.通过风力发电机组输出功率和风速得到的风速-功率曲线可以对风电机组的发电性能做出有效的评估,同时,风速-功率曲线也是预测风电场风速-功率的重要指标[2].通常,风电机组运行的风速-功率数据是通过安装在风电场的监视控制与数据采集(supervisory control and data acquisition,SCADA)系统采集得到的,但是,SCADA系统采集到的运行数据中存在大量的异常数据.产生异常数据的原因主要有3种.一是风机多位于风能资源丰富的区域,其运行环境较为恶劣[3],例如戈壁、荒野、高山等都会对风机造成一定的影响,导致传感器易产生故障,风电机组因检修故障计划停机也可能造成测量数据偏离正常值.二是由于SCADA系统的控制终端与风电场距离较远,数据传输过程中会产生噪声及外界电磁干扰,使运行数据产生异常.三是弃风限电[4]现象,弃风限电是当地电网接纳能力不足和风电不稳定等导致的部分风机暂停的现象.弃风限电会导致风电机组的输出功率长期维持在一个较低的水平,即使风速超过额定风速,输出功率也会低于额定功率,这就会造成原始数据中存在大量的异常数据,这些异常数据会直接影响预测模型的建模精度.因此,为了提高运行数据的数据质量,有必要对SCADA系统采集到的运行数据进行数据清洗[5],以提高运行数据的质量. ...
“三北”地区风电开发、输送及消纳研究
1
2012
... 随着社会经济的不断发展,传统能源的短缺问题已成为制约当今社会经济发展的首要问题.风能作为可再生的清洁能源,储量巨大、分布广泛,且开发利用成本较低,是可再生能源中最具开发前景的一种能源[1].风能作为一种成熟的技术,在过去的几十年中得到了快速的发展.但是在风力发电过程中,风具有高度随机性和波动性,风速-功率也会变化,这对电力系统有一定的影响.通过风力发电机组输出功率和风速得到的风速-功率曲线可以对风电机组的发电性能做出有效的评估,同时,风速-功率曲线也是预测风电场风速-功率的重要指标[2].通常,风电机组运行的风速-功率数据是通过安装在风电场的监视控制与数据采集(supervisory control and data acquisition,SCADA)系统采集得到的,但是,SCADA系统采集到的运行数据中存在大量的异常数据.产生异常数据的原因主要有3种.一是风机多位于风能资源丰富的区域,其运行环境较为恶劣[3],例如戈壁、荒野、高山等都会对风机造成一定的影响,导致传感器易产生故障,风电机组因检修故障计划停机也可能造成测量数据偏离正常值.二是由于SCADA系统的控制终端与风电场距离较远,数据传输过程中会产生噪声及外界电磁干扰,使运行数据产生异常.三是弃风限电[4]现象,弃风限电是当地电网接纳能力不足和风电不稳定等导致的部分风机暂停的现象.弃风限电会导致风电机组的输出功率长期维持在一个较低的水平,即使风速超过额定风速,输出功率也会低于额定功率,这就会造成原始数据中存在大量的异常数据,这些异常数据会直接影响预测模型的建模精度.因此,为了提高运行数据的数据质量,有必要对SCADA系统采集到的运行数据进行数据清洗[5],以提高运行数据的质量. ...
“三北”地区风电开发、输送及消纳研究
1
2012
... 随着社会经济的不断发展,传统能源的短缺问题已成为制约当今社会经济发展的首要问题.风能作为可再生的清洁能源,储量巨大、分布广泛,且开发利用成本较低,是可再生能源中最具开发前景的一种能源[1].风能作为一种成熟的技术,在过去的几十年中得到了快速的发展.但是在风力发电过程中,风具有高度随机性和波动性,风速-功率也会变化,这对电力系统有一定的影响.通过风力发电机组输出功率和风速得到的风速-功率曲线可以对风电机组的发电性能做出有效的评估,同时,风速-功率曲线也是预测风电场风速-功率的重要指标[2].通常,风电机组运行的风速-功率数据是通过安装在风电场的监视控制与数据采集(supervisory control and data acquisition,SCADA)系统采集得到的,但是,SCADA系统采集到的运行数据中存在大量的异常数据.产生异常数据的原因主要有3种.一是风机多位于风能资源丰富的区域,其运行环境较为恶劣[3],例如戈壁、荒野、高山等都会对风机造成一定的影响,导致传感器易产生故障,风电机组因检修故障计划停机也可能造成测量数据偏离正常值.二是由于SCADA系统的控制终端与风电场距离较远,数据传输过程中会产生噪声及外界电磁干扰,使运行数据产生异常.三是弃风限电[4]现象,弃风限电是当地电网接纳能力不足和风电不稳定等导致的部分风机暂停的现象.弃风限电会导致风电机组的输出功率长期维持在一个较低的水平,即使风速超过额定风速,输出功率也会低于额定功率,这就会造成原始数据中存在大量的异常数据,这些异常数据会直接影响预测模型的建模精度.因此,为了提高运行数据的数据质量,有必要对SCADA系统采集到的运行数据进行数据清洗[5],以提高运行数据的质量. ...
基于源-荷互动的大规模风电消纳协调控制策略
1
2017
... 随着社会经济的不断发展,传统能源的短缺问题已成为制约当今社会经济发展的首要问题.风能作为可再生的清洁能源,储量巨大、分布广泛,且开发利用成本较低,是可再生能源中最具开发前景的一种能源[1].风能作为一种成熟的技术,在过去的几十年中得到了快速的发展.但是在风力发电过程中,风具有高度随机性和波动性,风速-功率也会变化,这对电力系统有一定的影响.通过风力发电机组输出功率和风速得到的风速-功率曲线可以对风电机组的发电性能做出有效的评估,同时,风速-功率曲线也是预测风电场风速-功率的重要指标[2].通常,风电机组运行的风速-功率数据是通过安装在风电场的监视控制与数据采集(supervisory control and data acquisition,SCADA)系统采集得到的,但是,SCADA系统采集到的运行数据中存在大量的异常数据.产生异常数据的原因主要有3种.一是风机多位于风能资源丰富的区域,其运行环境较为恶劣[3],例如戈壁、荒野、高山等都会对风机造成一定的影响,导致传感器易产生故障,风电机组因检修故障计划停机也可能造成测量数据偏离正常值.二是由于SCADA系统的控制终端与风电场距离较远,数据传输过程中会产生噪声及外界电磁干扰,使运行数据产生异常.三是弃风限电[4]现象,弃风限电是当地电网接纳能力不足和风电不稳定等导致的部分风机暂停的现象.弃风限电会导致风电机组的输出功率长期维持在一个较低的水平,即使风速超过额定风速,输出功率也会低于额定功率,这就会造成原始数据中存在大量的异常数据,这些异常数据会直接影响预测模型的建模精度.因此,为了提高运行数据的数据质量,有必要对SCADA系统采集到的运行数据进行数据清洗[5],以提高运行数据的质量. ...
基于源-荷互动的大规模风电消纳协调控制策略
1
2017
... 随着社会经济的不断发展,传统能源的短缺问题已成为制约当今社会经济发展的首要问题.风能作为可再生的清洁能源,储量巨大、分布广泛,且开发利用成本较低,是可再生能源中最具开发前景的一种能源[1].风能作为一种成熟的技术,在过去的几十年中得到了快速的发展.但是在风力发电过程中,风具有高度随机性和波动性,风速-功率也会变化,这对电力系统有一定的影响.通过风力发电机组输出功率和风速得到的风速-功率曲线可以对风电机组的发电性能做出有效的评估,同时,风速-功率曲线也是预测风电场风速-功率的重要指标[2].通常,风电机组运行的风速-功率数据是通过安装在风电场的监视控制与数据采集(supervisory control and data acquisition,SCADA)系统采集得到的,但是,SCADA系统采集到的运行数据中存在大量的异常数据.产生异常数据的原因主要有3种.一是风机多位于风能资源丰富的区域,其运行环境较为恶劣[3],例如戈壁、荒野、高山等都会对风机造成一定的影响,导致传感器易产生故障,风电机组因检修故障计划停机也可能造成测量数据偏离正常值.二是由于SCADA系统的控制终端与风电场距离较远,数据传输过程中会产生噪声及外界电磁干扰,使运行数据产生异常.三是弃风限电[4]现象,弃风限电是当地电网接纳能力不足和风电不稳定等导致的部分风机暂停的现象.弃风限电会导致风电机组的输出功率长期维持在一个较低的水平,即使风速超过额定风速,输出功率也会低于额定功率,这就会造成原始数据中存在大量的异常数据,这些异常数据会直接影响预测模型的建模精度.因此,为了提高运行数据的数据质量,有必要对SCADA系统采集到的运行数据进行数据清洗[5],以提高运行数据的质量. ...
基于 SCADA 数据驱动的风电机组部件故障预警
1
2018
... 随着社会经济的不断发展,传统能源的短缺问题已成为制约当今社会经济发展的首要问题.风能作为可再生的清洁能源,储量巨大、分布广泛,且开发利用成本较低,是可再生能源中最具开发前景的一种能源[1].风能作为一种成熟的技术,在过去的几十年中得到了快速的发展.但是在风力发电过程中,风具有高度随机性和波动性,风速-功率也会变化,这对电力系统有一定的影响.通过风力发电机组输出功率和风速得到的风速-功率曲线可以对风电机组的发电性能做出有效的评估,同时,风速-功率曲线也是预测风电场风速-功率的重要指标[2].通常,风电机组运行的风速-功率数据是通过安装在风电场的监视控制与数据采集(supervisory control and data acquisition,SCADA)系统采集得到的,但是,SCADA系统采集到的运行数据中存在大量的异常数据.产生异常数据的原因主要有3种.一是风机多位于风能资源丰富的区域,其运行环境较为恶劣[3],例如戈壁、荒野、高山等都会对风机造成一定的影响,导致传感器易产生故障,风电机组因检修故障计划停机也可能造成测量数据偏离正常值.二是由于SCADA系统的控制终端与风电场距离较远,数据传输过程中会产生噪声及外界电磁干扰,使运行数据产生异常.三是弃风限电[4]现象,弃风限电是当地电网接纳能力不足和风电不稳定等导致的部分风机暂停的现象.弃风限电会导致风电机组的输出功率长期维持在一个较低的水平,即使风速超过额定风速,输出功率也会低于额定功率,这就会造成原始数据中存在大量的异常数据,这些异常数据会直接影响预测模型的建模精度.因此,为了提高运行数据的数据质量,有必要对SCADA系统采集到的运行数据进行数据清洗[5],以提高运行数据的质量. ...
基于 SCADA 数据驱动的风电机组部件故障预警
1
2018
... 随着社会经济的不断发展,传统能源的短缺问题已成为制约当今社会经济发展的首要问题.风能作为可再生的清洁能源,储量巨大、分布广泛,且开发利用成本较低,是可再生能源中最具开发前景的一种能源[1].风能作为一种成熟的技术,在过去的几十年中得到了快速的发展.但是在风力发电过程中,风具有高度随机性和波动性,风速-功率也会变化,这对电力系统有一定的影响.通过风力发电机组输出功率和风速得到的风速-功率曲线可以对风电机组的发电性能做出有效的评估,同时,风速-功率曲线也是预测风电场风速-功率的重要指标[2].通常,风电机组运行的风速-功率数据是通过安装在风电场的监视控制与数据采集(supervisory control and data acquisition,SCADA)系统采集得到的,但是,SCADA系统采集到的运行数据中存在大量的异常数据.产生异常数据的原因主要有3种.一是风机多位于风能资源丰富的区域,其运行环境较为恶劣[3],例如戈壁、荒野、高山等都会对风机造成一定的影响,导致传感器易产生故障,风电机组因检修故障计划停机也可能造成测量数据偏离正常值.二是由于SCADA系统的控制终端与风电场距离较远,数据传输过程中会产生噪声及外界电磁干扰,使运行数据产生异常.三是弃风限电[4]现象,弃风限电是当地电网接纳能力不足和风电不稳定等导致的部分风机暂停的现象.弃风限电会导致风电机组的输出功率长期维持在一个较低的水平,即使风速超过额定风速,输出功率也会低于额定功率,这就会造成原始数据中存在大量的异常数据,这些异常数据会直接影响预测模型的建模精度.因此,为了提高运行数据的数据质量,有必要对SCADA系统采集到的运行数据进行数据清洗[5],以提高运行数据的质量. ...
Wind turbine condition monitoring by the approach of SCADA data analysis
1
2013
... bin 算法[17]用于对监测数据进行平滑处理,其基本原理是:在切入风速(Vmin)与切出风速(Vmax)之间划出若干个风速区间,将所有数据点按照其风速大小归入各个风速区间,然后对各区间内的数据点进行统计分析,得出各个监测参数的统计值,最终以这些风速区间内监测参数的统计值代替原始数据进行后续的数据分析工作.1 号风机数据拟合结果如图3所示. ...