风电功率波动性的分析.docx
《风电功率波动性的分析.docx》由会员分享,可在线阅读,更多相关《风电功率波动性的分析.docx(52页珍藏版)》请在冰豆网上搜索。
风电功率波动性的分析
2014高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
B
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
东北电力大学
参赛队员(打印并签名):
1.张盛梅
2.齐天利
3.孔晖
指导教师或指导教师组负责人(打印并签名):
张杰
日期2014年8月20日
赛区评阅编号(由赛区组委会评阅前进行编号):
2014高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
风电功率波动性的分析
摘要
风电机组的发电功率主要与风速有关,由于风的不确定性、间歇性以及风电场内各机组间尾流的影响,使得风力发电机不能像常规发电机组那样根据对电能的需求来确定发电。
研究风电功率的波动特性,不论对改善风电预测精度还是克服风电接入对电网的不利影响都有重要意义。
对于问题1a,我们利用MATLAB软件做出了3日内的功率波动图,发现功率的波动曲线上下不断震荡,所以我们采用一段数据来进行分析(即从波谷到波峰再到波谷),利用MATLAB软件拟合工具箱中的dfittool对数据进行曲线拟合,并选出几种较为符合的概率分布,根据对数似然函数值的大小确定最佳的概率分布。
对于问题1b,利用MATLAB软件编程,将数据每天筛选出一个数据,利用SPSS软件对数据绘制P-P图,并与选出的最好的概率分布图作比较,求出其分布参数。
对于问题2,将数据每隔12个数据筛选出一个数据,并用问题1a的方法绘制曲线拟合和概率分布的比较,选出最好的概率分布,并计算每种分布下的数值特征。
对于问题3,首先利用MATLAB软件绘制出时间窗宽分别为5s和1min时的功率波动图,发现两者的概率的波动情况基本相同,分别计算两种情况下的信息波动率以及信息波动损失率,得出结论为两者的波动基本相同,但是时间窗宽为5s时会有局部信息损失。
对于问题4,我们筛选出时间窗宽为1min、5min、15min的数据,并利用MATLAB软件进行曲线拟合以及概率分布的拟合,并计算出每种概率分布下的特征值,用相同的方法求1min和5min时的信息波动率,计算得出信息波动损失率为0.27%。
对于问题5,采用灰色预测模型对数据进行预测。
利用5min和15min的功率预测之后的功率走向,并分析方法的优缺点。
论文的创新之处有:
模型中利用MATLAB软件编程的方法进行数据的筛选,可以筛选出任意时间窗宽的数据。
关键词:
风电机组;概率分布;功率预测;SPSS
1.问题的重述
风电机组发出的功率主要与风速有关。
由于风的不确定性、间歇性以及风电场内各机组间尾流的影响,使得风电机的功率并不稳定。
风电功率的随机波动被认为是对电网带来不利影响的主要因素,研究风电功率的波动特性,不论对改善风电预测精度还是克服风电接入对电网的不利影响都有重要意义。
附件给出了某风电场中20台1.5MW风电机组30天的风电功率数据(单位为kW,间隔为5s),请做如下分析。
1.任选5个风电机组:
a)在30天的范围内,分析机组i的风电功率Pi5s(tk)波动符合哪几种概率分布?
分别计算数值特征并进行检验,推荐最好的分布并说明理由。
比较5个机组分布的异同。
b)用以上确定的最好的概率分布,以每日为时间窗宽,对5个风电功率分别计算30个时段的概率分布参数并做出检验;试比较不同机组(空间)、不同时段(时间)风电功率波动的概率分布以及与30天总体分布之间的关系,由此说明了什么?
2.在风电场实际运行中,由于数据存储和管理等方面的限制,难以集中记录全部风电机组功率的秒级数据。
通常用分钟级间隔乃至更长间隔的数据来描述风电功率波动。
试从上述5台机的风电功率数据中提取出间隔为1分钟的数据序列Pim(tk)。
对于这5个序列,再做题1a)的分析。
3.试分析用Pim(tk)代替Pi5s(tk)时,损失了那些风电功率波动信息?
如何度量?
有何影响?
从上述全部计算中你能得出什么一般性的结论?
4.设全场20台风电机的总功率PΣ(t)=ΣPi(t),试计算时间间隔为1分钟、5分钟和15分钟的总功率序列PΣm(tk),PΣ5m(tk),PΣ15m(tk),分析其波动的概率分布数值特征。
若以PΣ5m(tk)代替PΣm(tk)来表征全场风电功率波动,损失了什么信息?
如何度量?
有何影响?
5.如果分别采用PΣ5m(tk)和PΣ15m(tk)作为样本来预测未来4小时(每15分钟一个点)风电场的总功率,请设计合适的预测模式(可取适当时段的数据作为历史数据建模,后续数据作为实际风电功率用于检验预测误差),分别给出不少于7天的滚动预测结果,分析比较2种方式的预测误差。
2.问题的分析
对于问题1a,我们利用EXCEL软件筛选出数据丢失最少的五组数据进行研究,从附件中的数据我们可以看出是很多次风的波动引起的数据的变化,我们采用一次风的波动(即从风速的波谷到波峰再到波谷)来研究风电机i功率的分布规律。
利用MATLAB软件拟合工具箱中dfittool对数据进行曲线拟合,并分析确定最符合的概率分布。
对于问题1b,我们将采样时间间隔改为1分钟,利用MATLAB编程进行数据的筛选,将筛选出来的数据用上一问中选出最好的概率分布在SPSS上绘制P-P图,并研究每日的概率分布规律以及总体之间的关系。
对于问题2,利用MATLAB软件每隔12个数据筛选出一个数据,然后用和问题1a同样的方法绘制概率分布图的拟合以及特征值的计算。
对于问题3,首先绘制出时间窗宽为5s和1min时的功率波动图,根据图像的变化直观判断,然后定义信息波动率来计算两种情况下的变化值,进而比较不同时间窗宽对信息波动率的影响。
对于问题4,我们选取20台机组的相同时间段进行数据的筛选,将筛选出来的数据进行曲线拟合和概率分布的拟合,并计算各种分布下的特征值,以及用同样的方法计算信息波动损失率。
对于问题5,我们采用灰色模型进行功率的预测,利用5min和15min的功率预测之后的功率走向,并分析方法的优缺点。
3.模型的假设与符号说明
3.1模型的假设
(1)假设模型所采取的数据均准确,附件中所给定的数据也均为准确数据;
(2)假设采样间隔改变时不影响数据的准确性;
(3)假设附件中丢失的数据对统计结果及概率分布没有影响。
3.2符号说明
符号
含义
采样间隔为5秒时风电机组i的功率
采样间隔为1分钟时风电机组i的功率
采样间隔为1分钟时全场的风电功率
采样间隔为5分钟时全场的风电功率
采样间隔为15分钟时全场的风电功率
信息波动率
4.模型的建立与求解
4.1问题1的模型建立与求解
4.1.1问题1a的模型建立与求解
对于风电机的选取,我们利用EXCEL软件筛选出数据丢失最少的五组数据,分别为7、9、11、13、14组风电机组。
对于数据的选取,首先利用MATLAB软件对机组7功率数据中1-3天的数据进行曲线拟合,得到结果见图1。
图1机组7风电功率1~3日曲线拟合图
由图1可以看出,风电机组的功率随着风速的变化而变化,其功率是随时间在不断波动的。
因此我们选取风速波动的中的一次完整波动进行研究,即选取附件数据中由波谷到波峰再到波谷的一段数据。
对选定的数据进行曲线拟合,利用MATLAB概率密度拟合工具箱dfittool得出五台风电机组的功率概率直方图及正态分布、t分布、log-logistic分布、Weibull分布的概率分布图分别见图2-图6。
图2机组7的概率分布图
机组7的这四种概率分布是数据较为接近的分布,这四种概率分布的数值特征可以通过MATLAB计算得出,结果见表1。
表1机组7概率分布的数值特征
t分布
正态分布
Weibull分布
Log-Logistic分布
均值
3280.12
3530.58
3541.15
3539.81
方差
2633210
2188350
2431810
3202530
对数似然函数值
-23365300
-23403700
-2326500
-23111600
从表1中数据我们可以看出,四种概率分布的数值特征差别不大,正态分布的方差最小,Log-Logistic分布的对数似然函数值最大,从图像上来看,也可以看出Log-Logistic分布的拟合效果最好,所以,我们推荐机组7的概率分布为Log-Logistic分布。
图3机组9的概率分布图
机组9的概率分布比较符合t分布、正太分布、gamma分布以及weibull分布,这四种分布的数值特征通过MATLAB软件可以计算,计算结果见表2。
表2机组9的概率分布数值特征表
t分布
正态分布
Gamma分布
Weibull分布
均值
3319.99
3468.74
3468.74
3477.16
方差
2248630
2188350
2074890
2227050
对数似然函数值
-23053200
-23068500
-22839200
-22954400
从表2可以看出,Gamma分布的方差最小,Gamma分布的对数似然函数值也是最大的,从概率分布图中也可以看出,Gamma分布的曲线最贴近数据的拟合曲线,所以,机组9我们推荐Gamma分布。
图4机组11的概率分布图
机组11的最符合的概率分布为正态分布、weibull分布、logistic分布、Birnbaum-Saunders分布,利用MATLAB软件计算其数值特征,计算结果见表3。
表3机组11的概率分布的数值特征表
正态分布
weibull分布
Logistic分布
Birnbaum-Saunders分布
均值
3807.58
3827.16
3557.13
3808.4
方差
3207950
3159760
3125600
3342180
对数似然函数值
-18883000
-23068500
-18551500
-18894500
从表3的计算结果可以看出,Logistic分布的方差最小,且对数似然函数值最大,从概率分布图也可以看出,Logistic分布的概率曲线最符合数据的拟合曲线,所以对于机组11我们推荐Logistic分布。
图5机组13的概率分布图
机组13较符合的概率分布分别为t分布、正态分布、weibull分布、logistic分布,通过MATLAB计算结果见表4。
表4机组13概率分布的数值特征表
t分布
正态分布
weibull分布
Logistic分布
均值
3233.77
3491.98
3497.22
3325.61
方差
2418190
2007170
2096330
1917460
对数似然函数值
-24581100
-24662200
-24560600
-24596200
从表4的计算结果显示出,Logistic分布的方差最小,weibull分布的对数似然函数值最小,结合图5的概率分布图,对于机组13我们推荐weibull分布。
图6机组14的概率分布图
机组14比较符合的概率分布有t分布、正态分布、weibull分布、logistic分布,利用MATLAB计算出结果见表5。
表5机组14概率分布的数值特征
t分布
正态分布
weibull分布
Logistic分布
均值
3241.29
3241.24
3235.15
3234.09
方差
2440630
2440850
2445430
2853350
对数似然函数值
-31117700
-31117700
-31060700
-31239700
从表5的计算结果显示出,weibull分布的对数似然函数值最大,结合图6的概率分布图,对于机组14,我们推荐weibull分布。
通过上述分析,我们得到了五个机组的最适合的概率分布见表6。
表6五个机组最符合的概率分布
机组7
机组9
机组11
机组13
机组14
推荐分布
Log-Logistic分布
Gamma分布
Logisitic分布
Weibull分布
Weibull分布
4.1.2问题1b的模型建立与求解
若以每日为时间窗宽,我们需要对数据进行筛选,筛选的原则为取每日数据的平均值作为该天的风电功率数据。
对于机组7、9、11、13、14每天筛选出一个数据,五个风电机组30天的数据见表7。
表7五个风电机组30天数据表
序号
机组7
机组9
机组11
机组13
机组14
序号
机组7
机组9
机组11
机组13
机组14
1
144
130
130
142
146
16
293
333
333
386
381
2
77
64
64
69
68
17
953
1055
1055
1122
1063
3
20
19
19
21
13
18
251
268
268
273
267
4
2
1
1
2
2
19
128
130
130
140
144
5
40
45
45
47
36
20
579
603
603
699
647
6
229
282
282
303
290
21
222
227
227
229
234
7
387
418
418
439
412
22
508
514
514
534
443
8
351
422
422
426
383
23
1133
1237
1237
1335
1209
9
368
267
267
257
227
24
699
750
750
892
838
10
133
140
140
140
120
25
512
658
658
701
606
11
196
188
188
152
125
26
167
211
211
232
198
12
34
40
40
40
30
27
413
444
444
551
539
13
227
238
238
246
191
28
199
181
181
197
210
14
610
691
691
613
519
29
698
707
707
450
451
15
311
321
321
312
320
30
302
311
311
299
295
对于机组7,我们选出的最好的分布为weibull分布,用SPSS软件对30天的数据绘制P-P图,并与weibull分布图作比较,绘制图见图7。
图7机组7的weibullP-P图
机组7的分布参数计算结果见表8。
表8机组7P-P图的分布参数
估计的分布参数
七号机组
Weibull分布
标度
400.936
形状
.879
上表中的形状参数是指密度函数曲线的形状,当m=1时,Weibull分布就是指数分布;当01时,图像有一个峰,随着m>1的增大,峰值越高,图像越窄;标度参数是指随着该参数的减小图像变扁。
后面四个机组的分布参数具有相同的含义。
用同样的方法绘制并其他四个风电机组的P-P图,分别见图8-图11。
图8机组9的GammaP-P图
机组9的分布参数结果见表9。
表9机组9分布参数表
估计的分布参数
九号机组
Gamma分布
形状
1.442
标度
.004
图9机组11的logisticP-P图
机组11的分布参数见表10。
表10机组11的分布参数表
估计的分布参数
十一号机组
Logistic分布
位置
363.17
标度
166.743
图10机组13的weibullP-P图
机组13的分布参数见表11。
表11机组13的分布参数表
估计的分布参数
十三号机组
Weibull分布
标度
421.697
形状
.898
图11机组14的weibullP-P图
机组14的分布参数见表12。
表12机组14的分布参数表
估计的分布参数
十四号机组
Weibull分布
标度
389.006
形状
.878
4.2问题2的模型建立与求解
从上述所选择的五台风电机组发电功率数据中,在30天范围内,选取30天内所有的采样间隔为1分钟的数据进行以下建模的使用,利用MATLAB软件编程对数据进行筛选,每隔12个数据选取一个数据,源程序见附录1。
用同1a的方法对筛选后的数据进行处理,利用MATLAB软件对数据进行曲线拟合并做概率分布图的比较,机组7、机组9、机组11、机组13、机组14的概率分布图分别见图12-16。
图12机组7每分钟概率分布图
机组7每分钟功率概率分布的数值特征见表13。
正态分布
t分布
Weibull分布
Logistic分布
均值
294
273
295
279
方差
16623
18290
16863
16364
对数似然函数值
-1395260
-1391990
-1383710
-1392080
表13机组7的概率分布的数值特征表
图13机组9每分钟概率分布图
机组9每分钟功率的概率分布的数值特征见表14。
表14机组9每分钟概率分布的数值特征
正态分布
t分布
Weibull分布
Logistic分布
均值
289
277
290
276
方差
15158
15581
15432
15325
对数似然函数值
-1373740
-1372460
-1364300
-1372150
图14机组11每分钟概率分布图
机组11每分钟功率的概率分布的数值特征见表15。
表15机组11每分钟概率分布的数值特征
正态分布
Weibull分布
Logistic分布
Birnbaum-Saunders分布
均值
203
204
181
202
方差
22898
21641
24117
30054
对数似然函数值
-1135940
-1099040
-1137400
-1093320
图15机组13每分钟概率分布图
机组13每分钟概率分布的数值特征见表16。
表16机组13每分钟概率分布的数值特征
正态分布
t分布
Weibull分布
Logistic分布
均值
290
269
290
276
方差
13596
16291
14246
12953
对数似然函数值
1456130
-1448780
-1448090
-1450400
图16机组14每分钟概率分布图
机组14每分钟概率分布的数值特征见表17。
表17机组14每分钟概率分布的数值特征
正态分布
Gamma分布
Weibull分布
Logistic分布
均值
260
260
259
260
方差
16945
23828
17395
19809
对数似然函数值
-1858250
-1870820
-1855130
-1868410
通过上面的计算,得到五个机组每分钟功率最符合的概率分布见表18。
表18五个机组每分钟功率最符合的概率分布表
机组7
机组9
机组11
机组13
机组14
推荐
分布
Weibull
分布
Weibull
分布
Birnbaum-Saunders
分布
Weibull
分布
Weibull
分布
从以上的统计结果可以看出,功率分布的空间差异性体现在不同机组符合不同的概率分布,见表18。
每天的波动规律和30天总体之间的关系通过MATLAB软件绘制功率波动图,见图17。
从图17可以看出每日的功率波动图与30天总体的功率波动图之间的波动规律大体相同,不同总体的峰值要大于每日功率的峰值。
图17每日功率波动于30天总体功率波动对比图
4.3问题3的模型建立与求解
4.3.1时间间隔从5s变为1min功率波动的对比
以机组7为例,利用MATLAB软件分别绘制时间间隔为5s和1min的功率波动图分别见图18和图19。
图185s功率波动图
图191min功率波动图
从图中可以看出,两者的波动规律基本相同,不过在数值上稍有差异,即时间间隔为1min的功率波动图相比于间隔5s的会有信息的局部损失。
4.3.2度量损失的波动信息
通过比较分析不同时间窗宽下风机功率波动的变化情况,来度量波动信息的损失。
方差和标准差都是刻画随机变量随着期望的变化的,方差和标准差距离期望远则波动性大,反之则小。
我们定义一种波动信息率:
(1)
波动信息率越小,说明波动越弱,反之,则波动越大。
利用MATLAB软件计算五个风电机组的波动信息率见表19。
表19时间窗宽为5s时的五组波动信息率
机组7
机组9
机组11
机组13
机组14
5s波动信息率
8.24%
12.07%
18.83%
0.29%
56.88%
1min波动信息率
8.47%
12.24%
18.2