电工杯A题国家二等奖电力系统短期负荷预测.doc

上传人:精*** 文档编号:16159227 上传时间:2023-07-11 格式:DOC 页数:34 大小:1.17MB
下载 相关 举报
电工杯A题国家二等奖电力系统短期负荷预测.doc_第1页
第1页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第2页
第2页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第3页
第3页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第4页
第4页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第5页
第5页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第6页
第6页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第7页
第7页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第8页
第8页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第9页
第9页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第10页
第10页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第11页
第11页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第12页
第12页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第13页
第13页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第14页
第14页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第15页
第15页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第16页
第16页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第17页
第17页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第18页
第18页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第19页
第19页 / 共34页
电工杯A题国家二等奖电力系统短期负荷预测.doc_第20页
第20页 / 共34页
亲,该文档总共34页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

电工杯A题国家二等奖电力系统短期负荷预测.doc

《电工杯A题国家二等奖电力系统短期负荷预测.doc》由会员分享,可在线阅读,更多相关《电工杯A题国家二等奖电力系统短期负荷预测.doc(34页珍藏版)》请在冰点文库上搜索。

电工杯A题国家二等奖电力系统短期负荷预测.doc

报名序号:

1254

论文题目:

电力系统短期负荷预测

姓名

班级

有效联系电话

参赛队员1

参赛队员2

参赛队员3

指导教师:

参赛学校:

证书邮寄地址、邮编、收件人:

报名序号:

阅卷专家1

阅卷专家2

阅卷专家3

论文等级

电力系统短期负荷预测

摘要

提高负荷预测进度是保障电力系统优化决策科学性的重要手段。

根据已有电力负荷数据及气象因素数据,文章主要建立了4个模型来解决关于短期负荷预测方面的问题。

针对问题一,建立日最高负荷量模型、日最低负荷量模型、日峰谷差模型、日平均负荷量模型以及日负荷率模型。

利用Excel软件可将两地区014年各个负荷量的统计值求出(详见附件1),其中地区二2014年1月1日的日最高负荷量、日最低负荷量、日峰谷差、日平均负荷量以及日负荷率分别为6765.5、3748.48、3017.05、5138.23和0.76。

通过观察两地2014年负荷数据变化曲线图,考虑数据的波动性等因素可得出地区二更准确的预测结果的结论。

针对问题二,构建多元线性回归模型,利用SPSS软件对日最高负荷、日最低负荷、日平均负荷与各气象因素进行回归分析。

通过观察标准化残差图(详见图4),认为没有趋势性,回归模型有效。

用同样的方法可得出两地区各个因变量的回归方程(详见表5)。

对多元线性方程做回归误差分析,认为将不重要的气象因素剔除可减小误差。

利用逐步回归法可进行更合理的回归分析,得出优先推荐平均温度来提高负荷预测精度。

针对问题三,构建ARIMA预测模型,对数据进行预处理,取每年春季的负荷量作为参照数据,消除了季节成分的影响。

通过自相关方面的分析,确定模型为ARIMA(1,1,1),利用SPSS软件可得出所需的预测结果。

例如地区一在时间点T0000的负荷量预测模型为。

模型拟合的可决系数都在0.8以上,说明预测结果精度比较高。

针对问题四,构建基于BP神经网络算法的多元非线性系统模型,确定模型为,利用Matlab编程可训练出相应的神经网络结构,得出预测结果。

通过参照数据、模型原理这两个方面,论证了计及气象因素影响的负荷预测结果的精度得到了改善这一结论。

针对问题五,提取两地区日负荷率作为待处理数据,分别对两地区日负荷率进行正态拟合、T分布拟合、Logistic拟合,做出拟合曲线并对各个拟合进行拟合曲线广义似然比检验。

得出地区二的数据比地区一的数据更有规律的结论。

关键词:

短期负荷预测;多元线性回归;ARIMA预测模型;BP神经网络;拟合

1.问题的重述

短期负荷预测是电力系统运行与分析的基础,对机组组合、经济调度、安全校核等具有重要意义。

提高负荷预测精度,是保障电力系统优化决策科学性的重要手段。

现代电力系统中,构成电力负荷的用电器种类繁多,空调等受气象条件影响的负荷占比持续增高,气象因素(温度、湿度、降雨量等)对电力系统负荷的影响愈显突出。

考虑气象因素成为调度中心进一步改进负荷预测精度的主要手段之一。

已知地区1、地区2从2009年1月1日至2015年1月10日的电力负荷数据(每15min一个采样点,每日96点,量纲为MW)以及2012年1月1日至2015年1月17日的气象因素数据(日最高温度、日最低温度、日平均温度、日相对湿度以及日降雨量)。

具体要求如下:

1.请分析两个地区2014年1月1日一2014年12月31日的负荷数据,统计各地区全年的日最高负荷、日最低负荷、日峰谷差、日负荷率指标的分布情况,并绘制两地区2014年全年的负荷持续曲线;结合上述结果,分析两地区负荷变化的主要差异;初步预判哪个地区的负荷可以获得更准确的预测结果,说明你的理由。

2.根据2012年1月1日至2014年12月31日的数据,分别对日最高负荷、日最低负荷、日平均负荷与各气象因素的关系进行回归分析,分析回归误差;如果要用气象因素来提高负荷预测精度,在诸气象因素中,你优先推荐哪个(或哪几个)?

简要说明理由。

3.请根据已知负荷数据,构建预测方法,对两个地区2015年1月11日至17日共7天的电力负荷进行预测(间隔15min),给出负荷预测结;在不知道实际负荷数据的条件下,你对预测结果的准确度有何推断,请说明理由。

4.如果已获得2015年1月11日至17日的气象因素数据,你能否构建计及气象因素的负荷预测方法,对两个地区2015年1月11日至17日共7天的电力负荷再次进行预测(间隔15min),给出预测结果;与原有的预测结果相比,你认为计及气象因素影响的负荷预测结果精度得到改善了吗?

有何证据?

请说明理由。

5.综合上述计算结果,你如何评价两地区负荷规律性的优劣?

你还有什么证据可以佐证两地区负荷整体规律性优劣的判断?

2.问题的分析

2.1对于问题一的分析

问题一要求分析两个地区二014年的负荷量数据的一些统计量,全年的日最高负荷、日最低负荷、日峰谷差、日负荷率指标的分布情况。

可以直接建立最大量最小量模型以及一些简单算数模型来解决,利用Excel软件可以很快求出答案。

题目还要求绘制出两地区二014年全年的负荷数据变化曲线,可以利用Matlab的绘图工具来绘制出想要的结果。

最后对所得统计量以及两地区二014年全年的负荷数据变化曲线进行分析,可以初步预判哪个地区的负荷可以获得更准确的预测结果。

2.2对于问题二的分析

问题二要求对日最高负荷、日最低负荷与各气象因素的关系进行回归分析,分析回归误差,还要求用推荐哪个(或哪几个)气象因素,来提高负荷预测精度。

可利用统计学知识分别对日最高负荷、日最低负荷与各气象因素的关系进行回归分析,并通过回归分析所得的一些统计学数据来进行回归误差分析以及选出推荐的气象因素。

2.3对于问题三的分析

该问题要求根据一致负荷数据,构建预测方法,对两个地区二015年1月11日至17日共7天的电力负荷进行预测。

此问题没有提及气象因素对负荷的影响,说明要求我们通过负荷数据本身进行预测,这是个时间序列预测问题,可建立ARIMA模型就可预测出指定7日的负荷量。

2.4对于问题四的分析

该问题要求构建计及气象因素的负荷预测方法,并给出预测结果。

气象因素对负荷影响是很大的,我们可以尝试构建人工建神经网络的模型,通过训练网络可以比较准确地找到各气象因素与负荷之间的关系,进而预测出指定7日的负荷量。

该问题还要求将通过气象因素预测出的结果与问题3的预测结果进行比较,可以从多个方面比较预测结果的精度。

2.5对于问题五的分析

该问题要求对两地区负荷规律性的优劣进行评价,既然是考虑规律性,我们可以将两地区的负荷数据进行正态拟合、Logistic拟合以及T分布拟合,比较两个地区负荷的拟合效果,就可以得出哪个地区的规律性更好。

3.模型的假设与符号说明

3.1模型的假设

(1)假设2009年1月1日至2015年1月10日的电力负荷数据均为真实有效数据;

(2)神经网络训练期间,“坏数据”带来的训练误差;不会使网络不能收敛到理想误差。

3.2符号说明

隐层节点数

权值输入端连接的神经节点数

第个地区第天第个时刻所测量的负荷数据

第个地区第天的日最高负荷量

第个地区第天的日最低负荷量

第个地区第天的日峰谷差

第个地区第天的日平均负荷,

第个地区第天的日负荷率

日最高负荷、日最低负荷、日平均负荷中的一种变量

ANN

非线性函数

最高温度

最低温度

平均温度

相对湿度

降雨量

4.模型的准备

4.1回归分析法基本原理

回归分析法是根据历史数据的变化规律和影响负荷变化的因素,寻找自变量与因变量之间的相关关系及回归方程式,确定模型参数,据此推断将来时刻的负荷值。

回归分析法的优点是计算原理和结构形式简单,预测速度快,外推性能好,对于历史上没有出现的情况有较好的预测。

4.2针对问题三对原始数据进行预处理

在解决问题三的过程中,利用ARIMA预测模型,首先运用SPSS软件将地区一的原始负荷数据导入,对时间点T0000构建如下的序列图。

图1数据处理前地区一T0000时间点序列图

图中有明显的季节成分,因此需要做季节分解。

题目要求预测两个地区二015年1月11日至17日共7天的电力负荷,都属于春季。

因此只需提取每年的前三个月的负荷数据作为输入的数据。

分解后,序列图如下。

图2数据处理后地区一T0000时间点序列图

从上图可知,排除了季节成分。

所做的预测将会更精准,同时计算的复杂程度将会降低。

4.3BP神经网络基本原理概述

4.3.1 BP神经网络基本原理

BP网络模型处理信息的基本原理是:

学习过程由信号的正向传播和误差的反向传播两个过程组成。

正向传播时,输入信号通过中间层作用于输出层,经过非线形变换,产生输出信号;若输出层的实际输出与期望输出不符,则转向误差的反向传播阶段。

误差的反向传播是将输出误差以某种形式通过中间层向输入层逐层反转,并将误差分摊给各层的所有单元,从而获得各层的误差信号作为修正各单元权值的依据。

此过程周而复始,直到输出的误差降到可以接受的程度。

此时经过训练的神经网络即能对类似样本的输入信息自行处理,进而输出误差最小的经过非线形转换的信息,然后可通过检验神经网络的有效性。

运用BP神经网络处理实际问题时分为两个步骤即网络训练和网络应用。

第一步网络训练采用有监督的学习,有监督的学习是指每一个训练样本都对应一个代表环境信息的教师信号作为期望输出,训练时计算实际输出与期望输出之间的误差,根据误差的大小和方向反复调整网络连接权值,直到误差达到预订的精度为止。

4.3.2 BP神经网络的结构

BP神经网络是一种多层前馈网络,其神经元连接权值的调整规则采用误差反传算法即BP算法。

BP神经网络又是一个多层感知器,多层次感知器强调神经网络在结构上由输入层、隐含层、输出层等多层构成,BP网络则强调层间连接权值通过误差反传算法进行调整。

BP神经网络的特点是:

网络由多层次构成,包括输入层、隐含层(单层或多层)和输出层;层与层之间全连接,同层神经元之间无连接;传递函数必须可微,常用的有Sifmoid型的对数、正切函数或线性函数;采用误差反传算法进行学习,逐层向前修正网络连接权值。

BP神经网络结构在设计时主要包括以下方面:

(1)网络层数

BP神经网络至少包括一个输入层和一个输出层,可以包含一个或多个隐含层,所以网络层数的决定问题即是隐含层层数的决定问题。

理论上己经证明,单个隐层可以通过适当增加神经元节点数达到任意的非线性映射,因此大多数情况单隐层结构的神经网络足以满足需求。

在样本较多的情况下,增加一个隐层可以有效减小网络规模。

(2)输入层节点数

输入层节点数取决于输入向量维数,具体可根据实际问题和数据类型确定。

如果输入数据为模型信号波形,则可根据波形的采样点数目决定输入向量维数;如果输入数据为时间序列数据,则输入节点为时间点数;如果输入为图像,则输入单元可以为图像像素或经处理的图像特征。

(3)隐含层节点数

隐含层节点数在很大程度上影响着BP神经网络的性能。

对此一个非常重要的定理表述为对任何一个在闭区间内的连续函数都可以用三层即单隐层BP神经网络逼近,因而单隐层BP网络可以完成任意的n维到m维的映射。

一般而言,隐含层较多节点可使网络达到更好的性能,但可能导致较长的收敛时间。

实践中,通常采用以下经验公式选

择最佳节点数:

第一种:

,其中为样本数,为隐层节点数。

如果,规定=0。

第二种:

,其中为输入节点数,为输出节点数。

是之间的常数。

第三种:

,为输入节点数。

(4)输出层节点数

输出层节点数需要根据实际问题的抽象模型进行确定。

例如在利用神经网络解决模式

分类问题中,如果共有个类别,则输出节点数为或,表述不小于的最小整数。

(5)传递函数

根据研究经验,一般情况下输入层和隐层的传递函数选用S型函数

或正切S型函数

输出层选用线性函数作为传递函数,用purelin表示。

(6)训练方法

BP神经网络采用迭代调整的方式进行权值确定,因此在训练之前需要确定初始值作为迭代调整的起点。

初始值的大小会影响网络的性能,通常情况将初始值定为较小的非零随机值,经验值为或之间,其中为权值输入端连接的神经节点数。

5.模型的建立与求解

5.1问题一的模型建立与求解

对于第一问,设为第个地区第天第个时刻所测量的负荷数据,可建立日最高负荷量的数学模型:

该模型中表示第个地区第天的日最高负荷量。

同样可建立最日低负荷量的数学模型:

该模型中表示第个地区第天的日最低负荷量。

对于日峰谷差,可建立如下模型:

该模型中表示第个地区第天的日峰谷差。

日负荷率为日平均负荷与日最大负荷的比值,可建立如下模型:

其中为第个地区第天的日平均负荷,表示第个地区第天的日负荷率。

依据上述模型可利用Excel软件求出部分下列结果如下(详见附件1):

表12014年地区二负荷量的统计量结果

日期

最高负荷

最低负荷

日峰谷差

日平均负荷

日负荷率

20140101

6765.53551

3748.481751

3017.053759

5138.225299

0.759470598

20140102

8464.700806

3278.47475

5186.226056

6232.420477

0.736283611

20140103

8642.119917

4141.438257

4500.68166

6703.741343

0.775705661

20140104

8350.459638

4269.594754

4080.864884

6550.929709

0.784499296

……

……

……

……

……

……

20141228

8480.166777

4356.945

4123.221777

6557.451155

0.773269126

20141229

9010.524753

4238.837121

4771.687632

6936.880418

0.769864199

20141230

8780.473733

4455.129564

4325.344169

6898.469963

0.785660338

20141231

8059.246529

4297.719613

3761.526916

6494.801036

0.805881916

利用Matlab软件,将数据导入后利用输入相应代码(详见附录1),可得出如下负荷持续曲线图:

图3两地2014年负荷持续曲线图

通过结合上述结果,分析两地区负荷变化的主要差异,初步预判地区二的负荷可获得更准确的预测结果。

原因是通过对附件1的统计量结果的分析,地区二的日峰谷差更小,通过图1也可以明显看出负荷持续波动更小,因此地区二可获得更准确的预测结果。

5.2问题二的模型建立与求解

5.2.1 多元线性回归模型的建立

变量和变量的关系:

其中分别代表最高温度、最低温度、平均温度、相对湿度以及降雨量,代表日最高负荷、日最低负荷、日平均负荷中的一种变量。

为均值为0的随机变量。

的函数为线性的,即整个线性模型为:

为了得到回归参数的估计值,就要对变量进行观测,对变量的次独立观测数据为:

,则这些观测数据应满足式,即有

其中,

若记,

则多元线性回归的数学模型式(4-6)可以写成矩阵形式

其中。

为了获得参的估计,我们采用最小二乘法,即选择,使

(4-8)

达到最小。

将对求导数并令其为零,得

即。

记,则

上述方程称为正规方程,其中为阶矩阵,一般假定,由线性代数理论可知,为满秩矩阵,它的秩,则正规方程有唯一解,记作

我们来证明上式中为参数向量的最小二乘法估计量,现用矩阵形式来叙述其证明步骤。

对任意的有则有

上述证明过程中应用了如下结果:

至此,在时,证明了正规方程中的是的最小二乘法估计量。

在实际工作中,常称为经验线性回归方程。

5.2.2 多元线性回归模型的求解

首先本文利用问题一中所给模型,求出2012年1月1日至2014年12月31日的日最高负荷、日最低负荷、日平均负荷,部分结果如下表(详见附件2):

表22012年到2014年地区一统计量结果

日期

最高负荷

最低负荷

日平均负荷

20120101

3967.259968

2674.310752

3193.704021

20120102

6203.327488

2102.91472

4518.020952

20120103

7362.322144

3413.132512

5688.646099

20120104

7654.747168

3972.14128

6055.78345

20120105

7772.622784

4126.712512

6158.695814

20120106

7635.090112

4130.5792

6103.478207

20120107

7478.730112

4114.814656

5928.308079

20120108

6682.430272

3930.446176

5384.340865

20120109

7316.607328

3658.456096

5716.865955

20120110

7267.226368

3895.22992

5743.61441

……

……

……

……

20141224

9041.502784

4830.504064

7095.792178

20141225

9055.009408

4861.555456

7122.141599

20141226

8960.655616

4805.517856

7073.389654

20141227

8899.329088

4826.893792

6912.876737

20141228

7501.186048

4616.671072

6078.493122

20141229

8738.955616

4224.25984

6707.0431

20141230

8479.017856

4578.106048

6627.303336

20141231

7797.769888

4313.017216

5880.430551

根据多元线性回归模型,利用SPSS软件,可对日最高负荷、日最低负荷、日平均负荷与各气象因素的关系进行回归分析。

将数据导入软件后,设置回归分析方法为进入法,分别将日最高负荷、日最低负荷、日平均负荷作为因变量,进行回归分析。

例如,对地区一日最高负荷与各气象因素的关系进行回归分析,可得以下分析结果:

表3地区一最高负荷与各气象因素回归分析的模型汇总

模型

R

R方

调整R方

标准估计的误差

更改统计量

R方改

F更改

df1

df2

Sig.F改

1

.623a

.388

.385

1517.28958

.388

137.693

5

1088

.000

从上表看出可决系数为0.388,其模型的拟合程度最好,但还是很一般。

表4地区一最高负荷与各气象因素回归分析的系数

模型

非标准化系数

标系

t

Sig.

相关性

共线性统计量

B

标误

试用版

零阶

部分

容差

VIF

(常量)

5604.140

402.913

13.909

.000

最高温度

-33.500

30.155

-.113

-1.111

.267

.573

-.034

-.026

.055

18.306

最低温度

130.059

60.378

.412

2.154

.031

.614

.065

.051

.015

64.995

平均温度

105.834

79.770

.334

1.327

.185

.615

.040

.031

.009

112.876

相对湿度

-12.906

4.419

-.091

-2.921

.004

.112

-.088

-.069

.582

1.718

降雨量

5.856

3.235

.046

1.810

.071

.074

.055

.043

.858

1.165

上表给出了各个自变量的回归系数,但在这得出结论之前,必须要观察以下标准化残差图:

图4地区一最高负荷与各气象因素回归分析标准化残差图

从图中可以看出,残差图中的分布是随机的,可以看作没有出现趋势性,所以回归模型是有效的。

最终的回归模型为:

用同样的分析过程可得两个地区各个因变量的回归分析,结果如下表:

表5各个回归方程汇总表

地区一

日最高

日最低

日平均

地区二

日最高

日最低

日平均

总的来说回归方程的有效性还是可以的,气候因素确实对负荷有影响。

5.2.3 多元线性回归误差的分析

本文将地区二的日平均负荷作为实例进行误差分析。

我们知道两个因素之间的相关性可作为两个因素的相互影响程度的衡量标准,因此可以通过下表来得出一些结论:

表6地区二的日平均负荷与各因素的相关系数表

日均负荷

最高温度

最低温度

平均温度

相对湿度

降雨量

Pearson相关性

日均负荷

1.000

.715

.656

.740

.123

.119

最高温度

.715

1.000

.795

.962

.138

.032

最低温度

.656

.795

1.000

.878

.398

.177

平均温度

.740

.962

.878

1.000

.278

.115

相对湿度

.123

.138

.398

.278

1.000

.411

降雨量

.119

.032

.177

.115

.411

1.000

从上表可以看出,相对湿度与日平均负荷的相关性为0.123,降雨量与日平均负荷的相关性为0.119。

这两个相关系数都比较低,说明相对湿度和降雨量对日平均负荷的影响很少。

如果将相对湿度与降雨量强行作为自变量的话,就会加大误差。

因此如果将相对湿度度与降雨量这两个因素从自变量中排除,可减小回归误差。

可以对回归分析模型的汇总进行比较。

表7地区二日平均负荷与各气象因素回归分析的模型汇总

模型

R

R方

调整R2

标准估计误差

更改统计量

R2改

F更改

df1

df2

Sig.F改

1

.750a

.563

.561

1054.322281

.563

280.634

5

1089

.000

表8地区二日平均负荷与部分象因素回归分析的模型汇总

模型

R

R方

调整R2

标准估计误差

更改统计量

R2改

F更改

df1

df2

Sig.F改

1

.741a

.549

.547

1070.475794

.549

442.276

3

1092

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2