Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 计算机论文 > 正文

基于 Stacking 多模型融合的超短期电网负荷预测论文

发布时间:2022-11-02 10:40:03 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):

  摘   要:为提升超短期电网负荷预测精度,提出基于 Stacking 多模型融合的超短期电网负荷预测法。首先,结合 5- 折交 叉验证法分别训练第一层的 LSTM、LightGBM、XGBoost 三个初级学习器,将训练结果进行 Stacking 融合 ;然后将融合结 果作为新特征用于训练第二层 LightGBM 次级学习器,使用次级学习器得到电网负荷预测的最终结果 ;最后利用山东省公共数 据开放平台提供的某市实际超短期电网数据验证所提方法的有效性。实验结果表明 , 比起单一模型预测,所提的 Stacking 多模 型融合预测法,在预测结果的平均精度与峰谷变化的适应能力方面更具优势。

  关键词:超短期电网负荷预测 ;Stacking 多模型融合 ;LSTM ;LightGBM

Ultra-short-term Power Grid Load Forecasting Based on Stacking Multi-model Fusion
 
ZHANG Zhongjian1, GAO Shiliang1, ZHANG Lu1, AN Runlu1, ZHANG Zhongcheng2, ZHOU Zili1
(1.School of Cyberspace Security, Qufu Normal University, Jining Shandong 273165;
2.School of Mathematics and Statistics, Northeast Petroleum University, Daqing Heilongjiang 163711)

  【Abstract】:  In order to improve the accuracy of ultra-short-term power grid load forecasting, an ultra-short- term power grid load forecasting method based on Stacking multi-model fusion is proposed. Firstly, combine the 5-fold cross-validation method to train the three primary learners of LSTM, LightGBM and XGBoost in the first layer, and stack the training results; then use the fusion results as new features to train the second layer of LightGBM secondary learning; Finally, the actual ultra-short-term power grid data of a city provided by the public data open platform of Shandong Province is used to verify the effectiveness of the proposed method. The experimental results show that the proposed Stacking multi-model fusion prediction method has more advantages in the average accuracy of the prediction results and the adaptability to peak-to-valley changes than the single model prediction.

  【Key words】:ultra-short-term power grid load forecasting;Stacking multi-model fusion;LSTM;LightGBM

  0引言

  近年来,为贯彻落实国家节能减排政策的要求,电网调度系统必须采取科学的发电调度方式,准确的电网母线负荷预测是实现节能降耗与电网调度精细化管理的基础。

  电网母线负荷预测按照预测时间范围来划分,可分为长期、中期、短期和超短期预测。中、长期负荷预测是以年为单位进行预测的,主要用于为电力系统规划建设。短期负荷预测的预测单位包括月、周、天、小时,

  主要用于调节指导电力部门的日常运行[1]。超短期负荷预测是以分钟为单位,主要用于帮助供配电部门及时应对紧急的电力事故,合理分配电量,满足社会各单位的电力需求[2]。

  电网负荷预测的模型可分为两类,一类是传统的统计学模型,主要有多元线性回归、时间序列分析法和卡尔曼滤波法等,这类方法原理与建模简单,但当数据样本容量较大时,预测效果一般。第二类是机器学习模型,例如支持向量机、逻辑回归、最小二乘法、决策树等。但存在的问题在于缺少对时序数据相关性的考虑,需要人为添加时间特征来保证预测的结果[3]。

\
图1LSTM的三个门的计算过程
Fig.1ThecalculationprocessofthethreegatesofLSTM

  1相关工作

  近年来,极端梯度提升机(XGBoost)以及轻梯度提升机(LightGBM)对电网负荷预测问题有着不错的效果。LightGBM与XGBoost都是基于梯度提升决策树(GBDT)算法的框架,具有训练速度快、内存占用低、支持非连续性特征等优点,但都缺乏对时间序列的整体感知能力[3]。文献[4]通过基于LightGBM的改进GBDT算法,证明了该算法具有更高的计算效率以及计算精度。

  长短期记忆网络(LSTM)为代表的深度学习算法在负荷预测领域也取得了较好的应用。长短期记忆网络(LSTM)由输入门、遗忘门、输出门以及记忆细胞状态组成,可以有选择的记忆输入的数据,并长时间的记住需要的数据,当需要时便将数据调用出来,不需要时也不会丢失,LSTM的计算流程图,如图1所示。文献[5]利用LSTM模型充分挖掘电网负荷时序数据之间的内在时序关联,但模型预测精度不高。

  2Stacking多模型融合预测(StackingMulti-modelFusionPrediction)

  为了克服单一模型在超短期电网负荷预测精度上的不足,Stacking多模型融合的方法应运而生。Stacking多模型融合预测利用初始训练集学习出若干个初级学习器模型后,将这几个初级学习器模型的预测结果进行Stacking融合作为新的训练集,来学习一个新的次级学习器[6]。文献[7]在工业产品质量预测研究上,将SVC、XGBoost、KNN等算法进行Stacking多模型融合,结果表明Stacking融合具有更高的预测精度和稳定性。文献[8]在超短期光伏功率预测研究上,将XGBoost、LightGBM、LSTM等模型融合,结果表明多模融合效果总体优于单独算法建模。

  Stacking多模型融合定义:

  初级训练集D
  
  次级训练集D'

  初级学习算法ϱ1,ϱ2,…,ϱT

  次级学习算法ϱ

  初级学习器h1,h2,…,hT

  次级学习器h'

  Stacking多模型融合算法过程:

  D={(x1,y1), ,(xm,ym)}       (1)

  D'=ϕ                                (2)
 
  ht=ϱt(D),t∈{1,2,…,T}         (3)

  zit=ht(xi),i∈{1,2,…,m},t∈{1,2,…,T}(4)

  D'=D'∪((zi1,…,ziT),yi)(5)

  h'=ϱ(D')(6)

  H(x)=h'(h1(x), ,hT(x))(7)

  公式(1)~(3)在初级训练集D上分别训练初级学习器。公式(4)利用训练好的初级学习器获得预测结果。公式(5)将所有初级学习器的预测结果构造为次级训练集D'。公式(6)利用次级训练集D'训练次级学习器。公式(7)通过训练好的次级学习器获得最终的预测结果。

  因此,针对LSTM网络、XGBoost及LightGBM3种单一模型存在的缺陷,提出基于Stacking多模型融合的超短期电网负荷预测方法。Stacking多模型融合结构如图2所示。首先结合5-折交叉验证法分别训练第一层LSTM、LightGBM、XGBoost三个初级学习器,并将各初级学习器的预测结果与验证结果进行Stacking融合,然后将融合后的验证结果作为新的训练集,预测结果作为新的测试集,训练集用于训练第二层LightGBM次级学习器,测试集用于预测最终的电网负荷预测值。

 \
 
  3实验过程

  3.1实验数据和平台

  以山东省公共数据开放平台提供的某市实际超短期电网数据作为实验数据集,选择从2019年5月17日至2019年5月30日的负荷数据作为训练集,共计320807条数据。选择2019年5月31日的负荷数据作为测试集,共计22631条数据。数据集中包括该市83个不同母线在每小时的第0分钟、5分钟、10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟的负荷值、变压器等级、电压等级、地区编号、风力情况、风向情况、温度情况、天气情况等字段。

  在特征工程工作中,选取待预测时刻的对应的月份、当月的第几日、当日的第几小时、当时的第几分、变压器等级、电压等级、地区编号、母线编号、风力情况、风向情况、温度情况、天气情况以及是否为工作日等为输入特征,标签值为待预测时刻(精确到分钟)的负荷值。将风力情况、风向情况、天气情况、星期几采用类别编码,是否为工作日选择0/1编码。对有缺失的连续性特征计为平均值,对有缺失值的离散性特征计为-1。

  本文采用的硬件平台为Intel(R)Xeon(R)Gold6254CPU和NVDIAQuadroRTX4000GPU。实验平台采用JupyterNotebook。特征工程使用Pandas、Numpy、Scikit-learn等Python库,LSTM网络调用Pytorch深度学习库,LightGBM模型调用LightGBM机器学习库,XGBoost模型调用XGBoost机器学习库,调参工具选择贝叶斯优化算法[9]与Optuna工具包[10]。

  3.2实验评价指标

  选取均方根误差RMSE作为实验的评价指标,yt为t时刻负荷的真实值,t为t时刻负荷的预测值,如公式(8)所示:

  \

  3.3实验设置

  LSTM模型需要确定其输入和输出序列。LSTM网络因其独特的记忆结构可以直接将t-1到t-n的各个滞后时刻数据作为单个特征直接输入。通过相关性分析,发现待测时刻的预测值与前一小时负荷值具有很大的相关性,故选取时间窗口大小为11(1小时)。结合Optuna工具包,得LSTM模型核心参数设置,如表1所示。

\
 
  LightGBM模型无法一次性得到每5min的负荷值,因此需要利用训练好的模型分别对每5min负荷值进行预测。结合贝叶斯优化算法,分别得到LightGBM初级学习器与LightGBM次级学习器的核心参数设置,如表2、表3所示。

\
 
\
 
  3.4实验结果对比分析

  结合预测结果(如图3所示)与训练结果(如表4所示)。

\
 
\

  XGBoost模型与LigntGBM模型都是树模型,具有较高的预测准确度,模型预测曲线与实际曲线基本一致。但在一些峰谷点附近,由于负荷变化的不确定性增加,使得模型的误差较大。

  LSTM模型预测曲线与实际曲线的变化趋势更相似,即使在一些峰谷点附近,负荷变化的也能快速适应。但是在负荷值的预测精度上,LSTM模型不如LightGBM模型与XGBoost模型。

  Stacking多模型融合则结合上述3种模型的优点,具有较高的峰谷变化适应能力与预测精度,比单一模型预测更具优势。

  4结语

  本文提出一种结合LSTM、LightGBM、XGBoost的Stacking多模型融合的超短期电网负荷预测方法。实验得出,Stacking多模型融合方法能够有效结合上述3种模型的特点,既可以考虑时序数据间的相互关联,也能有效挖掘数据特征信息,具有较高的预测精度与峰谷变化适应能力。

  后续工作在特征方面可以考虑采取Wrapper特征筛选,找出最佳特征集。同时,也可以尝试增加单模数量或其他模型之间的融合。

  参考文献

  [1]周潮,邢文洋,李宇龙.电力系统负荷预测方法综述[J].电源学报,2012(6):32-39.

  [2]刘东,周莉,郑晓亮.基于SA-DBN的超短期电力负荷预测[J].广西师范大学学报(自然科学版),2021,39(4):21-33.

  [3]陈纬楠,胡志坚,岳菁鹏,等.基于长短期记忆网络和LightGBM组合模型的短期负荷预测[J].电力系统自动化,2021,45(4):91-97.

  [4]王华勇,杨超,唐华.基于LightGBM改进的GBDT短期负荷预测研究[J].自动化仪表,2018,39(9):76-78+82.

  [5]陆继翔,张琪培,杨志宏,等.基于CNN-LSTM混合神经网络模型的短期负荷预测方法[J].电力系统自动化,2019,43(8):131-137.

  [6]许超明,朱星海,董超,等.基于集成学习的webshell检测技术探究[J].数字化用户,2019(37):110-113.

  [7]封晓斌,徐明江,汤易兵,等.基于Stacking多模型融合的工业产品质量预测[J].数学的实践与认识,2021,51(22):267-276.

  [8]杨国清,张凯,王德意,等.基于包络线聚类的多模融合超短期光伏功率预测算法[J].电力自动化设备,2021,41(2):39-46.

  [9]BERGSTRAJ,YAMINSD,COXDD.MakingaScienceofModelSearch:HyperparameterOptimizationinHundredsofDimensionsforVisionArchitectures[C]/
/InternationalConferenceonMachineLearning,2013:115-123.

  [10]AKIBAT,SANOS,YANASET,etal.Optuna:ANextgenerationHyperparameterOptimizationFramework[C]//
Proceedingsofthe25thACMSIGKDDInternationalConferenceonKnowledgeDiscovery&DataMining,2019:2623-2631

关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
 
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/45596.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml