SCI论文(www.lunwensci.com)
摘 要 :随着新一代信息技术的发展和应用,计算机技术在微电网行业发挥着越来越强大的作用。本文主要利用集成学习 当中的 XGBoost 模型实现异常用电检测。首先对数据进行清理、转换等预处理操作 ;其次对数据进行相关性分析,发现异常 值与家庭规模之间呈正相关关系,异常值与功率因数 A、电流 A 相之间呈负相关关系 ;然后使用 XGBoost 模型进行模型训练, 初始精度只有 91.11% ;接着利用遗传算法对模型当中的 8 个参数进行优化,经过 20 次迭代优化后,模型精度提升了 3.15% ; 最后基于优化后的模型构建了一套完整的用户用电异常检测系统。
Microgrid-based Electricity Usage Abnomaly Detection System
SUN Jiadong, SONG Yaohui, LI Fu, WANG Mengnan, REN Defen
(Wuxi University, Wuxi Jiangsu 214105)
【Abstract】:With the development and application of the new generation of information technology, computer technology is playing an increasingly powerful role in the microgrid industry. In this project, the XGBoost model in ensemble learning is used to detect abnormal power consumption. Firstly, perform pre-processing operations such as cleaning and transformation of the data; Secondly, the correlation analysis of the data showed that there was a positive correlation between the outlier and the family size, and the negative correlation between the outlier value and the power factor A and current A. Then, the XGBoost model was used for model training, and got the accuracy of 91.11%. Then, the genetic algorithm was used to optimize the eight parameters in the model, and the accuracy of the model was improved by 3.15% after 20 iterations of optimization. Finally, complete user eelectricity abnomaly detection system was constructed based on the optimized model.
【Key words】:Microgrid;XGBoost algorithm;genetic algorithm optimization
0 引言
微电网技术(Microgrid Technology) 是一种新 型的电力系统,相较于传统的电力系统,微电网具有更 高的灵活性、可靠性和适应性,可以有效地解决分布式 能源的并网问题,推动清洁能源的应用和普及,为国家 实现“双碳”目标提供强有力支撑 [1]。然而,中国的微 电网用电系统也存在一些特殊性,如用电用户量大、用 电数据类别较多、用电数据值较高且变化幅度较大。这 些特点给数据采集、传输和处理带来了巨大的挑战,需 要采用高效、快速的数据处理方法进行分析。此前,严莉(2022) [2]、陶华(2022) [3]、刘汉欣(2022) [4] 等专 家学者针对用电异常检测方法进行了相关的研究, 取得 了诸多成果。本系统通过对微电网用电数据进行分析和 建模,可以学习和预测电力系统的用电状态,自动识别 和报警异常情况,提高用电安全性和稳定性,同时也可 以降低企业的维护成本和人力成本,提高电厂的管理效 率和竞争力。此外,基于机器学习的用电异常分析系统 也有着广泛的应用前景,例如,在智能家居、智能电 网、工业控制等领域,都可以通过该系统来实现智能化 和自动化的用电管理。
1 XGBoost
XGBoost(Extreme Gradient Boosting) 是一种 高效、灵活的机器学习算法,主要用于分类和回归问 题。XGBoost 算法基于梯度提升决策树算法,具有比 传统 GBDT 更快的速度和更好的性能。XGBoost 算法 的计算方法主要包括损失函数、树的构建和正则化等方 面。XGBoost 模型树的构建过程当中,采用了一种称为 “近似贪心”的方法来构建树,即在每一次划分时,首 先选取最优的特征和阈值,然后通过近似贪心的方式, 计算最大化目标函数的增益,从而确定是否进行划分。 正则化则是为了避免过拟合, XGBoost 算法采用了 L1 和 L2 正则化、缺省值填充和树的剪枝等正则化方法。
XGBoost 算法在训练样本有限、训练时间短、调参 知识缺乏的场景下具有独特的优势, 且具有更强的可解 释性, 此外还具有易于调参、输入数据不变性等优势 [5.6]。 XGBoost 算法的具体流程如图 1 所示。
1.1 遗传算法
遗传算法(Genetic Algorithm) 是一种启发式算 法,模拟自然界 DNA 的遗传特征来产生新的解。算法 的整个进化过程依据的是生物学中的“优胜劣汰,适者 生存”的原理 [7]。在遗传算法中,每个解被称为一个个 体,它可以用一个二进制串来表示。例如,对于某个个 体x = {x1 , x2 ,..., xn }, 可以用一个 n 位的二进制串来表示, 其中每一位取 0 或 1.每个个体的优秀程度通过适应度 函数来评价,适应度函数值越大,说明个体的解越好 [8]。
遗传算法通常能够找到接近最优的解决方案,并且具有 较强的鲁棒性和通用性。遗传算法的流程如图 2 所示。
遗传算法可以选取迭代次数或者种群适应度阈值等 作为终止条件。遗传算法的优点是可以处理高维、非线 性、多峰等复杂问题,但也存在着运行时间长、局部最 优解等缺点。因此,在使用遗传算法时,需要根据具体 问题选择合适的算法,并进行参数调整和优化。
1.2 GUI 技术
用户用电异常检测系统人机交互界面基于 PyQt5 技 术开发,它是 Python 的 GUI 库,专用于开发桌面应用程 序,提供了丰富的界面控件、布局管理器和事件处理器等 功能。其中丰富的界面控件,包括常见的按钮、标签、文 本框、下拉框等,还包括图片控件、表格控件、列表控件 等。这些控件都可以通过 PyQt5 的模块来创建和使用,例 如,QPushButton、QLabel、QLineEdit、QComboBox 等。系统采用的 Qt for Application Development 企业 级应用框架,提供了丰富的工具和类库,简化运营系统 应用的开发。
2 需求分析
异常用电检测系统需对海量的用电数据进行数据分 析和挖掘,并且准确、快速地给出异常用电用户的信息 及异常原因,核心功能如下 :(1)异常诊断 :对于异常 用电的用户,应给出准确的异常问题判别,告知工程人 员,并在系统中进行记录和持久化存储。(2)告警功 能 :异常用电系统能够给出用户异常用电的各个原因及 其概率,对于小于警报阈值但是临近的用户,系统应给 出预警并告知工程人员。(3)查询功能 :系统应对预警 用户和异常用户进行记录,方便工程人员查询。(4)统 计功能 :系统能够统计用电异常情况以及近七天的异常 用电情况。
3 系统总体架构
本系统总体结构包括采样、数据、算法和展示四 层,如图 3 所示。数据层保存系统的配置信息、电网用 户信息、电网用电量信息以及管理员等数据 ;算法层通 过 Python 提供的数据接口与底层数据源相连接,并对 所传输的数据进行分析,分析结果通过内置接口传输到 展示层 ;展示层将分析结果图形化展示。
4 用电异常检测算法实现
异常用电检测总体流程如图 4 所示。首先,对数据 进行预处理,包括异常值处理、空缺值填充、数据标准 化等 ;接着,建立模型和训练,构建用电数据异常检测 模型 ;其次,对训练好的模型进行验证,计算模型的准 确度 ;最后,根据检测结果、反馈信息以及遗传算法对 模型进行优化和更新,提高模型的准确性和可靠性。
4.1 数据集介绍
本文所采用的数据集为南方某微电网所提供的用 户用电数据资料,数据大小为 243KB,包含了 7775 条 用电信息情况数据,其中 3735 条标注带有异常用电 (Abnormal=1)的标签,适合对模型进行训练。数据 集变量名称及描述如表 1 所示。
4.2 相关性分析
相关性分析用于确定两个或多个变量之间的相关性 质, 本文基于皮尔逊相关系数计算出各个因素的相关数值 并绘制相关系数热力图(如图 5 所示)。可以看到异常值 (Abnormal) 与家庭规模(Size) 之间呈正相关关系, 相 关系数为 0.43.说明家庭规模较大的家庭更有可能存在 异常用电现象。Abnormal 与功率因数 A(FactorA) 之间呈负相关关系, 相关系数为 -0.24. Abnormal 与 电流 A 相(CurrentA)之间呈负相关关系,相关系数 为 -0.22. 说明异常用电家庭的 CurrentA 和 FactorA 的值较低,我们的模型应该更加关注这两个变量。
根据该分析结果,分别绘制正常用电和异常用电的 110 名用户 CurrentA、FactorA 以及 FactorC 的变化, 如 图 6 所示。 一般来说,FactorA、FactorB 以及 FactorC 三 个变量的变化幅度相似,由图 6(a) 所示可以看出正常用电 用户的三个变量变化幅度较为相似,但是图 6(b) 所示可 以看出当中一些异常用电用户的 CurrentA 和 FactorA 的 变化幅度同 FactorC 相差较多,说明这些用户确实存在 异常用电现象。
4.3 对照模型构建
在训练模型之前,调用拆分函数将数据集划分为训 练集和测试集, 比例为 0.7.为了搭建基于集成学习的 微电网用户用电异常检测模型,我们先选择了常见的单 一模型,以及常见的集成学习模型进行对照。分别运行了 Random Forest、Navia Bayes、Decision Tree、KNN、 Logistic Regression 以及 SVM 模型, 并得到这些模型 的 Accuracy,如图 7 所示。
4.4 XGBoost 模型构建
XGBoost 模型初始 Accuracye 为 91.11%, 对应模 型的混淆矩阵如图 8 所示。
在 XGBoost 模型的训练过程中,经常会出现过拟合的问题,本课题选择 KFold 进行交叉检验。将数据 集分成 K 份,其中 K-1 份作为训练集,剩余的 1 份作 为测试集 [9],然后重复这个过程 K 次,每次选取的测 试集不同,最后将 K 个模型的测试结果进行平均得到 最终的评估结果。并绘制出 50 次交叉验证的评估曲线 如图 9 所示,结果表明 XGBoost 模型的预测精度范围 在 0.84 ~ 0.92 之间, 50 次交叉验证的准确度均值约为 0.88.说明模型预测效果较好。
4.5 遗传算法优化
XGBoost 模型当中存在较多的参数,这些参数值的 选取对于模型结果也存在一定的影响,为了提升模型的 准确性,本系统采用遗传算法来优化模型当中的参数, 而遗传算法采用均方根误差(RMSE)的倒数作为适应 度函数,关键参数配置如表 2 所示。
经过 20 次迭代,每次迭代的适应度大小变化如图 10 所示,优化后得到的最佳参数如表 3 所示,最终模型的 准确度为 93.98%,较初始模型提升了 3.15%。
5 系统应用
本系统还基于云平台配套开发了异常检测运营管理系统,根据异常检测模型自动运行结果,按照概率值的大小给出当前异常用电用户和当前可疑异常用电用户的信息,异常用电和可疑异常用电的概率阈值分别为 0.9和 0.8.检测到异常之后以表格的形式展示, 且可以在报警及处理界面进行处理(如图 11 所示)。界面上方还 显示当前时刻异常人数、可疑人数、已处理人数以及待 处理人数等统计数据。
6 总结
本文构建了一个基于微电网的用户用电异常检测模 型,采用的算法为集成学习当中的 XGBoost 算法,优 化算法为遗传算法。基于 XGBoost 算法的微电网用户 异常检测模型经过遗传算法 20 次迭代优化,精度提升 了 3.15%。此外,本系统还开发了一套基于微电网的 用户用电异常检测运营管理系统,包括查询用户用电信 息、查询当前时刻异常用电信息、查看历史异常用电信 息等常用运维功能。
参考文献
[1] 张少锋.基于线性判别分析和密度峰值聚类的异常用电模式 检测[D].吉林:东北电力大学,2022.
[2] 严莉,张凯,徐浩,等.基于缺失值补全与BiLSTM的用电行为 异常检测[J].软件导刊,2022.21(10):136-141.
[3] 陶华,庄友谊,戴欢.基于卷积神经网络的居民用电异常检测 方法[J].科学技术创新,2022(34):92-98.
[4] 刘汉欣.基于集成学习的用户异常用电检测方法研究[D].南 昌:华东交通大学,2022.
[5] 唐娟.基于XGBoost和LR集成模型的企业非法集资识别应 用研究[D].南宁:广西大学,2022.
[6] 马陇飞,萧汉敏,陶敬伟,等.基于梯度提升决策树算法的岩性 智能分类方法[J].油气地质与采收率,2022.29(01):21-29.
[7] 钟敏.基于改进遗传算法的异构云雾协同网络中的资源分配 [D].南京:南京邮电大学,2022.
[8] 龙福海.基于改进遗传算法优化的特征选择方法研究[D].贵 阳:贵州民族大学,2022.
[9] 姚珂.基于词典与规则的文本情感分析[J].电脑知识与技术, 2018.14(26):162-163.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/74741.html