Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

基于自适应权重混合策略主动学习的电能质量复合扰动识别

魏萱, 张浩毅, 赵晨, 李开成

魏萱, 张浩毅, 赵晨, 李开成. 基于自适应权重混合策略主动学习的电能质量复合扰动识别[J]. 华南师范大学学报(自然科学版), 2023, 55(6): 55-62. DOI: 10.6054/j.jscnun.2023078
引用本文: 魏萱, 张浩毅, 赵晨, 李开成. 基于自适应权重混合策略主动学习的电能质量复合扰动识别[J]. 华南师范大学学报(自然科学版), 2023, 55(6): 55-62. DOI: 10.6054/j.jscnun.2023078
WEI Xuan, ZHANG Haoyi, ZHAO Chen, LI Kaicheng. Identification of Complex Power Quality Disturbances Based on Adaptive Weighted Hybrid Strategy Active Learning[J]. Journal of South China Normal University (Natural Science Edition), 2023, 55(6): 55-62. DOI: 10.6054/j.jscnun.2023078
Citation: WEI Xuan, ZHANG Haoyi, ZHAO Chen, LI Kaicheng. Identification of Complex Power Quality Disturbances Based on Adaptive Weighted Hybrid Strategy Active Learning[J]. Journal of South China Normal University (Natural Science Edition), 2023, 55(6): 55-62. DOI: 10.6054/j.jscnun.2023078

基于自适应权重混合策略主动学习的电能质量复合扰动识别

基金项目: 

国家自然科学基金项目 52077089

详细信息
    通讯作者:

    李开成,Email: likaicheng@hust.edu.cn

  • 中图分类号: TM712

Identification of Complex Power Quality Disturbances Based on Adaptive Weighted Hybrid Strategy Active Learning

  • 摘要:

    为了降低电能质量复合扰动(CPQDs)数据的标注成本,利用混合策略的主动学习方法与拉普拉斯极限学习机来识别电力配电网络中的CPQDs。提出将不同的主动学习采样策略进行混合,选择最富含信息和最具有代表性的CPQDs数据进行标记。在主动学习过程中利用对数函数自适应调整不同策略权重。为了提高分类器的性能,在监督学习和无监督学习的框架下将拉普拉斯流形正则化并嵌入到极限学习机中。将所提出的架构与主流的主动学习算法在代码合成以及硬件生成的数据集上进行了比较,结果显示所提出的方法拥有更好的性能。

    Abstract:

    To mitigate the annotation cost of Complex Power Quality Disturbances (CPQDs) data, a hybrid strategy active learning approach was employed along with Laplacian Extreme Learning Machine to identify CPQDs in power distribution networks. It combines different categories of active learning sampling strategies to select the most informative and representative CPQDs data for labeling. In the active learning process, the weights of different strategies are adaptively adjusted using a logarithmic function. To enhance classifier performance, a Laplacian manifold regularization was embeded into Extreme Learning Machine in both supervised and unsupervised frameworks. The proposed architecture is compared with state-of-the-art active learning algorithms on datasets generated through code synthesis and hardware, demonstrating superior performance of the proposed method.

  • 随着科技的迅猛发展,电子设备在各类领域的应用日益广泛,尤其在处理高功率、非线性及非对称负载的任务中,发挥着不可或缺的作用[1]。这一拓展使得电能质量复合扰动(Complex Power Quality Disturbances, CPQDs)的发生频率有所增加,进而导致电能质量下降,最终造成电子设备无法正常运行或出现故障。因此,电能质量管理的重要性日益凸显,其中准确识别CPQDs成为了实现电能质量有效调控和管理的重要先决条件。

    传统的CPQDs识别方法主要依赖于两个关键步骤:特征提取和特征分类。针对所提取的CPQDs特征,众多学者采用了各种信号处理方法,包括短时傅里叶变换[2]、Stockwell变换[3]、小波变换[4]、希尔伯特变换[5]、经验模态分解[6]和变分模态分解[3]。此外,众多传统的机器学习算法已被广泛应用于基于生成特征的CPQDs识别,包括决策树[7]、人工神经网络[8]、概率神经网络[9]、支持向量机[9]和极限学习机[6]。随着深度学习领域的持续发展,越来越多的研究人员开始采用该领域的方法,以自动从数据中提取有价值特征,从而提高分类性能[10-12]。这些研究所用算法都基于监督学习框架。为了训练高性能的识别模型,人类专家必须对大量的CPQDs进行标记。为了减轻人类专家的标注负担,本文将主动学习方法与CPQDs分类相结合。主动学习是一种弱监督学习形式,已经在许多领域得到应用。与监督学习不同,主动学习将样本查询策略应用于未标记数据,并选择最有价值的样本交付给人类专家进行标注。然后,新标记的样本被添加到原始的已标记集合中,以重新训练分类器。因此,选择有效的查询策略对于主动学习非常重要。目前,主流的主动学习样本选择策略可以分为两类[13]:一类是基于样本信息性采样策略[14-16],另一类是基于样本代表性采样策略[17-19]

    样本信息性策略、样本代表性策略都是基于单一策略的主动学习方法,在改善模型性能方面存在一些局限性。因此,研究人员一直在探讨如何结合这两种策略。SHEN等[20]提出了两种新颖的策略整合结构:串行形式和并行形式。在串行形式混合策略主动学习中(Serial-form Hybrid Strategy Active Learning,SHSAL),使用一种策略选择一部分样本后,再将样本交给下一个不同的策略进行选择。在并行形式混合策略主动学习中(Parallel-form Hybrid Strategy Active Learning,PHSAL),通过加权和优化函数来整合两种不同策略,以保证所提取的样本能体现不同策略的特性。LUGHOFER[21]提出一种混合策略的主动学习模型(Hybrid Active Learning, HAL),该模型在早期阶段选择代表性样本,然后在后续阶段应用基于信息性的采样策略。虽然已有研究对上述方法进行了改进[21-23],但目前的方法仍然存在两个问题:一方面,根据主动学习理论和方法的研究,在主动学习过程中会出现一种有趣的现象,被称为“主动学习的时效性”[13]。具体指在主动学习的早期阶段,基于样本代表性策略优于基于样本信息性策略。随着学习过程的进行,基于样本信息性策略的优越性变得明显。然而现有的一些方法忽略了这一时效性。另一方面,现有的一些研究使用固定权重函数组合两种不同样本选择策略,这样的设计依赖人为经验值设置,无法在不同阶段自适应地调整不同种类策略权重。

    为了解决上述问题,本文提出了一种新颖的主动学习框架,命名为“自适应权重混合策略主动学习”(Adaptive Weighted Hybrid Strategy Active Learning,AWHSAL)。本文提出AWHSAL框架,引入策略贡献度函数以及一个对数函数。策略贡献度函数根据不同策略对每次迭代中的贡献度及权重进行动态调整,而对数函数则随着主动学习过程的进行,对不同类别策略的权重进行灵活调节。这种设计不仅解决了人工设置的权重无法随着主动学习的进程不断更新的问题,同时也充分考虑了不同策略在主动学习过程中贡献度的变化情况。这样的框架设计能够更加有效地利用样本信息性策略和样本代表性策略,从而挑选出更加有价值的样本进行标注。

    Stockwell变换(S变换)是一种非破坏性可逆的时频分析方法,它在特征提取方面表现出色。信号的连续S变换:

    S(τ,f)=+x(t)ϕ(τt,f)ei2πft dt,ϕ(τt,f)=f2πe(τt)2f2/2, (1)

    其中,ϕ(τt, f)为高斯窗函数,τ是用于定位波形位置的平移参数,f是信号频率。

    x[kT]定义为x(t)的离散形式,x(t)的离散傅里叶变换:

    X[nNT]=1NN1k=0x[kT]ei2πnkN, (2)

    其中,n=0, 1, …, N-1。离散S变换:

    S[kT,nNT]=1NN1m=0X[m+nNT]e2π2m2nei2πkmN,n0, S[kT,0]=1NN1m=0x[mNT],n=0, (3)

    其中,τkTfn/NTT为采样间隔。

    极限学习机是一个输出权重与输入权重没有连接的单隐层前馈网络[24]。在极限学习机中,输入层到隐藏层的权重是随机初始化的,而隐藏层到输出层的权重是通过最小化损失函数进行训练得到的。极限学习机通常用于回归或者分类任务,并且在许多应用中表现出很高的性能。假定有一个包含M个带有标签的数据集

    {X,Y}={xm,ym}Mm=1,xmRmi,ymRmo,

    其中,mimo为输入和输出维度。极限学习机输出方程:

    f(xm)=h(xm)β, (4)

    其中,βRmh·mo表示隐藏层和输出层之间的输出权重(mh是隐藏神经元的数量),h(xm)∈Rmh表示将数据集从原始空间映射到特征空间。

    极限学习机理论的重点是在于最小化训练误差的累计平方损失,以获得输出权重结果。其目标函数:

    min (5)

    其中,第一部分是为了防止过拟合加入的L2-norm正则化,在第二部分中,

    \boldsymbol{H}=\left[\boldsymbol{h}\left(\boldsymbol{x}_1\right)^{\mathrm{T}}, \cdots, \boldsymbol{h}\left(\boldsymbol{x}_M\right)^{\mathrm{T}}\right]^{\mathrm{T}} \in \mathfrak{R}^{M \cdot m_{\mathrm{h}}},

    C是用户指定的对训练误差的惩罚系数。

    为了在监督学习中保留样本的内部流形特征,研究人员将Laplacian流形正则化集成进损失函数之中,以提高极限学习机的性能,这一方法称为Laplacian极限学习机[24]。Laplacian极限学习机的目标函数:

    \min\limits_{\boldsymbol{\beta} \in \Re^{m_{\mathrm{h}} \cdot m_{\mathrm{o}}}}\frac{1}{2}\|\boldsymbol{\beta}\|^2+\frac{1}{2}\left\|\boldsymbol{C}^{\frac{1}{2}}(\tilde{\boldsymbol{Y}}-\boldsymbol{H} \boldsymbol{\beta})\right\|^2+\frac{\lambda}{2} \operatorname{Tr}\left(\boldsymbol{\beta}^{\mathrm{T}} \boldsymbol{H}^{\mathrm{T}} \boldsymbol{L} \boldsymbol{H} \boldsymbol{\beta}\right), (6)

    其中, L\mathfrak{R}M·M被定义为由原始数据集构建的图拉普拉斯矩阵,λ表示一个惩罚系数,C是一个对角矩阵,其对角元素[C]mm=Cm,其中Cm表示不同类别的预测误差。

    通过将约束条件带入目标函数,式(6)可改写为:

    \boldsymbol{\beta}^*=\boldsymbol{H}^{\mathrm{T}}\left(\boldsymbol{I}+\boldsymbol{C H}^{\mathrm{T}}+\lambda \boldsymbol{L} \boldsymbol{H} \boldsymbol{H}^{\mathrm{T}}\right)^{-1} \boldsymbol{C} \boldsymbol{Y}。 (7)

    在无监督学习的环境下,定义一个带有M个完全未标记的训练数据集X={xm}m=1M,与拉普拉斯极限学习机不同,无监督极限学习机的目标函数可以表示为:

    \min\limits_{\boldsymbol{\beta} \in \Re^{m_{\mathrm{h}} \cdot m_{\mathrm{o}}}}\|\boldsymbol{\beta}\|^2+\lambda \operatorname{Tr}\left(\boldsymbol{\beta}^{\mathrm{T}} \boldsymbol{H}^{\mathrm{T}} \boldsymbol{L} \boldsymbol{H} \boldsymbol{\beta}\right) \\ { s.t. }\;(\boldsymbol{H} \boldsymbol{\beta})^{\mathrm{T}}(\boldsymbol{H} \boldsymbol{\beta})=\boldsymbol{I}, (8)

    其中,β表示含有特征向量的矩阵,mo表示为输出空间的维度。结合式(8)可以得到β*

    \boldsymbol{\beta}^*=\boldsymbol{H}^{\mathrm{T}}\left[\tilde{\boldsymbol{v}}_2, \cdots, \tilde{\boldsymbol{v}}_{m_{\mathrm{o}}+1}\right], (9)

    其中,\tilde{\boldsymbol{v}}_i=\tilde{\boldsymbol{v}}_i /\left\|\boldsymbol{H} \tilde{\boldsymbol{v}}_i\right\|, i=2, \cdots, m_{\mathrm{o}}+1是归一化的特征向量,\tilde{v}_2, \cdots, \tilde{v}_{m_\mathrm{o}+1}是相对应的特征向量。

    将CPQDs数据集分为两部分:(1)数量较少的标注数据集Dl={X, Y}={xm, ym}m=1M;(2)数量非常丰富未标记数据池Du={xn}n=1Nxmxn\mathfrak{R}d表示d维特征向量,而ym∈{1, …, K}是xm的类别标签。在主动学习每次迭代中,样本挑选策略从Du中选择一个大小为B的最有价值的数据并构成数据集Dq,并由人类专家对其进行标注。DuDl根据Dq进行更新,分类器会在新的Dl上重新训练。该过程在不断迭代中进行,以逐步提升模型性能。

    基于信息性样本挑选策略包括熵[16]、最佳与次佳(Best versus Second-Best,BvSB) [16]和最小置信度[14]。通常,最小置信度策略仅考虑最可能的标签,忽略了其他标签的置信度分布。因此,它不适用于多类别问题。相比之下,基于熵的主动学习策略考虑所有标签;然而,它容易受到无关紧要标签的影响。所以在基于信息性采样策略中采用了BvSB方法。BvSB方法旨在找到具有最高条件概率和次高条件概率相似性的样本。假设P(yBest|xn)和P(ySecond-Best|xn)分别是最高条件概率和次高条件概率,并且BvSB采样查询策略,可以表示为:

    \boldsymbol{D}_{q(\mathrm{BvSB})}=\underset{x_n \in \boldsymbol{D}_u}{\operatorname{argmin}}\left[P\left(\boldsymbol{y}_{\text {Best }} \mid \boldsymbol{x}_n\right)-P\left(\boldsymbol{y}_{\text {Second-Best }} \mid \boldsymbol{x}_n\right)\right]。 (10)

    基于信息性采样策略是主动学习中数据选择的一个简单有效的标准,但存在可能选择一些具有冗余信息样本的问题。为了解决这个问题,将无监督极限学习机与K均值聚类算法相结合(Unsupervised Extreme Learning Machine Cluster,USELMC),选择更具代表性的数据进行标记。这有助于确保所选择的数据更好地代表了整个数据集。

    USELMC旨在保留原始高维数据的低维流形特征,以实现数据降维。在获得降维数据后,采用K均值算法来确定每个聚类的中心点。随后选择与每个聚类中心的欧氏距离最近的样本。USELMC采样策略的表述如下:

    \boldsymbol{D}_{q(\mathrm{USELMC})}=\underset{x_n^* \in \boldsymbol{D}_u, k=1, \cdots, K}{\operatorname{argmin}}\left\|\boldsymbol{c}_k-\boldsymbol{x}_n^*\right\|, (11)

    其中,xn*代表xn经过USELM降维后的样本,ck代表第k个聚类簇中心。

    为了对每个未标记样本的信息性和代表性进行量化和评分。将所采用的样本挑选策略转化为相应的样本得分公式。式(10)和式(11)可以重新表述为:

    Q_{\text {BvSB }}(n)=P\left(\boldsymbol{y}_{\text {Best }} \mid \boldsymbol{x}_n\right)-P\left(\boldsymbol{y}_{\text {Second-Best }} \mid \boldsymbol{x}_n\right), (12)
    Q_{\text {USELMC}}(n)=\left\|\boldsymbol{c}_k-\boldsymbol{x}_n^*\right\|, (13)

    其中, QBvSB(n)和QUSELMC(n)表示第n个样本在对应样本挑选策略下得分。将QBvSB(n)和QUSELMC(n)进行降序排列,得到QBvSB*(n)和QUSELMC*(n)。

    在以前的研究中,传统的混合策略主动学习框架通常使用固定权重。这种方法在计算上很方便,但它并没有考虑到不同策略的贡献在不同的主动学习阶段可能会发生变化。因此,本文建立一种自适应权重混合策略主动学习的CPQDs识别框架(图 1),用于每次迭代中的每种策略。这样可以根据不同阶段的需求动态调整各个策略的权重分配,以提高模型的性能。自适应权重计算公式如下:

    图  1  基于AWHSAL的CPQDs动识别框架
    Figure  1.  CPQDs identification framework based on AWHSAL
    W_{\mathrm{BvSB}}=\ln \left[1-\frac{Q_{\mathrm{BvSB}}^*(B+1)-Q_{\mathrm{BvSB}}^*(B)}{Q_{\mathrm{BvSB}}^*(1)-Q_{\mathrm{BvSB}}^*\left(\left|\boldsymbol{D}_u\right|\right)}\right] \ln (1-a), (14)
    W_{\mathrm{USELMC}}=\ln \left[1-\frac{Q_{\mathrm{USELMC}}^*(B+1)-Q_{\mathrm{USELMC}}^*(B)}{Q_{\mathrm{USELMC}}^*(1)-Q_{\mathrm{USELMC}}^*\left(\left|\boldsymbol{D}_u\right|\right)}\right] \ln (a), (15)

    式(14)和式(15)的前半部分是贡献度,衡量了相应策略在当前迭代中的贡献,后半部分通过对数函数调整不同类别策略的权重,其中a被定义为上一次迭代后分类器的准确度。联合式(14)和式(15)即可获得样本的最终得分:

    S(n)=W_{\mathrm{BvSB}} Q_{\mathrm{BvSB}}(n)+W_{\mathrm{USELMC}} Q_{\mathrm{USELMC}}(n)。 (16)

    本文提出一种新的主动学习框架:AWHSAL,并将其与拉普拉斯极限学习机相结合,构成CPQDs识别模型。以下为该模型训练流程:

    (1) 从所有CPQDs中提取关键的时域、频域和时频域特征,其中时频域特征是通过S变换获得的。

    (2) 将已标注样本送入基础分类器进行训练。

    (3) 利用基于样本信息性挑选策略(BvSB)以及基于样本代表性挑选策略(USELMC)对所有未标记样本的信息性和代表性进行打分,同时利用指数函数以策略的不同贡献程度进行自适应权重分配。

    (4) 选择特定数量的最具有价值的未标注样本贴上标签,并将它们添加到已标记样本集合中以重新训练分类器。

    本文提出自适应权重混合策略主动学习的CPQDs识别框架,具体算法流程如下。

    输入:已标注的样本集

    \boldsymbol{D}_l=\{\boldsymbol{X}, \boldsymbol{Y}\}=\left\{\boldsymbol{x}_m, \boldsymbol{y}_m\right\}_{m=1}^M,

    未标注样本集Du={xn}n=1N;隐藏层的层数mh惩罚系数Cλ等。

    步骤一:通过式(12)和式(13)计算Du中的所有样本的QBvSBQUSELMC

    步骤二:对所有样本的QBvSBQUSELMC进行归一化处理得到QBvSB*QUSELMC*

    步骤三:通过式(14)和式(15)计算自适应权重得分WBvSBWUSELMC

    步骤四:利用式(16)计算Du中的所有样本最终得分S;

    步骤五:挑选得分最高的前B个样本进行标注,形成Dq

    步骤六:Du=Du\DqDl=DlDq

    直到:到达最大选取次数。

    数据集由软件仿真数据和硬件采集的标准功率源数据共同构成,一共生成16种复合扰动,16种扰动类型如表 1所示。软件仿真数据由Matlab依据IEEE1159-2019生成,另一方面以STM32为核心的硬件模块对标准功率源Fluke 6105A生成的扰动进行采样,采样平台如图2所示。所有生成样本的基础频率为50 Hz,采样频率为6.4 kHz。训练集数据一共包含8 000个样本,其中每个类型复合扰动各500个。实验过程将数据集划分为:已标注集,测试集和未标注集。实验开始时每种扰动选取1个样本作为已标注集,每种扰动选取250个样本作为测试集,剩下的样本打乱后作为未标注集。对CPQDs所提取的特征如表 2所示,其中,定义50 Hz以下的频率为低频,50 Hz以上的为高频。本文所有运行结果均在Intel I9-13900KF 5.80 GHz、32 GB内存、Win11系统下通过Matlab2023a软件计算。

    表  1  16种不同电能质量扰动类型
    Table  1.  16 different types of CPQDs
    类别 扰动类型 类别 扰动类型
    C1 电压暂降 C9 电压下降+闪烁
    C2 电压暂升 C10 电压上升+谐波
    C3 电压中断 C11 电压上升+闪烁
    C4 瞬态干扰 C12 电压中断+谐波
    C5 电压振荡 C13 电压中断+闪烁
    C6 谐波 C14 电压下降+谐波+闪烁
    C7 电压闪烁 C15 电压下降+谐波+闪烁
    C8 电压下降+谐波 C16 电压中断+谐波+闪烁
    下载: 导出CSV 
    | 显示表格
    表  2  CPQDs特征集
    Table  2.  The feature sets of CPQDs
    类别 特征类型 类别 特征类型 类别 特征类型 类别 特征类型
    F1 时域最大值 F8 低频对应最小幅值最大值 F15 高频对应最大幅值最大值 F22 时频矩阵最大值
    F2 时域最小值 F9 低频对应最小幅值最小值 F16 高频对应最大幅值最小值 F23 时频矩阵最小值
    F3 时域均值 F10 低频对应最小幅值均值 F17 高频对应最大幅值均值 F24 时频矩阵均值
    F4 F1-F2 F11 F8-F9 F18 F15-F16 F25 F22-F23
    F5 时域标准差 F12 低频对应最小幅值标准差 F19 高频对应最大幅值标准差 F26 时频矩阵标准差
    F6 时域偏度 F13 低频对应最小幅值偏度 F20 高频对应最大幅值偏度 F27 时频矩阵偏度
    F7 时域峭度 F14 低频对应最小幅值峭度 F21 高频对应最大幅值峭度 F28 时频矩阵峭度
    下载: 导出CSV 
    | 显示表格

    将AWHSAL的性能与基于信息性度量的主动学习算法,包括最大熵(Entropy)[16]、BvSB[16]和委员会查询(Query by committee,QBC)[15]进行了比较,实验结果如图 3所示,其中Random曲线表示每次迭代随机选取样本加入标注集中进行训练。其准确率仅为在第20次迭代之前,AWHSAL的准确率上升速度最快。而在最终的准确率上,AWHSAL方法已经达到98.3%的准确率,BvSB方法的准确率略低于AWHSAL,其准确率为97.7%,Entropy仅为79.6%,而QBC方法表现最差,其准确率仅为57.5%。由此可以得出,AWHSAL相比于其他基于信息性度量的主动学习算法在具有大量类别的多类分类任务中表现突出,同时也体现出AWHSAL继承了基于信息性度量的主动学习算法在主动学习后期阶段表现优异的特性。

    图  3  AWHSAL与基于信息性度量策略对比
    Figure  3.  AWHSAL compared with informativeness-based strategies

    将AWHSAL的性能与基于代表性策略,包括多样性(Diversity)[18]、密度(Density)[19]和特征空间覆盖(Coreset)[17]进行对比,准确率曲线如图 4所示。基于代表性度量的主动学习方法在前5次迭代训练中表现较好,但从第6次迭代开始,大部分基于代表性度量的主动学习算法的准确率曲线趋于平缓。该结果表明:AWHSAL一直处于上升的趋势直至第30次迭代才趋于平缓。说明AWHSAL保留了基于代表性度量的主动学习方法在主动学习初期对分类器的性能有一定提升的能力。

    图  4  AWHSAL与基于代表性度量策略对比
    Figure  4.  AWHSAL compared with representative-based strategies

    将AWHSAL的性能与以前提出的4种混合策略方法进行比较,包括SSAL[21]、SHSAL[20]、PHSAL[20]、Adaptive Active Learning(AAL)[23]和Reinforced Active Learning Formulation(RALF)[22],实验结果如图 5所示。虽然RALF在最终准确率上与AWHSAL相差不大,但是其在前20次迭代上对模型准确率提升幅度没有AWHSAL大。在最终的准确率上,AWHSAL比其他方法高出约0.4%~33.4%。同时,AWHSAL在第11次迭代时即可达到90%以上的准确率,而RALF在第25次迭代才达到90%以上准确率,其余的对比算法直至迭代结束都没有达到90%准确率。综上所述,本文所提出的方法选择的样本比其他混合策略方法更有价值,更快让分类器到达较高的性能。

    图  5  AWHSAL与混合策略方法对比
    Figure  5.  AWHSAL compared with hybrid strategy methods

    消融实验将AWHSAL算法与BvSB、USELMC、BvSB+USELMC进行对比(图 6)。

    图  6  AWHSAL消融实验
    Figure  6.  AWHSAL ablation study

    BvSB+USELMC表示将这两种策略利用经验值加权融合后的精度曲线,USELMC表示只使用USELMC做代表性策略时的精度曲线。在没有自适应权重的分配下,单纯地将两种策略结合的方法表现明显劣于AWHSAL。AWHSAL算法有效改善了策略融合时权重分配问题,成功结合两种不同选择策略的优点,同时相较于单准则方法更快让分类器到达较高的性能。

    为了最小化标记CPQDs的成本,将主动学习与CPQDs识别相结合,并使用自适应权重方法将包括BvSB和USELM的两种样本选择策略进行了组合,其中Laplacian极限学习机的计算复杂度为O(M3+M2mh)。实验表明:由此产生的混合策略主动学习方法的性能优于其他方法。

    本文进行了比较研究,以展示提出的算法的卓越性能。一方面,将自适应权重混合策略主动学习方法与其他单一策略的主动学习方法进行比较,发现自适应权重混合策略主动学习中使用的混合策略能够有效弥补单一策略的劣势。另一方面,将自适应权重混合策略主动学习方法与现有的混合策略主动学习方法进行比较。结果表明:本文所提出的方法更适用于CPQDs分类,而且需要的调整参数比其他方法少。

  • 图  1   基于AWHSAL的CPQDs动识别框架

    Figure  1.   CPQDs identification framework based on AWHSAL

    图  3   AWHSAL与基于信息性度量策略对比

    Figure  3.   AWHSAL compared with informativeness-based strategies

    图  4   AWHSAL与基于代表性度量策略对比

    Figure  4.   AWHSAL compared with representative-based strategies

    图  5   AWHSAL与混合策略方法对比

    Figure  5.   AWHSAL compared with hybrid strategy methods

    图  6   AWHSAL消融实验

    Figure  6.   AWHSAL ablation study

    表  1   16种不同电能质量扰动类型

    Table  1   16 different types of CPQDs

    类别 扰动类型 类别 扰动类型
    C1 电压暂降 C9 电压下降+闪烁
    C2 电压暂升 C10 电压上升+谐波
    C3 电压中断 C11 电压上升+闪烁
    C4 瞬态干扰 C12 电压中断+谐波
    C5 电压振荡 C13 电压中断+闪烁
    C6 谐波 C14 电压下降+谐波+闪烁
    C7 电压闪烁 C15 电压下降+谐波+闪烁
    C8 电压下降+谐波 C16 电压中断+谐波+闪烁
    下载: 导出CSV

    表  2   CPQDs特征集

    Table  2   The feature sets of CPQDs

    类别 特征类型 类别 特征类型 类别 特征类型 类别 特征类型
    F1 时域最大值 F8 低频对应最小幅值最大值 F15 高频对应最大幅值最大值 F22 时频矩阵最大值
    F2 时域最小值 F9 低频对应最小幅值最小值 F16 高频对应最大幅值最小值 F23 时频矩阵最小值
    F3 时域均值 F10 低频对应最小幅值均值 F17 高频对应最大幅值均值 F24 时频矩阵均值
    F4 F1-F2 F11 F8-F9 F18 F15-F16 F25 F22-F23
    F5 时域标准差 F12 低频对应最小幅值标准差 F19 高频对应最大幅值标准差 F26 时频矩阵标准差
    F6 时域偏度 F13 低频对应最小幅值偏度 F20 高频对应最大幅值偏度 F27 时频矩阵偏度
    F7 时域峭度 F14 低频对应最小幅值峭度 F21 高频对应最大幅值峭度 F28 时频矩阵峭度
    下载: 导出CSV
  • [1]

    LIANG X D. Emerging power quality challenges due to integration of renewable energy sources[C]. 2016 IEEE Industry Applications Society Annual Meeting, Portland: 2016.

    [2] 黄建明, 瞿合祚, 李晓明. 基于短时傅里叶变换及其谱峭度的电能质量混合扰动分类[J]. 电网技术, 2016, 40(10): 3184-3191.

    HUANG J M, QU H Z, LI X M. Classification for hybrid power quality disturbance based on STFT and its spectral kurtosis[J]. Power System Technology, 2016, 40(10): 3184-3191.

    [3] 徐艳春, 高永康, 李振兴, 等. 基于VMD初始化S变换的混合动力系统电能质量扰动检测与分类[J]. 中国电机工程学报, 2019, 39(16): 4786-4798.

    XU Y C, GAO Y K, LI Z X, et al. Power quality disturbance detection and classification of hybrid power system based on VMD initialization S-transform[J]. Proceedings of the CSEE, 2019, 39(16): 4786-4798.

    [4] 吴建章, 梅飞, 郑建勇, 等. 基于改进经验小波变换和XGBoost的电能质量复合扰动分类[J]. 电工技术学报, 2022, 37(1): 232-243;253.

    WU J Z, MEI F, ZHENG J Y, et al. Recognition of multiple power Quality disturbances based on modified empirical wavelet transform and XGBoost[J]. Transactions of China Electrotechnical Society, 2022, 37(1): 232-243;253.

    [5] 郑戍华, 张宁宁, 王向周. 基于提升小波和Hilbert变换的暂态电能质量检测[J]. 北京理工大学学报, 2019, 39(2): 162-168.

    ZHENG X H, ZHANG N N, WANG X Z. A lifting wavelet and Hilbert transform fusion method for transient power quality detection[J]. Transactions of Beijing Institute of Technology, 2019, 39(2): 162-168.

    [6] 薛正爱, 黄陈蓉, 张建德, 等. 基于小波变换和极限学习机的电能质量扰动分类[J]. 电工技术, 2020(15): 41-43.
    [7]

    BISWAL M, DASH P. Detection and characterization of multiple power quality disturbances with a fast S-transform and decision tree based classifier[J]. Digital Signal Processing, 2013, 23(4): 1071-1083. doi: 10.1016/j.dsp.2013.02.012

    [8]

    KUMAR R, SINGH B, SHAHANI D T, et al. Al-haddad, recognition of power-quality disturbances using S-transform-based ANN classifier and rule-based decision tree[J]. IEEE Transactions on Industry Applications, 2015, 51(2): 1249-1258. doi: 10.1109/TIA.2014.2356639

    [9]

    SHAMACHURN H. Assessing the performance of a modified S-transform with probabilistic neural network, support vector machine and nearest neighhour classifiers for single and multiple power quality disturbances identification[J]. Neural Computing and Applications, 2019, 31(4): 1041-1060. doi: 10.1007/s00521-017-3136-z

    [10]

    LUO Y, LI K, LI Y, et al. Three-layer bayesian network for classification of complex power quality disturbances[J]. IEEE Transactions on Industrial Informatics, 2018, 14(9): 3997-4006. doi: 10.1109/TII.2017.2785321

    [11] 许立武, 李开成, 肖贤贵, 等. 基于深度前馈网络的电能质量复合扰动识别[J]. 电测与仪表, 2020, 57(1): 62-69;130.
    [12]

    DASH P K, PRASAD E, JALLI R K, et al. Multiple power quality disturbances analysis in photovoltaic integrated direct current microgrid using adaptive morphological filter with deep learning algorithm[J]. Applied Energy, 2022, 309: 118454/1-17.

    [13]

    ZHAO Y, SHI Z, ZHANG J, et al. A novel active learning framework for classification: using weighted rank aggregation to achieve multiple query criteria[J]. Pattern Recognition, 2019, 93: 581-602. doi: 10.1016/j.patcog.2019.03.029

    [14]

    AGRAWAL A, TRIPATHI S, VARDHAN M. Active learning approach using a modified least confidence sampling strategy for named entity recognition[J]. Progress in Artificial Intelligence, 2021, 10(2): 113-128. doi: 10.1007/s13748-021-00230-w

    [15]

    FREUND Y, SEUNG H S, SHAMIR E, et al. Selective sampling using the query by committee algorithm[J]. Machine Learning, 1997, 28(2/3): 133-168. doi: 10.1023/A:1007330508534

    [16]

    JOSHI A J, PORIKLI F, PAPANIKOLOPOULOS N. Multi-class active learning for image classification[C]//2009 IEEE Conference on Computer Vision and Pattern Recognition. Miami: IEEE, 2009, 2372-2379.

    [17]

    SENER O, SAVARESE S. Active learning for convolutional neural networks: a core-set approach[C]//International Conference on Learning Representations. Vancouver: OpenReview. net, 2018.

    [18]

    CAI L, XU X, ZHANG L, et al. Exploring spatial diversity for region-based active learning[J]. IEEE Transactions on Image Processing, 2021, 30: 8702-8712. doi: 10.1109/TIP.2021.3120041

    [19]

    SOUZA P V D C, LUGHOFER E. Online active learning for an evolving fuzzy neural classifier based on data density and specificity[J]. Neurocomputing, 2022, 512: 269-286.

    [20]

    SHEN D, ZHANG J, SU J, et al. Multi-criteria-based active learning for named entity recognition[C]//Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics-ACL'04. Barcelona: Association for Computational Linguistics, 2004: 589-596.

    [21]

    LUGHOFER E. Hybrid active learning for reducing the annotation effort of operators in classification systems[J]. Pattern Recognition, 2012, 45(2): 884-896. doi: 10.1016/j.patcog.2011.08.009

    [22]

    EBERT S, FRITZ M, SCHIELE B. RALF: a reinforced active learning formulation for object class recognition[C]//IEEE Conference on Computer Vision and Pattern Recognition. Providence: IEEE, 2012.

    [23]

    LI X, GUO Y. Adaptive active learning for image classification[C]//Computer Vision and Pattern Recognition (CVPR). Portland: IEEE, 2013.

    [24]

    XU X, SHAN D, LI S, et al. Multi-label learning method based on ML-RBF and laplacian ELM[J]. Neurocomputing, 2019, 331: 213-219. doi: 10.1016/j.neucom.2018.11.018

图(5)  /  表(2)
计量
  • 文章访问数:  53
  • HTML全文浏览量:  9
  • PDF下载量:  44
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-09-04
  • 网络出版日期:  2024-02-26
  • 刊出日期:  2023-12-24

目录

/

返回文章
返回