Processing math: 0%

基于改进Faster R-CNN的电力检修工程智慧监测

唐小煜, 罗杰豪, 黄声勇

唐小煜, 罗杰豪, 黄声勇. 基于改进Faster R-CNN的电力检修工程智慧监测[J]. 华南师范大学学报(自然科学版), 2024, 56(4): 60-67. DOI: 10.6054/j.jscnun.2024051
引用本文: 唐小煜, 罗杰豪, 黄声勇. 基于改进Faster R-CNN的电力检修工程智慧监测[J]. 华南师范大学学报(自然科学版), 2024, 56(4): 60-67. DOI: 10.6054/j.jscnun.2024051
TANG Xiaoyu, LUO Jiehao, HUANG Shengyong. Intelligent Monitoring of Power Maintenance Engineering Based on Improved Faster R-CNN[J]. Journal of South China Normal University (Natural Science Edition), 2024, 56(4): 60-67. DOI: 10.6054/j.jscnun.2024051
Citation: TANG Xiaoyu, LUO Jiehao, HUANG Shengyong. Intelligent Monitoring of Power Maintenance Engineering Based on Improved Faster R-CNN[J]. Journal of South China Normal University (Natural Science Edition), 2024, 56(4): 60-67. DOI: 10.6054/j.jscnun.2024051

基于改进Faster R-CNN的电力检修工程智慧监测

基金项目: 

国家自然科学基金项目 61371176

广东大学生科技创新培育专项资金(“攀登计划”专项资金)项目 pdjh2022a0131

详细信息
    通讯作者:

    唐小煜,Email: tangxy@scnu.edu.cn

  • 中图分类号: TP183

Intelligent Monitoring of Power Maintenance Engineering Based on Improved Faster R-CNN

  • 摘要:

    提出一种改进Faster R-CNN的目标检测模型用于智能化电力检修工程,构建了电力检修设备的数据集,并对其进行了数据清洗和数据增强。为了提高模型对被物体在遮挡以及复杂背景情况的识别能力,在模型中嵌入了精心设计的ESAM注意力模块,优化了模型的特征提取能力。ESAM注意力模块通过多尺度处理和跨空间学习方法,在保持计算效率的同时,能够更好地捕捉和利用图像特征中的重要信息,从而提高模型的整体性能。设计了多组实验并可视化模型效果,实验结果进一步验证了模型的有效性。该研究对于提高电力检修工作的效率和质量,保障电力系统的安全运行,从而支撑“双碳”目标的实现,具有一定的理论意义和实际价值。

    Abstract:

    An improved Faster R-CNN object detection model is proposed for intelligent power maintenance engineering. A dataset of power maintenance equipment was constructed, along with data cleaning and data augmentation. An attention module designed to optimize feature extraction has been incorporated into the model to enhance recognition of occluded and complex background objects. Through multi-scale processing and cross-space learning methods, the model is able to capture and utilize critical information in the image features while maintaining computational efficiency, thereby improving overall performance. Several experiments were designed and the model effects visualized. The experimental results further validate the effectiveness of the model. This research holds theoretical significance and practical value for enhancing the efficiency and quality of power maintenance work, ensuring the safe operation of power systems, and supporting the realization of the "Dual Carbon" goals.

  • 马尔可夫过程的估计问题是计算机科学、系统工程和数据科学等领域中的一个核心问题[1]。计算个性化网页排序的状态转移矩阵问题[2]、解决电子商务中的排序问题[3]和分析城市出租车或公交车的运行轨迹问题[4-5]等都可归结为马尔可夫过程的估计问题。源于上述问题的马尔可夫过程往往拥有很大的状态空间,但是它们的状态转移矩阵却被证明了是低秩或者近似低秩的矩阵[1]。因此,学者们对低秩马尔可夫过程的状态转移矩阵的估计及其应用问题开展了研究[1, 6-10]

    据我们所知,现有的估计方法都不能保证得到低秩的转移矩阵估计。譬如,ZHANG和WANG[1]利用频率矩阵的经验估计的截断奇异值分解结合非负投影,提出了低秩马尔可夫过程的谱估计方法,并建立了估计的统计误差界,证明了估计误差与极小极大误差的下界相差一个马尔可夫链轨迹长度的对数因子。但是,由于谱估计方法利用了非负投影,导致该文献最后得到的估计矩阵不是低秩的。ZHU等[8]提出了状态转移矩阵的核范数正则罚极大似然估计模型和秩约束极大似然估计模型,并建立了2种模型的统计误差界,证明了估计误差与极小极大误差的下界相差一个马尔可夫链状态空间维数的对数因子。然而,核范数正则优化问题的最优解不一定满足低秩条件,秩约束优化问题的最优解虽能满足秩约束条件,但其求解一般都是NP难。尽管文献[8]设计了一类DC (凸函数的差) 规划算法来近似求解秩约束极大似然估计模型,但不能保证算法的输出是一个低秩矩阵。特别地,该DC规划算法的每一步都需要进行奇异值分解,计算量非常大,因此不适用于大规模的马尔可夫过程估计问题。

    另一方面,误差界研究一直以来都是最优化领域中的重点和难题[11-15]。PANG[11]证明了:凸多面体集合具有全局Lipschitz型误差界; 在一定的约束规范下,一般凸不等式系统具有Lipschitz型误差界; 对一般非凸不等式系统,全局误差界(即使是Hölder型的)都很难成立。目前已有的研究主要是对次解析不等式系统和多项式不等式系统建立了局部Hölder型误差界[14],对矩阵秩约束系统的误差界研究还很少。对于一个有界且其多值函数在原点满足calmness条件的矩阵秩约束系统,BI和PAN[15]得到了该系统的局部和全局Lipschitz型误差界。但是,验证多值函数的calmness条件与建立误差界的难度基本一样。因此,我们需要寻求新的工具来研究矩阵秩约束系统的误差界。

    受上述启发,本文试图寻求一个能够快速获得低秩转移矩阵的方法,以估计大规模的低秩马尔可夫过程。首先,建立秩约束状态转移矩阵集合的局部Lipschitz型误差界,并寻求该集合高质量的近似投影方法; 然后,提出一种低秩马尔可夫过程状态转移矩阵的低秩谱估计算法(LRSEA),并进行数值实验。

    本节为秩约束状态转移矩阵集合建立局部Lipschitz型误差界。首先,给出本文的记号。

    (1) 记\boldsymbol{I} \in \mathbb{R}^{d \times d}、\boldsymbol{E} \in \mathbb{R}^{d \times d}、\boldsymbol{e} \in \mathbb{R}^d分别为单位矩阵、元素全为1的矩阵、元素全为1的向量。

    (2) 对于\boldsymbol{P} \in \mathbb{R}^{d \times d},定义\|\boldsymbol{P}\|_{\infty}: =\max \limits_{i, j}\left|P_{i j}\right|为无穷范数,\|\boldsymbol{P}\|_F: =\sqrt{\sum\limits_{i=1}^d \sum\limits_{j=1}^d P_{i j}^2}为Frobenius范数。

    (3) 秩约束状态转移矩阵集合定义为:\varPi: =\{\boldsymbol{P} \in \left.\mathbb{R}^{d \times d}: \operatorname{rank}(\boldsymbol{P}) \leqslant r, \boldsymbol{P e}=\boldsymbol{e}, P_{i j} \geqslant 0, 1 \leqslant i, j \leqslant d\right\},其中r \in [1, d-1]是一个给定整数。对于\boldsymbol{Z} \in \mathbb{R}^{d \times d},定义Z到集合Π的距离为:

    \operatorname{dist}(\boldsymbol{Z}, \varPi):=\min \left\{\|\boldsymbol{Z}-\boldsymbol{P}\|_F: \boldsymbol{P} \in \varPi\right\} 。

    (4) 给定\boldsymbol{x} \in \mathbb{R}^d,定义l1范数为\|\boldsymbol{x}\|_1:=\sum\limits_{i=1}^d\left|x_i\right|,无穷范数为\|\boldsymbol{x}\|_{\infty}: =\max \limits_i\left|x_i\right|,记\operatorname{diag}(\boldsymbol{x}) \in \mathbb{R}^{d \times d}是第i个对角元为xi(i=1, 2, …, d)的对角矩阵。

    (5) 定义秩r约束矩阵集合为\mathcal{R}: =\left\{\boldsymbol{Z} \in \mathbb{R}^{d \times d}\right. : \operatorname{rank}(\boldsymbol{Z}) \leqslant r\}。对任意\boldsymbol{P} \in \mathbb{R}^{d \times d},定义

    \varUpsilon_{\mathcal{R}}(\boldsymbol{P}):=\sum\limits_{i=1}^r \sigma_i(\boldsymbol{P}) u_i(\boldsymbol{P}) v_i(\boldsymbol{P})^{\mathrm{T}},

    其中,\sigma_i(\boldsymbol{P})(i=1, 2, \cdots, r)P的第i个最大奇异值,u_i(\boldsymbol{P}) \in \mathbb{R}^d、v_i(\boldsymbol{P}) \in \mathbb{R}^d分别是σi(P)对应的左、右奇异向量。众所周知,在Frobenius范数距离意义下,\varUpsilon_{\mathcal{R}}(\boldsymbol{P})P\mathcal{R}上的一个投影矩阵。

    (6) 定义集合\varOmega: =\left\{\boldsymbol{Z} \in \mathbb{R}^{d \times d}: Z \boldsymbol{e}=\boldsymbol{e}, \beta / d \geqslant Z_{i j} \geqslant\right. \alpha / d, 1 \leqslant i, j \leqslant d\},其中\alpha \in(0, 1)\beta \in(1, d)是给定常数。

    下面给出建立矩阵\boldsymbol{P} \in \varOmega 与投影矩阵\varUpsilon_{\mathcal{R}}(\boldsymbol{P})之间关系的引理。

    引理1   令\gamma \in(0, 1)是给定常数。任取\boldsymbol{P} \in \varOmega,若\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_i \geqslant \gamma(i=1, 2, \cdots, d),则有:

    \|\boldsymbol{I}-\boldsymbol{D}\|_{\infty} \leqslant \frac{d}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}, (1)
    \left\|\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \frac{d\left(\|\boldsymbol{P}\|_{\infty}+\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}\right)}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}, (2)
    \left|\min \left(0, \min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j\right)\right| \leqslant \frac{1}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}, (3)

    其中\boldsymbol{D}: =\operatorname{diag}\left(\frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_1}, \cdots, \frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_d}\right)

    证明   由于(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})e)jγ>0 (j=1, 2, …, d)且Pe=e,利用\langle\boldsymbol{x}, \boldsymbol{y}\rangle \leqslant\|\boldsymbol{x}\|_1\|\boldsymbol{y}\|_{\infty}\left(\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^d\right),有

    \|\boldsymbol{I}-\boldsymbol{D}\|_{\infty}=\max \limits_j\left|1-\frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j}\right|=\\ \max \limits_j \frac{\left|\left(\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j-1\right|}{\left(\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j} \leqslant\\ \frac{1}{\gamma} \max \limits_j\left|\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j-(\boldsymbol{P} \boldsymbol{e})_j\right|=\\ \frac{1}{\gamma}\left\|\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right) \boldsymbol{e}\right\|_{\infty} \leqslant \frac{d}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} 。

    因此,不等式(1)成立。利用不等式(1)、ID是对角矩阵以及d\|\boldsymbol{P}\|_{\infty} \geqslant 1>\gamma,可得

    \begin{aligned} &\left\|\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}=\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})+(\boldsymbol{I}-\boldsymbol{D}) \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\|\boldsymbol{I}-\boldsymbol{D}\|_{\infty}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\frac{d\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}}{\gamma}\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(P)\right\|_{\infty} \leqslant \\ &\frac{d\left(\|\boldsymbol{P}\|_{\infty}+\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}\right)}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \circ \end{aligned}

    于是,不等式(2)成立。当0 \leqslant \min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j时,不等式(3)显然成立。当\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_j < 0时, 由\|\boldsymbol{D}\|_{\infty} \leqslant 1 / \gamma, \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j < 0\boldsymbol{P}_{i j} \geqslant 0, 1 \leqslant i, j \leqslant d,可得

    \begin{array}{r} 0<-\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j \leqslant-\|\boldsymbol{D}\|_{\infty} \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j= \\ \|\boldsymbol{D}\|_{\infty}\left|\min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j\right| \leqslant \frac{1}{\gamma}\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}, \end{array}

    不等式(3)成立。证毕。

    \gamma>0, c \in(0, 1)为给定常数。对任意矩阵\boldsymbol{P} \in \varOmega, 定义如下矩阵

    \left\{\begin{array}{l} \operatorname{diag}(\tilde{\boldsymbol{v}}) \widetilde{\boldsymbol{P}}\left(\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}, \left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) e\right)_j \geqslant \gamma, \right. \\ \left.\frac{\beta}{c} \geqslant\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j \geqslant c \alpha, 1 \leqslant j \leqslant d\right), \\ \frac{1}{d} \boldsymbol{E}\left(\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}>10\|\boldsymbol{P}\|_{\infty} \text { 或 } \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) e\right)_j <\gamma\right) \text { 或 } \\ \left.\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j <c \alpha \text { 或 } \max \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j>\frac{\beta}{c}\right), \end{array}\right. (4)

    其中,\boldsymbol{D}: =\operatorname{diag}\left(\frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_1}, \cdots, \frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_d}\right), \tilde{\boldsymbol{v}}= \left(\frac{1}{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_1}, \frac{1}{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_2}, \cdots, \frac{1}{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_d}\right)^{\mathrm{T}}, \widetilde{\boldsymbol{P}}=\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{t} \boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P}), \boldsymbol{t} \in \mathbb{R}^d,定义为t_i=\min \left(0, \min \limits_{1 \leqslant j \leqslant d} \frac{\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_{i j}}{\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j}\right)(i=1, 2, \cdots, d)

    下面给出建立集合Π的局部Lipschitz型误差界的命题。

    命题1   令\gamma \in(0, 1 / 2], c \in(0, (\sqrt{5}-1) / 2), \beta \geqslant 1 \geqslant \alpha>0是给定常数。任取\boldsymbol{P} \in \varOmega,有\widetilde{\boldsymbol{P}}_{\varPi} \in \varPi,且

    \frac{1}{d} \cdot\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{I I}\right\|_F \leqslant \frac{11 \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right)\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}。 (5)

    证明   设\boldsymbol{P} \in \varOmega, 下面分5种情况证明。

    (1) 假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}, \left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j \geqslant \gamma\beta / c \geqslant\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j \geqslant c \alpha(1 \leqslant j \leqslant d)。由\widetilde{\boldsymbol{P}}t_i的定义,可得\widetilde{P}_{i l}=\left(\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_{i l}-t_i\left(\boldsymbol{e} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_l \geqslant 0 (1 \leqslant i, l \leqslant d)。注意-t_i\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_l \geqslant 0,可得\widetilde{P}_{i l} \geqslant\left(\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_{i l}(1 \leqslant i, l \leqslant d),因此(\widetilde{\boldsymbol{P}} \boldsymbol{e})_i \geqslant \left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_i=1(i=1, 2, \cdots, d),进而得到0 < \tilde{v}_i \leqslant 1(i=1, 2, \cdots, d)。定义\widetilde{\boldsymbol{P}}_{\varPi}=\operatorname{Diag}(\tilde{\boldsymbol{v}}) \widetilde{\boldsymbol{P}},由\operatorname{rank}(\widetilde{\boldsymbol{P}}) \leqslant r,可得\operatorname{rank}\left(\widetilde{\boldsymbol{P}}_{\varPi}\right) \leqslant r, \widetilde{\boldsymbol{P}}_{\varPi} \geqslant 0, \widetilde{\boldsymbol{P}}_{\varPi} \boldsymbol{e}=\boldsymbol{e},即\widetilde{\boldsymbol{P}}_{\varPi} \in \varPi。根据假设\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} Y_{\mathcal{R}}(\boldsymbol{P})\right)_j \geqslant c \alpha(1 \leqslant j \leqslant d),可得\frac{\left|\min \left(0, \min _{1 \leqslant i \leqslant d}\left(\boldsymbol{D} Y_{\mathcal{R}}(\boldsymbol{P})\right)_i\right)\right|}{c \alpha} \geqslant\|\boldsymbol{t}\|_{\infty}。利用假设\beta / c \geqslant\left\|\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty},可得

    \left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ \frac{\left|\min \left(0, \min _{1 \leqslant i \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_i\right)\right|}{c \alpha}\left\|\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ \frac{\beta\left|\min \left(0, \min _{1 \leqslant i \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_i\right)\right|}{c^2 \alpha}。 (6)

    由不等式(6)、\|\boldsymbol{D}\|_{\infty} \leqslant 1 / \gamma, \left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|\boldsymbol{P}_I=\operatorname{Diag}(\widetilde{\boldsymbol{v}}) \widetilde{\boldsymbol{P}},可得

    \begin{aligned} &\left\|\widetilde{\boldsymbol{P}}_{\varPi}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant\left\|(\operatorname{Diag}(\tilde{\boldsymbol{v}})-\boldsymbol{I}) \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+ \\ &\left\|\operatorname{Diag}(\tilde{\boldsymbol{v}})\left(\widetilde{\boldsymbol{P}}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)\right\|_{\infty} \leqslant \max \limits_j\left|1-\frac{1}{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_j}\right|\|\boldsymbol{D}\|_{\infty} \times \\ &\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\|\tilde{\boldsymbol{v}}\|_{\infty}\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \frac{\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \times}{\gamma} \times \\ &\max \limits_j\left|\frac{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_j-\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j}{\| \widetilde{\boldsymbol{P}} \boldsymbol{e})_j}\right|+\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\frac{\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}}{\gamma} \max \limits_j\left|\left(\left(\widetilde{\boldsymbol{P}}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right) \boldsymbol{e}\right)_j\right|+\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\frac{d\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}}{\gamma}\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\frac{11 d\|\boldsymbol{P}\|_{\infty}}{\gamma} \cdot \frac{\beta\left|\min \left(0, \min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j\right)\right|}{c^2 \alpha}。 \end{aligned} (7)

    因此,利用d\|\boldsymbol{P}\|_{\infty} \leqslant \beta及不等式(2)、(3)、(7),可得

    \begin{aligned} \frac{1}{d} \cdot\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F \leqslant\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_{\infty} \leqslant\left\|\widetilde{\boldsymbol{P}}_{\varPi}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\\ \left\|\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \frac{11 \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right)\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}, \end{aligned}

    即不等式(5)成立。

    假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}>10\|\boldsymbol{P}\|_{\infty}\min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right) < \gamma\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right) < c \alpha\max \limits_{1 \leqslant j \leqslant d}\left(e^1 \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)>\beta / c, 由式(4)可知\widetilde{\boldsymbol{P}}_{\varPi}=\boldsymbol{E} / d。显然1\widetilde{\boldsymbol{P}}_{\varPi} \in \varPi

    \frac{1}{d} \cdot\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F \leqslant\left\|\boldsymbol{P}-\frac{1}{d} \boldsymbol{E}\right\|_{\infty} \leqslant \max \left(\frac{1}{d}, \|\boldsymbol{P}\|_{\infty}\right) \leqslant\|\boldsymbol{P}\|_{\infty} 。

    (2) 假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}>10\|\boldsymbol{P}\|_{\infty}。显然

    \left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \geqslant 9\|\boldsymbol{P}\|_{\infty} \geqslant \frac{1}{d}\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F,

    不等式(5)成立。

    (3) 假设\left\|\varUpsilon_{\mathcal{R}}(P)\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}\min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j < \gamma。由于\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e} 中存在小于\gamma 的元素,不妨设\left(\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_i < \gamma_{\circ}(\boldsymbol{P e})_i=1dP\varUpsilon_{\mathcal{R}}(\boldsymbol{P})d\|\boldsymbol{P}\|_{\infty} \leqslant \beta,可得

    d\left\|\boldsymbol{P}-\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \geqslant\left\|\left(\boldsymbol{P}-\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P})\right) \boldsymbol{e}\right\|_{\infty} \geqslant$ $(\boldsymbol{P e})_i-\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_i \geqslant 1-\gamma \geqslant 0.5

    \begin{gathered} \frac{1}{d}\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_I\right\|_F \leqslant\|\boldsymbol{P}\|_{\infty} \leqslant 2 d\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}\|\boldsymbol{P}\|_{\infty} \leqslant \\ 2 \beta\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \circ \end{gathered}

    由此可得不等式(5)成立。

    (4) 假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}, \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j \geqslant \gamma\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right) < c \alpha。由于\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})中存在小于c \alpha的元素,不防设\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_i < c \alpha < \alpha。由\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{P}\right)_i \geqslant \alpha,可得

    \begin{gathered} d\left\|\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \geqslant\left\|\boldsymbol{e}^{\mathrm{T}}\left(\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)\right\|_{\infty} \geqslant \\ \quad\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{P}\right)_i-\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_i \geqslant \alpha-c \boldsymbol{\alpha}_{\circ} \end{gathered} (8)

    由不等式(8)、d\|\boldsymbol{P}\|_{\infty} \leqslant \beta 及引理1,可得

    \begin{aligned} &\frac{1}{d}\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F \leqslant\|\boldsymbol{P}\|_{\infty} \leqslant \\ &\|\boldsymbol{P}\|_{\infty} \frac{d}{\alpha(1-c)} \cdot \frac{11 \beta}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \leqslant \\ &\frac{11 \beta^2}{(1-c) \alpha \gamma}\left\|\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \circ \end{aligned}

    c \in(0, (\sqrt{5}-1) / 2),可得不等式(5)成立。

    (5) 假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}, \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j \geqslant \gamma。由于\max \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j>\beta / c_{\text {。}} 由于\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})中存在大于β/c的元素,不妨设\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_i>\beta / c。由\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{P}\right)_i \leqslant \beta,可得

    \begin{aligned} d \| & \boldsymbol{P}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\left\|_{\infty} \geqslant\right\| \boldsymbol{e}^{\mathrm{T}}\left(\boldsymbol{P}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right) \|_{\infty} \geqslant \\ &\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_i-\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{P}\right)_i \geqslant \frac{\beta}{c}-\beta=\frac{\beta(1-c)}{c} 。 \end{aligned} (9)

    由不等式(9)、d\|\boldsymbol{P}\|_{\infty} \leqslant \beta及引理1, 可得

    \begin{aligned} &\frac{1}{d}\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F \leqslant\|\boldsymbol{P}\|_{\infty} \leqslant \\ &\|\boldsymbol{P}\|_{\infty} \frac{c d}{\beta(1-c)} \cdot \frac{11 \beta}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \leqslant \\ &\frac{11 \beta^2}{(1-c) \gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \leqslant \end{aligned}

    c \in(0, (\sqrt{5}-1) / 2),可得不等式(5)成立。证毕。

    由于\widetilde{\boldsymbol{P}}_{\varPi} \in \varPi,命题1给出了任意\boldsymbol{P} \in \varOmega到集合Π的距离估计,即

    \operatorname{dist}(\boldsymbol{P}, \varPi) \leqslant\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi I}\right\|_F \leqslant \frac{11 d \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right)\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} 。

    同时,在集合Π中找到了低秩状态转移矩阵\widetilde{\boldsymbol{P}}_{\varPi I},使得P\widetilde{\boldsymbol{P}}_{\varPi}的距离满足误差界不等式。所以,\widetilde{\boldsymbol{P}}_I可以看成是\boldsymbol{P} \in \varOmega 在集合Π上的近似投影矩阵。

    考虑d (≥2)个状态{S1, S2, …, Sd}的离散时间马尔可夫过程,假设其状态转移矩阵为\overline{\boldsymbol{P}} \in \mathbb{R}^{d \times d},频率矩阵为\overline{\boldsymbol{Q}} \in \mathbb{R}^{d \times d},且满足\operatorname{rank}(\overline{\boldsymbol{P}})=\operatorname{rank}(\overline{\boldsymbol{Q}}) \leqslant r \ll d。源于现实生活当中的一些马尔可夫过程已经被证明是低秩或者近似低秩的,比如交通网络、网页及电子商务排序[1-7]。本文旨在通过轨迹长为n+1的马尔可夫链{X0, X1, …, Xn}来估计其状态转移矩阵\overline{\boldsymbol{P}}

    首先给出本文的假设。

    假设1   存在常数\beta \in[1, d), \alpha \in(0, 1],使得:

    (1) \forall 1 \leqslant i, j \leqslant d, \alpha / d \leqslant \bar{P}_{i j} \leqslant \beta / d;

    (2) \left\{X_0, X_1, \cdots, X_n\right\}是遍历马尔可夫链,平稳分布为\boldsymbol{\pi} \in \mathbb{R}^d,满足\pi_i \geqslant \alpha / d(i=1, 2, \cdots, d), 其中\pi_i是向量\boldsymbol{\pi}的第i个元素。

    注意到文献[1]的谱估计矩阵虽然不是低秩的,但其是一个状态转移矩阵。因此,以谱估计矩阵为基础,利用式(4)计算秩-r状态转移矩阵作为\overline{\boldsymbol{P}}的估计,具体见算法1。

    算法1   LRSEA算法

    输入:谱估计矩阵\hat{\boldsymbol{S}} \in\left\{\boldsymbol{Z} \in \mathbb{R}^{d \times d}: Z \boldsymbol{e}=\boldsymbol{e}, Z_{i j} \geqslant 0, 1 \leqslant i, j \leqslant\right. d\}, \alpha \in(0, 1), \beta \in(1, d)r

    第1步:计算修正的谱估计

    for i=1 to d

    if \min \limits_{1 \leqslant j \leqslant d} \hat{S}_{i j} <\frac{\alpha}{d}

    n_{+}=\sum\limits_{j=1}^d \max \left(\frac{\alpha}{d}-\hat{S}_{i j}, 0\right); n_{-}=1-\alpha+n_{+};

    for j=1 to d

    \widetilde{S}_{i j}=\max \left(\hat{S}_{i j}-\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\frac{\alpha}{d}\right), \frac{\alpha}{d}\right);

    end for

    else

    \tilde{\boldsymbol{S}}(i, : )=\hat{\boldsymbol{S}}(i, : );

    end if

    end for

    for i=1 to d

    if \max \limits_{1 \leqslant j \leqslant d} \widetilde{S}_{i j}>\frac{\beta}{d}

    m_{+}=\sum\limits_{j=1}^d \max \left(\widetilde{S}_{i j}-\frac{\beta}{d}, 0\right); m_{-}=m_{+}+\beta-1 ;

    for j=1 to d

    S_{i j}=\min \left(\widetilde{S}_{i j}+\frac{m_{+}}{m_{-}}\left(\frac{\beta}{d}-\widetilde{S}_{i j}\right), \frac{\beta}{d}\right)

    end for

    else

    \boldsymbol{S}(i, : )=\widetilde{\boldsymbol{S}}(i, : );

    end if

    end for

    第2步:令\boldsymbol{P}=\boldsymbol{S}, \gamma \in(0, 1 / 2], c \in(0, (\sqrt{5}-1) / 2),由式(4)得到\overline{\boldsymbol{P}}的低秩谱估计\widetilde{\boldsymbol{S}}_{\varPi}

    由于LRSEA算法产生的估计矩阵\tilde{\boldsymbol{S}}_{\varPi} \in \varPi是一个满足低秩约束条件的状态转移矩阵,因此称其为低秩谱估计算法。可以预见,由于LRSEA算法可以满足低秩性要求,其有效性将高于现有的谱估计方法。为了建立LRSEA算法的理论保证,定义马尔可夫链的\frac{1}{4}-混合时间[16]

    \tau:=\min \left\{k: \max \limits_{1 \leqslant i \leqslant d} \frac{1}{2}\left\|(\overline{\boldsymbol{P}})^k(i, :)-\boldsymbol{\pi}^{\mathrm{T}}\right\|_1 \leqslant \frac{1}{4}\right\}。

    定理1   定义\bar{r}: =\|\overline{\boldsymbol{Q}}\|_F^2 / \sigma_r^2(\overline{\boldsymbol{Q}}),其中\sigma_r(\overline{\boldsymbol{Q}})\overline{\boldsymbol{Q}}的第r个最大奇异值,且记\kappa=d^2\|\overline{\boldsymbol{Q}}\|_{\infty}。若假设1成立,\tilde{S}, \boldsymbol{S}, \tilde{\boldsymbol{S}}_I \in \mathbb{R}^{d \times d}由LRSEA算法产生,则有:

    (a) S \in \varOmega

    \|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1(1 \leqslant i \leqslant d)

    (b) 令C_1=\frac{11 \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right) \sqrt{d}+1。存在常数C,使得

    E \frac{1}{d}\left\|\tilde{\boldsymbol{S}}_{\varPi}-\overline{\boldsymbol{P}}\right\|_F \leqslant C_1 \sqrt{\frac{C \bar{r} d \log ^2(n)}{n} \cdot \frac{\kappa^3 \tau}{\alpha^2}},

    其中E表示数学期望。

    证明   (a)由算法1,易证n_{-}=\sum\limits_{j=1}^d \max \left(\hat{S}_{i j}-\frac{\alpha}{d}, 0\right), m_{-}=\sum\limits_{j=1}^d \max \left(\frac{\beta}{d}-\tilde{S}_{i j}, 0\right)。由于\alpha < 1,所以n_{-}>n_{+} \geqslant 0。注意到\hat{\boldsymbol{S}} \in\left\{\boldsymbol{Z} \in \mathbb{R}^{d \times d}: Z \boldsymbol{e}=\boldsymbol{e}, Z_{i j} \geqslant 0, 1 \leqslant i, j \leqslant d\right\}。若\min \limits_{1 \leqslant j \leqslant d} S_{i j} \geqslant \alpha / d,则\tilde{\boldsymbol{S}}(i, j)=\hat{\boldsymbol{S}}(i, j) \geqslant \alpha / d(j=1, 2, \cdots, d)\tilde{\boldsymbol{S}}(i, : ) \boldsymbol{e}=1。若\min \limits_{1 \leqslant j \leqslant d} \hat{S}_{i j} < \alpha / d,利用n_{-}> n_{+} \geqslant 0\hat{S}_{i j} \leqslant \alpha / d 时, 有\tilde{S}_{i j}=\alpha / d; 当\hat{S}_{i j}>\alpha / d 时, 有

    \tilde{S}_{i j}=\hat{S}_{i j}-\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\frac{\alpha}{d}\right)>\hat{S}_{i j}-\left(\hat{S}_{i j}-\frac{\alpha}{d}\right)=\frac{\alpha}{d},

    \begin{gathered} \sum\limits_{j=1}^d \tilde{S}_{i j}=\sum\limits_{j: S_{i j} \leqslant \alpha / d} \frac{\alpha}{d}+\sum\limits_{j: S_{i j}>\alpha / d}\left(\hat{S}_{i j}-\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\frac{\alpha}{d}\right)\right)= \\ \sum\limits_{j: S_{i j} \leqslant \alpha / d} \frac{\alpha}{d}+\sum\limits_{j: s_{i j}>\alpha / d} S_{i j}-n_{+}=1 。 \end{gathered}

    因此,可得\alpha / d \leqslant \tilde{S}_{i j}\tilde{\boldsymbol{S}}(i, : ) \boldsymbol{e}=1(i, j=1, \cdots, d)。同理, 可以证明\alpha / d \leqslant S_{i j} \leqslant \beta / d\boldsymbol{S}(i, : ) \boldsymbol{e}=1(i, j= 1, \cdots, d)。因此, S \in \varOmega_{\text {。}}

    \min \limits_{1 \leqslant j \leqslant d} \hat{S}_{i j} \geqslant \alpha / d,由于\tilde{\boldsymbol{S}}(i, : )=\hat{\boldsymbol{S}}(i, : ),有

    \|\tilde{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1=\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|。

    现假设\min \limits_{1 \leqslant j \leqslant d} \hat{S}_{i j} < \alpha / d。利用\alpha / d \leqslant \bar{P}_{i j} \leqslant \beta / d \quad(1 \leqslant i, j \leqslant d), 可得

    \begin{aligned} &\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1=\sum\limits_{j: s_{i j} \leqslant \alpha / d}\left|\hat{S}_{i j}-\bar{P}_{i j}\right|+ \\ &\sum\limits_{j: s_{i j}>\alpha / d}\left|\hat{S}_{i j}-\bar{P}_{i j}\right|=\sum\limits_{j: s_{i j \leqslant} \leqslant \alpha / d}\left|\hat{S}_{i j}-\frac{\alpha}{d}+\frac{\alpha}{d}-\bar{P}_{i j}\right|+ \\ &\sum\limits_{j: S_{i j}>\alpha / d}\left|\bar{S}_{i j}+\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\alpha / d\right)-\bar{P}_{i j}\right| \geqslant \sum\limits_{j: S_{i j} \leqslant \alpha / d}\left|\hat{S}_{i j}-\frac{\alpha}{d}\right|+ \\ &\sum\limits_{j: S_{i j} \leqslant \alpha / d}\left|\frac{\alpha}{d}-\bar{P}_{i j}\right|+\sum\limits_{j: s_{i j}>\alpha / d}\left|\tilde{S}_{i j}-\bar{P}_{i j}\right|- \\ &\sum\limits_{j: S_{i j}>\alpha / d}\left|\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\frac{\alpha}{d}\right)\right|=n_{+}+\sum\limits_{j: s_{i j} \leqslant \alpha / d}\left|\tilde{S}_{i j}-\bar{P}_{i j}\right|+ \\ &\sum\limits_{j: S_{i j}>\alpha / d}\left|\tilde{S}_{i j}-\bar{P}_{i j}\right|-n_{+}=\|\tilde{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_{1 \circ} \end{aligned}

    由上述讨论,可得

    \|\tilde{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1(1 \leqslant i \leqslant d)。

    同理可以证明

    \|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant\|\tilde{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1(1 \leqslant i \leqslant d)。

    所以,

    \|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1(1 \leqslant i \leqslant d)。

    (b) 若假设1成立,则由文献[1]的定理1可知:存在一个常数C,使得

    E \max \limits_{1 \leqslant i \leqslant d}\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant \sqrt{\frac{C \bar{r} d \log ^2(n)}{n} \cdot \frac{\kappa^3 \tau}{\alpha^2}}。

    由(a)部分的结论,可知存在常数C,使得

    E \max \limits_{1 \leqslant i \leqslant d}\|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant \sqrt{\frac{C \bar{r} d \log ^2(n)}{n}\cdot \frac{\kappa^3 \tau}{\alpha^2}} 。 (10)

    由于\boldsymbol{S} \in \varOmega,由命题1可知

    其中C_2=\frac{11 \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right)。利用\varUpsilon_{\mathcal{R}}(S)的定义可得\left\|\boldsymbol{S}-\varUpsilon_{\mathcal{R}}(\boldsymbol{S})\right\|_F \leqslant\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_F。于是

    \begin{aligned} &\frac{1}{d}\left\|\tilde{\boldsymbol{S}}_{\varPi}-\overline{\boldsymbol{P}}\right\|_F \leqslant \frac{1}{d}\left\|\tilde{\boldsymbol{S}}_{\varPi}-\boldsymbol{S}\right\|_F+\frac{1}{d}\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_F \leqslant \\ &C_2\left\|\boldsymbol{S}-\varUpsilon_{\mathcal{R}}(\boldsymbol{S})\right\|_{\infty}+\frac{1}{d}\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_1 \leqslant C_2\left\|\boldsymbol{S}-\varUpsilon_{\mathcal{R}}(\boldsymbol{S})\right\|_F+ \\ &\frac{1}{d}\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_1 \leqslant C_2\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_F+\max \limits_{1 \leqslant i \leqslant d}\|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant \\ &\quad\left(C_2 \sqrt{d}+1\right) \max \limits_{1 \leqslant i \leqslant d}\|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_{10} \end{aligned} (11)

    由不等式(10)、(11)可得定理结论。证毕。

    定理1建立了LRSEA算法产生的估计矩阵与真实状态转移矩阵\overline{\boldsymbol{P}}之间的距离估计。由定理1(b)可知,轨迹长度n越大,估计误差的期望越小。

    在LRSEA算法中,取\gamma=0.01, c=0.02, \alpha=\frac{1}{2} d \times \min \limits_{1 \leqslant i, j \leqslant d} \bar{P}_{i j}, \beta=\min \left(d, 2 d \max \limits_{1 \leqslant i, j \leqslant d} \bar{P}_{i j}\right)。首先,通过人工合成数据实验来比较LRSEA算法、谱估计方法[1]、经验估计方法[17]的效果。然后,利用LRSEA算法与k-均值聚类方法结合来分析纽约曼哈顿岛出租车运行轨迹的公开数据集,揭露该城市的潜在交通模式。所有数值实验都是在配置为英特尔奔腾G4600处理器和CPU主频3.6 GHz的笔记本电脑上,通过运行MATLAB(2019年版本)完成的。

    首先,考虑具有平衡分布的低秩马尔可夫过程估计问题。假设\boldsymbol{U}_0 \in \mathbb{R}^{d \times r}, V_0 \in \mathbb{R}^{d \times r},它们的元素由标准正态分布随机生成。定义矩阵\widetilde{\boldsymbol{U}} \in \mathbb{R}^{d \times r}, \widetilde{\boldsymbol{V}} \in \mathbb{R}^{d \times r} : \widetilde{\boldsymbol{U}}_{[i, i]}=\left(\boldsymbol{U}_0 \odot \boldsymbol{U}_0\right)_{[i, :]} /\left\|\left(\boldsymbol{U}_0\right)_{[i, i]}\right\|_2^2(i=1, \cdots, d), \widetilde{\boldsymbol{V}}_{[:, j]}=\left(\boldsymbol{V}_0 \odot \boldsymbol{V}_0\right)_{[:, j]} /\left\|\left(\boldsymbol{V}_0\right)_{[:, j}\right\|_2^2(j=1, \cdots, r),这里\widetilde{\boldsymbol{U}}_{[i, , ]}表示\widetilde{\boldsymbol{U}}的第i行,\widetilde{\boldsymbol{V}}_{[:, j]} 表示\widetilde{\boldsymbol{V}} 的第j 列, \odot 表示矩阵Hadamard积。定义真实状态转移矩阵为\overline{\boldsymbol{P}}=\widetilde{\boldsymbol{U}} \widetilde{\boldsymbol{V}}^{\mathrm{T}}。本文利用状态转移矩阵\overline{\boldsymbol{P}} 生成状态数为d、长度为n=\operatorname{round}\left(q d r(\log d)^2\right) 的马尔可夫链X_0, \cdots, X_n, 这里q 是常数。

    下面比较文献[17]的经验估计方法、文献[1]的谱估计方法和LRSEA算法的估计误差。记P为相应的估计矩阵,本文利用以下2个数值来衡量其估计效果:

    \eta_F=\|\boldsymbol{P}-\overline{\boldsymbol{P}}\|_F^2, \eta_{U, V}=\max \left(r-\left\|\overline{\boldsymbol{U}}^{\mathrm{T}} \boldsymbol{U}\right\|_F^2, r-\left\|\overline{\boldsymbol{V}}^{\mathrm{T}} \boldsymbol{V}\right\|_F^2\right),

    其中,\boldsymbol{U} \in \mathbb{R}^{d \rtimes r}、\boldsymbol{V} \in \mathbb{R}^{d \times r}分别是P的前r个最大奇异值对应的左奇异向量、右奇异向量,\overline{\boldsymbol{U}} \in \mathbb{R}^{d \times r}、\overline{\boldsymbol{V}} \in \mathbb{R}^{d x_r} 分别是\overline{\boldsymbol{P}}的前r个最大奇异值对应的左奇异向量、右奇异向量。

    d=1 000、r=10、k\in [1, 10]时,3种方法的估计效果(图 1)表明:LRSEA算法与谱估计方法的估计误差相差不大,小于经验估计方法的。

    图  1  平衡分布下3种估计方法的比较
    Figure  1.  The comparison of three estimators in balanced distribution

    接下来,考虑具有非平衡分布的低秩马尔可夫过程的估计问题,即一部分状态的概率远小于其他状态的概率。此处构造矩阵\boldsymbol{P}=\widetilde{\boldsymbol{U}} \widetilde{\boldsymbol{V}}^{\mathrm{T}} \boldsymbol{B},并将其标准化得到\overline{\boldsymbol{P}},这里\widetilde{\boldsymbol{U}}、\widetilde{\boldsymbol{V}}与前面一致,B为对角矩阵,其对角元服从独立同分布的贝塔分布(Beta(α1, α2))。取α1=α2=0.1,d=1 000、r=10、轨迹长度n=round(qdr(log d)2)时, 3种方法的估计效果(图 2)表明:对于非平衡分布情况下的马尔可夫过程估计问题,LRSEA算法的估计误差小于谱估计方法和经验估计方法的。

    图  2  非平衡分布下3种估计方法的比较
    Figure  2.  The comparison of three estimators in imbalanced distribution

    纽约市曼哈顿岛于2016年公开的黄色出租车运行轨迹数据集记录了r次乘客的行程(https://s3.amazonaws.com/nyc-tlc/trip+data/yellow_tripdata_2016-01.csv),本研究利用此数据集将曼哈顿岛分割成几个区域,满足同一区域中的乘客前往同一个目的地的概率相似。

    类似文献[1],本文将曼哈顿岛细分为大小一致的小正方形网格,将每个小网格近似地看成马尔可夫过程的一个状态,乘客从一个网格到另一个网格的行程视为该马尔可夫过程的一次状态转移。为了排除干扰项,本文只选取那些作为行程的起点或者终点的总次数超过2 000的网格作为有效状态。然后,利用LRSEA算法来估计该马尔可夫过程的状态转移矩阵,并利用k-均值聚类方法对估计矩阵的左奇异子空间进行聚类划分。由r=k分别为4, 5, 6, 7时的聚类结果(图 3)可知:当聚类数r增加时,LRSEA算法可以给曼哈顿岛的交通网络一个较好的分区,同一个区域的乘客前往同一个地点的概率相似。

    图  3  LRSEA算法对曼哈顿岛交通网络的划分结果
    注:1种颜色代表 1个区域。
    Figure  3.  The result of a citywide partition of Manhattan traffic network with the low-rank spectral method

    鉴于在不同时段,人们出行目的不同,将该出租车运行数据集化分为3个时段:早上(06:00~11:59)、中午(12:00~17:59)、晚上(18:00~23:59),每个时段的有效状态数分别为769、1 029、1 147个。利用LRSEA算法来估计每个时段的马尔可夫过程的状态转移矩阵,并利用k-均值聚类方法对估计矩阵的左奇异子空间进行聚类划分,其中xietichuli=xietichuli=5。聚类结果所展示的在不同时段下LRSEA算法对曼哈顿岛的交通网络的分区结果(图 4)表明:同一时段下,同一个区域的乘客前往同一个目的地的概率相似。

    图  4  LRSEA算法在不同时间段下对曼哈顿岛交通网络的划分结果
    注:1种颜色代表 1个区域。
    Figure  4.  The result of a per-time-segment citywide partition of Manhattan traffic network with the low-rank spectral method

    针对马尔可夫过程的估计问题,利用秩约束状态转移矩阵集合的近似投影,本文对现有的谱方法进行低秩修正,提出了一个低秩谱估计算法(LRSEA),以快速得到满足秩约束条件的状态转移矩阵。此外,通过建立秩约束状态转移矩阵集合的局部Lipschitz型误差界,给出该算法的统计误差界,建立了算法的理论保证。数值实验结果表明,对于具有非平衡分布的低秩马尔可夫过程的估计问题,LRSEA算法的估计误差小于谱估计方法和经验估计方法的。下一步,将把LRSEA算法应用到强化学习问题以及系统工程领域中的控制问题。

  • 图  1   Faster R-CNN网络结构图

    Figure  1.   The Faster R-CNN network architecture diagram

    图  2   能量模块原理图

    Figure  2.   Schematic diagram of the Energy Module

    图  3   ESAM模块结构图

    Figure  3.   The structure of the ESAM module

    图  4   改进后的Faster R-CNN网络结构图

    Figure  4.   The improved Faster R-CNN network structure diagram

    图  5   数据集中的各种类型示例

    Figure  5.   Examples of various classes in the dataset

    图  6   数据集类别分布

    Figure  6.   Distribution of categories in the dataset

    图  7   数据集增强效果示例

    Figure  7.   Example of dataset augmentation effects

    表  1   对比实验结果

    Table  1   Results of comparison experiments

    模型 mAP mAP_50 每秒浮点数G 参数量M
    Faster R-CNN(baseline) 90.51 90.50 76.29 41.36
    YOLOV5-n[15] 72.90 89.00 4.10 1.77
    YOLOV5-l[15] 82.70 92.10 107.70 46.12
    Sparse R-CNN[16] 71.10 84.10 56.00 106.00
    Cascade R-CNN[17] 77.70 90.80 99.97 69.16
    DINO[18] 83.90 91.60 100.00 47.46
    Faster R-CNN + EMA[13] 91.46 91.85 79.24 42.15
    Faster R-CNN+ESAM(本文) 93.47 93.50 80.14 42.23
    下载: 导出CSV

    表  2   竹梯识别对比实验结果

    Table  2   Results of comparison experiments for bamboo ladder recognition

    模型 召回率/% mAP mAP_50 每秒浮点数G 参数量M
    YOLOV5n[15] 48.90 47.80 71.10 4.10 1.77
    YOLOV5l[15] 85.30 63.90 86.30 107.70 46.12
    Faster R-CNN+ESAM(本文) 93.50 93.47 93.50 80.14 42.23
    下载: 导出CSV

    表  3   消融实验结果

    Table  3   Results of ablation experiments

    模型 mAP mAP_50 每秒浮点数G 参数量M
    Faster R-CNN(baseline) 90.51 90.50 76.29 41.36
    Faster R-CNN+DA 92.09 92.10 76.29 41.36
    Faster R-CNN+ESAM 93.47 93.50 80.14 42.23
    Faster R-CNN++DA+ESAM 94.17 94.20 81.04 42.23
    下载: 导出CSV
  • [1] 隋宇, 宁平凡, 牛萍娟, 等. 面向架空输电线路的挂载无人机电力巡检技术研究综述[J]. 电网技术, 2021, 45(9): 3636-3648.

    SUI Y, NING P F, NIU P J, et al. A review of research on mounted UAV power inspection technology for overhead transmission lines[J]. Power System Technology, 2021, 45(9): 3636-3648.

    [2] 刘欢. 电力线路无人机巡检图像的目标检测与缺陷识别[D]. 武汉: 华中科技大学, 2023.

    LIU H. Target detection and defect recognition of power line UAV inspection images[D]. Wuhan: Huazhong University of Science and Technology, 2023.

    [3] 丘灵华, 朱铮涛. 基于深度学习的输电线路绝缘子缺陷检测研究[J]. 计算机应用研究, 2020, 37(S1): 358-360;365.

    QIU L H, ZHU Z T. Research on insulator defect detection of transmission line based on deep learning[J]. Application Research of Computers, 2020, 37(S1): 358-360;365.

    [4] 郑含博, 崔耀辉, 李金恒, 等. 基于深度学习模型的电力设备红外目标检测与诊断方法: CN202210205071[P]. 2023-12-10.

    ZHENG H B, CUI Y H, LI J H, et al. Infrared target detection and diagnosis method for power equipment based on deep learning model: CN202210205071[P]. 2023-12-10.

    [5] 廖恩红, 李会芳, 王华, 等. 基于卷积神经网络的食品图像识别[J]. 华南师范大学学报(自然科学版), 2019, 51(4): 113-119.

    LIAO E H, LI H F, WANG H, et al. Food image recognition based on convolutional neural network[J]. Journal of South China Normal University (Natural Science Edition), 2019, 51(4): 113-119.

    [6] 屈文谦, 邱志斌, 廖才波, 等. 基于YOLOv3的电网作业人员安全帽佩戴检测[J]. 中国安全生产科学技术, 2022, 18(2): 214-219.

    QU W Q, QIU Z B, LIAO C B, et al. Safety helmet wearing detection of power grid workers based on YOLOv3[J]. Journal of Safety Science and Technology, 2022, 18(2): 214-219.

    [7]

    GIRSHICK R. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus: IEEE, 2013: 580-587.

    [8]

    GIRSHICK R. Fast R-CNN[C]//Proceedings of the IEEE international conference on computer vision. Santiago: IEEE, 2015: 1440-1448.

    [9]

    REN S, HE K, GIRSHICK R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[J]. Advances in Neural Information Processing Systems, 2015, 28: 91-99.

    [10]

    EVERINGHAM M, van GOOL L, WILLIAMS C K I, et al. The pascal visual object classes (VOC) challenge[J]. International Journal of Computer Vision, 2010, 88: 303-338.

    [11]

    LIN T Y, MAIRE M, BELONGIE S, et al. Microsoft coco: common objects in context[C]//Computer Vision-ECCV 2014: 13th European Conference. Zurich: Springer International Publishing, 2014: 740-755.

    [12]

    YANG S, LUO P, LOY C C, et al. Wider face: a face detection benchmark[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. Las Vegas: IEEE, 2016: 5525-5533.

    [13]

    OUYANG D, HE S, ZHANG G, et al. Efficient multi-scale attention module with cross-spatial learning[C]//International Conference on Acoustics, Speech and Signal Processing (ICASSP). Rhodes: IEEE, 2023: 1-5.

    [14]

    YANG L, ZHANG R Y, LI L, et al. Simam: a simple, parameter-free attention module for convolutional neural networks[C]//International Conference on Machine Learning. Vienna: PMLR, 2021: 11863-11874.

    [15]

    JOCHER G, CHAURASIA A, STOKEN A, et al. Ultralytics/YOLOV5: v7.0-YOLOV5 sota realtime instance segmentation[EB/OL]. Zenodo, 2022.

    [16]

    SUN P, ZHANG R, JIANG Y, et al. Sparse R-CNN: end-to-end object detection with learnable proposals[C]//Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. Nashville: IEEE, 2021: 14454-14463.

    [17]

    CAI Z, VASCONCELOS N. Cascade R-CNN: delving into high quality object detection[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. Salt Lake City: IEEE, 2018: 6154-6162.

    [18]

    ZHANG H, LI F, LIU S, et al. Dino: Detr with improved denoising anchor boxes for end-to-end object detection[J]. arXiv, 2022: abs/2203.03605.

图(7)  /  表(3)
计量
  • 文章访问数:  0
  • HTML全文浏览量:  0
  • PDF下载量:  0
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-04-21
  • 刊出日期:  2024-08-24

目录

/

返回文章
返回