Processing math: 0%

双向机制下企业自愿碳减排的三方博弈模拟

魏琦, 郭艳

魏琦, 郭艳. 双向机制下企业自愿碳减排的三方博弈模拟[J]. 华南师范大学学报(自然科学版), 2024, 56(2): 42-54. DOI: 10.6054/j.jscnun.2024021
引用本文: 魏琦, 郭艳. 双向机制下企业自愿碳减排的三方博弈模拟[J]. 华南师范大学学报(自然科学版), 2024, 56(2): 42-54. DOI: 10.6054/j.jscnun.2024021
WEI Qi, GUO Yan. Tripartite Game Simulation of Voluntary Carbon Emission Reduction by Enterprises Under Bidirectional Mechanism[J]. Journal of South China Normal University (Natural Science Edition), 2024, 56(2): 42-54. DOI: 10.6054/j.jscnun.2024021
Citation: WEI Qi, GUO Yan. Tripartite Game Simulation of Voluntary Carbon Emission Reduction by Enterprises Under Bidirectional Mechanism[J]. Journal of South China Normal University (Natural Science Edition), 2024, 56(2): 42-54. DOI: 10.6054/j.jscnun.2024021

双向机制下企业自愿碳减排的三方博弈模拟

基金项目: 

国家自然科学基金项目 71963024

甘肃省教育厅揭榜挂帅项目 2021jyjbgs-08

详细信息
    通讯作者:

    郭艳,Email: 1668527595@qq.com

  • 中图分类号: F272

Tripartite Game Simulation of Voluntary Carbon Emission Reduction by Enterprises Under Bidirectional Mechanism

  • 摘要:

    工业企业碳减排对平衡环境保护和经济发展尤为重要。基于政府和消费者双向机制探究企业自愿碳减排的影响因素,根据政府正向激励机制和消费者反向倒逼机制构建政府、企业和消费者三方演化博弈模型,分析了各参与方策略选择的演化稳定性,从系统动力学角度探讨三方主体策略选择不同时各个参数对企业自愿碳减排的影响机制,进一步分析了三方博弈系统中均衡点的稳定性。结果表明: 企业选择自愿减排策略的概率与消费者低碳消费概率和政府非物质激励带给企业的收益额、减排成本补贴率、政府奖金、企业碳披露损失额等参数呈正相关;与企业的低碳营销费用、绿色积分价值、消费污染等参数呈负相关。最后,利用MATLAB 2016a进行数值仿真,验证了以上结论,并结合实际提出相关建议。

    Abstract:

    Carbon emission reduction in industrial enterprises is particularly important for balancing environmental protection and economic development. The factors influencing the voluntary carbon emission reduction of enterprises were explered based on the bidirectional mechanism of government and consumers. The evolutionary stability of each participant's strategy choice is analyzed by constructing a Tripartite Evolutionary Game model of government, enterprises and consumers based on the government's positive incentive mechanism and the consumer's anti-driving mechanism. The stability of the equilibrium point in the Tripartite Game System is further analyzed by exploring the influence mechanism of each parameter on the voluntary carbon emission reduction of enterprises from the perspective of system dynamics when different strategies are chosen by the three subjects. The results show that the probability of choosing voluntary emission reduction strategy is positively correlated with the parameters of the amount of benefits brought to enterprises by consumers' low-carbon consumption and government non-material incentives, the subsidy rate of emission reduction costs, government bonuses, and the amount of loss of enterprises' carbon disclosure; and negatively correlated with the parameters of enterprises' low-carbon marketing costs, the value of green points, and consumption pollution. Finally, MATLAB 2016a numerical simulation is used to verify the above conclusions and put forward relevant suggestions in the context of practice.

  • 马尔可夫过程的估计问题是计算机科学、系统工程和数据科学等领域中的一个核心问题[1]。计算个性化网页排序的状态转移矩阵问题[2]、解决电子商务中的排序问题[3]和分析城市出租车或公交车的运行轨迹问题[4-5]等都可归结为马尔可夫过程的估计问题。源于上述问题的马尔可夫过程往往拥有很大的状态空间,但是它们的状态转移矩阵却被证明了是低秩或者近似低秩的矩阵[1]。因此,学者们对低秩马尔可夫过程的状态转移矩阵的估计及其应用问题开展了研究[1, 6-10]

    据我们所知,现有的估计方法都不能保证得到低秩的转移矩阵估计。譬如,ZHANG和WANG[1]利用频率矩阵的经验估计的截断奇异值分解结合非负投影,提出了低秩马尔可夫过程的谱估计方法,并建立了估计的统计误差界,证明了估计误差与极小极大误差的下界相差一个马尔可夫链轨迹长度的对数因子。但是,由于谱估计方法利用了非负投影,导致该文献最后得到的估计矩阵不是低秩的。ZHU等[8]提出了状态转移矩阵的核范数正则罚极大似然估计模型和秩约束极大似然估计模型,并建立了2种模型的统计误差界,证明了估计误差与极小极大误差的下界相差一个马尔可夫链状态空间维数的对数因子。然而,核范数正则优化问题的最优解不一定满足低秩条件,秩约束优化问题的最优解虽能满足秩约束条件,但其求解一般都是NP难。尽管文献[8]设计了一类DC (凸函数的差) 规划算法来近似求解秩约束极大似然估计模型,但不能保证算法的输出是一个低秩矩阵。特别地,该DC规划算法的每一步都需要进行奇异值分解,计算量非常大,因此不适用于大规模的马尔可夫过程估计问题。

    另一方面,误差界研究一直以来都是最优化领域中的重点和难题[11-15]。PANG[11]证明了:凸多面体集合具有全局Lipschitz型误差界; 在一定的约束规范下,一般凸不等式系统具有Lipschitz型误差界; 对一般非凸不等式系统,全局误差界(即使是Hölder型的)都很难成立。目前已有的研究主要是对次解析不等式系统和多项式不等式系统建立了局部Hölder型误差界[14],对矩阵秩约束系统的误差界研究还很少。对于一个有界且其多值函数在原点满足calmness条件的矩阵秩约束系统,BI和PAN[15]得到了该系统的局部和全局Lipschitz型误差界。但是,验证多值函数的calmness条件与建立误差界的难度基本一样。因此,我们需要寻求新的工具来研究矩阵秩约束系统的误差界。

    受上述启发,本文试图寻求一个能够快速获得低秩转移矩阵的方法,以估计大规模的低秩马尔可夫过程。首先,建立秩约束状态转移矩阵集合的局部Lipschitz型误差界,并寻求该集合高质量的近似投影方法; 然后,提出一种低秩马尔可夫过程状态转移矩阵的低秩谱估计算法(LRSEA),并进行数值实验。

    本节为秩约束状态转移矩阵集合建立局部Lipschitz型误差界。首先,给出本文的记号。

    (1) 记\boldsymbol{I} \in \mathbb{R}^{d \times d}、\boldsymbol{E} \in \mathbb{R}^{d \times d}、\boldsymbol{e} \in \mathbb{R}^d分别为单位矩阵、元素全为1的矩阵、元素全为1的向量。

    (2) 对于\boldsymbol{P} \in \mathbb{R}^{d \times d},定义\|\boldsymbol{P}\|_{\infty}: =\max \limits_{i, j}\left|P_{i j}\right|为无穷范数,\|\boldsymbol{P}\|_F: =\sqrt{\sum\limits_{i=1}^d \sum\limits_{j=1}^d P_{i j}^2}为Frobenius范数。

    (3) 秩约束状态转移矩阵集合定义为:\varPi: =\{\boldsymbol{P} \in \left.\mathbb{R}^{d \times d}: \operatorname{rank}(\boldsymbol{P}) \leqslant r, \boldsymbol{P e}=\boldsymbol{e}, P_{i j} \geqslant 0, 1 \leqslant i, j \leqslant d\right\},其中r \in [1, d-1]是一个给定整数。对于\boldsymbol{Z} \in \mathbb{R}^{d \times d},定义Z到集合Π的距离为:

    \operatorname{dist}(\boldsymbol{Z}, \varPi):=\min \left\{\|\boldsymbol{Z}-\boldsymbol{P}\|_F: \boldsymbol{P} \in \varPi\right\} 。

    (4) 给定\boldsymbol{x} \in \mathbb{R}^d,定义l1范数为\|\boldsymbol{x}\|_1:=\sum\limits_{i=1}^d\left|x_i\right|,无穷范数为\|\boldsymbol{x}\|_{\infty}: =\max \limits_i\left|x_i\right|,记\operatorname{diag}(\boldsymbol{x}) \in \mathbb{R}^{d \times d}是第i个对角元为xi(i=1, 2, …, d)的对角矩阵。

    (5) 定义秩r约束矩阵集合为\mathcal{R}: =\left\{\boldsymbol{Z} \in \mathbb{R}^{d \times d}\right. : \operatorname{rank}(\boldsymbol{Z}) \leqslant r\}。对任意\boldsymbol{P} \in \mathbb{R}^{d \times d},定义

    \varUpsilon_{\mathcal{R}}(\boldsymbol{P}):=\sum\limits_{i=1}^r \sigma_i(\boldsymbol{P}) u_i(\boldsymbol{P}) v_i(\boldsymbol{P})^{\mathrm{T}},

    其中,\sigma_i(\boldsymbol{P})(i=1, 2, \cdots, r)P的第i个最大奇异值,u_i(\boldsymbol{P}) \in \mathbb{R}^d、v_i(\boldsymbol{P}) \in \mathbb{R}^d分别是σi(P)对应的左、右奇异向量。众所周知,在Frobenius范数距离意义下,\varUpsilon_{\mathcal{R}}(\boldsymbol{P})P\mathcal{R}上的一个投影矩阵。

    (6) 定义集合\varOmega: =\left\{\boldsymbol{Z} \in \mathbb{R}^{d \times d}: Z \boldsymbol{e}=\boldsymbol{e}, \beta / d \geqslant Z_{i j} \geqslant\right. \alpha / d, 1 \leqslant i, j \leqslant d\},其中\alpha \in(0, 1)\beta \in(1, d)是给定常数。

    下面给出建立矩阵\boldsymbol{P} \in \varOmega 与投影矩阵\varUpsilon_{\mathcal{R}}(\boldsymbol{P})之间关系的引理。

    引理1   令\gamma \in(0, 1)是给定常数。任取\boldsymbol{P} \in \varOmega,若\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_i \geqslant \gamma(i=1, 2, \cdots, d),则有:

    \|\boldsymbol{I}-\boldsymbol{D}\|_{\infty} \leqslant \frac{d}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}, (1)
    \left\|\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \frac{d\left(\|\boldsymbol{P}\|_{\infty}+\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}\right)}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}, (2)
    \left|\min \left(0, \min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j\right)\right| \leqslant \frac{1}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}, (3)

    其中\boldsymbol{D}: =\operatorname{diag}\left(\frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_1}, \cdots, \frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_d}\right)

    证明   由于(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})e)jγ>0 (j=1, 2, …, d)且Pe=e,利用\langle\boldsymbol{x}, \boldsymbol{y}\rangle \leqslant\|\boldsymbol{x}\|_1\|\boldsymbol{y}\|_{\infty}\left(\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^d\right),有

    \|\boldsymbol{I}-\boldsymbol{D}\|_{\infty}=\max \limits_j\left|1-\frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j}\right|=\\ \max \limits_j \frac{\left|\left(\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j-1\right|}{\left(\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j} \leqslant\\ \frac{1}{\gamma} \max \limits_j\left|\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j-(\boldsymbol{P} \boldsymbol{e})_j\right|=\\ \frac{1}{\gamma}\left\|\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right) \boldsymbol{e}\right\|_{\infty} \leqslant \frac{d}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} 。

    因此,不等式(1)成立。利用不等式(1)、ID是对角矩阵以及d\|\boldsymbol{P}\|_{\infty} \geqslant 1>\gamma,可得

    \begin{aligned} &\left\|\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}=\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})+(\boldsymbol{I}-\boldsymbol{D}) \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\|\boldsymbol{I}-\boldsymbol{D}\|_{\infty}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\frac{d\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}}{\gamma}\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(P)\right\|_{\infty} \leqslant \\ &\frac{d\left(\|\boldsymbol{P}\|_{\infty}+\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}\right)}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \circ \end{aligned}

    于是,不等式(2)成立。当0 \leqslant \min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j时,不等式(3)显然成立。当\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_j < 0时, 由\|\boldsymbol{D}\|_{\infty} \leqslant 1 / \gamma, \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j < 0\boldsymbol{P}_{i j} \geqslant 0, 1 \leqslant i, j \leqslant d,可得

    \begin{array}{r} 0<-\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j \leqslant-\|\boldsymbol{D}\|_{\infty} \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j= \\ \|\boldsymbol{D}\|_{\infty}\left|\min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j\right| \leqslant \frac{1}{\gamma}\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}, \end{array}

    不等式(3)成立。证毕。

    \gamma>0, c \in(0, 1)为给定常数。对任意矩阵\boldsymbol{P} \in \varOmega, 定义如下矩阵

    \left\{\begin{array}{l} \operatorname{diag}(\tilde{\boldsymbol{v}}) \widetilde{\boldsymbol{P}}\left(\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}, \left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) e\right)_j \geqslant \gamma, \right. \\ \left.\frac{\beta}{c} \geqslant\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j \geqslant c \alpha, 1 \leqslant j \leqslant d\right), \\ \frac{1}{d} \boldsymbol{E}\left(\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}>10\|\boldsymbol{P}\|_{\infty} \text { 或 } \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) e\right)_j <\gamma\right) \text { 或 } \\ \left.\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j <c \alpha \text { 或 } \max \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j>\frac{\beta}{c}\right), \end{array}\right. (4)

    其中,\boldsymbol{D}: =\operatorname{diag}\left(\frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_1}, \cdots, \frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_d}\right), \tilde{\boldsymbol{v}}= \left(\frac{1}{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_1}, \frac{1}{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_2}, \cdots, \frac{1}{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_d}\right)^{\mathrm{T}}, \widetilde{\boldsymbol{P}}=\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{t} \boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P}), \boldsymbol{t} \in \mathbb{R}^d,定义为t_i=\min \left(0, \min \limits_{1 \leqslant j \leqslant d} \frac{\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_{i j}}{\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j}\right)(i=1, 2, \cdots, d)

    下面给出建立集合Π的局部Lipschitz型误差界的命题。

    命题1   令\gamma \in(0, 1 / 2], c \in(0, (\sqrt{5}-1) / 2), \beta \geqslant 1 \geqslant \alpha>0是给定常数。任取\boldsymbol{P} \in \varOmega,有\widetilde{\boldsymbol{P}}_{\varPi} \in \varPi,且

    \frac{1}{d} \cdot\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{I I}\right\|_F \leqslant \frac{11 \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right)\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}。 (5)

    证明   设\boldsymbol{P} \in \varOmega, 下面分5种情况证明。

    (1) 假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}, \left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j \geqslant \gamma\beta / c \geqslant\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j \geqslant c \alpha(1 \leqslant j \leqslant d)。由\widetilde{\boldsymbol{P}}t_i的定义,可得\widetilde{P}_{i l}=\left(\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_{i l}-t_i\left(\boldsymbol{e} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_l \geqslant 0 (1 \leqslant i, l \leqslant d)。注意-t_i\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_l \geqslant 0,可得\widetilde{P}_{i l} \geqslant\left(\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_{i l}(1 \leqslant i, l \leqslant d),因此(\widetilde{\boldsymbol{P}} \boldsymbol{e})_i \geqslant \left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_i=1(i=1, 2, \cdots, d),进而得到0 < \tilde{v}_i \leqslant 1(i=1, 2, \cdots, d)。定义\widetilde{\boldsymbol{P}}_{\varPi}=\operatorname{Diag}(\tilde{\boldsymbol{v}}) \widetilde{\boldsymbol{P}},由\operatorname{rank}(\widetilde{\boldsymbol{P}}) \leqslant r,可得\operatorname{rank}\left(\widetilde{\boldsymbol{P}}_{\varPi}\right) \leqslant r, \widetilde{\boldsymbol{P}}_{\varPi} \geqslant 0, \widetilde{\boldsymbol{P}}_{\varPi} \boldsymbol{e}=\boldsymbol{e},即\widetilde{\boldsymbol{P}}_{\varPi} \in \varPi。根据假设\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} Y_{\mathcal{R}}(\boldsymbol{P})\right)_j \geqslant c \alpha(1 \leqslant j \leqslant d),可得\frac{\left|\min \left(0, \min _{1 \leqslant i \leqslant d}\left(\boldsymbol{D} Y_{\mathcal{R}}(\boldsymbol{P})\right)_i\right)\right|}{c \alpha} \geqslant\|\boldsymbol{t}\|_{\infty}。利用假设\beta / c \geqslant\left\|\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty},可得

    \left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ \frac{\left|\min \left(0, \min _{1 \leqslant i \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_i\right)\right|}{c \alpha}\left\|\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ \frac{\beta\left|\min \left(0, \min _{1 \leqslant i \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_i\right)\right|}{c^2 \alpha}。 (6)

    由不等式(6)、\|\boldsymbol{D}\|_{\infty} \leqslant 1 / \gamma, \left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|\boldsymbol{P}_I=\operatorname{Diag}(\widetilde{\boldsymbol{v}}) \widetilde{\boldsymbol{P}},可得

    \begin{aligned} &\left\|\widetilde{\boldsymbol{P}}_{\varPi}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant\left\|(\operatorname{Diag}(\tilde{\boldsymbol{v}})-\boldsymbol{I}) \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+ \\ &\left\|\operatorname{Diag}(\tilde{\boldsymbol{v}})\left(\widetilde{\boldsymbol{P}}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)\right\|_{\infty} \leqslant \max \limits_j\left|1-\frac{1}{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_j}\right|\|\boldsymbol{D}\|_{\infty} \times \\ &\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\|\tilde{\boldsymbol{v}}\|_{\infty}\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \frac{\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \times}{\gamma} \times \\ &\max \limits_j\left|\frac{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_j-\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j}{\| \widetilde{\boldsymbol{P}} \boldsymbol{e})_j}\right|+\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\frac{\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}}{\gamma} \max \limits_j\left|\left(\left(\widetilde{\boldsymbol{P}}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right) \boldsymbol{e}\right)_j\right|+\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\frac{d\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}}{\gamma}\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\frac{11 d\|\boldsymbol{P}\|_{\infty}}{\gamma} \cdot \frac{\beta\left|\min \left(0, \min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j\right)\right|}{c^2 \alpha}。 \end{aligned} (7)

    因此,利用d\|\boldsymbol{P}\|_{\infty} \leqslant \beta及不等式(2)、(3)、(7),可得

    \begin{aligned} \frac{1}{d} \cdot\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F \leqslant\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_{\infty} \leqslant\left\|\widetilde{\boldsymbol{P}}_{\varPi}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\\ \left\|\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \frac{11 \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right)\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}, \end{aligned}

    即不等式(5)成立。

    假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}>10\|\boldsymbol{P}\|_{\infty}\min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right) < \gamma\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right) < c \alpha\max \limits_{1 \leqslant j \leqslant d}\left(e^1 \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)>\beta / c, 由式(4)可知\widetilde{\boldsymbol{P}}_{\varPi}=\boldsymbol{E} / d。显然1\widetilde{\boldsymbol{P}}_{\varPi} \in \varPi

    \frac{1}{d} \cdot\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F \leqslant\left\|\boldsymbol{P}-\frac{1}{d} \boldsymbol{E}\right\|_{\infty} \leqslant \max \left(\frac{1}{d}, \|\boldsymbol{P}\|_{\infty}\right) \leqslant\|\boldsymbol{P}\|_{\infty} 。

    (2) 假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}>10\|\boldsymbol{P}\|_{\infty}。显然

    \left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \geqslant 9\|\boldsymbol{P}\|_{\infty} \geqslant \frac{1}{d}\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F,

    不等式(5)成立。

    (3) 假设\left\|\varUpsilon_{\mathcal{R}}(P)\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}\min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j < \gamma。由于\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e} 中存在小于\gamma 的元素,不妨设\left(\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_i < \gamma_{\circ}(\boldsymbol{P e})_i=1dP\varUpsilon_{\mathcal{R}}(\boldsymbol{P})d\|\boldsymbol{P}\|_{\infty} \leqslant \beta,可得

    d\left\|\boldsymbol{P}-\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \geqslant\left\|\left(\boldsymbol{P}-\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P})\right) \boldsymbol{e}\right\|_{\infty} \geqslant$ $(\boldsymbol{P e})_i-\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_i \geqslant 1-\gamma \geqslant 0.5

    \begin{gathered} \frac{1}{d}\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_I\right\|_F \leqslant\|\boldsymbol{P}\|_{\infty} \leqslant 2 d\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}\|\boldsymbol{P}\|_{\infty} \leqslant \\ 2 \beta\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \circ \end{gathered}

    由此可得不等式(5)成立。

    (4) 假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}, \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j \geqslant \gamma\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right) < c \alpha。由于\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})中存在小于c \alpha的元素,不防设\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_i < c \alpha < \alpha。由\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{P}\right)_i \geqslant \alpha,可得

    \begin{gathered} d\left\|\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \geqslant\left\|\boldsymbol{e}^{\mathrm{T}}\left(\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)\right\|_{\infty} \geqslant \\ \quad\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{P}\right)_i-\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_i \geqslant \alpha-c \boldsymbol{\alpha}_{\circ} \end{gathered} (8)

    由不等式(8)、d\|\boldsymbol{P}\|_{\infty} \leqslant \beta 及引理1,可得

    \begin{aligned} &\frac{1}{d}\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F \leqslant\|\boldsymbol{P}\|_{\infty} \leqslant \\ &\|\boldsymbol{P}\|_{\infty} \frac{d}{\alpha(1-c)} \cdot \frac{11 \beta}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \leqslant \\ &\frac{11 \beta^2}{(1-c) \alpha \gamma}\left\|\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \circ \end{aligned}

    c \in(0, (\sqrt{5}-1) / 2),可得不等式(5)成立。

    (5) 假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}, \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j \geqslant \gamma。由于\max \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j>\beta / c_{\text {。}} 由于\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})中存在大于β/c的元素,不妨设\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_i>\beta / c。由\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{P}\right)_i \leqslant \beta,可得

    \begin{aligned} d \| & \boldsymbol{P}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\left\|_{\infty} \geqslant\right\| \boldsymbol{e}^{\mathrm{T}}\left(\boldsymbol{P}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right) \|_{\infty} \geqslant \\ &\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_i-\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{P}\right)_i \geqslant \frac{\beta}{c}-\beta=\frac{\beta(1-c)}{c} 。 \end{aligned} (9)

    由不等式(9)、d\|\boldsymbol{P}\|_{\infty} \leqslant \beta及引理1, 可得

    \begin{aligned} &\frac{1}{d}\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F \leqslant\|\boldsymbol{P}\|_{\infty} \leqslant \\ &\|\boldsymbol{P}\|_{\infty} \frac{c d}{\beta(1-c)} \cdot \frac{11 \beta}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \leqslant \\ &\frac{11 \beta^2}{(1-c) \gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \leqslant \end{aligned}

    c \in(0, (\sqrt{5}-1) / 2),可得不等式(5)成立。证毕。

    由于\widetilde{\boldsymbol{P}}_{\varPi} \in \varPi,命题1给出了任意\boldsymbol{P} \in \varOmega到集合Π的距离估计,即

    \operatorname{dist}(\boldsymbol{P}, \varPi) \leqslant\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi I}\right\|_F \leqslant \frac{11 d \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right)\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} 。

    同时,在集合Π中找到了低秩状态转移矩阵\widetilde{\boldsymbol{P}}_{\varPi I},使得P\widetilde{\boldsymbol{P}}_{\varPi}的距离满足误差界不等式。所以,\widetilde{\boldsymbol{P}}_I可以看成是\boldsymbol{P} \in \varOmega 在集合Π上的近似投影矩阵。

    考虑d (≥2)个状态{S1, S2, …, Sd}的离散时间马尔可夫过程,假设其状态转移矩阵为\overline{\boldsymbol{P}} \in \mathbb{R}^{d \times d},频率矩阵为\overline{\boldsymbol{Q}} \in \mathbb{R}^{d \times d},且满足\operatorname{rank}(\overline{\boldsymbol{P}})=\operatorname{rank}(\overline{\boldsymbol{Q}}) \leqslant r \ll d。源于现实生活当中的一些马尔可夫过程已经被证明是低秩或者近似低秩的,比如交通网络、网页及电子商务排序[1-7]。本文旨在通过轨迹长为n+1的马尔可夫链{X0, X1, …, Xn}来估计其状态转移矩阵\overline{\boldsymbol{P}}

    首先给出本文的假设。

    假设1   存在常数\beta \in[1, d), \alpha \in(0, 1],使得:

    (1) \forall 1 \leqslant i, j \leqslant d, \alpha / d \leqslant \bar{P}_{i j} \leqslant \beta / d;

    (2) \left\{X_0, X_1, \cdots, X_n\right\}是遍历马尔可夫链,平稳分布为\boldsymbol{\pi} \in \mathbb{R}^d,满足\pi_i \geqslant \alpha / d(i=1, 2, \cdots, d), 其中\pi_i是向量\boldsymbol{\pi}的第i个元素。

    注意到文献[1]的谱估计矩阵虽然不是低秩的,但其是一个状态转移矩阵。因此,以谱估计矩阵为基础,利用式(4)计算秩-r状态转移矩阵作为\overline{\boldsymbol{P}}的估计,具体见算法1。

    算法1   LRSEA算法

    输入:谱估计矩阵\hat{\boldsymbol{S}} \in\left\{\boldsymbol{Z} \in \mathbb{R}^{d \times d}: Z \boldsymbol{e}=\boldsymbol{e}, Z_{i j} \geqslant 0, 1 \leqslant i, j \leqslant\right. d\}, \alpha \in(0, 1), \beta \in(1, d)r

    第1步:计算修正的谱估计

    for i=1 to d

    if \min \limits_{1 \leqslant j \leqslant d} \hat{S}_{i j} <\frac{\alpha}{d}

    n_{+}=\sum\limits_{j=1}^d \max \left(\frac{\alpha}{d}-\hat{S}_{i j}, 0\right); n_{-}=1-\alpha+n_{+};

    for j=1 to d

    \widetilde{S}_{i j}=\max \left(\hat{S}_{i j}-\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\frac{\alpha}{d}\right), \frac{\alpha}{d}\right);

    end for

    else

    \tilde{\boldsymbol{S}}(i, : )=\hat{\boldsymbol{S}}(i, : );

    end if

    end for

    for i=1 to d

    if \max \limits_{1 \leqslant j \leqslant d} \widetilde{S}_{i j}>\frac{\beta}{d}

    m_{+}=\sum\limits_{j=1}^d \max \left(\widetilde{S}_{i j}-\frac{\beta}{d}, 0\right); m_{-}=m_{+}+\beta-1 ;

    for j=1 to d

    S_{i j}=\min \left(\widetilde{S}_{i j}+\frac{m_{+}}{m_{-}}\left(\frac{\beta}{d}-\widetilde{S}_{i j}\right), \frac{\beta}{d}\right)

    end for

    else

    \boldsymbol{S}(i, : )=\widetilde{\boldsymbol{S}}(i, : );

    end if

    end for

    第2步:令\boldsymbol{P}=\boldsymbol{S}, \gamma \in(0, 1 / 2], c \in(0, (\sqrt{5}-1) / 2),由式(4)得到\overline{\boldsymbol{P}}的低秩谱估计\widetilde{\boldsymbol{S}}_{\varPi}

    由于LRSEA算法产生的估计矩阵\tilde{\boldsymbol{S}}_{\varPi} \in \varPi是一个满足低秩约束条件的状态转移矩阵,因此称其为低秩谱估计算法。可以预见,由于LRSEA算法可以满足低秩性要求,其有效性将高于现有的谱估计方法。为了建立LRSEA算法的理论保证,定义马尔可夫链的\frac{1}{4}-混合时间[16]

    \tau:=\min \left\{k: \max \limits_{1 \leqslant i \leqslant d} \frac{1}{2}\left\|(\overline{\boldsymbol{P}})^k(i, :)-\boldsymbol{\pi}^{\mathrm{T}}\right\|_1 \leqslant \frac{1}{4}\right\}。

    定理1   定义\bar{r}: =\|\overline{\boldsymbol{Q}}\|_F^2 / \sigma_r^2(\overline{\boldsymbol{Q}}),其中\sigma_r(\overline{\boldsymbol{Q}})\overline{\boldsymbol{Q}}的第r个最大奇异值,且记\kappa=d^2\|\overline{\boldsymbol{Q}}\|_{\infty}。若假设1成立,\tilde{S}, \boldsymbol{S}, \tilde{\boldsymbol{S}}_I \in \mathbb{R}^{d \times d}由LRSEA算法产生,则有:

    (a) S \in \varOmega

    \|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1(1 \leqslant i \leqslant d)

    (b) 令C_1=\frac{11 \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right) \sqrt{d}+1。存在常数C,使得

    E \frac{1}{d}\left\|\tilde{\boldsymbol{S}}_{\varPi}-\overline{\boldsymbol{P}}\right\|_F \leqslant C_1 \sqrt{\frac{C \bar{r} d \log ^2(n)}{n} \cdot \frac{\kappa^3 \tau}{\alpha^2}},

    其中E表示数学期望。

    证明   (a)由算法1,易证n_{-}=\sum\limits_{j=1}^d \max \left(\hat{S}_{i j}-\frac{\alpha}{d}, 0\right), m_{-}=\sum\limits_{j=1}^d \max \left(\frac{\beta}{d}-\tilde{S}_{i j}, 0\right)。由于\alpha < 1,所以n_{-}>n_{+} \geqslant 0。注意到\hat{\boldsymbol{S}} \in\left\{\boldsymbol{Z} \in \mathbb{R}^{d \times d}: Z \boldsymbol{e}=\boldsymbol{e}, Z_{i j} \geqslant 0, 1 \leqslant i, j \leqslant d\right\}。若\min \limits_{1 \leqslant j \leqslant d} S_{i j} \geqslant \alpha / d,则\tilde{\boldsymbol{S}}(i, j)=\hat{\boldsymbol{S}}(i, j) \geqslant \alpha / d(j=1, 2, \cdots, d)\tilde{\boldsymbol{S}}(i, : ) \boldsymbol{e}=1。若\min \limits_{1 \leqslant j \leqslant d} \hat{S}_{i j} < \alpha / d,利用n_{-}> n_{+} \geqslant 0\hat{S}_{i j} \leqslant \alpha / d 时, 有\tilde{S}_{i j}=\alpha / d; 当\hat{S}_{i j}>\alpha / d 时, 有

    \tilde{S}_{i j}=\hat{S}_{i j}-\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\frac{\alpha}{d}\right)>\hat{S}_{i j}-\left(\hat{S}_{i j}-\frac{\alpha}{d}\right)=\frac{\alpha}{d},

    \begin{gathered} \sum\limits_{j=1}^d \tilde{S}_{i j}=\sum\limits_{j: S_{i j} \leqslant \alpha / d} \frac{\alpha}{d}+\sum\limits_{j: S_{i j}>\alpha / d}\left(\hat{S}_{i j}-\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\frac{\alpha}{d}\right)\right)= \\ \sum\limits_{j: S_{i j} \leqslant \alpha / d} \frac{\alpha}{d}+\sum\limits_{j: s_{i j}>\alpha / d} S_{i j}-n_{+}=1 。 \end{gathered}

    因此,可得\alpha / d \leqslant \tilde{S}_{i j}\tilde{\boldsymbol{S}}(i, : ) \boldsymbol{e}=1(i, j=1, \cdots, d)。同理, 可以证明\alpha / d \leqslant S_{i j} \leqslant \beta / d\boldsymbol{S}(i, : ) \boldsymbol{e}=1(i, j= 1, \cdots, d)。因此, S \in \varOmega_{\text {。}}

    \min \limits_{1 \leqslant j \leqslant d} \hat{S}_{i j} \geqslant \alpha / d,由于\tilde{\boldsymbol{S}}(i, : )=\hat{\boldsymbol{S}}(i, : ),有

    \|\tilde{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1=\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|。

    现假设\min \limits_{1 \leqslant j \leqslant d} \hat{S}_{i j} < \alpha / d。利用\alpha / d \leqslant \bar{P}_{i j} \leqslant \beta / d \quad(1 \leqslant i, j \leqslant d), 可得

    \begin{aligned} &\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1=\sum\limits_{j: s_{i j} \leqslant \alpha / d}\left|\hat{S}_{i j}-\bar{P}_{i j}\right|+ \\ &\sum\limits_{j: s_{i j}>\alpha / d}\left|\hat{S}_{i j}-\bar{P}_{i j}\right|=\sum\limits_{j: s_{i j \leqslant} \leqslant \alpha / d}\left|\hat{S}_{i j}-\frac{\alpha}{d}+\frac{\alpha}{d}-\bar{P}_{i j}\right|+ \\ &\sum\limits_{j: S_{i j}>\alpha / d}\left|\bar{S}_{i j}+\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\alpha / d\right)-\bar{P}_{i j}\right| \geqslant \sum\limits_{j: S_{i j} \leqslant \alpha / d}\left|\hat{S}_{i j}-\frac{\alpha}{d}\right|+ \\ &\sum\limits_{j: S_{i j} \leqslant \alpha / d}\left|\frac{\alpha}{d}-\bar{P}_{i j}\right|+\sum\limits_{j: s_{i j}>\alpha / d}\left|\tilde{S}_{i j}-\bar{P}_{i j}\right|- \\ &\sum\limits_{j: S_{i j}>\alpha / d}\left|\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\frac{\alpha}{d}\right)\right|=n_{+}+\sum\limits_{j: s_{i j} \leqslant \alpha / d}\left|\tilde{S}_{i j}-\bar{P}_{i j}\right|+ \\ &\sum\limits_{j: S_{i j}>\alpha / d}\left|\tilde{S}_{i j}-\bar{P}_{i j}\right|-n_{+}=\|\tilde{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_{1 \circ} \end{aligned}

    由上述讨论,可得

    \|\tilde{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1(1 \leqslant i \leqslant d)。

    同理可以证明

    \|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant\|\tilde{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1(1 \leqslant i \leqslant d)。

    所以,

    \|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1(1 \leqslant i \leqslant d)。

    (b) 若假设1成立,则由文献[1]的定理1可知:存在一个常数C,使得

    E \max \limits_{1 \leqslant i \leqslant d}\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant \sqrt{\frac{C \bar{r} d \log ^2(n)}{n} \cdot \frac{\kappa^3 \tau}{\alpha^2}}。

    由(a)部分的结论,可知存在常数C,使得

    E \max \limits_{1 \leqslant i \leqslant d}\|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant \sqrt{\frac{C \bar{r} d \log ^2(n)}{n}\cdot \frac{\kappa^3 \tau}{\alpha^2}} 。 (10)

    由于\boldsymbol{S} \in \varOmega,由命题1可知

    其中C_2=\frac{11 \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right)。利用\varUpsilon_{\mathcal{R}}(S)的定义可得\left\|\boldsymbol{S}-\varUpsilon_{\mathcal{R}}(\boldsymbol{S})\right\|_F \leqslant\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_F。于是

    \begin{aligned} &\frac{1}{d}\left\|\tilde{\boldsymbol{S}}_{\varPi}-\overline{\boldsymbol{P}}\right\|_F \leqslant \frac{1}{d}\left\|\tilde{\boldsymbol{S}}_{\varPi}-\boldsymbol{S}\right\|_F+\frac{1}{d}\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_F \leqslant \\ &C_2\left\|\boldsymbol{S}-\varUpsilon_{\mathcal{R}}(\boldsymbol{S})\right\|_{\infty}+\frac{1}{d}\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_1 \leqslant C_2\left\|\boldsymbol{S}-\varUpsilon_{\mathcal{R}}(\boldsymbol{S})\right\|_F+ \\ &\frac{1}{d}\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_1 \leqslant C_2\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_F+\max \limits_{1 \leqslant i \leqslant d}\|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant \\ &\quad\left(C_2 \sqrt{d}+1\right) \max \limits_{1 \leqslant i \leqslant d}\|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_{10} \end{aligned} (11)

    由不等式(10)、(11)可得定理结论。证毕。

    定理1建立了LRSEA算法产生的估计矩阵与真实状态转移矩阵\overline{\boldsymbol{P}}之间的距离估计。由定理1(b)可知,轨迹长度n越大,估计误差的期望越小。

    在LRSEA算法中,取\gamma=0.01, c=0.02, \alpha=\frac{1}{2} d \times \min \limits_{1 \leqslant i, j \leqslant d} \bar{P}_{i j}, \beta=\min \left(d, 2 d \max \limits_{1 \leqslant i, j \leqslant d} \bar{P}_{i j}\right)。首先,通过人工合成数据实验来比较LRSEA算法、谱估计方法[1]、经验估计方法[17]的效果。然后,利用LRSEA算法与k-均值聚类方法结合来分析纽约曼哈顿岛出租车运行轨迹的公开数据集,揭露该城市的潜在交通模式。所有数值实验都是在配置为英特尔奔腾G4600处理器和CPU主频3.6 GHz的笔记本电脑上,通过运行MATLAB(2019年版本)完成的。

    首先,考虑具有平衡分布的低秩马尔可夫过程估计问题。假设\boldsymbol{U}_0 \in \mathbb{R}^{d \times r}, V_0 \in \mathbb{R}^{d \times r},它们的元素由标准正态分布随机生成。定义矩阵\widetilde{\boldsymbol{U}} \in \mathbb{R}^{d \times r}, \widetilde{\boldsymbol{V}} \in \mathbb{R}^{d \times r} : \widetilde{\boldsymbol{U}}_{[i, i]}=\left(\boldsymbol{U}_0 \odot \boldsymbol{U}_0\right)_{[i, :]} /\left\|\left(\boldsymbol{U}_0\right)_{[i, i]}\right\|_2^2(i=1, \cdots, d), \widetilde{\boldsymbol{V}}_{[:, j]}=\left(\boldsymbol{V}_0 \odot \boldsymbol{V}_0\right)_{[:, j]} /\left\|\left(\boldsymbol{V}_0\right)_{[:, j}\right\|_2^2(j=1, \cdots, r),这里\widetilde{\boldsymbol{U}}_{[i, , ]}表示\widetilde{\boldsymbol{U}}的第i行,\widetilde{\boldsymbol{V}}_{[:, j]} 表示\widetilde{\boldsymbol{V}} 的第j 列, \odot 表示矩阵Hadamard积。定义真实状态转移矩阵为\overline{\boldsymbol{P}}=\widetilde{\boldsymbol{U}} \widetilde{\boldsymbol{V}}^{\mathrm{T}}。本文利用状态转移矩阵\overline{\boldsymbol{P}} 生成状态数为d、长度为n=\operatorname{round}\left(q d r(\log d)^2\right) 的马尔可夫链X_0, \cdots, X_n, 这里q 是常数。

    下面比较文献[17]的经验估计方法、文献[1]的谱估计方法和LRSEA算法的估计误差。记P为相应的估计矩阵,本文利用以下2个数值来衡量其估计效果:

    \eta_F=\|\boldsymbol{P}-\overline{\boldsymbol{P}}\|_F^2, \eta_{U, V}=\max \left(r-\left\|\overline{\boldsymbol{U}}^{\mathrm{T}} \boldsymbol{U}\right\|_F^2, r-\left\|\overline{\boldsymbol{V}}^{\mathrm{T}} \boldsymbol{V}\right\|_F^2\right),

    其中,\boldsymbol{U} \in \mathbb{R}^{d \rtimes r}、\boldsymbol{V} \in \mathbb{R}^{d \times r}分别是P的前r个最大奇异值对应的左奇异向量、右奇异向量,\overline{\boldsymbol{U}} \in \mathbb{R}^{d \times r}、\overline{\boldsymbol{V}} \in \mathbb{R}^{d x_r} 分别是\overline{\boldsymbol{P}}的前r个最大奇异值对应的左奇异向量、右奇异向量。

    d=1 000、r=10、k\in [1, 10]时,3种方法的估计效果(图 1)表明:LRSEA算法与谱估计方法的估计误差相差不大,小于经验估计方法的。

    图  1  平衡分布下3种估计方法的比较
    Figure  1.  The comparison of three estimators in balanced distribution

    接下来,考虑具有非平衡分布的低秩马尔可夫过程的估计问题,即一部分状态的概率远小于其他状态的概率。此处构造矩阵\boldsymbol{P}=\widetilde{\boldsymbol{U}} \widetilde{\boldsymbol{V}}^{\mathrm{T}} \boldsymbol{B},并将其标准化得到\overline{\boldsymbol{P}},这里\widetilde{\boldsymbol{U}}、\widetilde{\boldsymbol{V}}与前面一致,B为对角矩阵,其对角元服从独立同分布的贝塔分布(Beta(α1, α2))。取α1=α2=0.1,d=1 000、r=10、轨迹长度n=round(qdr(log d)2)时, 3种方法的估计效果(图 2)表明:对于非平衡分布情况下的马尔可夫过程估计问题,LRSEA算法的估计误差小于谱估计方法和经验估计方法的。

    图  2  非平衡分布下3种估计方法的比较
    Figure  2.  The comparison of three estimators in imbalanced distribution

    纽约市曼哈顿岛于2016年公开的黄色出租车运行轨迹数据集记录了r次乘客的行程(https://s3.amazonaws.com/nyc-tlc/trip+data/yellow_tripdata_2016-01.csv),本研究利用此数据集将曼哈顿岛分割成几个区域,满足同一区域中的乘客前往同一个目的地的概率相似。

    类似文献[1],本文将曼哈顿岛细分为大小一致的小正方形网格,将每个小网格近似地看成马尔可夫过程的一个状态,乘客从一个网格到另一个网格的行程视为该马尔可夫过程的一次状态转移。为了排除干扰项,本文只选取那些作为行程的起点或者终点的总次数超过2 000的网格作为有效状态。然后,利用LRSEA算法来估计该马尔可夫过程的状态转移矩阵,并利用k-均值聚类方法对估计矩阵的左奇异子空间进行聚类划分。由r=k分别为4, 5, 6, 7时的聚类结果(图 3)可知:当聚类数r增加时,LRSEA算法可以给曼哈顿岛的交通网络一个较好的分区,同一个区域的乘客前往同一个地点的概率相似。

    图  3  LRSEA算法对曼哈顿岛交通网络的划分结果
    注:1种颜色代表 1个区域。
    Figure  3.  The result of a citywide partition of Manhattan traffic network with the low-rank spectral method

    鉴于在不同时段,人们出行目的不同,将该出租车运行数据集化分为3个时段:早上(06:00~11:59)、中午(12:00~17:59)、晚上(18:00~23:59),每个时段的有效状态数分别为769、1 029、1 147个。利用LRSEA算法来估计每个时段的马尔可夫过程的状态转移矩阵,并利用k-均值聚类方法对估计矩阵的左奇异子空间进行聚类划分,其中xietichuli=xietichuli=5。聚类结果所展示的在不同时段下LRSEA算法对曼哈顿岛的交通网络的分区结果(图 4)表明:同一时段下,同一个区域的乘客前往同一个目的地的概率相似。

    图  4  LRSEA算法在不同时间段下对曼哈顿岛交通网络的划分结果
    注:1种颜色代表 1个区域。
    Figure  4.  The result of a per-time-segment citywide partition of Manhattan traffic network with the low-rank spectral method

    针对马尔可夫过程的估计问题,利用秩约束状态转移矩阵集合的近似投影,本文对现有的谱方法进行低秩修正,提出了一个低秩谱估计算法(LRSEA),以快速得到满足秩约束条件的状态转移矩阵。此外,通过建立秩约束状态转移矩阵集合的局部Lipschitz型误差界,给出该算法的统计误差界,建立了算法的理论保证。数值实验结果表明,对于具有非平衡分布的低秩马尔可夫过程的估计问题,LRSEA算法的估计误差小于谱估计方法和经验估计方法的。下一步,将把LRSEA算法应用到强化学习问题以及系统工程领域中的控制问题。

  • 图  1   双向机制对企业自愿碳减排的作用机理

    Figure  1.   Action mechanism of bidirectional mechanism on voluntary carbon emission reduction of enterprises

    图  2   政府策略演化相位图

    Figure  2.   Phase diagram of government strategy evolution

    图  3   企业策略演化相位图

    Figure  3.   Phase diagram of enterprise strategy evolution

    图  4   消费者策略演化相位图

    Figure  4.   Phase diagram of consumer strategy evolution

    图  5   dq1对系统演化的影响

    Figure  5.   Impact of d, q1 on the system evolution

    图  6   Re2、1-α、e1对系统的影响

    Figure  6.   Impact of Re2, 1-α, e1 on the system evolution

    图  7   Re1p2θ对系统的影响

    Figure  7.   Impact of Re1, p2, θ on the system evolution

    表  1   企业、政府与消费者的三方演化博弈收益矩阵

    Table  1   Tripartite evolutionary game income matrix of enterprise, government and consumer

    博弈方 消费者
    政府 企业 低碳消费z(0≤z≤1) 普通消费1-z
    物质激励
    x(0≤x≤1)
    自愿减排
    y(0≤y≤1)
    \begin{gathered} R_{\mathrm{g}}+R_{\mathrm{g} 1}-e_1-(1-\alpha)\left(c_1+c_2\right) ; \\ R_e+R_{e 1}-\alpha c_1+e_1 ; \\ R_c+R_{c 1}-\alpha c_2 \end{gathered} \begin{gathered} R_g+R_{g 1}-e_1-(1-\alpha) c_1 \\ R_e-\alpha c_1+e_1-d \\ R_c-\theta \end{gathered}
    不减排
    1-y
    \begin{gathered} R_g-p_1 \\ R_e-q_1-q_2-q_4 \\ R_c+R_{c 2}-\theta \end{gathered} \begin{gathered} R_g-p_1 \\ R_e-q_1-q_2 \\ R_c-\theta \end{gathered}
    非物质激励
    1-x
    自愿减排y
    (0≤y≤1)
    \begin{gathered} R_g+R_{g 2} \\ R_e+R_{e 1}+R_{e 2}-c_1-p_2 \\ R_c+R_{c 1}-c_2+p_2 \end{gathered} \begin{gathered} R_g+R_{g 2}-e_2 \\ R_e+R_{e 2}-c_1-d \\ R_c-\theta \end{gathered}
    不减排
    1-y
    \begin{gathered} R_g-p_1 \\ R_e-q_1-q_3-q_4 \\ R_c+R_{c 2}-\theta \end{gathered} \begin{gathered} R_g-p_1-e_2 \\ R_e-q_1-q_3 \\ R_c-\theta \end{gathered}
    下载: 导出CSV

    表  2   均衡点稳定性分析

    Table  2   Stability analysis of equilibrium points

    均衡点 Jacobian矩阵特征值(λ1λ2λ3) 实部符号 稳定性 条件
    E1(0, 0, 0) Rc2, e2, Re2c1d+q1+q3 (+, +, ×) 不稳定点
    E2(0, 0, 1) Rc2, Re1+Re2c1p2+q1+q3+q4, 0 (-, -, 0); 不稳定点 y=0时, Re1+Re2c1p2+q1+q3+q4 < 0。
    E3(0, 1, 0) c1Re2+dq1q3, Rg1Rg2-(1-α)c1e1+e2, Rc1c2+θ+p2 (-, -, -) ESS x=0时, Rg1Rg2-(1-α)c1e1+e2 < 0;
    y=1时, c1Re2+dq1q3 < 0;
    z=0时, Rc1c2+θ+p2 < 0。
    E4(0, 1, 1) c1Re2Re1+p2q1q3q4, Rg1Rg2-(1-α)·(c1+c2), c2Rc1θp2 (-, -, -) ESS x=0时, Rg1Rg2-(1-α)(c1+c2) < 0;
    y=1时, c1Re2Re1+p2q1q3q4 < 0;
    z=1时, c2Rc1θp2 < 0。
    E5(1, 0, 0) e2, e1d+q1+q2αc1, Rc2 (-, -, +) 不稳定点 y=0时, e1d+q1+q2αc1 < 0。
    E6(1, 0, 1) Re1+e1+q1+q2+q4αc1, -Rc2, 0 (-, -, 0) 不确定 y=0时, Re1+e1+q1+q2+q4αc1 < 0。
    E7(1, 1, 0) d-e1q1q2+αc1, Rg2Rg1+c1+e1e2αc1, Rc1θαc2 (-, -, -) ESS x=1时, Rg2Rg1+c1+e1e2αc1 < 0;
    y=1时, de1q1q2+αc1 < 0;
    z=0时, Rc1θαc2 < 0。
    E8(1, 1, 1) αc1e1q1q2q4Re1, Rg1Rg2-(1-α)·(c1+c2)-e1, αc2θRc1 (-, +, -) 不稳定点 x=1时, Rg1Rg2-(1-α)(c1+c2)-e1 < 0;
    y=1时, αc1e1q1q2q4Re1 < 0;
    z=1时, αc2θRc1 < 0。
    E9(0, y1, z1) a1, λ2=λ3=w (-, 0, 0) 不确定 a1 < 0;
    x=0时, Rg1Rg2-(1-α)(c1+c2)-e1 < 0。
    E10(x2, y2, 0) a2, λ2=-λ3=μ (×, +, -) 不稳定点 Rg1Rg2-(1-α)c1e1>0;
    (1-α)c1+e1Re2q3+q2>0。
    E12(x3, 1, z3) a3, λ2=λ3=π (-, 0, 0) 不确定 a3 < 0, (1-α)c2p2 < 0;
    E13(x4, 0, 1) 0, λ2=λ3=φ (0, +, +) 不稳定点 Rg1Rg2-(1-α)(c1+c2)-e1>0。
    注:w=\sqrt{y_1\left(1-y_1\right)\left(R_{e 1}-p_2+d+q_4\right) z_1\left(1-z_1\right)\left(R_{c 1}-R_{c 2}+c_2+p_2\right)} \cdot i, \varphi=\sqrt{x_2\left(1-x_2\right)\left[-(1-\alpha)\left(c_1-c_2\right)+R_{g 1}-R_{g 2}-e_1\right]}, \mu=\sqrt{x_2\left(1-x_2\right)\left(R_{g 1}-e_1-(1-\alpha) c_1-R_{g 2}\right) y_2\left(1-y_2\right)\left[(1-\alpha) c_1+e_1-R_{e 2}-q_3+q_2\right]}, \pi=\sqrt{x_3\left(1-x_3\right)\left[-(1-\alpha) c_1-e_2\right] z_3\left(1-z_3\right)\left[(1-\alpha) c_2-p_2\right]} \cdot i, ×表示特征值实部符号不确定。
    下载: 导出CSV
  • [1] 刘朝, 王梓林, 原慈佳. 结构视域下自主技术创新对工业碳排放的影响及趋势预测[J]. 中国人口·资源与环境, 2022, 32(7): 12-21. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGRZ202207002.htm

    LIU Z, WANG Z L, YUAN C J. Impact of independent technological innovation on industrial carbon emissions and trend prediction from the perspective of structure[J]. China Population, Resources and Environment, 2022, 32(7): 12-21. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGRZ202207002.htm

    [2] 张志勋. 论我国碳排放权交易体系的构建[J]. 企业经济, 2012, 31(6): 178-181. https://www.cnki.com.cn/Article/CJFDTOTAL-QUIT201206043.htm
    [3] 陆敏, 苍玉权, 李岩岩. 强制减排交易机制外企业会自愿减排么?[J]. 中国人口·资源与环境, 2019, 29(5): 21-29. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGRZ201905003.htm

    LU M, CANG Y Q, LI Y Y. Do enterprises choose voluntary emissions trading outside mandatory mechanism?[J]. China Population, Resources and Environment, 2019, 29(5): 21-29. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGRZ201905003.htm

    [4] 梅德文, 葛兴安, 邵诗洋. 自愿减排交易助力实现"双碳"目标[J]. 清华金融评论, 2021(10): 56-59. https://www.cnki.com.cn/Article/CJFDTOTAL-JRQH202110019.htm
    [5] 王道平, 尹一博, 董汉玺. 考虑政府补贴和制造商互惠偏好的碳减排策略研究[J]. 系统科学与数学, 2023, 43(8): 2064-2085. https://www.cnki.com.cn/Article/CJFDTOTAL-STYS202308009.htm

    WANG D P, YIN Y B, DONG H X. Research on carbon emission reduction strategies considering government subsidies and manufacturers' reciprocal preferences[J]. Journal of Systems Science and Mathematical Sciences, 2023, 43(8): 2064-2085. https://www.cnki.com.cn/Article/CJFDTOTAL-STYS202308009.htm

    [6] 魏琦, 丁亚楠. 计及消费领域的碳补贴政策演化博弈[J]. 中国环境科学, 2022, 42(3): 1456-1465. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGHJ202203052.htm

    WEI Q, DING Y N. An evolutionary game of carbon subsidy policy considering consumption field[J]. China Environmental Science, 2022, 42(3): 1456-1465. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGHJ202203052.htm

    [7] 巨烨. 浅析央行碳减排支持工具及其对市场的影响[J]. 中国财政, 2022(5): 80-81. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGCE202205040.htm
    [8] 王志强, 周隽, 沈月琴. 基于自愿协议减排的企业演化博弈分析[J]. 浙江农林大学学报, 2014, 31(5): 785-790. https://www.cnki.com.cn/Article/CJFDTOTAL-ZJLX201405022.htm

    WANG Z Q, ZHOU J, SHEN Y Q. Evolutionary game analysis of enterprises' emission reduction based on voluntary agreement[J]. Journal of Zhejiang A&F University, 2014, 31(5): 785-790. https://www.cnki.com.cn/Article/CJFDTOTAL-ZJLX201405022.htm

    [9] 周鹏, 高朱红, 闻雯. 政府补贴、碳减排目标约束与工业企业低碳策略选择[J]. 北京理工大学学报(社会科学版), 2022, 24(4): 118-128. https://www.cnki.com.cn/Article/CJFDTOTAL-BLDS202204011.htm

    ZHOU P, GAO Z H, WEN W. Government Subsidies, Constraints on emission reduction targets and firm's Low-Carbon strategy selections in industrial sector[J]. Journal of Beijing Institute of Technology(Social Sciences Edition), 2022, 24(4): 118-128. https://www.cnki.com.cn/Article/CJFDTOTAL-BLDS202204011.htm

    [10] 陈晓红, 王钰, 李喜华. 环境规制下区域间企业绿色技术转型策略演化稳定性研究[J]. 系统工程理论与实践, 2021, 41(7): 1732-1749. https://www.cnki.com.cn/Article/CJFDTOTAL-XTLL202107009.htm

    CHEN X H, WANG Y, LI X H. Research on green technology transformation strategy of inter-regional enterprises under environmental regulation based on evolutionary game theory[J]. Systems Engineering-Theory & Practice, 2021, 41(7): 1732-1749. https://www.cnki.com.cn/Article/CJFDTOTAL-XTLL202107009.htm

    [11] 吴健宇, 袁涛, 李洁, 等. 碳中和视角下广东省主体功能区特征与优化策略研究[J]. 华南师范大学学报(自然科学版), 2022, 54(3): 111-127. doi: 10.6054/j.jscnun.2022050

    WU J Y, YUAN T, LI J, et al. On the characteristics and optimization strategies of Guangdong province's major functional zones from the perspective of carbon neutrality[J]. Journal of South China Normal University(Natural Science Edition), 2022, 54(3): 111-127. doi: 10.6054/j.jscnun.2022050

    [12] 程承, 安润飞, 董康银, 等. 碳交易机制引导下可再生能源发电企业创新策略研究——基于演化博弈视角[J]. 中国管理科学, 2024(3): 82-94. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGGK202403009.htm

    CHENG C, AN R F, DONG K Y, et al. Research on innovation strategy for renewable power generation enterprises under the background of carbon trading mechanism-from the perspective of evolutionary game[J]. Chinese Journal of Management Science, 2024(3): 82-94. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGGK202403009.htm

    [13] 武丹, 杨玉香. 考虑消费者低碳偏好的供应链减排微分博弈模型研究[J]. 中国管理科学, 2021, 29(4): 126-137. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGGK202104013.htm

    WU D, YANG Y X. Study on the differential dame model for supply Chain with consumers' low carbon preference[J]. Chinese Journal of Management Science, 2021, 29(4): 126-137. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGGK202104013.htm

    [14]

    VANCLAY J K, SHORTISS J, AULSEBROOK S, et al. Customer response to carbon labeling of groceries[J]. Journal of Consumer Policy, 2011, 34(1): 153-160. doi: 10.1007/s10603-010-9140-7

    [15] 陈佳浩. "双碳"目标下政府、制造业企业与消费者的三方博弈[J]. 中国商论, 2023(12): 75-78. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGSM202312020.htm

    CHEN J H. The trilateral game among the government, manufacturing companies, and consumers under goals of carbon neutrality and carbon peak[J]. China Journal of Commerce, 2023(12): 75-78. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGSM202312020.htm

    [16] 张金泉, 温素彬, 李慧, 等. 低碳经济下供应链运营决策的演化博弈分析——基于政府-企业-消费者的协同作用视角[J/OL]. 运筹与管理, 2023: 1-9.
    [17] 昝欣, 欧国立. "补贴退坡"背景下补贴模式异质性与消费者购买行为的博弈研究[J]. 中央财经大学学报, 2021(5): 94-108. https://www.cnki.com.cn/Article/CJFDTOTAL-ZYCY202105009.htm

    ZAN X, OU G L. Game study on the heterogeneity of subsidy models and consumers' purchase behaviors under the background of "Subsidy Regression"[J]. Journal of Central University of Finance & Economics, 2021(5): 94-108. https://www.cnki.com.cn/Article/CJFDTOTAL-ZYCY202105009.htm

    [18] 刘志华, 徐军委, 张彩虹. 省域横向碳生态补偿的演化博弈分析[J]. 软科学, 2021, 35(11): 115-122. https://www.cnki.com.cn/Article/CJFDTOTAL-XUXI202111018.htm

    LIU Z H, XU J W, ZHANG C H. The evolutionary game analysis of inter-provincial horizontal carbon ecological compensation[J]. Soft Science, 2021, 35(11): 115-122. https://www.cnki.com.cn/Article/CJFDTOTAL-XUXI202111018.htm

    [19] 李璟, 谢家平, 古丽扎尔·艾赛提. 非对称信息下考虑绿色偏好差异化与碳约束的减排定价策略优化[J/OL]. 中国管理科学, 2021: 1-13.

    LI J, XIE J P, GULIZHAER A. Optimization of emission reducing and pricing decisions based on differentiated green preference and carbon constraints under information asymmetry[J]. Chinese Journal of Management Science, 2022: 1-13.

    [20]

    FRIEDMAN D. Evolutionary games in economics[J]. Econometrica, 1991, 59(3): 637-666. doi: 10.2307/2938222

    [21] 朱立龙, 荣俊美, 张思意. 政府奖惩机制下药品安全质量监管三方演化博弈及仿真分析[J]. 中国管理科学, 2021, 29(11): 55-67. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGGK202111006.htm

    ZHU L L, RONG J M, ZHANG S Y. Three-party evolutionary game and simulation analysis of drug quality supervision under the government reward and punishment mechanism[J]. Chinese Journal of Management Science, 2021, 29(11): 55-67. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGGK202111006.htm

  • 期刊类型引用(1)

    1. 罗铝彬,康玉泉. 消费者偏好、政府补贴与企业绿色技术创新的演化及仿真. 中小企业管理与科技. 2024(21): 40-43 . 百度学术

    其他类型引用(0)

图(7)  /  表(2)
计量
  • 文章访问数:  70
  • HTML全文浏览量:  19
  • PDF下载量:  28
  • 被引次数: 1
出版历程
  • 收稿日期:  2023-10-12
  • 网络出版日期:  2024-06-21
  • 刊出日期:  2024-04-24

目录

/

返回文章
返回