Processing math: 0%

掺混含氧燃料对柴油模型燃料燃烧过程的影响

李铭迪, 李广华, 陈健, 胡焰彬, 李友势

李铭迪, 李广华, 陈健, 胡焰彬, 李友势. 掺混含氧燃料对柴油模型燃料燃烧过程的影响[J]. 华南师范大学学报(自然科学版), 2024, 56(2): 11-17. DOI: 10.6054/j.jscnun.2024017
引用本文: 李铭迪, 李广华, 陈健, 胡焰彬, 李友势. 掺混含氧燃料对柴油模型燃料燃烧过程的影响[J]. 华南师范大学学报(自然科学版), 2024, 56(2): 11-17. DOI: 10.6054/j.jscnun.2024017
LI Mingdi, LI Guanghua, CHEN Jian, HU Yanbin, LI Youshi. Impact of Blending Oxygenated Fuels on the Formation of Intermediate Products in Diesel Combustion Process[J]. Journal of South China Normal University (Natural Science Edition), 2024, 56(2): 11-17. DOI: 10.6054/j.jscnun.2024017
Citation: LI Mingdi, LI Guanghua, CHEN Jian, HU Yanbin, LI Youshi. Impact of Blending Oxygenated Fuels on the Formation of Intermediate Products in Diesel Combustion Process[J]. Journal of South China Normal University (Natural Science Edition), 2024, 56(2): 11-17. DOI: 10.6054/j.jscnun.2024017

掺混含氧燃料对柴油模型燃料燃烧过程的影响

基金项目: 

国家自然科学基金项目 52206230

详细信息
    通讯作者:

    李铭迪, Email: lmd-fj@163.com

  • 中图分类号: TK46+4

Impact of Blending Oxygenated Fuels on the Formation of Intermediate Products in Diesel Combustion Process

  • 摘要:

    采用Chemkin-Pro柴油机燃烧模型,以正庚烷作为柴油的模型燃料,构建了乙醇/二甲醚/正庚烷燃烧机理。研究乙醇和二甲醚这两种含氧燃料的不同掺混比(摩尔比)对正庚烷燃烧温度、燃烧压力以及燃烧产物的影响规律。结果表明:与掺混二甲醚相比,掺混乙醇对反应温度和压力的降低更为显著。而当乙醇和二甲醚同时掺混时,二甲醚的掺混比成为决定反应时刻的关键因素。随着二甲醚掺混比从15%增加到35%,燃烧反应提前了约10°(曲轴转角)。此外,二甲醚掺混比对氧化自由基的生成时刻具有显著影响,掺混比越高,自由基的生成时刻越早。在自由基摩尔分数峰值方面,乙醇掺混比例发挥着主导作用。随着乙醇掺混比的增加,3种自由基的摩尔分数峰值均呈现上升趋势。在燃烧产物方面,掺混乙醇能够有效降低甲醛和乙醛的生成量,而掺混二甲醚则能够减少乙醛的生成,但可能导致甲醛生成量的增加。当乙醇和二甲醚同时掺混,并增加二甲醚的比例时,甲醛和乙醛的摩尔分数峰值均下降,同时CO2的最终生成量也有所减少。

    Abstract:

    Employing the Chemkin-Pro diesel engine combustion model, n-heptane was chosen as a surrogate fuel to represent diesel, and a combustion mechanism encompassing ethanol/dimethyl ether/n-heptane was developed. The investigation delved into the effects of varying molar blending ratios of ethanol and dimethyl ether, two oxygenated fuels, on the combustion temperature, pressure, and resulting products of n-heptane. The outcomes revealed that ethanol blending led to a more pronounced reduction in reaction temperature and pressure compared to dimethyl ether. Notably, when ethanol and dimethyl ether were blended concurrently, the blending ratio of dimethyl ether emerged as a determinant factor in shaping the reaction timing. Specifically, as the dimethyl ether blending ratio rose from 15% to 35%, the combustion reaction advanced by approximately 10°(Crank Angle). Furthermore, the blending ratio of dimethyl ether exerted a significant influence on the genesis timing of oxidizing free radicals, with a higher ratio precipitating an earlier formation. Conversely, the peak molar fractions of free radicals were primarily influenced by the blending ratio of ethanol. As the ethanol blending ratio increased, the peak molar fractions of all three free radicals exhibited a rising trend. In terms of combustion products, ethanol blending effectively mitigated the formation of formaldehyde and acetaldehyde, while dimethyl ether blending primarily reduced acetaldehyde levels but potentially increased formaldehyde production. Intriguingly, when ethanol and dimethyl ether were blended in tandem and the proportion of dimethyl ether was enhanced, both the peak molar fractions of formaldehyde and acetaldehyde decreased, and the ultimate production of CO2 also diminished.

  • 马尔可夫过程的估计问题是计算机科学、系统工程和数据科学等领域中的一个核心问题[1]。计算个性化网页排序的状态转移矩阵问题[2]、解决电子商务中的排序问题[3]和分析城市出租车或公交车的运行轨迹问题[4-5]等都可归结为马尔可夫过程的估计问题。源于上述问题的马尔可夫过程往往拥有很大的状态空间,但是它们的状态转移矩阵却被证明了是低秩或者近似低秩的矩阵[1]。因此,学者们对低秩马尔可夫过程的状态转移矩阵的估计及其应用问题开展了研究[1, 6-10]

    据我们所知,现有的估计方法都不能保证得到低秩的转移矩阵估计。譬如,ZHANG和WANG[1]利用频率矩阵的经验估计的截断奇异值分解结合非负投影,提出了低秩马尔可夫过程的谱估计方法,并建立了估计的统计误差界,证明了估计误差与极小极大误差的下界相差一个马尔可夫链轨迹长度的对数因子。但是,由于谱估计方法利用了非负投影,导致该文献最后得到的估计矩阵不是低秩的。ZHU等[8]提出了状态转移矩阵的核范数正则罚极大似然估计模型和秩约束极大似然估计模型,并建立了2种模型的统计误差界,证明了估计误差与极小极大误差的下界相差一个马尔可夫链状态空间维数的对数因子。然而,核范数正则优化问题的最优解不一定满足低秩条件,秩约束优化问题的最优解虽能满足秩约束条件,但其求解一般都是NP难。尽管文献[8]设计了一类DC (凸函数的差) 规划算法来近似求解秩约束极大似然估计模型,但不能保证算法的输出是一个低秩矩阵。特别地,该DC规划算法的每一步都需要进行奇异值分解,计算量非常大,因此不适用于大规模的马尔可夫过程估计问题。

    另一方面,误差界研究一直以来都是最优化领域中的重点和难题[11-15]。PANG[11]证明了:凸多面体集合具有全局Lipschitz型误差界; 在一定的约束规范下,一般凸不等式系统具有Lipschitz型误差界; 对一般非凸不等式系统,全局误差界(即使是Hölder型的)都很难成立。目前已有的研究主要是对次解析不等式系统和多项式不等式系统建立了局部Hölder型误差界[14],对矩阵秩约束系统的误差界研究还很少。对于一个有界且其多值函数在原点满足calmness条件的矩阵秩约束系统,BI和PAN[15]得到了该系统的局部和全局Lipschitz型误差界。但是,验证多值函数的calmness条件与建立误差界的难度基本一样。因此,我们需要寻求新的工具来研究矩阵秩约束系统的误差界。

    受上述启发,本文试图寻求一个能够快速获得低秩转移矩阵的方法,以估计大规模的低秩马尔可夫过程。首先,建立秩约束状态转移矩阵集合的局部Lipschitz型误差界,并寻求该集合高质量的近似投影方法; 然后,提出一种低秩马尔可夫过程状态转移矩阵的低秩谱估计算法(LRSEA),并进行数值实验。

    本节为秩约束状态转移矩阵集合建立局部Lipschitz型误差界。首先,给出本文的记号。

    (1) 记\boldsymbol{I} \in \mathbb{R}^{d \times d}、\boldsymbol{E} \in \mathbb{R}^{d \times d}、\boldsymbol{e} \in \mathbb{R}^d分别为单位矩阵、元素全为1的矩阵、元素全为1的向量。

    (2) 对于\boldsymbol{P} \in \mathbb{R}^{d \times d},定义\|\boldsymbol{P}\|_{\infty}: =\max \limits_{i, j}\left|P_{i j}\right|为无穷范数,\|\boldsymbol{P}\|_F: =\sqrt{\sum\limits_{i=1}^d \sum\limits_{j=1}^d P_{i j}^2}为Frobenius范数。

    (3) 秩约束状态转移矩阵集合定义为:\varPi: =\{\boldsymbol{P} \in \left.\mathbb{R}^{d \times d}: \operatorname{rank}(\boldsymbol{P}) \leqslant r, \boldsymbol{P e}=\boldsymbol{e}, P_{i j} \geqslant 0, 1 \leqslant i, j \leqslant d\right\},其中r \in [1, d-1]是一个给定整数。对于\boldsymbol{Z} \in \mathbb{R}^{d \times d},定义Z到集合Π的距离为:

    \operatorname{dist}(\boldsymbol{Z}, \varPi):=\min \left\{\|\boldsymbol{Z}-\boldsymbol{P}\|_F: \boldsymbol{P} \in \varPi\right\} 。

    (4) 给定\boldsymbol{x} \in \mathbb{R}^d,定义l1范数为\|\boldsymbol{x}\|_1:=\sum\limits_{i=1}^d\left|x_i\right|,无穷范数为\|\boldsymbol{x}\|_{\infty}: =\max \limits_i\left|x_i\right|,记\operatorname{diag}(\boldsymbol{x}) \in \mathbb{R}^{d \times d}是第i个对角元为xi(i=1, 2, …, d)的对角矩阵。

    (5) 定义秩r约束矩阵集合为\mathcal{R}: =\left\{\boldsymbol{Z} \in \mathbb{R}^{d \times d}\right. : \operatorname{rank}(\boldsymbol{Z}) \leqslant r\}。对任意\boldsymbol{P} \in \mathbb{R}^{d \times d},定义

    \varUpsilon_{\mathcal{R}}(\boldsymbol{P}):=\sum\limits_{i=1}^r \sigma_i(\boldsymbol{P}) u_i(\boldsymbol{P}) v_i(\boldsymbol{P})^{\mathrm{T}},

    其中,\sigma_i(\boldsymbol{P})(i=1, 2, \cdots, r)P的第i个最大奇异值,u_i(\boldsymbol{P}) \in \mathbb{R}^d、v_i(\boldsymbol{P}) \in \mathbb{R}^d分别是σi(P)对应的左、右奇异向量。众所周知,在Frobenius范数距离意义下,\varUpsilon_{\mathcal{R}}(\boldsymbol{P})P\mathcal{R}上的一个投影矩阵。

    (6) 定义集合\varOmega: =\left\{\boldsymbol{Z} \in \mathbb{R}^{d \times d}: Z \boldsymbol{e}=\boldsymbol{e}, \beta / d \geqslant Z_{i j} \geqslant\right. \alpha / d, 1 \leqslant i, j \leqslant d\},其中\alpha \in(0, 1)\beta \in(1, d)是给定常数。

    下面给出建立矩阵\boldsymbol{P} \in \varOmega 与投影矩阵\varUpsilon_{\mathcal{R}}(\boldsymbol{P})之间关系的引理。

    引理1   令\gamma \in(0, 1)是给定常数。任取\boldsymbol{P} \in \varOmega,若\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_i \geqslant \gamma(i=1, 2, \cdots, d),则有:

    \|\boldsymbol{I}-\boldsymbol{D}\|_{\infty} \leqslant \frac{d}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}, (1)
    \left\|\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \frac{d\left(\|\boldsymbol{P}\|_{\infty}+\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}\right)}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}, (2)
    \left|\min \left(0, \min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j\right)\right| \leqslant \frac{1}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}, (3)

    其中\boldsymbol{D}: =\operatorname{diag}\left(\frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_1}, \cdots, \frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_d}\right)

    证明   由于(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})e)jγ>0 (j=1, 2, …, d)且Pe=e,利用\langle\boldsymbol{x}, \boldsymbol{y}\rangle \leqslant\|\boldsymbol{x}\|_1\|\boldsymbol{y}\|_{\infty}\left(\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^d\right),有

    \|\boldsymbol{I}-\boldsymbol{D}\|_{\infty}=\max \limits_j\left|1-\frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j}\right|=\\ \max \limits_j \frac{\left|\left(\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j-1\right|}{\left(\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j} \leqslant\\ \frac{1}{\gamma} \max \limits_j\left|\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j-(\boldsymbol{P} \boldsymbol{e})_j\right|=\\ \frac{1}{\gamma}\left\|\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right) \boldsymbol{e}\right\|_{\infty} \leqslant \frac{d}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} 。

    因此,不等式(1)成立。利用不等式(1)、ID是对角矩阵以及d\|\boldsymbol{P}\|_{\infty} \geqslant 1>\gamma,可得

    \begin{aligned} &\left\|\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}=\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})+(\boldsymbol{I}-\boldsymbol{D}) \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\|\boldsymbol{I}-\boldsymbol{D}\|_{\infty}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\frac{d\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}}{\gamma}\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(P)\right\|_{\infty} \leqslant \\ &\frac{d\left(\|\boldsymbol{P}\|_{\infty}+\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}\right)}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \circ \end{aligned}

    于是,不等式(2)成立。当0 \leqslant \min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j时,不等式(3)显然成立。当\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_j < 0时, 由\|\boldsymbol{D}\|_{\infty} \leqslant 1 / \gamma, \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j < 0\boldsymbol{P}_{i j} \geqslant 0, 1 \leqslant i, j \leqslant d,可得

    \begin{array}{r} 0<-\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j \leqslant-\|\boldsymbol{D}\|_{\infty} \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j= \\ \|\boldsymbol{D}\|_{\infty}\left|\min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j\right| \leqslant \frac{1}{\gamma}\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}, \end{array}

    不等式(3)成立。证毕。

    \gamma>0, c \in(0, 1)为给定常数。对任意矩阵\boldsymbol{P} \in \varOmega, 定义如下矩阵

    \left\{\begin{array}{l} \operatorname{diag}(\tilde{\boldsymbol{v}}) \widetilde{\boldsymbol{P}}\left(\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}, \left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) e\right)_j \geqslant \gamma, \right. \\ \left.\frac{\beta}{c} \geqslant\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j \geqslant c \alpha, 1 \leqslant j \leqslant d\right), \\ \frac{1}{d} \boldsymbol{E}\left(\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}>10\|\boldsymbol{P}\|_{\infty} \text { 或 } \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) e\right)_j <\gamma\right) \text { 或 } \\ \left.\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j <c \alpha \text { 或 } \max \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j>\frac{\beta}{c}\right), \end{array}\right. (4)

    其中,\boldsymbol{D}: =\operatorname{diag}\left(\frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_1}, \cdots, \frac{1}{\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_d}\right), \tilde{\boldsymbol{v}}= \left(\frac{1}{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_1}, \frac{1}{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_2}, \cdots, \frac{1}{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_d}\right)^{\mathrm{T}}, \widetilde{\boldsymbol{P}}=\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{t} \boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P}), \boldsymbol{t} \in \mathbb{R}^d,定义为t_i=\min \left(0, \min \limits_{1 \leqslant j \leqslant d} \frac{\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_{i j}}{\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j}\right)(i=1, 2, \cdots, d)

    下面给出建立集合Π的局部Lipschitz型误差界的命题。

    命题1   令\gamma \in(0, 1 / 2], c \in(0, (\sqrt{5}-1) / 2), \beta \geqslant 1 \geqslant \alpha>0是给定常数。任取\boldsymbol{P} \in \varOmega,有\widetilde{\boldsymbol{P}}_{\varPi} \in \varPi,且

    \frac{1}{d} \cdot\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{I I}\right\|_F \leqslant \frac{11 \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right)\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}。 (5)

    证明   设\boldsymbol{P} \in \varOmega, 下面分5种情况证明。

    (1) 假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}, \left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j \geqslant \gamma\beta / c \geqslant\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j \geqslant c \alpha(1 \leqslant j \leqslant d)。由\widetilde{\boldsymbol{P}}t_i的定义,可得\widetilde{P}_{i l}=\left(\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_{i l}-t_i\left(\boldsymbol{e} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_l \geqslant 0 (1 \leqslant i, l \leqslant d)。注意-t_i\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_l \geqslant 0,可得\widetilde{P}_{i l} \geqslant\left(\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_{i l}(1 \leqslant i, l \leqslant d),因此(\widetilde{\boldsymbol{P}} \boldsymbol{e})_i \geqslant \left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_i=1(i=1, 2, \cdots, d),进而得到0 < \tilde{v}_i \leqslant 1(i=1, 2, \cdots, d)。定义\widetilde{\boldsymbol{P}}_{\varPi}=\operatorname{Diag}(\tilde{\boldsymbol{v}}) \widetilde{\boldsymbol{P}},由\operatorname{rank}(\widetilde{\boldsymbol{P}}) \leqslant r,可得\operatorname{rank}\left(\widetilde{\boldsymbol{P}}_{\varPi}\right) \leqslant r, \widetilde{\boldsymbol{P}}_{\varPi} \geqslant 0, \widetilde{\boldsymbol{P}}_{\varPi} \boldsymbol{e}=\boldsymbol{e},即\widetilde{\boldsymbol{P}}_{\varPi} \in \varPi。根据假设\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} Y_{\mathcal{R}}(\boldsymbol{P})\right)_j \geqslant c \alpha(1 \leqslant j \leqslant d),可得\frac{\left|\min \left(0, \min _{1 \leqslant i \leqslant d}\left(\boldsymbol{D} Y_{\mathcal{R}}(\boldsymbol{P})\right)_i\right)\right|}{c \alpha} \geqslant\|\boldsymbol{t}\|_{\infty}。利用假设\beta / c \geqslant\left\|\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty},可得

    \left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ \frac{\left|\min \left(0, \min _{1 \leqslant i \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_i\right)\right|}{c \alpha}\left\|\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ \frac{\beta\left|\min \left(0, \min _{1 \leqslant i \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_i\right)\right|}{c^2 \alpha}。 (6)

    由不等式(6)、\|\boldsymbol{D}\|_{\infty} \leqslant 1 / \gamma, \left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|\boldsymbol{P}_I=\operatorname{Diag}(\widetilde{\boldsymbol{v}}) \widetilde{\boldsymbol{P}},可得

    \begin{aligned} &\left\|\widetilde{\boldsymbol{P}}_{\varPi}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant\left\|(\operatorname{Diag}(\tilde{\boldsymbol{v}})-\boldsymbol{I}) \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+ \\ &\left\|\operatorname{Diag}(\tilde{\boldsymbol{v}})\left(\widetilde{\boldsymbol{P}}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)\right\|_{\infty} \leqslant \max \limits_j\left|1-\frac{1}{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_j}\right|\|\boldsymbol{D}\|_{\infty} \times \\ &\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\|\tilde{\boldsymbol{v}}\|_{\infty}\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \frac{\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \times}{\gamma} \times \\ &\max \limits_j\left|\frac{(\widetilde{\boldsymbol{P}} \boldsymbol{e})_j-\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j}{\| \widetilde{\boldsymbol{P}} \boldsymbol{e})_j}\right|+\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\frac{\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}}{\gamma} \max \limits_j\left|\left(\left(\widetilde{\boldsymbol{P}}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right) \boldsymbol{e}\right)_j\right|+\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\frac{d\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}}{\gamma}\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\left\|\widetilde{\boldsymbol{P}}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \\ &\frac{11 d\|\boldsymbol{P}\|_{\infty}}{\gamma} \cdot \frac{\beta\left|\min \left(0, \min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j\right)\right|}{c^2 \alpha}。 \end{aligned} (7)

    因此,利用d\|\boldsymbol{P}\|_{\infty} \leqslant \beta及不等式(2)、(3)、(7),可得

    \begin{aligned} \frac{1}{d} \cdot\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F \leqslant\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_{\infty} \leqslant\left\|\widetilde{\boldsymbol{P}}_{\varPi}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}+\\ \left\|\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant \frac{11 \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right)\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty}, \end{aligned}

    即不等式(5)成立。

    假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}>10\|\boldsymbol{P}\|_{\infty}\min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right) < \gamma\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right) < c \alpha\max \limits_{1 \leqslant j \leqslant d}\left(e^1 \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)>\beta / c, 由式(4)可知\widetilde{\boldsymbol{P}}_{\varPi}=\boldsymbol{E} / d。显然1\widetilde{\boldsymbol{P}}_{\varPi} \in \varPi

    \frac{1}{d} \cdot\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F \leqslant\left\|\boldsymbol{P}-\frac{1}{d} \boldsymbol{E}\right\|_{\infty} \leqslant \max \left(\frac{1}{d}, \|\boldsymbol{P}\|_{\infty}\right) \leqslant\|\boldsymbol{P}\|_{\infty} 。

    (2) 假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}>10\|\boldsymbol{P}\|_{\infty}。显然

    \left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \geqslant 9\|\boldsymbol{P}\|_{\infty} \geqslant \frac{1}{d}\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F,

    不等式(5)成立。

    (3) 假设\left\|\varUpsilon_{\mathcal{R}}(P)\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}\min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j < \gamma。由于\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e} 中存在小于\gamma 的元素,不妨设\left(\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_i < \gamma_{\circ}(\boldsymbol{P e})_i=1dP\varUpsilon_{\mathcal{R}}(\boldsymbol{P})d\|\boldsymbol{P}\|_{\infty} \leqslant \beta,可得

    d\left\|\boldsymbol{P}-\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \geqslant\left\|\left(\boldsymbol{P}-\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P})\right) \boldsymbol{e}\right\|_{\infty} \geqslant$ $(\boldsymbol{P e})_i-\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_i \geqslant 1-\gamma \geqslant 0.5

    \begin{gathered} \frac{1}{d}\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_I\right\|_F \leqslant\|\boldsymbol{P}\|_{\infty} \leqslant 2 d\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty}\|\boldsymbol{P}\|_{\infty} \leqslant \\ 2 \beta\left\|\boldsymbol{P}-\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \circ \end{gathered}

    由此可得不等式(5)成立。

    (4) 假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}, \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j \geqslant \gamma\min \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right) < c \alpha。由于\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})中存在小于c \alpha的元素,不防设\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_i < c \alpha < \alpha。由\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{P}\right)_i \geqslant \alpha,可得

    \begin{gathered} d\left\|\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \geqslant\left\|\boldsymbol{e}^{\mathrm{T}}\left(\boldsymbol{P}-\boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)\right\|_{\infty} \geqslant \\ \quad\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{P}\right)_i-\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_i \geqslant \alpha-c \boldsymbol{\alpha}_{\circ} \end{gathered} (8)

    由不等式(8)、d\|\boldsymbol{P}\|_{\infty} \leqslant \beta 及引理1,可得

    \begin{aligned} &\frac{1}{d}\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F \leqslant\|\boldsymbol{P}\|_{\infty} \leqslant \\ &\|\boldsymbol{P}\|_{\infty} \frac{d}{\alpha(1-c)} \cdot \frac{11 \beta}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \leqslant \\ &\frac{11 \beta^2}{(1-c) \alpha \gamma}\left\|\boldsymbol{Y}_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \circ \end{aligned}

    c \in(0, (\sqrt{5}-1) / 2),可得不等式(5)成立。

    (5) 假设\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right\|_{\infty} \leqslant 10\|\boldsymbol{P}\|_{\infty}, \min \limits_{1 \leqslant j \leqslant d}\left(\varUpsilon_{\mathcal{R}}(\boldsymbol{P}) \boldsymbol{e}\right)_j \geqslant \gamma。由于\max \limits_{1 \leqslant j \leqslant d}\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \varUpsilon_{\mathcal{R}}(\boldsymbol{P})\right)_j>\beta / c_{\text {。}} 由于\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})中存在大于β/c的元素,不妨设\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_i>\beta / c。由\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{P}\right)_i \leqslant \beta,可得

    \begin{aligned} d \| & \boldsymbol{P}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\left\|_{\infty} \geqslant\right\| \boldsymbol{e}^{\mathrm{T}}\left(\boldsymbol{P}-\boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right) \|_{\infty} \geqslant \\ &\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{\varUpsilon}_{\mathcal{R}}(\boldsymbol{P})\right)_i-\left(\boldsymbol{e}^{\mathrm{T}} \boldsymbol{P}\right)_i \geqslant \frac{\beta}{c}-\beta=\frac{\beta(1-c)}{c} 。 \end{aligned} (9)

    由不等式(9)、d\|\boldsymbol{P}\|_{\infty} \leqslant \beta及引理1, 可得

    \begin{aligned} &\frac{1}{d}\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi}\right\|_F \leqslant\|\boldsymbol{P}\|_{\infty} \leqslant \\ &\|\boldsymbol{P}\|_{\infty} \frac{c d}{\beta(1-c)} \cdot \frac{11 \beta}{\gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \leqslant \\ &\frac{11 \beta^2}{(1-c) \gamma}\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} \leqslant \end{aligned}

    c \in(0, (\sqrt{5}-1) / 2),可得不等式(5)成立。证毕。

    由于\widetilde{\boldsymbol{P}}_{\varPi} \in \varPi,命题1给出了任意\boldsymbol{P} \in \varOmega到集合Π的距离估计,即

    \operatorname{dist}(\boldsymbol{P}, \varPi) \leqslant\left\|\boldsymbol{P}-\widetilde{\boldsymbol{P}}_{\varPi I}\right\|_F \leqslant \frac{11 d \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right)\left\|\varUpsilon_{\mathcal{R}}(\boldsymbol{P})-\boldsymbol{P}\right\|_{\infty} 。

    同时,在集合Π中找到了低秩状态转移矩阵\widetilde{\boldsymbol{P}}_{\varPi I},使得P\widetilde{\boldsymbol{P}}_{\varPi}的距离满足误差界不等式。所以,\widetilde{\boldsymbol{P}}_I可以看成是\boldsymbol{P} \in \varOmega 在集合Π上的近似投影矩阵。

    考虑d (≥2)个状态{S1, S2, …, Sd}的离散时间马尔可夫过程,假设其状态转移矩阵为\overline{\boldsymbol{P}} \in \mathbb{R}^{d \times d},频率矩阵为\overline{\boldsymbol{Q}} \in \mathbb{R}^{d \times d},且满足\operatorname{rank}(\overline{\boldsymbol{P}})=\operatorname{rank}(\overline{\boldsymbol{Q}}) \leqslant r \ll d。源于现实生活当中的一些马尔可夫过程已经被证明是低秩或者近似低秩的,比如交通网络、网页及电子商务排序[1-7]。本文旨在通过轨迹长为n+1的马尔可夫链{X0, X1, …, Xn}来估计其状态转移矩阵\overline{\boldsymbol{P}}

    首先给出本文的假设。

    假设1   存在常数\beta \in[1, d), \alpha \in(0, 1],使得:

    (1) \forall 1 \leqslant i, j \leqslant d, \alpha / d \leqslant \bar{P}_{i j} \leqslant \beta / d;

    (2) \left\{X_0, X_1, \cdots, X_n\right\}是遍历马尔可夫链,平稳分布为\boldsymbol{\pi} \in \mathbb{R}^d,满足\pi_i \geqslant \alpha / d(i=1, 2, \cdots, d), 其中\pi_i是向量\boldsymbol{\pi}的第i个元素。

    注意到文献[1]的谱估计矩阵虽然不是低秩的,但其是一个状态转移矩阵。因此,以谱估计矩阵为基础,利用式(4)计算秩-r状态转移矩阵作为\overline{\boldsymbol{P}}的估计,具体见算法1。

    算法1   LRSEA算法

    输入:谱估计矩阵\hat{\boldsymbol{S}} \in\left\{\boldsymbol{Z} \in \mathbb{R}^{d \times d}: Z \boldsymbol{e}=\boldsymbol{e}, Z_{i j} \geqslant 0, 1 \leqslant i, j \leqslant\right. d\}, \alpha \in(0, 1), \beta \in(1, d)r

    第1步:计算修正的谱估计

    for i=1 to d

    if \min \limits_{1 \leqslant j \leqslant d} \hat{S}_{i j} <\frac{\alpha}{d}

    n_{+}=\sum\limits_{j=1}^d \max \left(\frac{\alpha}{d}-\hat{S}_{i j}, 0\right); n_{-}=1-\alpha+n_{+};

    for j=1 to d

    \widetilde{S}_{i j}=\max \left(\hat{S}_{i j}-\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\frac{\alpha}{d}\right), \frac{\alpha}{d}\right);

    end for

    else

    \tilde{\boldsymbol{S}}(i, : )=\hat{\boldsymbol{S}}(i, : );

    end if

    end for

    for i=1 to d

    if \max \limits_{1 \leqslant j \leqslant d} \widetilde{S}_{i j}>\frac{\beta}{d}

    m_{+}=\sum\limits_{j=1}^d \max \left(\widetilde{S}_{i j}-\frac{\beta}{d}, 0\right); m_{-}=m_{+}+\beta-1 ;

    for j=1 to d

    S_{i j}=\min \left(\widetilde{S}_{i j}+\frac{m_{+}}{m_{-}}\left(\frac{\beta}{d}-\widetilde{S}_{i j}\right), \frac{\beta}{d}\right)

    end for

    else

    \boldsymbol{S}(i, : )=\widetilde{\boldsymbol{S}}(i, : );

    end if

    end for

    第2步:令\boldsymbol{P}=\boldsymbol{S}, \gamma \in(0, 1 / 2], c \in(0, (\sqrt{5}-1) / 2),由式(4)得到\overline{\boldsymbol{P}}的低秩谱估计\widetilde{\boldsymbol{S}}_{\varPi}

    由于LRSEA算法产生的估计矩阵\tilde{\boldsymbol{S}}_{\varPi} \in \varPi是一个满足低秩约束条件的状态转移矩阵,因此称其为低秩谱估计算法。可以预见,由于LRSEA算法可以满足低秩性要求,其有效性将高于现有的谱估计方法。为了建立LRSEA算法的理论保证,定义马尔可夫链的\frac{1}{4}-混合时间[16]

    \tau:=\min \left\{k: \max \limits_{1 \leqslant i \leqslant d} \frac{1}{2}\left\|(\overline{\boldsymbol{P}})^k(i, :)-\boldsymbol{\pi}^{\mathrm{T}}\right\|_1 \leqslant \frac{1}{4}\right\}。

    定理1   定义\bar{r}: =\|\overline{\boldsymbol{Q}}\|_F^2 / \sigma_r^2(\overline{\boldsymbol{Q}}),其中\sigma_r(\overline{\boldsymbol{Q}})\overline{\boldsymbol{Q}}的第r个最大奇异值,且记\kappa=d^2\|\overline{\boldsymbol{Q}}\|_{\infty}。若假设1成立,\tilde{S}, \boldsymbol{S}, \tilde{\boldsymbol{S}}_I \in \mathbb{R}^{d \times d}由LRSEA算法产生,则有:

    (a) S \in \varOmega

    \|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1(1 \leqslant i \leqslant d)

    (b) 令C_1=\frac{11 \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right) \sqrt{d}+1。存在常数C,使得

    E \frac{1}{d}\left\|\tilde{\boldsymbol{S}}_{\varPi}-\overline{\boldsymbol{P}}\right\|_F \leqslant C_1 \sqrt{\frac{C \bar{r} d \log ^2(n)}{n} \cdot \frac{\kappa^3 \tau}{\alpha^2}},

    其中E表示数学期望。

    证明   (a)由算法1,易证n_{-}=\sum\limits_{j=1}^d \max \left(\hat{S}_{i j}-\frac{\alpha}{d}, 0\right), m_{-}=\sum\limits_{j=1}^d \max \left(\frac{\beta}{d}-\tilde{S}_{i j}, 0\right)。由于\alpha < 1,所以n_{-}>n_{+} \geqslant 0。注意到\hat{\boldsymbol{S}} \in\left\{\boldsymbol{Z} \in \mathbb{R}^{d \times d}: Z \boldsymbol{e}=\boldsymbol{e}, Z_{i j} \geqslant 0, 1 \leqslant i, j \leqslant d\right\}。若\min \limits_{1 \leqslant j \leqslant d} S_{i j} \geqslant \alpha / d,则\tilde{\boldsymbol{S}}(i, j)=\hat{\boldsymbol{S}}(i, j) \geqslant \alpha / d(j=1, 2, \cdots, d)\tilde{\boldsymbol{S}}(i, : ) \boldsymbol{e}=1。若\min \limits_{1 \leqslant j \leqslant d} \hat{S}_{i j} < \alpha / d,利用n_{-}> n_{+} \geqslant 0\hat{S}_{i j} \leqslant \alpha / d 时, 有\tilde{S}_{i j}=\alpha / d; 当\hat{S}_{i j}>\alpha / d 时, 有

    \tilde{S}_{i j}=\hat{S}_{i j}-\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\frac{\alpha}{d}\right)>\hat{S}_{i j}-\left(\hat{S}_{i j}-\frac{\alpha}{d}\right)=\frac{\alpha}{d},

    \begin{gathered} \sum\limits_{j=1}^d \tilde{S}_{i j}=\sum\limits_{j: S_{i j} \leqslant \alpha / d} \frac{\alpha}{d}+\sum\limits_{j: S_{i j}>\alpha / d}\left(\hat{S}_{i j}-\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\frac{\alpha}{d}\right)\right)= \\ \sum\limits_{j: S_{i j} \leqslant \alpha / d} \frac{\alpha}{d}+\sum\limits_{j: s_{i j}>\alpha / d} S_{i j}-n_{+}=1 。 \end{gathered}

    因此,可得\alpha / d \leqslant \tilde{S}_{i j}\tilde{\boldsymbol{S}}(i, : ) \boldsymbol{e}=1(i, j=1, \cdots, d)。同理, 可以证明\alpha / d \leqslant S_{i j} \leqslant \beta / d\boldsymbol{S}(i, : ) \boldsymbol{e}=1(i, j= 1, \cdots, d)。因此, S \in \varOmega_{\text {。}}

    \min \limits_{1 \leqslant j \leqslant d} \hat{S}_{i j} \geqslant \alpha / d,由于\tilde{\boldsymbol{S}}(i, : )=\hat{\boldsymbol{S}}(i, : ),有

    \|\tilde{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1=\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|。

    现假设\min \limits_{1 \leqslant j \leqslant d} \hat{S}_{i j} < \alpha / d。利用\alpha / d \leqslant \bar{P}_{i j} \leqslant \beta / d \quad(1 \leqslant i, j \leqslant d), 可得

    \begin{aligned} &\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1=\sum\limits_{j: s_{i j} \leqslant \alpha / d}\left|\hat{S}_{i j}-\bar{P}_{i j}\right|+ \\ &\sum\limits_{j: s_{i j}>\alpha / d}\left|\hat{S}_{i j}-\bar{P}_{i j}\right|=\sum\limits_{j: s_{i j \leqslant} \leqslant \alpha / d}\left|\hat{S}_{i j}-\frac{\alpha}{d}+\frac{\alpha}{d}-\bar{P}_{i j}\right|+ \\ &\sum\limits_{j: S_{i j}>\alpha / d}\left|\bar{S}_{i j}+\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\alpha / d\right)-\bar{P}_{i j}\right| \geqslant \sum\limits_{j: S_{i j} \leqslant \alpha / d}\left|\hat{S}_{i j}-\frac{\alpha}{d}\right|+ \\ &\sum\limits_{j: S_{i j} \leqslant \alpha / d}\left|\frac{\alpha}{d}-\bar{P}_{i j}\right|+\sum\limits_{j: s_{i j}>\alpha / d}\left|\tilde{S}_{i j}-\bar{P}_{i j}\right|- \\ &\sum\limits_{j: S_{i j}>\alpha / d}\left|\frac{n_{+}}{n_{-}}\left(\hat{S}_{i j}-\frac{\alpha}{d}\right)\right|=n_{+}+\sum\limits_{j: s_{i j} \leqslant \alpha / d}\left|\tilde{S}_{i j}-\bar{P}_{i j}\right|+ \\ &\sum\limits_{j: S_{i j}>\alpha / d}\left|\tilde{S}_{i j}-\bar{P}_{i j}\right|-n_{+}=\|\tilde{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_{1 \circ} \end{aligned}

    由上述讨论,可得

    \|\tilde{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1(1 \leqslant i \leqslant d)。

    同理可以证明

    \|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant\|\tilde{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1(1 \leqslant i \leqslant d)。

    所以,

    \|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1(1 \leqslant i \leqslant d)。

    (b) 若假设1成立,则由文献[1]的定理1可知:存在一个常数C,使得

    E \max \limits_{1 \leqslant i \leqslant d}\|\hat{\boldsymbol{S}}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant \sqrt{\frac{C \bar{r} d \log ^2(n)}{n} \cdot \frac{\kappa^3 \tau}{\alpha^2}}。

    由(a)部分的结论,可知存在常数C,使得

    E \max \limits_{1 \leqslant i \leqslant d}\|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant \sqrt{\frac{C \bar{r} d \log ^2(n)}{n}\cdot \frac{\kappa^3 \tau}{\alpha^2}} 。 (10)

    由于\boldsymbol{S} \in \varOmega,由命题1可知

    其中C_2=\frac{11 \beta}{\gamma}\left(\frac{\beta}{c^2 \alpha \gamma}+1\right)。利用\varUpsilon_{\mathcal{R}}(S)的定义可得\left\|\boldsymbol{S}-\varUpsilon_{\mathcal{R}}(\boldsymbol{S})\right\|_F \leqslant\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_F。于是

    \begin{aligned} &\frac{1}{d}\left\|\tilde{\boldsymbol{S}}_{\varPi}-\overline{\boldsymbol{P}}\right\|_F \leqslant \frac{1}{d}\left\|\tilde{\boldsymbol{S}}_{\varPi}-\boldsymbol{S}\right\|_F+\frac{1}{d}\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_F \leqslant \\ &C_2\left\|\boldsymbol{S}-\varUpsilon_{\mathcal{R}}(\boldsymbol{S})\right\|_{\infty}+\frac{1}{d}\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_1 \leqslant C_2\left\|\boldsymbol{S}-\varUpsilon_{\mathcal{R}}(\boldsymbol{S})\right\|_F+ \\ &\frac{1}{d}\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_1 \leqslant C_2\|\boldsymbol{S}-\overline{\boldsymbol{P}}\|_F+\max \limits_{1 \leqslant i \leqslant d}\|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_1 \leqslant \\ &\quad\left(C_2 \sqrt{d}+1\right) \max \limits_{1 \leqslant i \leqslant d}\|\boldsymbol{S}(i, :)-\overline{\boldsymbol{P}}(i, :)\|_{10} \end{aligned} (11)

    由不等式(10)、(11)可得定理结论。证毕。

    定理1建立了LRSEA算法产生的估计矩阵与真实状态转移矩阵\overline{\boldsymbol{P}}之间的距离估计。由定理1(b)可知,轨迹长度n越大,估计误差的期望越小。

    在LRSEA算法中,取\gamma=0.01, c=0.02, \alpha=\frac{1}{2} d \times \min \limits_{1 \leqslant i, j \leqslant d} \bar{P}_{i j}, \beta=\min \left(d, 2 d \max \limits_{1 \leqslant i, j \leqslant d} \bar{P}_{i j}\right)。首先,通过人工合成数据实验来比较LRSEA算法、谱估计方法[1]、经验估计方法[17]的效果。然后,利用LRSEA算法与k-均值聚类方法结合来分析纽约曼哈顿岛出租车运行轨迹的公开数据集,揭露该城市的潜在交通模式。所有数值实验都是在配置为英特尔奔腾G4600处理器和CPU主频3.6 GHz的笔记本电脑上,通过运行MATLAB(2019年版本)完成的。

    首先,考虑具有平衡分布的低秩马尔可夫过程估计问题。假设\boldsymbol{U}_0 \in \mathbb{R}^{d \times r}, V_0 \in \mathbb{R}^{d \times r},它们的元素由标准正态分布随机生成。定义矩阵\widetilde{\boldsymbol{U}} \in \mathbb{R}^{d \times r}, \widetilde{\boldsymbol{V}} \in \mathbb{R}^{d \times r} : \widetilde{\boldsymbol{U}}_{[i, i]}=\left(\boldsymbol{U}_0 \odot \boldsymbol{U}_0\right)_{[i, :]} /\left\|\left(\boldsymbol{U}_0\right)_{[i, i]}\right\|_2^2(i=1, \cdots, d), \widetilde{\boldsymbol{V}}_{[:, j]}=\left(\boldsymbol{V}_0 \odot \boldsymbol{V}_0\right)_{[:, j]} /\left\|\left(\boldsymbol{V}_0\right)_{[:, j}\right\|_2^2(j=1, \cdots, r),这里\widetilde{\boldsymbol{U}}_{[i, , ]}表示\widetilde{\boldsymbol{U}}的第i行,\widetilde{\boldsymbol{V}}_{[:, j]} 表示\widetilde{\boldsymbol{V}} 的第j 列, \odot 表示矩阵Hadamard积。定义真实状态转移矩阵为\overline{\boldsymbol{P}}=\widetilde{\boldsymbol{U}} \widetilde{\boldsymbol{V}}^{\mathrm{T}}。本文利用状态转移矩阵\overline{\boldsymbol{P}} 生成状态数为d、长度为n=\operatorname{round}\left(q d r(\log d)^2\right) 的马尔可夫链X_0, \cdots, X_n, 这里q 是常数。

    下面比较文献[17]的经验估计方法、文献[1]的谱估计方法和LRSEA算法的估计误差。记P为相应的估计矩阵,本文利用以下2个数值来衡量其估计效果:

    \eta_F=\|\boldsymbol{P}-\overline{\boldsymbol{P}}\|_F^2, \eta_{U, V}=\max \left(r-\left\|\overline{\boldsymbol{U}}^{\mathrm{T}} \boldsymbol{U}\right\|_F^2, r-\left\|\overline{\boldsymbol{V}}^{\mathrm{T}} \boldsymbol{V}\right\|_F^2\right),

    其中,\boldsymbol{U} \in \mathbb{R}^{d \rtimes r}、\boldsymbol{V} \in \mathbb{R}^{d \times r}分别是P的前r个最大奇异值对应的左奇异向量、右奇异向量,\overline{\boldsymbol{U}} \in \mathbb{R}^{d \times r}、\overline{\boldsymbol{V}} \in \mathbb{R}^{d x_r} 分别是\overline{\boldsymbol{P}}的前r个最大奇异值对应的左奇异向量、右奇异向量。

    d=1 000、r=10、k\in [1, 10]时,3种方法的估计效果(图 1)表明:LRSEA算法与谱估计方法的估计误差相差不大,小于经验估计方法的。

    图  1  平衡分布下3种估计方法的比较
    Figure  1.  The comparison of three estimators in balanced distribution

    接下来,考虑具有非平衡分布的低秩马尔可夫过程的估计问题,即一部分状态的概率远小于其他状态的概率。此处构造矩阵\boldsymbol{P}=\widetilde{\boldsymbol{U}} \widetilde{\boldsymbol{V}}^{\mathrm{T}} \boldsymbol{B},并将其标准化得到\overline{\boldsymbol{P}},这里\widetilde{\boldsymbol{U}}、\widetilde{\boldsymbol{V}}与前面一致,B为对角矩阵,其对角元服从独立同分布的贝塔分布(Beta(α1, α2))。取α1=α2=0.1,d=1 000、r=10、轨迹长度n=round(qdr(log d)2)时, 3种方法的估计效果(图 2)表明:对于非平衡分布情况下的马尔可夫过程估计问题,LRSEA算法的估计误差小于谱估计方法和经验估计方法的。

    图  2  非平衡分布下3种估计方法的比较
    Figure  2.  The comparison of three estimators in imbalanced distribution

    纽约市曼哈顿岛于2016年公开的黄色出租车运行轨迹数据集记录了r次乘客的行程(https://s3.amazonaws.com/nyc-tlc/trip+data/yellow_tripdata_2016-01.csv),本研究利用此数据集将曼哈顿岛分割成几个区域,满足同一区域中的乘客前往同一个目的地的概率相似。

    类似文献[1],本文将曼哈顿岛细分为大小一致的小正方形网格,将每个小网格近似地看成马尔可夫过程的一个状态,乘客从一个网格到另一个网格的行程视为该马尔可夫过程的一次状态转移。为了排除干扰项,本文只选取那些作为行程的起点或者终点的总次数超过2 000的网格作为有效状态。然后,利用LRSEA算法来估计该马尔可夫过程的状态转移矩阵,并利用k-均值聚类方法对估计矩阵的左奇异子空间进行聚类划分。由r=k分别为4, 5, 6, 7时的聚类结果(图 3)可知:当聚类数r增加时,LRSEA算法可以给曼哈顿岛的交通网络一个较好的分区,同一个区域的乘客前往同一个地点的概率相似。

    图  3  LRSEA算法对曼哈顿岛交通网络的划分结果
    注:1种颜色代表 1个区域。
    Figure  3.  The result of a citywide partition of Manhattan traffic network with the low-rank spectral method

    鉴于在不同时段,人们出行目的不同,将该出租车运行数据集化分为3个时段:早上(06:00~11:59)、中午(12:00~17:59)、晚上(18:00~23:59),每个时段的有效状态数分别为769、1 029、1 147个。利用LRSEA算法来估计每个时段的马尔可夫过程的状态转移矩阵,并利用k-均值聚类方法对估计矩阵的左奇异子空间进行聚类划分,其中xietichuli=xietichuli=5。聚类结果所展示的在不同时段下LRSEA算法对曼哈顿岛的交通网络的分区结果(图 4)表明:同一时段下,同一个区域的乘客前往同一个目的地的概率相似。

    图  4  LRSEA算法在不同时间段下对曼哈顿岛交通网络的划分结果
    注:1种颜色代表 1个区域。
    Figure  4.  The result of a per-time-segment citywide partition of Manhattan traffic network with the low-rank spectral method

    针对马尔可夫过程的估计问题,利用秩约束状态转移矩阵集合的近似投影,本文对现有的谱方法进行低秩修正,提出了一个低秩谱估计算法(LRSEA),以快速得到满足秩约束条件的状态转移矩阵。此外,通过建立秩约束状态转移矩阵集合的局部Lipschitz型误差界,给出该算法的统计误差界,建立了算法的理论保证。数值实验结果表明,对于具有非平衡分布的低秩马尔可夫过程的估计问题,LRSEA算法的估计误差小于谱估计方法和经验估计方法的。下一步,将把LRSEA算法应用到强化学习问题以及系统工程领域中的控制问题。

  • 图  1   正庚烷机理与乙醇/二甲醚/正庚烷机理对比

    Figure  1.   Comparison of n-heptane mechanism and ethanol/dimethyl ether/n-heptane mechanism

    图  2   掺混含氧燃料对正庚烷反应温度的影响

    Figure  2.   Effect of blending oxygen-containing fuel on the reaction temperature of n-heptane

    图  3   掺混含氧燃料对正庚烷缸内压力的影响

    Figure  3.   Effect of blending oxygen-containing fuel on cylinder pressure of n-heptane

    图  4   掺混含氧燃料对氧自由基生成的影响

    Figure  4.   Effect of blending oxygen-containing fuel on the generation of oxygen free radicals

    图  5   掺混含氧燃料对OH自由基生成的影响

    Figure  5.   Effect of blending oxygen-containing fuel on the generation of OH radicals

    图  6   掺混含氧燃料对H自由基生成的影响

    Figure  6.   Effect of blending oxygen-containing fuel on the generation of H radicals

    图  7   掺混含氧燃料对甲醛生成的影响

    Figure  7.   Effect of blending oxygen-containing fuel on formaldehyde generation

    图  8   掺混含氧燃料对乙醛生成的影响

    Figure  8.   Effect of blending oxygen-containing fuel on acetaldehyde generation

    图  9   掺混含氧燃料对CO2生成的影响

    Figure  9.   Effect of blending oxygen-containing fuel on CO2 generation

  • [1] 苗长林, 李吾环, 吕鹏梅, 等. 酯类含氧燃料应用研究现状及进展[J]. 农业工程学报, 2021, 37(11): 197-205. doi: 10.11975/j.issn.1002-6819.2021.11.022

    MIAO C L, LI W H, LÜ P M, et al. Development and current situation of ester oxygenated fuels application[J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(11): 197-205. doi: 10.11975/j.issn.1002-6819.2021.11.022

    [2] 苏鹏, 杨鑫, 张永虎, 等. 高原环境下聚甲氧基二甲醚对柴油机燃烧和排放性能的影响[J]. 内燃机工程, 2022, 43(6): 55-61;68. https://www.cnki.com.cn/Article/CJFDTOTAL-NRJG202206007.htm

    SU P, YANG X, ZHANG Y, et al. Effects of polyoxymethylene dimethyl ethers on the combustion and emission characteristics of a diesel engine at plateau environment[J]. Chinese Internal Combustion Engine Engineering, 2022, 43(6): 55-61;68. https://www.cnki.com.cn/Article/CJFDTOTAL-NRJG202206007.htm

    [3] 王海峰, 李士杰, 谢斌, 等. 柴油/正戊醇/甲醇三元微乳化燃料柴油机燃烧与排放特性研究[J]. 内燃机工程, 2018, 39(5): 30-37. https://www.cnki.com.cn/Article/CJFDTOTAL-NRJG201805005.htm

    WANG H F, LI S J, XIE B, et al. Analysis of combustion and emission characteristics of a diesel engine fueled with ternary micro-emulsion blends[J]. Chinese Internal Combustion Engine Engineering, 2018, 39(5): 30-37. https://www.cnki.com.cn/Article/CJFDTOTAL-NRJG201805005.htm

    [4] 陈健, 孙世超, 李铭迪, 等. 钙铜复合吸收剂CO2捕集性能优化研究进展[J]. 华南师范大学学报(自然科学版), 2022, 54(3): 43-52. doi: 10.6054/j.jscnun.2022043

    CHEN J, SUN S C, LI M D, et al. The progress in the research on optimizing CO2 capture performance of CaO/CuO Composites[J]. Journal of South China Normal University (Natural Science Edition), 2022, 54(3): 43-52. doi: 10.6054/j.jscnun.2022043

    [5] 伊尔夏提·地里夏提, 白翔, 纳森巴特, 等. 不同方法改性的镍负载柱撑蛭石对CH4与CO2重整反应的催化性能研究[J]. 华南师范大学学报(自然科学版), 2023, 55(3): 9-16. doi: 10.6054/j.jscnun.2023030

    YIERXIATI D, BAI X, NASEN B, et al. The reforming reaction of CH4 and CO2 zed by nickel-loading column vermiculite modified by different methods[J]. Journal of South China Normal University (Natural Science Edition), 2023, 55(3): 9-16. doi: 10.6054/j.jscnun.2023030

    [6] 纪常伟, 辛固, 汪硕峰, 等. 零碳及碳中和燃料内燃机应用进展[J]. 北京工业大学学报, 2022, 48(3): 273-291. https://www.cnki.com.cn/Article/CJFDTOTAL-BJGD202203006.htm

    JI C W, XIN G, WANG S F, et al. Application progress of zero carbon and carbon-neutral fuel internal combustion engines[J]. Journal of Beijing University of Technology, 2022, 48(3): 273-291. https://www.cnki.com.cn/Article/CJFDTOTAL-BJGD202203006.htm

    [7]

    PATRIK S, THOMAS H, YURI W, et al. The potential of dimethyl ether (DME) to meet current and future emissions standards in heavy-duty compression-ignition engines[J]. Fuel, 2024, 355, 129357/1-16: .

    [8] 刘少华, 杨顺堃, 申立中, 等. 大气氧和燃料氧对高压共轨柴油机燃烧和排放的影响[J]. 昆明理工大学学报(自然科学版), 2023, 48(4): 64-73;152. https://www.cnki.com.cn/Article/CJFDTOTAL-KMLG202304008.htm

    LIU S H, YANG S K, SHEN L Z, et al. Effect of atmospheric oxygen content and oxygenated fuel on combustion and emission of high-pressure common-rail diesel engines[J]. Journal of Kunming University of Science and Technology (Natural Science), 2023, 48(4): 64-73;152. https://www.cnki.com.cn/Article/CJFDTOTAL-KMLG202304008.htm

    [9] 刘海峰, 张朔, 张鹏, 等. 不同醇类燃料对柴油替代物部分预混火焰多环芳烃及碳烟演化的影响[J]. 燃烧科学与技术, 2022, 28(3): 313-321. https://www.cnki.com.cn/Article/CJFDTOTAL-RSKX202203011.htm

    LIU H F, ZHANG S, ZHANG P, et al. Effects of different alcohol fuels on polycyclic aromatic hydrocarbons and soot evolution of partially premixed flames using diesel surrogate[J]. Journal of Combustion Science and Technology, 2022, 28(3): 313-321. https://www.cnki.com.cn/Article/CJFDTOTAL-RSKX202203011.htm

    [10] 唐琦军, 蒋蘋, 刘敬平, 等. 丙酮-丁醇-乙醇/汽油混合燃料对高速发动机性能影响的试验研究[J]. 内燃机工程, 2021, 42(3): 33-40. https://www.cnki.com.cn/Article/CJFDTOTAL-NRJG202103006.htm

    TANG Q J, JIANG P, LIU J P, et al. Experimental study on the effects of acetone-butanol-ethanol/gasoline blends on the performance of a high-speed engine[J]. Chinese Internal Combustion Engine Engineering, 2021, 42(3): 33-40. https://www.cnki.com.cn/Article/CJFDTOTAL-NRJG202103006.htm

    [11] 赵鹏云, 陈占明, 王涛, 等. 二甲醚和柴油高压喷射喷雾与燃烧可视化对比研究[J]. 西安交通大学学报, 2023, 57(6): 152-159. https://www.cnki.com.cn/Article/CJFDTOTAL-XAJT202306017.htm

    ZHAO P Y, CHEN Z M, WANG T, et al. A comparative study of visual spray and combustion characteristics of dimethyl ether and diesel under high pressure[J]. Journal of Xi'an Jiaotong University, 2023, 57(6): 152-159. https://www.cnki.com.cn/Article/CJFDTOTAL-XAJT202306017.htm

    [12]

    COVA-BONILLO A, PATIO-CAMINO R, HERNÁNDE Z, et al. Autoignition of ethanol-diesel blends: is it worth dehydrating ethanol[J]. Social Science Electronic Publishing, 2022, 317, 123523/1-12.

    [13]

    SEISER R, PITSCH H, SESHADRI K, et al. Extinction and autoignition of n-heptane in counterflow configuration[J]. Proceedings of the Combustion Institute, 2000, 28(2): 2029-2037.

    [14]

    MARINOV N M. A detailed chemical kinetic model for high temperature ethanol oxidation[J]. International Journal of Chemical Kinetics, 1999, 31: 183-220. doi: 10.1002/(SICI)1097-4601(1999)31:3%3C183::AID-KIN3%3E3.0.CO;2-X/abstract

    [15]

    FISCHER S L, DRYER F J, CURRAN H J. The reaction kinetics of dimethyl ether. Ⅰ. High-temperature pyrolysis and oxidation in flow reactor[J]. International Journal of Chemical Kinetics, 2000, 32(12): 713-740.

    [16]

    CURRAN H J, FISCHER S L, DRYER F L. The reaction kinetics of dimethyl ether. Ⅱ. Low-temperature oxidation in flow reactors[J]. International Journal of Chemical Kinetics, 2000, 32(12): 741-759.

图(9)
计量
  • 文章访问数:  80
  • HTML全文浏览量:  35
  • PDF下载量:  37
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-01-29
  • 网络出版日期:  2024-06-21
  • 刊出日期:  2024-04-24

目录

/

返回文章
返回