Loading [MathJax]/jax/element/mml/optable/MathOperators.js

马尔可夫过程的低秩谱估计

贲树军, 翁艺鸿

贲树军, 翁艺鸿. 马尔可夫过程的低秩谱估计[J]. 华南师范大学学报(自然科学版), 2022, 54(4): 101-108. DOI: 10.6054/j.jscnun.2022063
引用本文: 贲树军, 翁艺鸿. 马尔可夫过程的低秩谱估计[J]. 华南师范大学学报(自然科学版), 2022, 54(4): 101-108. DOI: 10.6054/j.jscnun.2022063
BI Shujun, WENG Yihong. A Low-rank Spectral Estimation of Markov Process[J]. Journal of South China Normal University (Natural Science Edition), 2022, 54(4): 101-108. DOI: 10.6054/j.jscnun.2022063
Citation: BI Shujun, WENG Yihong. A Low-rank Spectral Estimation of Markov Process[J]. Journal of South China Normal University (Natural Science Edition), 2022, 54(4): 101-108. DOI: 10.6054/j.jscnun.2022063

马尔可夫过程的低秩谱估计

基金项目: 

国家自然科学基金项目 11701186

国家自然科学基金项目 11971177

详细信息
    通讯作者:

    贲树军,Email: bishj@scut.edu.cn

  • 中图分类号: O224

A Low-rank Spectral Estimation of Markov Process

  • 摘要: 针对马尔可夫过程的谱估计算法利用了非负投影而导致估计矩阵不能满足低秩要求的问题,提出一个低秩谱估计算法(Low-rank Spectral Estimation Algorithm, LRSEA):首先,建立秩约束状态转移矩阵集合的局部Lipschitz型误差界,并给出满足该集合误差界不等式的近似投影矩阵; 然后,基于近似投影矩阵对现有的谱估计算法进行低秩修正,得到LRSEA算法,并为该算法建立统计误差界。通过人工合成数据实验对LRSEA算法、经验估计方法和谱估计方法进行比较,结果表明LRSEA算法的估计误差最小。最后,将LRSEA算法与k-均值聚类算法结合应用到纽约市曼哈顿岛出租车轨迹的分析问题。
    Abstract: As the method for spectral estimation of Markov process makes use of nonnegativity-preserving step, the spectral estimator does not necessarily satisfy low-rank condition. Motivated by this, a low-rank spectral estimation algorithm (LRSEA) is proposed. First of all, the local Lipschitzian type error bound of the rank-constrained state transition matrix set is established, and an approximate projection matrix that satisfies the error bound inequality is given. Then, using the approximate projection matrix to modify the spectral estimation method, the LRSEA is proposed, and the statistical error bound for the proposed estimation method is provided. Numerical comparisons on the synthetic data with empirical estimator and spectral estimator show that the LRSEA has the lowest estimation error. Finally, the LRSEA together with k-means algorithm is used to analyze the dataset of Manhattan taxi trips.
  • 马尔可夫过程的估计问题是计算机科学、系统工程和数据科学等领域中的一个核心问题[1]。计算个性化网页排序的状态转移矩阵问题[2]、解决电子商务中的排序问题[3]和分析城市出租车或公交车的运行轨迹问题[4-5]等都可归结为马尔可夫过程的估计问题。源于上述问题的马尔可夫过程往往拥有很大的状态空间,但是它们的状态转移矩阵却被证明了是低秩或者近似低秩的矩阵[1]。因此,学者们对低秩马尔可夫过程的状态转移矩阵的估计及其应用问题开展了研究[1, 6-10]

    据我们所知,现有的估计方法都不能保证得到低秩的转移矩阵估计。譬如,ZHANG和WANG[1]利用频率矩阵的经验估计的截断奇异值分解结合非负投影,提出了低秩马尔可夫过程的谱估计方法,并建立了估计的统计误差界,证明了估计误差与极小极大误差的下界相差一个马尔可夫链轨迹长度的对数因子。但是,由于谱估计方法利用了非负投影,导致该文献最后得到的估计矩阵不是低秩的。ZHU等[8]提出了状态转移矩阵的核范数正则罚极大似然估计模型和秩约束极大似然估计模型,并建立了2种模型的统计误差界,证明了估计误差与极小极大误差的下界相差一个马尔可夫链状态空间维数的对数因子。然而,核范数正则优化问题的最优解不一定满足低秩条件,秩约束优化问题的最优解虽能满足秩约束条件,但其求解一般都是NP难。尽管文献[8]设计了一类DC (凸函数的差) 规划算法来近似求解秩约束极大似然估计模型,但不能保证算法的输出是一个低秩矩阵。特别地,该DC规划算法的每一步都需要进行奇异值分解,计算量非常大,因此不适用于大规模的马尔可夫过程估计问题。

    另一方面,误差界研究一直以来都是最优化领域中的重点和难题[11-15]。PANG[11]证明了:凸多面体集合具有全局Lipschitz型误差界; 在一定的约束规范下,一般凸不等式系统具有Lipschitz型误差界; 对一般非凸不等式系统,全局误差界(即使是Hölder型的)都很难成立。目前已有的研究主要是对次解析不等式系统和多项式不等式系统建立了局部Hölder型误差界[14],对矩阵秩约束系统的误差界研究还很少。对于一个有界且其多值函数在原点满足calmness条件的矩阵秩约束系统,BI和PAN[15]得到了该系统的局部和全局Lipschitz型误差界。但是,验证多值函数的calmness条件与建立误差界的难度基本一样。因此,我们需要寻求新的工具来研究矩阵秩约束系统的误差界。

    受上述启发,本文试图寻求一个能够快速获得低秩转移矩阵的方法,以估计大规模的低秩马尔可夫过程。首先,建立秩约束状态转移矩阵集合的局部Lipschitz型误差界,并寻求该集合高质量的近似投影方法; 然后,提出一种低秩马尔可夫过程状态转移矩阵的低秩谱估计算法(LRSEA),并进行数值实验。

    本节为秩约束状态转移矩阵集合建立局部Lipschitz型误差界。首先,给出本文的记号。

    (1) 记IRd×dERd×deRd分别为单位矩阵、元素全为1的矩阵、元素全为1的向量。

    (2) 对于PRd×d,定义P:=maxi,j|Pij|为无穷范数,PF:=di=1dj=1P2ij为Frobenius范数。

    (3) 秩约束状态转移矩阵集合定义为:Π:={PRd×d:rank(P)r,Pe=e,Pij0,1i,jd},其中r[1,d1]是一个给定整数。对于ZRd×d,定义Z到集合Π的距离为:

    dist(Z,Π):=min{ZPF:PΠ}

    (4) 给定xRd,定义l1范数为x1:=di=1|xi|,无穷范数为x:=maxi|xi|,记diag(x)Rd×d是第i个对角元为xi(i=1, 2, …, d)的对角矩阵。

    (5) 定义秩r约束矩阵集合为R:={ZRd×d : rank(Z)r}。对任意PRd×d,定义

    ΥR(P):=ri=1σi(P)ui(P)vi(P)T,

    其中,σi(P)(i=1,2,,r)P的第i个最大奇异值,ui(P)Rdvi(P)Rd分别是σi(P)对应的左、右奇异向量。众所周知,在Frobenius范数距离意义下,ΥR(P)PR上的一个投影矩阵。

    (6) 定义集合Ω:={ZRd×d:Ze=e,β/dZij α/d,1i,jd},其中α(0,1)β(1,d)是给定常数。

    下面给出建立矩阵PΩ 与投影矩阵ΥR(P)之间关系的引理。

    引理1   令γ(0,1)是给定常数。任取PΩ,若(ΥR(P)e)iγ(i=1,2,,d),则有:

    IDdγΥR(P)P, (1)
    PDΥR(P)d(P+ΥR(P))γΥR(P)P, (2)
    |min(0,min1jd(DΥR(P))j)|1γΥR(P)P, (3)

    其中D:=diag(1(ΥR(P)e)1,,1(ΥR(P)e)d)

    证明   由于(ΥR(P)e)jγ>0 (j=1, 2, …, d)且Pe=e,利用x,yx1y(x,yRd),有

    ID=maxj|11(ΥR(P)e)j|=maxj|(YR(P)e)j1|(YR(P)e)j1γmaxj|(ΥR(P)e)j(Pe)j|=1γ(ΥR(P)P)edγΥR(P)P

    因此,不等式(1)成立。利用不等式(1)、ID是对角矩阵以及dP1>γ,可得

    PDΥR(P)=PΥR(P)+(ID)ΥR(P)PΥR(P)+IDΥR(P)PΥR(P)+dΥR(P)γPΥR(P)d(P+ΥR(P))γΥR(P)P

    于是,不等式(2)成立。当0min1jd(DΥR(P))j时,不等式(3)显然成立。当min1jd(DΥR(P))j<0时, 由D1/γ,min1jd(ΥR(P))j<0Pij0,1i,jd,可得

    0<min1jd(DΥR(P))jDmin1jd(ΥR(P))j=D|min1jd(ΥR(P))j|1γPΥR(P),

    不等式(3)成立。证毕。

    γ>0,c(0,1)为给定常数。对任意矩阵PΩ, 定义如下矩阵

    {diag(˜v)˜P(ΥR(P)10P,(ΥR(P)e)jγ,βc(eTDΥR(P))jcα,1jd),1dE(ΥR(P)>10P 或 min1jd(ΥR(P)e)j<γ) 或 min1jd(eTDΥR(P))j<cα 或 max1jd(eTDΥR(P))j>βc), (4)

    其中,D:=diag(1(ΥR(P)e)1,,1(ΥR(P)e)d),˜v= (1(˜Pe)1,1(˜Pe)2,,1(˜Pe)d)T,˜P=DΥR(P)teTDΥR(P), tRd,定义为ti=min(0,min1jd(DΥR(P))ij(eTDΥR(P))j)(i=1,2, ,d)

    下面给出建立集合Π的局部Lipschitz型误差界的命题。

    命题1   令γ(0,1/2],c(0,(51)/2),β1α>0是给定常数。任取PΩ,有˜PΠΠ,且

    1dP˜PIIF11βγ(βc2αγ+1)ΥR(P)P (5)

    证明   设PΩ, 下面分5种情况证明。

    (1) 假设ΥR(P)10P,(ΥR(P)e)jγβ/c(eTDΥR(P))jcα(1jd)。由˜Pti的定义,可得˜Pil=(DΥR(P))ilti(eDΥR(P))l0(1i,ld)。注意ti(eTDΥR(P))l0,可得˜Pil(DΥR(P))il(1i,ld),因此(˜Pe)i(DΥR(P)e)i=1(i=1,2,,d),进而得到0<˜vi1(i=1,2,,d)。定义˜PΠ=Diag(˜v)˜P,由rank(˜P)r,可得rank(˜PΠ)r,˜PΠ0,˜PΠe=e,即˜PΠΠ。根据假设(eTDYR(P))jcα(1jd),可得|min(0,min1id(DYR(P))i)|cαt。利用假设β/ceTDΥR(P),可得

    ˜PDΥR(P)|min(0,min1id(DΥR(P))i)|cαeTDΥR(P)β|min(0,min1id(DΥR(P))i)|c2α (6)

    由不等式(6)、D1/γ,ΥR(P)10PPI=Diag(˜v)˜P,可得

    ˜PΠDΥR(P)(Diag(˜v)I)DΥR(P)+Diag(˜v)(˜PDΥR(P))maxj|11(˜Pe)j|D×ΥR(P)+˜v˜PDΥR(P)ΥR(P)×γ×maxj|(˜Pe)j(DΥR(P)e)j˜Pe)j|+˜PDΥR(P)ΥR(P)γmaxj|((˜PDΥR(P))e)j|+˜PDΥR(P)dΥR(P)γ˜PDΥR(P)+˜PDΥR(P)11dPγβ|min(0,min1jd(DΥR(P))j)|c2α (7)

    因此,利用dPβ及不等式(2)、(3)、(7),可得

    1dP˜PΠFP˜PΠ˜PΠDΥR(P)+PDΥR(P)11βγ(βc2αγ+1)ΥR(P)P,

    即不等式(5)成立。

    假设ΥR(P)>10Pmin1jd(ΥR(P)e)<γmin1jd(eTDΥR(P))<cαmax1jd(e1DΥR(P))>β/c, 由式(4)可知˜PΠ=E/d。显然1˜PΠΠ

    1dP˜PΠFP1dEmax(1d,P)P

    (2) 假设ΥR(P)>10P。显然

    ΥR(P)P9P1dP˜PΠF,

    不等式(5)成立。

    (3) 假设ΥR(P)10Pmin1jd(ΥR(P)e)j<γ由于ΥR(P)e 中存在小于γ 的元素,不妨设(YR(P)e)i<γ(Pe)i=1dPΥR(P)dPβ,可得

    dPYR(P)(PYR(P))e$$(Pe)i(ΥR(P)e)i1γ0.5

    1dP˜PIFP2dPΥR(P)P2βPΥR(P)

    由此可得不等式(5)成立。

    (4) 假设ΥR(P)10P,min1jd(ΥR(P)e)jγmin1jd(eTDΥR(P))<cα。由于eTDΥR(P)中存在小于cα的元素,不防设(eTDΥR(P))i<cα<α。由(eTP)iα,可得

    dPDΥR(P)eT(PDΥR(P))(eTP)i(eTDΥR(P))iαcα (8)

    由不等式(8)、dPβ 及引理1,可得

    1dP˜PΠFPPdα(1c)11βγΥR(P)P11β2(1c)αγYR(P)P

    c(0,(51)/2),可得不等式(5)成立。

    (5) 假设ΥR(P)10P,min1jd(ΥR(P)e)j γ。由于max1jd(eTDΥR(P))j>β/c 由于eTDΥR(P)中存在大于β/c的元素,不妨设(eTDΥR(P))i>β/c。由(eTP)i β,可得

    dPDΥR(P)eT(PDΥR(P))(eTDΥR(P))i(eTP)iβcβ=β(1c)c (9)

    由不等式(9)、dPβ及引理1, 可得

    1dP˜PΠFPPcdβ(1c)11βγΥR(P)P11β2(1c)γΥR(P)P

    c(0,(51)/2),可得不等式(5)成立。证毕。

    由于˜PΠΠ,命题1给出了任意PΩ到集合Π的距离估计,即

    dist(P,Π)P˜PΠIF11dβγ(βc2αγ+1)ΥR(P)P

    同时,在集合Π中找到了低秩状态转移矩阵˜PΠI,使得P˜PΠ的距离满足误差界不等式。所以,˜PI可以看成是PΩ 在集合Π上的近似投影矩阵。

    考虑d (≥2)个状态{S1, S2, …, Sd}的离散时间马尔可夫过程,假设其状态转移矩阵为¯PRd×d,频率矩阵为¯QRd×d,且满足rank(¯P)=rank(¯Q)rd。源于现实生活当中的一些马尔可夫过程已经被证明是低秩或者近似低秩的,比如交通网络、网页及电子商务排序[1-7]。本文旨在通过轨迹长为n+1的马尔可夫链{X0, X1, …, Xn}来估计其状态转移矩阵¯P

    首先给出本文的假设。

    假设1   存在常数β[1,d),α(0,1],使得:

    (1) 1i,jd,α/dˉPijβ/d;

    (2) {X0,X1,,Xn}是遍历马尔可夫链,平稳分布为πRd,满足πiα/d(i=1,2,,d), 其中πi是向量π的第i个元素。

    注意到文献[1]的谱估计矩阵虽然不是低秩的,但其是一个状态转移矩阵。因此,以谱估计矩阵为基础,利用式(4)计算秩-r状态转移矩阵作为¯P的估计,具体见算法1。

    算法1   LRSEA算法

    输入:谱估计矩阵ˆS{ZRd×d:Ze=e,Zij0,1i,j d},α(0,1),β(1,d)r

    第1步:计算修正的谱估计

    for i=1 to d

    if min1jdˆSij<αd

    n+=dj=1max(αdˆSij,0);n=1α+n+;

    for j=1 to d

    ˜Sij=max(ˆSijn+n(ˆSijαd),αd);

    end for

    else

    ˜S(i,:)=ˆS(i,:);

    end if

    end for

    for i=1 to d

    if max1jd˜Sij>βd

    m+=dj=1max(˜Sijβd,0);m=m++β1;

    for j=1 to d

    Sij=min(˜Sij+m+m(βd˜Sij),βd)

    end for

    else

    S(i,:)=˜S(i,:);

    end if

    end for

    第2步:令P=S,γ(0,1/2],c(0,(51)/2),由式(4)得到¯P的低秩谱估计˜SΠ

    由于LRSEA算法产生的估计矩阵˜SΠΠ是一个满足低秩约束条件的状态转移矩阵,因此称其为低秩谱估计算法。可以预见,由于LRSEA算法可以满足低秩性要求,其有效性将高于现有的谱估计方法。为了建立LRSEA算法的理论保证,定义马尔可夫链的14-混合时间[16]

    τ:=min{k:max1id12(¯P)k(i,:)πT114}

    定理1   定义ˉr:=¯Q2F/σ2r(¯Q),其中σr(¯Q)¯Q的第r个最大奇异值,且记κ=d2¯Q。若假设1成立,˜S,S,˜SIRd×d由LRSEA算法产生,则有:

    (a) SΩ

    S(i,:)¯P(i,:)1ˆS(i,:)¯P(i,:)1(1id)

    (b) 令C1=11βγ(βc2αγ+1)d+1。存在常数C,使得

    E1d˜SΠ¯PFC1Cˉrdlog2(n)nκ3τα2,

    其中E表示数学期望。

    证明   (a)由算法1,易证n=dj=1max(ˆSijαd,0), m=dj=1max(βd˜Sij,0)。由于α<1,所以n>n+0。注意到ˆS{ZRd×d:Ze=e,Zij0,1i,jd}。若min1jdSijα/d,则˜S(i,j)=ˆS(i,j)α/d(j=1,2, ,d)˜S(i,:)e=1。若min1jdˆSij<α/d,利用n> n+0ˆSijα/d 时, 有˜Sij=α/d; 当ˆSij>α/d 时, 有

    ˜Sij=ˆSijn+n(ˆSijαd)>ˆSij(ˆSijαd)=αd,

    dj=1˜Sij=j:Sijα/dαd+j:Sij>α/d(ˆSijn+n(ˆSijαd))=j:Sijα/dαd+j:sij>α/dSijn+=1

    因此,可得α/d˜Sij˜S(i,:)e=1(i,j=1,,d)。同理, 可以证明α/dSijβ/dS(i,:)e=1(i,j= 1,,d)。因此, SΩ

    min1jdˆSijα/d,由于˜S(i,:)=ˆS(i,:),有

    ˜S(i,:)¯P(i,:)1=ˆS(i,:)¯P(i,:)

    现假设min1jdˆSij<α/d。利用α/dˉPijβ/d(1i, jd), 可得

    ˆS(i,:)¯P(i,:)1=j:sijα/d|ˆSijˉPij|+j:sij>α/d|ˆSijˉPij|=j:sijα/d|ˆSijαd+αdˉPij|+j:Sij>α/d|ˉSij+n+n(ˆSijα/d)ˉPij|j:Sijα/d|ˆSijαd|+j:Sijα/d|αdˉPij|+j:sij>α/d|˜SijˉPij|j:Sij>α/d|n+n(ˆSijαd)|=n++j:sijα/d|˜SijˉPij|+j:Sij>α/d|˜SijˉPij|n+=˜S(i,:)¯P(i,:)1

    由上述讨论,可得

    ˜S(i,:)¯P(i,:)1ˆS(i,:)¯P(i,:)1(1id)

    同理可以证明

    S(i,:)¯P(i,:)1˜S(i,:)¯P(i,:)1(1id)

    所以,

    S(i,:)¯P(i,:)1ˆS(i,:)¯P(i,:)1(1id)

    (b) 若假设1成立,则由文献[1]的定理1可知:存在一个常数C,使得

    Emax1idˆS(i,:)¯P(i,:)1Cˉrdlog2(n)nκ3τα2

    由(a)部分的结论,可知存在常数C,使得

    Emax1idS(i,:)¯P(i,:)1Cˉrdlog2(n)nκ3τα2 (10)

    由于SΩ,由命题1可知

    其中C2=11βγ(βc2αγ+1)。利用ΥR(S)的定义可得SΥR(S)FS¯PF。于是

    1d˜SΠ¯PF1d˜SΠSF+1dS¯PFC2SΥR(S)+1dS¯P1C2SΥR(S)F+1dS¯P1C2S¯PF+max1idS(i,:)¯P(i,:)1(C2d+1)max1idS(i,:)¯P(i,:)10 (11)

    由不等式(10)、(11)可得定理结论。证毕。

    定理1建立了LRSEA算法产生的估计矩阵与真实状态转移矩阵¯P之间的距离估计。由定理1(b)可知,轨迹长度n越大,估计误差的期望越小。

    在LRSEA算法中,取γ=0.01,c=0.02,α=12d×min1i,jdˉPij,β=min(d,2dmax1i,jdˉPij)。首先,通过人工合成数据实验来比较LRSEA算法、谱估计方法[1]、经验估计方法[17]的效果。然后,利用LRSEA算法与k-均值聚类方法结合来分析纽约曼哈顿岛出租车运行轨迹的公开数据集,揭露该城市的潜在交通模式。所有数值实验都是在配置为英特尔奔腾G4600处理器和CPU主频3.6 GHz的笔记本电脑上,通过运行MATLAB(2019年版本)完成的。

    首先,考虑具有平衡分布的低秩马尔可夫过程估计问题。假设U0Rd×r,V0Rd×r,它们的元素由标准正态分布随机生成。定义矩阵˜URd×r,˜VRd×r : ˜U[i,i]=(U0U0)[i,:]/(U0)[i,i]22(i=1,,d), ˜V[:,j]=(V0V0)[:,j]/(V0)[:,j22(j=1,,r),这里˜U[i,,]表示˜U的第i行,˜V[:,j] 表示˜V 的第j 列, 表示矩阵Hadamard积。定义真实状态转移矩阵为¯P=˜U˜VT。本文利用状态转移矩阵¯P 生成状态数为d、长度为n=round(qdr(logd)2) 的马尔可夫链X0, ,Xn, 这里q 是常数。

    下面比较文献[17]的经验估计方法、文献[1]的谱估计方法和LRSEA算法的估计误差。记P为相应的估计矩阵,本文利用以下2个数值来衡量其估计效果:

    ηF=P¯P2F,ηU,V=max(r¯UTU2F,r¯VTV2F),

    其中,URd分别是P的前r个最大奇异值对应的左奇异向量、右奇异向量,\overline{\boldsymbol{U}} \in \mathbb{R}^{d \times r}、\overline{\boldsymbol{V}} \in \mathbb{R}^{d x_r} 分别是\overline{\boldsymbol{P}}的前r个最大奇异值对应的左奇异向量、右奇异向量。

    d=1 000、r=10、k\in [1, 10]时,3种方法的估计效果(图 1)表明:LRSEA算法与谱估计方法的估计误差相差不大,小于经验估计方法的。

    图  1  平衡分布下3种估计方法的比较
    Figure  1.  The comparison of three estimators in balanced distribution

    接下来,考虑具有非平衡分布的低秩马尔可夫过程的估计问题,即一部分状态的概率远小于其他状态的概率。此处构造矩阵\boldsymbol{P}=\widetilde{\boldsymbol{U}} \widetilde{\boldsymbol{V}}^{\mathrm{T}} \boldsymbol{B},并将其标准化得到\overline{\boldsymbol{P}},这里\widetilde{\boldsymbol{U}}、\widetilde{\boldsymbol{V}}与前面一致,B为对角矩阵,其对角元服从独立同分布的贝塔分布(Beta(α1, α2))。取α1=α2=0.1,d=1 000、r=10、轨迹长度n=round(qdr(log d)2)时, 3种方法的估计效果(图 2)表明:对于非平衡分布情况下的马尔可夫过程估计问题,LRSEA算法的估计误差小于谱估计方法和经验估计方法的。

    图  2  非平衡分布下3种估计方法的比较
    Figure  2.  The comparison of three estimators in imbalanced distribution

    纽约市曼哈顿岛于2016年公开的黄色出租车运行轨迹数据集记录了r次乘客的行程(https://s3.amazonaws.com/nyc-tlc/trip+data/yellow_tripdata_2016-01.csv),本研究利用此数据集将曼哈顿岛分割成几个区域,满足同一区域中的乘客前往同一个目的地的概率相似。

    类似文献[1],本文将曼哈顿岛细分为大小一致的小正方形网格,将每个小网格近似地看成马尔可夫过程的一个状态,乘客从一个网格到另一个网格的行程视为该马尔可夫过程的一次状态转移。为了排除干扰项,本文只选取那些作为行程的起点或者终点的总次数超过2 000的网格作为有效状态。然后,利用LRSEA算法来估计该马尔可夫过程的状态转移矩阵,并利用k-均值聚类方法对估计矩阵的左奇异子空间进行聚类划分。由r=k分别为4, 5, 6, 7时的聚类结果(图 3)可知:当聚类数r增加时,LRSEA算法可以给曼哈顿岛的交通网络一个较好的分区,同一个区域的乘客前往同一个地点的概率相似。

    图  3  LRSEA算法对曼哈顿岛交通网络的划分结果
    注:1种颜色代表 1个区域。
    Figure  3.  The result of a citywide partition of Manhattan traffic network with the low-rank spectral method

    鉴于在不同时段,人们出行目的不同,将该出租车运行数据集化分为3个时段:早上(06:00~11:59)、中午(12:00~17:59)、晚上(18:00~23:59),每个时段的有效状态数分别为769、1 029、1 147个。利用LRSEA算法来估计每个时段的马尔可夫过程的状态转移矩阵,并利用k-均值聚类方法对估计矩阵的左奇异子空间进行聚类划分,其中xietichuli=xietichuli=5。聚类结果所展示的在不同时段下LRSEA算法对曼哈顿岛的交通网络的分区结果(图 4)表明:同一时段下,同一个区域的乘客前往同一个目的地的概率相似。

    图  4  LRSEA算法在不同时间段下对曼哈顿岛交通网络的划分结果
    注:1种颜色代表 1个区域。
    Figure  4.  The result of a per-time-segment citywide partition of Manhattan traffic network with the low-rank spectral method

    针对马尔可夫过程的估计问题,利用秩约束状态转移矩阵集合的近似投影,本文对现有的谱方法进行低秩修正,提出了一个低秩谱估计算法(LRSEA),以快速得到满足秩约束条件的状态转移矩阵。此外,通过建立秩约束状态转移矩阵集合的局部Lipschitz型误差界,给出该算法的统计误差界,建立了算法的理论保证。数值实验结果表明,对于具有非平衡分布的低秩马尔可夫过程的估计问题,LRSEA算法的估计误差小于谱估计方法和经验估计方法的。下一步,将把LRSEA算法应用到强化学习问题以及系统工程领域中的控制问题。

  • 图  1   平衡分布下3种估计方法的比较

    Figure  1.   The comparison of three estimators in balanced distribution

    图  2   非平衡分布下3种估计方法的比较

    Figure  2.   The comparison of three estimators in imbalanced distribution

    图  3   LRSEA算法对曼哈顿岛交通网络的划分结果

    注:1种颜色代表 1个区域。

    Figure  3.   The result of a citywide partition of Manhattan traffic network with the low-rank spectral method

    图  4   LRSEA算法在不同时间段下对曼哈顿岛交通网络的划分结果

    注:1种颜色代表 1个区域。

    Figure  4.   The result of a per-time-segment citywide partition of Manhattan traffic network with the low-rank spectral method

  • [1]

    ZHANG A, WANG M D. Spectral state compression of Markov processes[J]. IEEE Transactions on Information Theory, 2020, 66(5): 3202-3231. doi: 10.1109/TIT.2019.2956737

    [2]

    BENCZÚR A A, CSALOGÁNY K, SARLS T. On the feasibility of low-rank approximation for personalized Page-Rank[C]//Proceedings of Special Interest Tracks and Posters of the 14th International Conference on World Wide Web. New York: Association for Computing Machi-nery, 2005: 972-973.

    [3]

    NEGAHBAN S, OH S, SHAH D. Rank centrality: ranking from pairwise comparisons[J]. Operations Research, 2017, 65(1): 266-287. doi: 10.1287/opre.2016.1534

    [4]

    LIU Y, KANG C, GAO S, et al. Understanding intra-urban trip patterns from taxi trajectory data[J]. Journal of Geographical Systems, 2012, 14(4): 463-483. doi: 10.1007/s10109-012-0166-z

    [5] 李耀华, 任田园, 邵攀登, 等. 基于马尔可夫链的西安市城市公交工况构建[J]. 中国科技论文, 2019, 14(2): 121-128. https://www.cnki.com.cn/Article/CJFDTOTAL-ZKZX201902001.htm

    LI Y H, REN T Y, SHAO P D, et al. Development of dri-ving cycle of bus in Xi'an city based on Markov chain[J]. China Sciencepaper, 2019, 14(2): 121-128. https://www.cnki.com.cn/Article/CJFDTOTAL-ZKZX201902001.htm

    [6]

    BENSON A R, GLEICH D F, LIM L H. The spacey random walk: a stochastic process for higher-order data[J]. SIAM Review, 2017, 59(2): 321-345. doi: 10.1137/16M1074023

    [7]

    SANDERS J, PROUTIERE A, YUN S Y. Clustering in block Markov chains[J]. Annals of Statistics, 2020, 48(10): 3488-3512.

    [8]

    ZHU Z W, LI X D, WANG M D, et al. Learning Markov models via low-rank optimization[J]. arXiv, (2020-11-26)[2021-05-15]. https://arxiv.org/abs/1907.00113v2.

    [9] 徐翔斌, 李志鹏. 强化学习在运筹学的应用: 研究进展与展望[J]. 运筹与管理, 2020, 29(5): 227-239. https://www.cnki.com.cn/Article/CJFDTOTAL-YCGL202005027.htm

    XU X B, LI Z P. Research progress and prospects for application of reinforcement learning in operations research[J]. Operations Research and Management Science, 2020, 29(5): 227-239. https://www.cnki.com.cn/Article/CJFDTOTAL-YCGL202005027.htm

    [10] 翟永, 刘津, 陈杰, 等. 基于马尔可夫链的无桩共享单车车辆投放规模分析[J]. 北京交通大学学报, 2019(5): 27-36. https://www.cnki.com.cn/Article/CJFDTOTAL-BFJT201905004.htm

    ZHAI Y, LIU J, CHEN J, et al. Analysis of dockless bike-sharing fleet size based on Markov chain[J]. Journal of Beijing Jiaotong University, 2019(5): 27-36. https://www.cnki.com.cn/Article/CJFDTOTAL-BFJT201905004.htm

    [11]

    PANG J S. Error bounds in mathematical programming[J]. Mathematical Programming, 1997, 79: 299-332.

    [12]

    TSENG P. Approximation accuracy, gradient methods, and error bound for structured convex optimization[J]. Mathematical Programming, 2010, 125(2): 263-295. doi: 10.1007/s10107-010-0394-2

    [13]

    ZHOU Z R, SO A M. A unified approach to error bounds for structured convex optimization problems[J]. Mathematical Programming, 2017, 165(2): 689-728. doi: 10.1007/s10107-016-1100-9

    [14]

    LI G, MORDUKHOVICH B S, NGHIA T T A, et al. Error bounds for parametric polynomial systems with applications to higher-order stability analysis and convergence rates[J]. Mathematical Programming, 2018, 168: 313-346. doi: 10.1007/s10107-016-1014-6

    [15]

    BI S J, PAN S H. Error bounds for rank constrained optimization problems and applications[J]. Operations Research Letters, 2016, 44(3): 336-341.

    [16]

    LEVIN D A, PERES Y, WILMER E L. Markov chains and mixing times[M]. Rhode Island: American Mathematical Society, 2009.

    [17]

    ANDERSON T W, GOODMAN L A. Statistical inference about Markov chains[J]. The Annals of Mathematical Statistics, 1957, 28(1): 89-110.

图(4)
计量
  • 文章访问数:  283
  • HTML全文浏览量:  93
  • PDF下载量:  55
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-06-04
  • 网络出版日期:  2022-09-21
  • 刊出日期:  2022-08-24

目录

/

返回文章
返回