Loading [MathJax]/jax/output/SVG/fonts/TeX/Main/Regular/BasicLatin.js

基于多特征参数的OMI遥感产品气溶胶分类研究——以广东省为例

郑仰成, 黎丽莉, 王云鹏

郑仰成, 黎丽莉, 王云鹏. 基于多特征参数的OMI遥感产品气溶胶分类研究——以广东省为例[J]. 华南师范大学学报(自然科学版), 2021, 53(4): 68-75. DOI: 10.6054/j.jscnun.2021060
引用本文: 郑仰成, 黎丽莉, 王云鹏. 基于多特征参数的OMI遥感产品气溶胶分类研究——以广东省为例[J]. 华南师范大学学报(自然科学版), 2021, 53(4): 68-75. DOI: 10.6054/j.jscnun.2021060
ZHENG Yangcheng, LI Lili, WANG Yunpeng. The Multi-feature Parameter Classification of Aerosol Based on OMI Remote Sensing Data: A Case Study in Guangdong Province[J]. Journal of South China Normal University (Natural Science Edition), 2021, 53(4): 68-75. DOI: 10.6054/j.jscnun.2021060
Citation: ZHENG Yangcheng, LI Lili, WANG Yunpeng. The Multi-feature Parameter Classification of Aerosol Based on OMI Remote Sensing Data: A Case Study in Guangdong Province[J]. Journal of South China Normal University (Natural Science Edition), 2021, 53(4): 68-75. DOI: 10.6054/j.jscnun.2021060

基于多特征参数的OMI遥感产品气溶胶分类研究——以广东省为例

基金项目: 

国家自然科学基金项目 42007205

广东省自然科学基金项目 2021A1515011375

详细信息
    通讯作者:

    黎丽莉,Email: lilili@gig.ac.cn

  • 中图分类号: X87

The Multi-feature Parameter Classification of Aerosol Based on OMI Remote Sensing Data: A Case Study in Guangdong Province

  • 摘要: 为了解决气溶胶分类精度低和特征参数冗杂的问题,基于OMI(Ozone Monitoring Instrument)遥感产品的气溶胶特征参数,利用随机森林算法,将广东省2014年的气溶胶类型划分为沙尘型气溶胶(Desert Dust, DST)、生物质燃烧型含碳气溶胶(Carbonaceous Aerosols Associated with Biomass Burning, CRB)和硫酸盐型城镇-工业气溶胶(Sulfate-based Urban-industrial Aerosols,SLF)3种类型. 并统计分析随机森林以及特征参数的重要性,将分类结果的空间分布与OMI气溶胶类型产品的空间分布进行对比. 结果表明:(1)随机森林算法仅需少量训练样本点即可达到97%以上的总体分类精度. (2)通过计算不同气溶胶特征参数在随机森林分类过程中的重要性高低,得到重要性排名前六的特征参数依次为α指数、UVAI、RI388、RI354、SSA500、AAOD500,表明在分类过程中,气溶胶粒径分布和吸收能力起到了最关键的作用. (3)3种气溶胶类型的空间分布显示,SLF型气溶胶为广东省最主要的气溶胶类型;DST型和CRB型气溶胶在珠三角地区占比最高,在粤东、粤北地区的占比最低.
    Abstract: In order to solve the problems of low precision and redundant feature parameters in the process of aerosol classification, several significant aerosol feature parameters were extracted from the OMI (Ozone Monitoring Instrument) remote sensing products and Random Forest (RF) algorithm was used for aerosol type classification and verification. Aerosols of Guangdong Province in 2014 were divided into three types: desert dust (DST), carbonaceous aerosols associated with biomass burning (CRB) and sulfate-based urban-industrial aerosols (SLF). The Random Forest classification results and the importance of feature parameters were analyzed. The spatial distribution of cla-ssification results were compared to that of OMI aerosol type products. The following results are obtained. First, with the RF algorithm, a total precision of over 97% can be reached with a few training samples. Second, calculating the importance of different aerosol feature parameters in RF shows that the most important feature parameters are angstrom exponent, UVAI, RI388, RI354, SSA500 and AAOD500 in turn, indicating that size distribution and absorption ability of aerosols play the key roles. Third, the spatial distribution of three aerosol types shows that sulfate-based urban-industrial aerosols are dominant in the Pearl River Delta. Proportion of biomass burning and desert dust aerosols are highest in the Pearl River Delta and lowest in the eastern and northern Guangdong.
  • 大气中的气溶胶粒子通过散射、吸收太阳辐射和形成云凝结核等方式来影响全球气候变化[1]. 不同类型气溶胶之间的光学属性、成分以及粒径分布有所差异,因此,不同类型的气溶胶也会给气候带来不同程度的影响[2]. 沙尘型气溶胶的粒径分布较大,有较强的散射能力,会降低地表的能见度[3]. 生物质燃烧型含碳气溶胶的粒径分布较小,但由于吸收性成分含量较高,此类气溶胶表现出较强的辐射吸收能力;大量的生物质燃烧型含碳气溶胶会影响云的微物理性质,甚至影响生物地球化学循环[4]. 因此,对不同的气溶胶类型进行有效的区分,有助于进行气溶胶源解析、改善气溶胶光学模型、减少卫星观测气溶胶的不确定性[5].

    传统的监测和分析气溶胶类型的方法主要基于地面的监测站点,这种监测分析方法受限于监测站点的数量以及空间分布,因此,地面站点的监测数据无法反映真实的气溶胶空间分布情况[6]. 遥感技术具有监测范围大、覆盖时间长的特点,在气溶胶的监测分析中起到了不可或缺的作用,利用卫星遥感数据可以进行广覆盖、长时间序列的气溶胶监测[7-9]. 利用遥感数据进行气溶胶分类,其原理是提取描述气溶胶的消光、吸收、散射、折射和粒径分布等各种气溶胶特征参数. 不同种类的气溶胶的各项特征参数互有差别,因此,可以通过特征参数区分不同的气溶胶类型[4, 10-11].

    目前已有许多大气遥感卫星发布了气溶胶相关的产品,为气溶胶的监测和分析发挥了重要的作用. OMIAuraAER是美国国家航空航天局(National Aeronautics and Space Administration, NASA)公布的一组近紫外型气溶胶产品,该产品由搭载在Aura卫星上的OMI(Ozone Monitoring Instrument)传感器观测数据反演得到,包含多项气溶胶特征参数以及气溶胶类型产品[12]. 对EOS-Aqua卫星上的一氧化碳指数(Carbon Monoxide Index, COI)和OMI上的近紫外型气溶胶指数(Ultraviolet Aerosol Index, UVAI)进行阈值分析,可得到OMI的3种气溶胶类型产品:沙尘型气溶胶(Desert Dust, DST)、生物质燃烧型含碳气溶胶(Carbonaceous Aerosols Associated with Biomass Burning, CRB)和硫酸盐型城镇-工业气溶胶(Sulfate-based Urban-industrial Aerosols, SLF). 这3类气溶胶类型产品已得到广泛运用,对气溶胶空间特征研究、源解析及气溶胶光学模型的改善起到了重要的作用[13-15]. 但是,COI数据和UVAI数据来自2颗不同的卫星,时间分辨率与空间分辨率均存在差异,无法满足数据融合的需求,部分像元点无法反演得到气溶胶类型的数据. 因此,本研究以广东省为研究区,在不使用COI辅助数据条件下进行气溶胶类型的反演,从而提高气溶胶类型产品的空间覆盖度,拟为广东省的气溶胶源解析和排放源控制提供科学参考.

    以广东省(20°13′ N~25°31′ N,109°39′ E~117°19′ E)为研究区域,采用OMI的气溶胶产品进行研究. NASA的近紫外型气溶胶产品由不同年份获取的地表反射率及其反演得到的气溶胶产品构成,其中OMIAuraAER为2004年8月至今的气溶胶产品. 该产品的时间分辨率为98.8 min、空间分辨率为13 km×24 km,2个用于获取地表反射率的波段分别为354、388 nm,并由这2个波段反演得到一个500 nm波段的产品. 该卫星为极地轨道卫星,观测范围可以覆盖全球所有区域,本研究仅选用覆盖研究区域内的像元点进行研究.

    在OMIAuraAER产品中,有多个用于反映气溶胶不同物理属性的气溶胶特征参数,其中可被用于气溶胶分类的气溶胶特征参数包括:

    (1) 气溶胶吸收光学厚度(Aerosol Absorption Optical Depth, AAOD):描述气溶胶对太阳辐射的消光作用中吸收的部分,取值范围为0~1.

    (2) 气溶胶光学厚度(Aerosol Optical Depth, AOD):描述气溶胶对太阳辐射的总消光能力,取值范围为0~6.

    (3) 单向散射反照率(Single Scattering Albedo, SSA):描述气溶胶的吸收和散射的相对大小,SSA值越大,则说明该气溶胶的散射能力强于吸收能力,取值范围为0~1.

    (4) 复折射指数(Refraction Index, RI):由实部和虚部组成,其中实部描述气溶胶的散射能力,虚部描述气溶胶的吸收能力. OMIAuraAER产品仅提供了RI的虚部,取值范围为0~1.

    (5) 近紫外型气溶胶指数(Ultraviolet Aerosol Index, UVAI):反映吸气溶胶吸收能力的强弱. 吸收性气溶胶的UVAI呈现正值,且吸收性越强UVAI值越高,而非吸收性气溶胶的UVAI呈现负值. 取值范围为-2~3.

    (6)α指数(Angstrom Exponent):通过2个波段(388 nm和500 nm)的AOD产品计算得到,反映气溶胶粒径分布的大小. 气溶胶粒径分布越大,则α值越小,反之则越大. 取值范围为0.5~2.0.

    (7) 经纬度:每个像元点的经度和纬度坐标,数值范围为广东省的经纬度范围.

    本文使用上述所有气溶胶特征参数作为训练数据,包括AAOD(λ为354、388、500 nm)、AOD(λ为354、388、500 nm)、SSA(λ为354、388、500 nm)、RI(λ为354、388 nm)、UVAI、经纬度以及α指数共计15个特征参数;以OMIAuraAER自带的气溶胶类型产品作为标签数据,利用随机森林算法对广东省气溶胶类型进行监督分类. ZHENG等[16]曾使用K-means聚类算法,结合AOD、UVAI和α指数3种气溶胶特征参数对2010年广东省气溶胶类型进行非监督分类. 为形成长时间序列研究,本研究的时间段选取2014年,探讨不同的分类方法及特征参数选取对气溶胶分类的影响. 选取数据集中所有产品质量合格,各特征参数没有异常值的像元点共计53 882个,其中:SLF型气溶胶占比最高(84.3%),共有45 404个像元点;其次是DST型气溶胶占比(12.3%),有6 629个像元点;CRB型气溶胶占比最低(3.4%),有1 849个像元点.

    在使用OMI气溶胶产品的特征参数进行气溶胶分类的过程中存在2个问题:(1)如何在多种特征参数中挑选出最适合分类的特征参数及其组合,使得分类结果的精确度和计算性能满足研究需求. (2)已有研究使用的分类模型大多是基于阈值分类法,即在特征参数上确定一个阈值,以区别不同的气溶胶类型. 然而,这个阈值大多由历史经验数据给出,而且不同地区的气溶胶的物理特征有所差异,在一个地区所确定的阈值并不能广泛地运用到其他区域进行分类.

    本文利用随机森林算法进行气溶胶分类,探讨适用于气溶胶分类的特征参数及其组合. 随机森林算法[17]是一种分类速度快、分类准确率高的监督分类算法,已用于解决土地覆盖类型分类、植被覆盖度估算、农作物识别和用水总量影响因素解析等问题,并取得了良好的效果[18-24]. 在分类过程中,利用随机森林算法可以得到不同特征参数的重要性,可根据重要性的高低对气溶胶的各项特征参数进行排序,从而挑选其中重要性最高的特征参数. 此外,随机森林并不会显式地给出一个具体的分类阈值,而是根据不同的训练数据得到不同的模型,泛化性能要高于传统的阈值分类法.

    随机森林由多棵决策树构成,每棵决策树会随机选取样本数据及气溶胶特征参数,得到一个预测的气溶胶类别,然后由多棵决策树进行众数投票,选取得票最多的预测类别作为随机森林的预测结果(图 1A). 在决策树中,用Gini指数来衡量数据集的不确定性,Gini指数值越大,则表示数据集的不确定性越大. 决策树的分类过程即是通过不断分割训练样本,从而降低样本数据集Gini指数的过程. 对于整个样本数据集D,其Gini指数为:

    Gini(D)=13k=1(|Ck||D|)2,
    (1)
    图  1  气溶胶分类流程图
    Figure  1.  The flow chart of aerosol type classification

    其中,k=1, 2, 3,代表有3种气溶胶类型(DST、CRB和SLF);Ck是指每个类的样本数.

    根据特征参数A,将数据集D分割成2个子数据集(D1D2),则在特征参数A的条件下,数据集D的Gini指数为:

    Gini(D,A)=|D1||D|Gini(D1)+|D2||D|Gini(D2),
    (2)

    即数据集D在特征参数A条件下的Gini指数可以用2个子数据集的Gini指数来表示. 通过寻找最优的阈值,使数据集的Gini指数在分割成子数据集后降至最低,在子数据集中尽量只包含属于同一个类的样本点. 利用数据集D和子数据集D1D2在特征参数A条件下的Gini指数之差来衡量特征参数A的重要性.

    在每棵决策树中,每个节点代表一个样本数据集. 计算每个节点的Gini指数,如果Gini指数高于阈值,则代表该节点的不确定性过高,需要继续分裂以降低不确定性;如果Gini指数低于阈值,则代表该节点是一个稳定的分类结果,可以停止分裂,形成一个叶子结点. 如果所有叶子结点不再分裂,即决策树不再成长,则输出该决策树,再继续随机选取不同的样本点和气溶胶特征参数构建新的决策树,直到决策树的数量达到要求(图 1B).

    在随机森林算法中,使用特征参数重要性来衡量每个特征参数在分类过程中作出的贡献大小. 在决策树中,当1个节点分裂为2个子节点后,数据集被分为2个确定度更高的子集,衡量不确定性的Gini指数也相应减小. 如果一个特征参数能够降低的不确定性越多,则其分类效果越好,重要性也越高. 将每个特征参数的重要性进行归一化,使其重要性之和为1.

    在随机森林的参数设置中,决策树的数量为100棵. 由于标签数据仅有3种类别(DST、CRB、SLF),而用于分类的特征数量有15个,为了防止每棵树的分裂深度过大,将最大叶子结点数量设置为6个,即每棵决策树出现6个叶子结点后将停止分裂,以节省分类时间. 在研究过程中,依次选取不同数量的样本点进行训练,观察随机森林算法的分类精度与样本点数量的关系,并使用所有的样本点进行精度的验证.

    基于2014年广东省气溶胶类型的分类结果,本文讨论了随机森林算法的分类精度,提取分类过程中重要的气溶胶特征参数,并对气溶胶类型的空间分布特征进行了分析.

    分类精度是衡量算法优劣的重要指标. 计算分类正确的训练样本数量在总体训练样本数量中的百分比,作为总体的分类精度. 同时,分别计算DST、CRB、SLF型气溶胶分类正确的训练样本数量在各自类别的训练样本数量中的百分比,作为各个类别的分类精度.

    由分类精度结果(图 2)可知:(1)总体的分类精度可达97%以上,且随着投入训练的像元数量增加而不断提高. (2)初始训练样本数量较少时,CRB型气溶胶的分类精度较低(仅为35%左右),但由于CRB样本在总体样本中所占比例较低,因此,总体的分类精度和其他2类气溶胶类型(DST, SLF)的分类精度均可达到60%~70%. (3)随着训练样本数量的增加,总体的分类精度与各个分类别的分类精度迅速增大. 训练样本数量达到50个时,DST、SLF型气溶胶和总体的分类精度均可达到97%以上,而CRB型气溶胶的分类精度有点波动,但也逐渐趋于稳定. 由此可知,使用随机森林算法进行气溶胶分类,可以满足在不使用COI辅助数据的条件下,单独用OMI自身的气溶胶特征参数完成气溶胶的高精度分类;同时,在实际应用中,受到卫星过境时间以及云层覆盖度的影响,单景遥感影像中可用于训练的高质量像元数量并不多,而随机森林算法的高效性使其可以在训练像元数量稀疏的特殊情况下建立分类模型.

    图  2  气溶胶分类精度与训练样本数量关系
    Figure  2.  The relationship between the training sample size and the classification precision

    由特征参数重要性结果(表 1)可知:(1)在所有特征参数中,α指数对气溶胶分类影响最大,其重要性达到0.245,说明气溶胶的粒径分布是用于判断气溶胶类型的重要指标. (2)UVAI指数的重要性达到0.218,在各项气溶胶特征参数中排名第二,符合预期结果. 究其原因为:在反演OMI气溶胶产品的阈值分类法中,使用了UVAI、AOD、SSA以及COI指数,其中UVAI占主导因素. (3)在其余特征参数中,重要性由高到低依次为RI、SSA、AAOD、AOD,不同波段的AAOD、AOD、SSA和RI的重要性差别不大. 因此,在使用气溶胶分类算法中,使用哪个波段的产品对于分类精度没有太大影响. (4)经纬度对气溶胶分类的重要性接近0,意味着经纬度在分类过程中无法降低数据集的不确定性,是无效的分类特征参数.

    表  1  各项气溶胶特征参数的重要性
    Table  1.  The importance of each aerosol feature parameter
    特征参数 重要性
    AAOD λ=354 nm 0.034
         λ=388 nm 0.019
         λ=500 nm 0.045
    AOD λ=354 nm 0.008
         λ=388 nm 0.009
         λ=500 nm 0.008
    SSA λ=354 nm 0.038
         λ=388 nm 0.020
         λ=500 nm 0.079
    RI λ=354 nm 0.141
         λ=388 nm 0.128
    经度 0.004
    纬度 0.004
    UVAI 0.218
    α指数 0.245
    下载: 导出CSV 
    | 显示表格

    由分类价值最高的6个特征参数(α指数、UVAI、RI354、RI388、SSA500和AAOD500)在3种气溶胶类型中的均值、标准差以及最大、最小值(表 2)可知:(1)在反映气溶胶粒径分布的α指数上,SLF型气溶胶的均值最大,说明其粒径分布最小;而DST型气溶胶的均值较小,说明其粒径分布最大. (2)在反映气溶胶吸收能力的UVAI指数上,DST、CRB型气溶胶的均值较大,说明这2种气溶胶的吸收能力强;SLF型气溶胶的均值最小,说明SLF型气溶胶的吸收能力较弱. (3)CRB型气溶胶的α指数均值与SLF型气溶胶的相近、UVAI均值与DST型气溶胶的相近,单独考虑一种特征参数无法较好地识别CRB型气溶胶. 此时可结合α指数和UVAI指数进行判别:CRB型气溶胶在这2种指数上均具有较高的均值,可以凭此区分CRB型气溶胶与另外2种气溶胶类型.

    表  2  3类气溶胶特征参数的均值、标准差、最大值及最小值
    Table  2.  The mean value, standard deviation, and maximum and minimum values of three aerosol feature parameter
    气溶胶类型 特征参数 均值 标准差 最大值 最小值
    DST α指数 0.605 0.000 0.604 0.602
    UVAI 1.233 0.416 3.862 0.800
    RI388 0.007 0.004 0.028 0.003
    RI354 0.019 0.010 0.071 0.007
    SSA500 0.950 0.026 0.982 0.829
    AAOD500 0.039 0.018 0.155 0.011
    CRB α指数 1.614 0.059 1.740 1.544
    UVAI 1.168 0.460 5.604 0.801
    RI388 0.001 0.001 0.016 0.000
    RI354 0.002 0.002 0.022 0.000
    SSA500 0.985 0.010 0.997 0.869
    AAOD500 0.016 0.007 0.082 0.005
    SLF α指数 1.853 0.013 1.872 1.779
    UVAI 0.106 0.385 0.800 -2.186
    RI388 0.004 0.003 0.019 0.000
    RI354 0.004 0.003 0.019 0.000
    SSA500 0.964 0.021 1.000 0.853
    AAOD500 0.026 0.014 0.082 0.000
    下载: 导出CSV 
    | 显示表格

    在使用随机森林法进行气溶胶分类后,可以统计广东省总体及各个城市中各类型气溶胶的占比. 由图 3表 3可知:(1)在广东省中,SLF型气溶胶占比最高,达到84.5%;其次是DST型气溶胶占比,达到12.5%;CRB型气溶胶占比最低(3.0%). (2)SLF型气溶胶在广东省内占比最高. SLF型气溶胶主要来自工业生产和机动车排放,因此,可反映广东省的工业化程度较高,机动车数量较多.

    图  3  广东省的气溶胶类型占比的空间分布(随机森林分类结果)
    Figure  3.  The spatial distribution of aerosol types proportion in Guangdong (results of RF classification)
    表  3  广东省各城市3种气溶胶类型占比
    Table  3.  The proportion of three aerosol types of each city in Guangdong  %
    城市 OMI产品标签数据 随机森林分类结果
    DST CRB SLF DST CRB SLF
    潮州市 6.6 2.5 90.9 6.6 4.1 89.3
    东莞市 23.9 1.2 74.9 19.6 4.3 76.1
    佛山市 16.4 1.3 82.3 19.6 2.2 78.2
    广州市 17.1 1.8 81.1 17.1 2.1 80.8
    河源市 7.8 1.2 9.1 7.8 1.9 90.3
    惠州市 9.6 1.0 89.4 9.6 2.5 87.9
    江门市 13.8 1.6 84.6 13.7 1.9 84.4
    揭阳市 7.3 1.7 91.0 7.3 1.9 90.8
    茂名市 12.8 0.7 86.5 12.8 0.7 86.5
    梅州市 5.9 1.7 92.4 5.9 3.0 91.1
    清远市 10.8 0.5 88.7 10.6 0.5 88.9
    汕头市 8.6 8.6 82.8 10.6 11.6 77.8
    汕尾市 6.9 4.0 89.1 6.9 3.9 89.2
    韶关市 9.6 1.8 88.6 8.1 1.9 90.0
    深圳市 10.1 2.9 87.0 10.1 5.0 84.9
    阳江市 7.7 2.1 90.2 8.2 2.1 89.7
    云浮市 5.3 1.1 93.6 8.2 1.9 89.9
    湛江市 12.7 3.2 84.1 16.7 6.9 76.4
    肇庆市 10.5 0.9 88.6 10.5 0.9 88.6
    中山市 8.4 3.1 88.5 10.8 4.1 85.1
    珠海市 8.7 3.3 88.0 10.8 4.1 85.1
    下载: 导出CSV 
    | 显示表格

    (3) DST型气溶胶在珠三角地区的占比最高,其次是在粤西地区,在粤东地区的占比最低. DST型气溶胶主要来自道路扬尘与土木工程建设,反映出珠三角和粤西地区的交通设施较为发达,在建城市基础设施较多. (4)CRB型气溶胶在珠三角及粤东汕头、潮州等城市占比较高. 珠三角地区的CRB型气溶胶主要来自大量的汽车尾气排放,而粤东汕头和潮州地区的CRB型气溶胶则可能来自秸秆的燃烧.

    由随机森林分类结果与OMI气溶胶类型产品标签数据的空间分布(图 3图 4)可知:(1)两者的空间分布呈现高度的相似性. (2)各类型气溶胶占比排名相同,从高至低依次均为SLF、DST、CRB型气溶胶. (3)结合表 3可知各种气溶胶类型的占比有所差异,CRB型气溶胶占比升高,DST、SLF型气溶胶占比降低.

    图  4  广东省的气溶胶类型占比的空间分布(OMI产品标签数据)
    Figure  4.  The spatial distribution of aerosol type proportion in Guangdong (label data from OMI product)

    本文所得2014年的分类结果与2010年的分类结果[16]相符,各气溶胶类型占比没有太大变化,说明广东省内气溶胶类型在2010—2014年间没有较大的变化. 与2010年使用的非监督分类K-means聚类法相比,使用OMI气溶胶类型产品作为标签数据进行随机森林监督分类提高了分类结果的可靠性. 本文提取了6项最重要的气溶胶特征参数,与2010年使用的3项特征参数相比,α指数和UVAI仍是重要的分类指标,但是AOD的重要性下降.

    本研究基于OMI卫星遥感产品提取的特征参数,使用随机森林法对广东省2014年气溶胶进行分类并做验证. 根据随机森林法的分类结果,讨论了分类的精度、各项气溶胶特征参数的选取以及分类结果的空间分布,主要结论如下:

    (1) 使用随机森林法进行气溶胶分类,分类精度可稳定在97%以上,仅需少量样本点即可达到高精度的分类. 样本数量达到50个时,总体的分类精度可达97.6%,其中DST、CRB、SLF型气溶胶的分类精度分别为95.6%、88.1%、98.6%. 说明在不使用COI指数的条件下,通过随机森林算法可以用OMI自身的气溶胶特征参数产品完成较高精度的气溶胶分类.

    (2) 本研究使用了15个特征参数进行分类,根据特征参数重要性高低,最重要的6个分类特征参数依次为α指数、UVAI、RI388、RI354、SSA500、AAOD500,说明气溶胶的粒径分布特征和光学吸收特征在分类中起到了最关键的作用.

    (3) 2014年广东省内各城市各类型气溶胶的占比结果显示:SLF型气溶液为广东省最主要的气溶胶类型;DST型气溶胶在珠三角地区的占比最高,其次是在粤西地区,在粤东地区的占比最低;CRB型气溶胶在珠三角地区和潮州、汕头、湛江等城市的占比较高,在其他地区的较低.

    本文提出了一种基于OMI气溶胶特征参数和随机森林算法的气溶胶分类法,为传统气溶胶分类方法存在的精度低和特征参数冗余的问题提供了一种解决方法. 在今后的研究中,将以本文的研究结果为基础,进一步反演2018年广东省的气溶胶类型,讨论更长时间序列气溶胶类型的变化特征.

  • 图  1   气溶胶分类流程图

    Figure  1.   The flow chart of aerosol type classification

    图  2   气溶胶分类精度与训练样本数量关系

    Figure  2.   The relationship between the training sample size and the classification precision

    图  3   广东省的气溶胶类型占比的空间分布(随机森林分类结果)

    Figure  3.   The spatial distribution of aerosol types proportion in Guangdong (results of RF classification)

    图  4   广东省的气溶胶类型占比的空间分布(OMI产品标签数据)

    Figure  4.   The spatial distribution of aerosol type proportion in Guangdong (label data from OMI product)

    表  1   各项气溶胶特征参数的重要性

    Table  1   The importance of each aerosol feature parameter

    特征参数 重要性
    AAOD λ=354 nm 0.034
         λ=388 nm 0.019
         λ=500 nm 0.045
    AOD λ=354 nm 0.008
         λ=388 nm 0.009
         λ=500 nm 0.008
    SSA λ=354 nm 0.038
         λ=388 nm 0.020
         λ=500 nm 0.079
    RI λ=354 nm 0.141
         λ=388 nm 0.128
    经度 0.004
    纬度 0.004
    UVAI 0.218
    α指数 0.245
    下载: 导出CSV

    表  2   3类气溶胶特征参数的均值、标准差、最大值及最小值

    Table  2   The mean value, standard deviation, and maximum and minimum values of three aerosol feature parameter

    气溶胶类型 特征参数 均值 标准差 最大值 最小值
    DST α指数 0.605 0.000 0.604 0.602
    UVAI 1.233 0.416 3.862 0.800
    RI388 0.007 0.004 0.028 0.003
    RI354 0.019 0.010 0.071 0.007
    SSA500 0.950 0.026 0.982 0.829
    AAOD500 0.039 0.018 0.155 0.011
    CRB α指数 1.614 0.059 1.740 1.544
    UVAI 1.168 0.460 5.604 0.801
    RI388 0.001 0.001 0.016 0.000
    RI354 0.002 0.002 0.022 0.000
    SSA500 0.985 0.010 0.997 0.869
    AAOD500 0.016 0.007 0.082 0.005
    SLF α指数 1.853 0.013 1.872 1.779
    UVAI 0.106 0.385 0.800 -2.186
    RI388 0.004 0.003 0.019 0.000
    RI354 0.004 0.003 0.019 0.000
    SSA500 0.964 0.021 1.000 0.853
    AAOD500 0.026 0.014 0.082 0.000
    下载: 导出CSV

    表  3   广东省各城市3种气溶胶类型占比

    Table  3   The proportion of three aerosol types of each city in Guangdong  %

    城市 OMI产品标签数据 随机森林分类结果
    DST CRB SLF DST CRB SLF
    潮州市 6.6 2.5 90.9 6.6 4.1 89.3
    东莞市 23.9 1.2 74.9 19.6 4.3 76.1
    佛山市 16.4 1.3 82.3 19.6 2.2 78.2
    广州市 17.1 1.8 81.1 17.1 2.1 80.8
    河源市 7.8 1.2 9.1 7.8 1.9 90.3
    惠州市 9.6 1.0 89.4 9.6 2.5 87.9
    江门市 13.8 1.6 84.6 13.7 1.9 84.4
    揭阳市 7.3 1.7 91.0 7.3 1.9 90.8
    茂名市 12.8 0.7 86.5 12.8 0.7 86.5
    梅州市 5.9 1.7 92.4 5.9 3.0 91.1
    清远市 10.8 0.5 88.7 10.6 0.5 88.9
    汕头市 8.6 8.6 82.8 10.6 11.6 77.8
    汕尾市 6.9 4.0 89.1 6.9 3.9 89.2
    韶关市 9.6 1.8 88.6 8.1 1.9 90.0
    深圳市 10.1 2.9 87.0 10.1 5.0 84.9
    阳江市 7.7 2.1 90.2 8.2 2.1 89.7
    云浮市 5.3 1.1 93.6 8.2 1.9 89.9
    湛江市 12.7 3.2 84.1 16.7 6.9 76.4
    肇庆市 10.5 0.9 88.6 10.5 0.9 88.6
    中山市 8.4 3.1 88.5 10.8 4.1 85.1
    珠海市 8.7 3.3 88.0 10.8 4.1 85.1
    下载: 导出CSV
  • [1]

    EALO M, ALASTUEY A, PEREZ N, et al. Impact of aerosol particle sources on optical properties in urban, regional and remote areas in the north-western Mediterranean[J]. Atmospheric Chemistry and Physics, 2018, 18: 1149-1169. doi: 10.5194/acp-18-1149-2018

    [2]

    CHEN Q X, SHEN W X, YUAN Y, et al. Verification of aerosol classification methods through satellite and ground-based mea-surements over Harbin, Northeast China[J]. Atmospheric Research, 2019, 216: 167-175. doi: 10.1016/j.atmosres.2018.09.022

    [3]

    RENARD J B, DULAC F, DURAND P, et al. In situ mea-surements of desert dust particles above the western Mediterranean Sea with the balloon-borne Light Optical Aerosol Counter/sizer (LOAC) during the ChArMEx campaign of summer 2013[J]. Atmospheric Chemistry and Physics, 2018, 18: 3677-3699. doi: 10.5194/acp-18-3677-2018

    [4]

    CRUTZEN P J, ANDREAE M O. Biomass burning in the tropics: impact on atmospheric chemistry and biogeochemi-cal cycles[J]. Science, 1990, 250: 1669-1678. doi: 10.1126/science.250.4988.1669

    [5]

    DUBOVIK O, HOLBEN B, ECK T F, et al. Variability of absorption and optical properties of key aerosol types observed in worldwide locations[J]. Journal of the Atmospheric Sciences, 2001, 59: 590-608.

    [6]

    HAMILL P, GIORDANO M, WARD C, et al. An AERONET-based aerosol classification using the Mahalanobis distance[J]. Atmospheric Environment, 2016, 140: 213-233. doi: 10.1016/j.atmosenv.2016.06.002

    [7]

    KALAPUREDDY M C R, KASKAOUTIS D G, RAJ P E, et al. Identification of aerosol type over the Arabian Sea in the pre-monsoon season during the Integrated Campaign for Aerosols, Gases and Radiation Budget (ICARB)[J]. Journal of Geophysical Research, 2009, 114: D17203/1-12. http://adsabs.harvard.edu/abs/2009JGRD..11417203K

    [8]

    SREEKANTH V. On the classification and sub-classification of aerosol key types over south central peninsular India: MODIS-OMI algorithm[J]. Science of the Total Environment, 2014, 468/469: 1086-1092. doi: 10.1016/j.scitotenv.2013.09.038

    [9] 白冰, 张强, 陈旭辉, 等. 中国西北干旱半干旱区气溶胶分类及特征[J]. 中国沙漠, 2019, 39(5): 105-110. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGSS201905014.htm

    BAI B, ZHANG Q, CHEN X H, et al. Classification and characteristics of aerosols in arid and semi-arid areas of northwest China[J]. Journal of Desert Research, 2019, 39(5): 105-110. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGSS201905014.htm

    [10]

    KUMAR K R, KANG N, YIN Y. Classification of key aerosol types and their frequency distributions based on satellite remote sensing data at an industrially polluted city in the Yangtze River Delta, China[J]. International Journal of Climatology, 2018, 38: 320-336. doi: 10.1002/joc.5178

    [11]

    CHEN Q X, YUAN Y, SHUAI Y, et al. Graphical aerosol classification method using aerosol relative optical depth[J]. Atmospheric Environment, 2016, 135: 84-91. doi: 10.1016/j.atmosenv.2016.03.061

    [12]

    TORRES O, TANSKANEN A, VEIHELMANN B, et al. Aerosols and surface UV products from Ozone Monitoring Instrument observations: an overview[J]. Journal of Geophysical Research-Atmospheres, 2007, 112: D24S47/1-14. doi: 10.1029/2007JD008809/full

    [13]

    BUCHARD V, DA SILVA A M, COLARCO P R, et al. Using the OMI aerosol index and absorption aerosol optical depth to evaluate the NASA MERRA Aerosol Reanalysis[J]. Atmospheric Chemistry and Physics, 2015, 15: 5743-5760. doi: 10.5194/acp-15-5743-2015

    [14]

    FIELD R D, VAN DER WERF G R, FANIN T, et al. Indonesian fire activity and smoke pollution in 2015 show persistent nonlinear sensitivity to El Nino-induced drought[J]. Proceedings of the National Academy of Sciences of the United States of America, 2016, 113: 9204-9209. doi: 10.1073/pnas.1524888113

    [15]

    CHEN J M, LI C L, RISTOVSKI Z, et al. A review of biomass burning: emissions and impacts on air quality, health and climate in China[J]. Science of the Total Environment, 2017, 579: 1000-1034. http://www.sciencedirect.com/science/article/pii/S0048969716324561

    [16]

    ZHENG Y C, LI L L, WANG Y P. An aerosol type classification method based on remote sensing data in Guangdong, China[C]//The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. Göttingen, Germany: Copernicus Publications, 2019: 239-243.

    [17]

    BREIMAN L. Random forests[J]. Machine Learning, 2001, 45: 5-32. doi: 10.1023/A:1010933404324

    [18] 耿仁方, 付波霖, 蔡江涛, 等. 基于无人机影像和面向对象随机森林算法的岩溶湿地植被识别方法研究[J]. 地球信息科学学报, 2019, 21(8): 1295-1306. https://www.cnki.com.cn/Article/CJFDTOTAL-DQXX201908016.htm

    GENG R F, FU B L, CAI J T, et al. Object-based karst wetland vegetation classification method using unmanned aerial vehicle images and random forest algorithm[J]. Journal of Geo-information Science, 2019, 21(8): 1295-1306. https://www.cnki.com.cn/Article/CJFDTOTAL-DQXX201908016.htm

    [19] 曹爽, 潘锁艳, 管海燕. 机载多光谱LiDAR的随机森林地物分类[J]. 测绘通报, 2019, 11: 79-84. https://www.cnki.com.cn/Article/CJFDTOTAL-CHTB201911016.htm

    CAO S, PAN S Y, GUAN H Y. Random forest-based land-use classification using multispectral LiDAR data[J]. Bulletin of Surveying and Mapping, 2019, 11: 79-84. https://www.cnki.com.cn/Article/CJFDTOTAL-CHTB201911016.htm

    [20] 马玥, 姜琦刚, 孟治国, 等. 基于随机森林算法的农耕区土地利用分类研究[J]. 农业机械学报, 2016, 47(1): 297-303. https://www.cnki.com.cn/Article/CJFDTOTAL-NYJX201601040.htm

    MA Y, JIANG Q G, MENG Z G, et al. Classification of land use in farming area based on random forest algorithm[J]. Transactions of the Chinese Society of Agriculture Machinery, 2016, 47(1): 297-303. https://www.cnki.com.cn/Article/CJFDTOTAL-NYJX201601040.htm

    [21]

    SU H, SHEN W, WANG J, et al. Machine learning and geostatistical approaches for estimating aboveground biomass in Chinese subtropical forests[J]. Forest Ecosystems, 2020, 7: 64/1-20. http://qikan.cqvip.com/Qikan/Article/Detail?id=7103641717

    [22]

    HUNT D A, TABOR K, HEWSON J H, et al. Review of remote sensing methods to map coffee production systems[J]. Remote Sensing, 2020, 12: 2041/1-23. http://www.researchgate.net/publication/342452963_Review_of_Remote_Sensing_Methods_to_Map_Coffee_Production_Systems

    [23] 李宁, 汪丽娜. 基于随机森林回归算法的用水总量影响因素解析——以广东省为例[J]. 华南师范大学学报(自然科学版), 2021, 53(1): 78-84. doi: 10.6054/j.jscnun.2021012

    LI N, WANG L N. An analysis of the factors in total water consumption based on random forest regression algorithm: a case study of Guangdong Province[J]. Journal of South China Normal University(Natural Science Edition), 2021, 53(1): 78-84. doi: 10.6054/j.jscnun.2021012

    [24] 刘望保, 谢智豪. 位置服务大数据下广州市土地利用类型模拟探讨[J]. 华南师范大学学报(自然科学版), 2019, 51(1): 75-83. doi: 10.6054/j.jscnun.2019013

    LIU W B, XIE Z H. Inferring land use of Guangzhou from big data of location service[J]. Journal of South China Normal University(Natural Science Edition), 2019, 51(1): 75-83. doi: 10.6054/j.jscnun.2019013

  • 期刊类型引用(3)

    1. 陈金车,迪里努尔·牙生,王田宇,李旭,王金艳,谢祥珊,孙彩霞. 3种机器学习方法对空气污染预报效果的对比. 兰州大学学报(自然科学版). 2023(05): 638-646 . 百度学术
    2. 姚娜,张苗苗,卜令兵,郜海阳,王勤. 基于机载高光谱分辨率激光雷达的气溶胶分类研究. 光学学报. 2023(24): 298-310 . 百度学术
    3. 邱志诚,林丽衡,李光程,云龙. 大气污染环境监测技术及治理方案. 化工管理. 2022(12): 54-57 . 百度学术

    其他类型引用(2)

图(4)  /  表(3)
计量
  • 文章访问数:  503
  • HTML全文浏览量:  171
  • PDF下载量:  57
  • 被引次数: 5
出版历程
  • 收稿日期:  2020-12-07
  • 网络出版日期:  2021-09-02
  • 刊出日期:  2021-08-24

目录

/

返回文章
返回