Dynamic Change Analysis of Forest Disturbance and Forest Recovery in Guangdong Province From 1990 to 2020 Using the LandTrendr Algorithm
-
摘要:
为准确掌握广东省森林干扰与森林恢复的动态特征,文章基于谷歌地球引擎(Google Earth Engine, GEE)云平台构建Landsat长时序年度无云地表反射率影像集,采用LandTrendr(Landsat-based detection of Trends in Disturbance and Recovery)算法提取广东省1990—2020年森林干扰与森林恢复的时空分布特征,并分析其演变的驱动因素,比较不同森林类型的干扰与恢复特征。结果表明:(1)1990—2020年,广东省的森林干扰总面积约为1.35×104 km2,集中分布在广东省西部、东部和中部小范围地区,干扰面积最大的3个城市分别为韶关、梅州、清远市;森林恢复总面积约为1.91×104 km2,集中分布在广东省北部和西部地区,恢复面积最大的3个城市分别为韶关、清远、肇庆市。(2)广东省森林干扰与森林恢复均集中发生在海拔小于等于600 m的地区,高海拔地区的森林面积较为稳定;广东省森林干扰集中发生在坡度小于等于25°的地区,森林恢复集中发生在坡度小于等于35°的地区。(3)广东省森林干扰在1996年后发生较为频繁,其中2011年的森林干扰面积最大;森林恢复主要集中在2001—2016年,其中2012年的森林恢复面积最大。(4)广东省的森林干扰与森林恢复主要受雨雪冰冻灾害、台风、病虫害等自然因素以及森林火灾、城市化、采伐、林业政策等人为因素的综合影响,其中雨雪冰冻灾害对广东省北部地区的常绿针叶林的影响较大,但该类型的森林恢复也较快。
Abstract:In order to accurately understand the dynamic characteristics of forest disturbance and forest recovery in Guangdong Province, a Landsat long time-series annual cloud-free surface reflectance dataset is established based on the GEE cloud platform. Then, the dataset is combined with the LandTrendr (Landsat-based detection of Trends in Disturbance and Recovery) algorithm to explore the characteristics of the spatial and temporal distribution of forest disturbances and forest restoration in Guangdong Province from 1990 to 2020. Finally, the driving factors of forest evolution and the contrast of the disturbance and recovery characteristics of different forest types are analyzed. The results indicated that: (1)From 1990 to 2020, the total area of forest disturbance in Guangdong Province is 1.35×104 km2, concentrated in the western, eastern, and small areas of central regions. The three cities with the largest forest disturbance area are Shaoguan, Meizhou, and Qingyuan. The total area of forest recovery is 1.91×104 km2, concentrated in the northern and western regions. The three cities with the largest forest recovery area are Shaoguan, Qingyuan, and Zhaoqing. (2)Forest disturbance and forest recovery in Guangdong Province are concentrated in areas less than or equal to 600 m, and the area of forest is relatively stable in high-altitude areas. Forest disturbance in Guangdong Province is concentrated in slopes less than or equal to 25°, while forest recovery is concentrated in slopes less than or equal to 35°. (3)Forest disturbance in Guangdong Province occurred more frequently after 1996, with the largest disturbance area occurring in 2011. Forest recovery in Guangdong Province occurred more frequently from 2001 to 2016, with the largest forest recovery area in 2012. (4)Forest disturbance and forest recovery in Guangdong Province are mainly affected by natural factors (rain, snow, and freezing disasters, typhoons, and insect pests) and human factors (forest fire, urbanization, cutting, and forestry policies). The impact of rain, snow, and freezing disasters on evergreen needle-leaved forests is significant, and this type of forest recovers quickly.
-
随着信息技术的飞速发展,互联网规模正在逐渐扩展,网络中流量急剧增长,网络攻击问题愈发凸显. 网络中攻击流量通过各种手段隐藏在海量的网络流量数据当中,如何从海量数据中准确检测出攻击流量成为如今网络安全所面临的难题[1-3]. 近几年,随着云计算、大数据和人工智能等技术的发展,有监督的机器学习方法被广泛应用于攻击流量检测任务中[4-6]. 此类方法利用大量带标签数据训练模型,对已知类别的样本具有良好的分类效果. 但它基于一个假设前提:训练样本与测试样本属于同一分布. 这种假设使得有监督的分类方法无法对未知类别的流量进行预测,而且,若将一个已经训练好的模型放入新的网络环境中,则需要在该网络环境中重新进行数据采集,并且标注大量数据用于模型的训练.
除上述问题外,在真实网络中,还存在样本不均衡的问题,即存在正常流量规模远大于攻击流量规模的问题. 目前研究中,解决样本不均衡的问题手段主要有3种[3, 7]:(1)调整样本权重:通过给少数类别的样本增加权重,或为多数类别的样本减少权重;(2)样本采样:利用过采样或欠采样的方法,构造均衡的训练数据;(3)生成攻击样本:利用GAN网络生成攻击样本,构造样本均衡的训练数据.
为了减轻数据标注以及样本不均衡对模型检测效果的影响,本文首先针对一种少样本且不均衡的攻击流量检测场景,即训练数据仅包含少量蜜罐捕获的攻击流量且无正常流量,设计了一个基于少样本且不均衡的网络攻击流量检测系统,并构建了基于孪生网络和深度学习的网络攻击流量检测模型(CNN-Siamese);然后,结合迁移学习、自编码器,构建了基于预训练的检测模型(AE-CNN-Siamese);最后,对孪生网络中常用的损失函数进行了改进.
1. 相关技术
1.1 孪生网络
孪生网络[8]是少样本学习的一种解决思路(图 1):将输入的2个样本通过子模型计算得到映射在高维空间的向量,通过对比向量间的欧氏距离,判断2个样本是否为同类(若距离相近则为同类样本,反之则为不同类样本). 在少样本的问题中,通过先将样本两两构造成样本对、再进行样本匹配的方式,有效地解决了样本量缺少的问题. 孪生网络最先被应用于图像分类领域,KOCH等[9]将其应用在Omniglot数据集中,在每个类别仅包含20个训练样本的情况下,达到了92%的分类准确率. 随着研究的深入,孪生网络在目标领域中取得了良好的成果并被广泛应用[10-11].
1.2 迁移学习
迁移学习[12]是为了解决一些研究领域中由于数据采集成本昂贵而难以构造大规模高质量的数据集的问题. 其实现思路为:给定1个源数据集DS及1个学习任务TS、1个目标数据集Dt及1个学习任务Tt,将模型在DS和TS上学习到的知识应用在目标数据集Dt上,以提高预测函数ft(x)的效果. 一般通过参数或超参数的迁移,在原有的网络基础上增加新的网络层来实现. SUN等[13]将基于迁移学习改进的TrAdaBoost算法应用在网络流量分类任务中,提高了分类的准确率.
1.3 蜜罐技术
蜜罐技术[14]是为了扭转网络安全攻击事件中防御方与攻击方不对称的局面而提出的主动防御技术,本质上是对攻击方进行欺骗:首先,通过部署一些作为诱饵的主机、网络服务或信息,诱使攻击方对攻击者实施攻击,从而对攻击行为进行捕获;然后,分析攻击行为,了解攻击方所使用的攻击方法,推测攻击意图和动机,使防御方可以增强网络防护. 不同的蜜罐对应不同的网络服务,因此,可以通过蜜罐所应对的攻击类别标记对应数据的标签.
2. 系统设计及模型优化
2.1 系统框架设计
为了解决网络安全检测中数据采集、数据标记费时费力以及样本不均衡的问题,本节提出一种基于少样本且不均衡的攻击流量检测系统(图 2).
该系统包含4个模块:
(1) 数据采集模块. 该模块包括2个功能:一是通过部署各类常见网络服务的蜜罐系统,捕获网络环境中的恶意流量;二是通过抓包软件获取网络环境中的全部流量数据. 其中,蜜罐所捕获的流量为本文研究问题中的训练数据.
(2) 数据预处理模块. 该模块主要包括以下几个部分:
① 流量切分. 根据五元组(源IP、源端口、目的IP、目的端口、传输层协议)的异同划分网络流量. 一般情况下,设置60 s或90 s的空闲时间表示流结束.
② 流量清洗. 若训练数据与测试数据来自不同的网络环境,IP地址与MAC地址不具备显著的分类效果,则需要对这2个地址数据进行清洗. 清洗后需要注意,一些网络流的IP与MAC地址虽然不同,但其上层内容相同,导致产生相同的样本,为了减少训练误差,需要对样本进行去重操作.
③ 生成灰度图. 一般情况下,网络流具有前期可识别的特点,因此,将网络流的大小固定为784字节,如果长度大于784字节则截取多余部分,否则使用0x00在后面进行补充. 长度统一后,按照二进制格式转为28*28的灰度图片,其中每个字节对应灰度图的一个像素,0x00对应黑色,0xff对应白色.
(3) 预测模型构造及训练模块. 主要分为2个部分:训练数据的构造以及模型的构造.
孪生网络训练数据需要构造为样本对的形式. 同类别样本对的标签为1,不同类别样本对的标签为0. 需要注意的是,若将已有样本两两构成样本对,会造成以下2个问题:一是样本数量发生组合爆炸的问题,二是不相似样本对的数量远大于相似样本对的数量,出现样本不均衡的问题. 因此,训练数据需要进行采样,以构造数量合理且均衡的训练数据.
模型的搭建主要在于子模型的结构设计. 传统有监督方法[15-18]中,卷积神经网络是最常用的网络,主要设计为卷积层-池化层-卷积层-池化层-全连接层的结构. 其中卷积层通道数通常设置为32、64或36、72. 这是因为传统有监督方法需要大量训练数据,在实现分类目标时,只需要对每个类别挖掘出一个或几个典型特征即可完成分类任务.
而孪生网络通过对比相似度,从而判断样本是否为同类别,这就表明其对特征挖掘的要求更高. 因此,本文设计了基于孪生网络的检测模型(CNN-Siamese). 图 3为CNN-Siamese的子模型结构图,该结构在第2个池化层后再添加1层卷积层提取特征,并将3个卷积层的通道数调整为64、128、256,使CNN网络可以提取更多不同维度的特征. 通过将2个完全相同的子模型进行拼接,得到CNN-Siamese.
(4) 预测模块. 孪生网络通过对比样本间的距离来分类:从每个已知标签的样本集合中,随机抽出一部分样本与待测试样本计算距离,根据待测试样本与每个已知类别的平均距离来判断该样本的类别归属. 具体预测步骤见算法1.
算法1 孪生网络预测算法
输入:经过训练的模型M,已知标签的样本集合DH,其中包含K个类别(A1, A2, …, AK),待测试样本集合DTest.
输出:模型预测分类结果.
for Si in DTest do
for k=1, 2, …, K do
选择C个样本(a1, a2, …, aC)∈Ak
Dis(Si, k)= 1CC∑j=1dis(Si,aj)//计算样本Si与第k类样本的距离
Dis(Si, K+1)=th//设置第K+1类为未知类别样本,待测试样本与该类别样本的平均距离设置为判断阈值th
di=Dis(Si, 1), yi=1
for k=2, 3, …, K+1 do
if Dis(Si, k) < di then
di=Dis(Si, k), yi=k//说明Si属于第k类
返回DTest的预测结果.
2.2 基于预训练改进的孪生网络模型
CNN-Siamese虽然可以解决少样本且不均衡的网络攻击流量检测问题,但仍然存在一些缺陷:样本对的构造需要依赖样本标签,因此,训练中无法使用正常流量样本,从而无法充分挖掘此类样本的特征;预测效果受到训练样本对构造时采样质量的影响,造成模型预测的不稳定性.
为了解决以上问题,在CNN-Siamese的基础上,提出了一种基于预训练的改进模型(AE-CNN-Siamese):利用CNN-Siamese的子模型构造一个对称的自编码器,在使用完整的数据集对自编码器进行训练后,自编码器中的编码器可以作为一个良好的特征提取网络,直接迁移至孪生网络子模型中,最后通过冻结部分层的权重及微调其他层的权重来提高模型预测效果. 预训练的自编码器结构是以孪生网络子模型为基础所构造的对称结构(图 4),其中编码器部分为:输入层-卷积层C1-池化层P1-卷积层C2-池化层P2-卷积层C3-Flatten层-全连接层FC1.
本文选择保留卷积层之间连接的全连接层,主要原因如下:
(1) 若没有增加全连接层,所构造的自编码器会出现3个卷积层相连的情况,则不能得到良好的特征提取效果.
(2) 由于孪生网络子模型中带有全连接层部分,得到的权重可以作为初始化权重应用在孪生网络子模型中.
(3) 若不加入全连接层,网络层与全连接层权重的训练需要依靠构造出的训练数据,则在训练数据中不包含正常流量样本的情况下,仍然会出现预测结果不稳定的问题.
改进后的攻击流量检测系统框架如图 5所示.
与图 2相比,改动的模块包括:
(1) 在数据预处理后加入预训练模块. 利用完整的数据集训练一个与孪生网络子模型相关的自编码器,并将预训练后的编码器权重迁移至孪生网络子模型中.
(2) 模型训练步骤调整为模型的权重微调. 将卷积层与池化层之间的权重进行冻结,保持CNN特征提取的稳定性,仅训练卷积层与全连接层的权重.
2.3 改进损失函数
孪生网络的损失函数一般采用对比损失(Con-trastive Loss)[12],公式如下:
loss=12NN∑i=1(yid2i+(1−yi)(max(0,m−di))2), (1) 其中:N为样本对的数量;di= ‖a-b‖2,表示第i个样本对中的样本a与样本b之间的距离,一般选用欧氏距离;yi为样本对Si的标签,对同类别样本,yi=1,否则yi=0;m是设定的参数,默认为1. 模型中还包含一个判断2个样本是否为同类别样本的阈值th:当di≤th时,2个样本视为相同类别,反之视为不同类别.
但Contrastive Loss存在以下问题:
(1) 模型在训练的过程中,为了降低损失函数,训练目标设为:
d(y=1)→0,d(y=0)→m2. (2) 在实际样本空间中,当y=1时,只有完全相同的2个样本才不会存在距离;当y=0时,由于平方计算的引入,训练目标受m值变化的影响较大. 如当m=1时,不相似样本的训练目标为d>1;当m=2时,不相似样本的训练目标扩大为d>4. 但样本特征空间在经过归一化操作后,即使是不相似样本也不会存在较大的距离.
(2) 当样本不相似时,样本对Si的损失函数值为12(max(0,m−di))2. 以随机梯度下降为例,此时梯度的计算如下:
∂loss∂W={0(di>m),−(m−di)∂di∂W(di<m). (3) 由式(3)可发现:在梯度下降的计算过程中,m的取值会影响梯度的计算;由于平方计算的引入,梯度值随着迭代深入存在下降的趋势,这使得模型在后期的收敛速度减缓.
基于上述考虑,本文将Contrastive Loss改进如下:
loss=12NN∑i=1(yimax(di−m1,0)+(1−yi)max(m2−di,0)). (4) 改进后的损失函数与Contrastive Loss存在以下几点不同:
(1) 对于相似样本对引入了参数m1,其目的是当相似样本对距离di < m1时,损失值为0,减少模型对相似样本对的关注度.
(2) 去掉不相似样本对距离的平方计算,消除了参数对梯度计算的影响.
(3) 梯度不会随训练轮数增加而减缓,加快了模型的收敛速度.
3. 实验结果与分析
首先,在样本量缺少且类别缺失的情况下,对比CNN-Siamese、CNN、CNN-SVM的检测效果;然后,对比AE-CNN-Siamese与CNN-Siamese的稳定性;最后,对比本文改进的损失函数与Contrastive Loss的训练收敛速度以及训练效果.
3.1 实验数据集
实验选用USTC-TFC2016数据集[16], 该数据集包含两部分:一部分是CTU研究人员在2011—2015年在实际网络中收集到的10种攻击软件流量数据;另一部分是IXIABPS采集的10种正常流量数据.
3.2 实验评价指标
采用准确率(Accuracy)、误报率(FPR,False Positive Rate)和漏报率(FNR,False Negative Rate)作为实验评价指标. 由于正常流量类别样本不存在标签,实验会将全部的正常流量归类为同一类样本,即未知流量. 准确率用于评价多分类情况,即模型能否一一区分已知的10类恶意流量样本和未知类别样本. 漏报率与误报率则用于评价二分类情况,此时我们将10类恶意流量样本视为一种类型,用这2个指标来评价模型能否区分恶意流量样本与正常流量样本.
3.3 实验设置
3.3.1 训练数据设置
由于本文的研究问题为少样本且类别缺失的网络攻击流量检测问题,实验将从攻击流量数据中抽取30%的样本假设为蜜罐捕获的带标签数据,剩余的数据作为测试数据. 实验中通过调整训练样本占比,分析训练数据数量对结果的影响. 为了避免单次实验结果不稳定的问题,采用多次实验的平均值进行记录.
3.3.2 主要参数
(1) Contrastive Loss参数m. 由式(1)可知m值将影响不相似样本对的损失值计算. 一般情况下,m默认设置为1,经实验证明本文研究问题下,m=2是一个较为理想的参数设置,因此,除结构对比部分采用m=1的默认设置外,其余实验均采用m=2的参数设置.
(2) 预测阶段从已知样本中抽取的样本数量(记做C). 一般情况下,设置C=1,即从每个已知类别中抽取1个样本计算与待测试样本的距离,从而判断待测试样本的类别归属. 由于抽取样本具有随机性,导致预测结果出现波动,因此C可以设置为大于1的值,此时待测试样本类别归属根据该样本与某个类别中C个样本的平均距离来判断.
(3) 训练样本构造时的采样次数(记做T). 训练样本构造时,为了保证样本对数量不会发生组合爆炸的情况,进行了采样处理. 在加入预训练方法后,权重微调的参数规模远大于样本量,所以需要提高采样次数以增加训练样本规模,提升模型微调效果.
3.4 结果分析
本文所有算法均采用Python开发工具Pycharm实现. 计算机配置如下:内存16G,双核CPU,单张GTX 1080Ti显卡.
3.4.1 子模型结构对比
将CNN[16]和LeNet[18]的网络结构分别作为孪生网络的子模型构建CNN2-Siamese和LetNet-Siamese,与CNN-Siamese的子模型进行对比. 实验结果(表 1)表明:CNN-Siamese明显优于其他结构,当训练数据规模达到假设前提最大的情况时,CNN-Siamese的子模型结构更适用于孪生网络方法中.
表 1 不同子模型结构的实验结果Table 1. Experimental results of different sub-model structures% 模型名称 准确率 漏报率 误报率 CNN-Siamese 72.36 0.08 37.23 CNN2-Siamese 52.77 0.07 50.72 LeNet-Siamese 41.98 0.08 55.13 3.4.2 与现有方法对比
将CNN-Siamese与CNN[16]、CNN-SVM[17]在检测的准确率、漏报率和误报率3个方面进行对比. 实验中参数设置如下:学习率=0.001,th=0.5,m=2,C=1,T=1. 由于CNN和CNN-SVM不支持未知类别的预测,因此在实验过程中进行了未知类别的阈值探索,以使2个方法均能适应本文的检测问题.
实验结果(图 6)表明CNN-Siamese具有明显的优势:CNN和CNN-SVM虽然能够在已知类别上进行准确的分类,但在未知类别上的分类准确率仅70%左右,即存在30%左右的误报率,而CNN-Siamese可以将误报率降低至10%以下.
3.4.3 预训练的实验结果与分析
将CNN-Siamese、AE-CNN-Siamese、DAE-CNN-Siamese在准确率、误报率、漏报率3个方面进行对比,其中,DAE-CNN-Siamese为降噪预训练模型,该模型与AE-CNN-Siamese的区别是在自编码器训练阶段对输入的数据增加了少量噪声. 对比实验中,CNN-Siamese仅研究了T=1的情况,因为无预训练操作,模型特征提取会随着输入数据而变化,仍然存在不稳定性;AE-CNN-Siamese、DAE-CNN-Siamese均研究了T=1和T=5的情况.
由实验结果(图 7)可知:(1)预训练模型拥有更低的误报率,并且不存在明显波动. (2)由于预训练网络仅微调最后一层卷积层与全连接层的权重,参数量占比较大,所以当数据量较小时,预训练模型的漏报率较高,随着数据规模扩大,预训练模型的预测效果比无预训练模型更稳定,且在漏报率和准确率逐渐接近的情况下,将误报率降低至2%以下. (3)预训练模型受T的取值影响较大,当T提高时,预测效果明显提升,并且在数据规模大于20%后,该模型在准确率与误报率上的表现逐渐超过无预训练模型,漏报率也随着样本规模的扩大而逐渐降低. (4)降噪功能对预测效果有一定影响:当数据量较小时,无降噪的预训练模型(AE-CNN-Siamese)的准确率、漏报率、误报率均优于有降噪的预训练模型(DAE-CNN-Siamese);随着数据量的提升,误报率出现一定的波动,此时降噪的预训练模型(DAE-CNN-Siamese)表现了更好的鲁棒性.
3.4.4 损失函数的实验结果与分析
由于改进的损失函数引入了2个需要人工设置的参数,因此,本实验设置了3种参数组合,并与Contrastive Loss中参数m=2的结果进行对比. 具体设置如下:
(i) Contrastive Loss,参数m=2.
(ii) 改进的损失函数,参数m1=0,m2=2.
(iii) 改进的损失函数,参数m1=0.25,m2=2.
(iv) 改进的损失函数,参数m1=0.5,m2=2.
在改进的损失函数中,m2与不相似样本相关,其作用等同于Contrastive Loss的参数m,均是调整模型对不相似样本在训练过程中的关注度. 此处对m2=2的设置不再进行过多的讨论. m1与相似样本相关:当m1=0时,代表训练过程中期望将相似样本的距离尽可能缩小,以降低损失;实验中根据距离判断样本是否相似的阈值th=0.5,设置m1=0.5,此时当样本被准确判断为相似样本时,该样本的损失值为0;根据3.4.1~3.4.3的预测结果分析,当y=1时,d基本集中在0, 0.2的区间范围内,因此,设置m1=0.25的情况进行对比.
本节对比2种损失函数以及改进的损失函数在不同参数条件下的预测效果,实验均采用AE-CNN-Siamese的模型,且设置参数T=1. 由实验结果(图 8)可知:(1)在前20轮迭代中,改进的损失函数在收敛速度上明显优于Contrastive Loss;(2)随着迭代深入,参数设置(ii)、(iv)下的预测准确率不再有明显的提升;(3)Contrastive Loss虽然在第20轮之后的迭代过程中逐步靠近参数设置(iii)下的实验结果,但前者仍然略低于后者;(4)改进的损失函数在收敛速度明显优于Contrastive Loss,预测效果取决于模型对相似样本的关注度.
3.4.5 模型运行效率实验
本节将对几种采样参数不同设置情况下AE-CNN-Siamese的运行效率进行分析. 由结果(表 2)可知:参数C对预测阶段有着重要的影响;参数T对模型的训练时长产生影响,随着T的增加,训练时长有所增加;预训练增加了模型整体的运行时长. 本文研究问题是基于少样本的前提,因此训练时长占比较少. 预测和预训练时长与数据整体的规模直接相关,但预训练仅对整体数据训练一次,而参数C的增加则将增加待测试数据的计算次数,从而增加整体运行时长.
表 2 AE-CNN-Siamese的运行效率分析Table 2. The analysis of AE-CNN-Siamese operating efficiency参数设置 模型选择 执行效率 C T 是否预训练 是否降噪 平均训练时长/s 平均预测时长/s 平均运行总时长/s 1 1 否 否 95 191 317 3 1 否 否 103 341 483 5 1 否 否 98 734 869 1 5 否 否 596 183 820 1 1 是 否 1 876 184 2 105 1 1 是 是 1 831 202 2 093 1 5 是 否 1 905 207 2 153 1 5 是 是 1 849 199 2 133 4. 结论
为了解决网络流量样本标注困难以及样本不均衡的问题,本文针对一种少样本且分布不均衡的网络攻击流量检测场景,设计了一个基于少样本且不均衡的网络攻击流量检测系统,并通过引入孪生网络,构建了基于孪生网络和深度学习的网络攻击流量检测模型(CNN-Siamese);针对CNN-Siamese因样本对构造采样造成预测结果的不稳定性问题,结合预训练方法,改进得到基于预训练的检测模型(AE-CNN-Siamese),最后改进孪生网络常用的损失函数.
实验结果表明:(1)CNN-Siamese在本文的研究问题下可以达到90%以上的分类准确率;与CNN、CNN-SVM等模型相比,在将漏报率保持在1%左右的前提下,将误报率降低至10%以下. (2)AE-CNN-Siamese通过调整训练样本对构造时的样本采样次数,将分类准确率提升到95%以上,并在漏报率仍保持在1%左右的情况下,降低了误报率,且不会产生明显波动. (3)在保证预测效果准确的前提下,改进的对比损失函数加快了AE-CNN-Siamese的收敛速度.
未来工作中,可以对未知攻击类型进行深入研究,或引入流量的时序特征,利用循环神经网络开展后续研究.
-
表 1 本文使用的LandTrendr算法的参数设置
Table 1 Parameter settings of the LandTrendr algorithm in this study
参数名称 参数含义 参数值 maxSegments 分割最大片段数量 6 spikeThreshold 尖峰噪声阈值 0.9 vertexCountOvershoot 在初始阶段的潜在顶点回归中可以超过的顶点数量 3 preventOneYearRecovery 是否防止一年的恢复 true recoveryThreshold 恢复率阈值倒数 0.25 pvalThreshold F检验的p值阈值 0.05 bestModelProportion 最优模型比例 0.75 minObservationsNeeded 拟合中需要的最少观测数量 6 mag 变化幅度阈值 0.2 preval 检测到干扰前的NBR指数值 0.3 mmu 发生变化最小像素量 11 表 2 基于LandTrendr算法的森林变化检测精度
Table 2 The accuracy of forest change detection using the LandTrendr in this study
检测结果类别 实际像元数/个 用户精度/% 稳定像元 变化像元 合计 稳定像元 127 23 150 84.67 变化像元 8 142 150 94.67 合计 135 165 300 生产者精度/% 94.07 86.06 注:总体精度为89.67%,Kappa系数为0.79。 -
[1] LI X, DU H, MAO F, et al. Assimilating spatiotemporal MODIS LAI data with a particle filter algorithm for improving carbon cycle simulations for bamboo forest ecosystems[J]. Science of The Total Environment, 2019, 694: 133803/1-14.
[2] KENNEDY R E, YANG Z, BRAATEN J, et al. Attribution of disturbance change agent from Landsat time-series in support of habitat monitoring in the Puget Sound region, USA[J]. Remote Sensing of Environment, 2015, 166: 271-285. doi: 10.1016/j.rse.2015.05.005
[3] 王宁, 岳彩荣, 罗洪斌, 等. 森林扰动遥感影像检测方法研究进展[J]. 世界林业研究, 2022, 35(4): 40-46. https://www.cnki.com.cn/Article/CJFDTOTAL-SJLY202204007.htm WANG N, YUE C R, LUO H B, et al. Review on forest disturbance detection methods by remote sensing[J]. World Forestry Research, 2022, 35(4): 40-46. https://www.cnki.com.cn/Article/CJFDTOTAL-SJLY202204007.htm
[4] 徐晋涛, 易媛媛. "双碳"目标与基于自然的解决方案: 森林碳汇的潜力和政策需求[J]. 农业经济问题, 2022(9): 11-23. https://www.cnki.com.cn/Article/CJFDTOTAL-NJWT202209002.htm XU J T, YI Y Y. Nature-based solutions in meeting China's dual-carbon goal: the potential of forest and policy needs[J]. Issues in Agricultural Economy, 2022(9): 11-23. https://www.cnki.com.cn/Article/CJFDTOTAL-NJWT202209002.htm
[5] 郑洁玮, 陈传国, 罗勇, 等. 广东省近15年森林资源主要因子动态变化分析[J]. 林业与环境科学, 2022, 38(5): 127-130. https://www.cnki.com.cn/Article/CJFDTOTAL-GDLY202205019.htm ZHENG J W, CHEN C G, LUO Y, et al. Dynamic changes of main factors of forest resources in Guangdong Province in recent 15 years[J]. Forestry and Environmental Science, 2022, 38(5): 127-130. https://www.cnki.com.cn/Article/CJFDTOTAL-GDLY202205019.htm
[6] REN H, CHEN H, LI L, et al. Spatial and temporal patterns of carbon storage from 1992 to 2002 in forest ecosystems in Guangdong, Southern China[J]. Plant and Soil, 2013, 363(1): 123-138.
[7] CHEN Y, LIU Z, RAO X, et al. Carbon storage and allocation pattern in plant biomass among different forest plantation stands in Guangdong, China[J]. Forests, 2015, 6(12): 794-808.
[8] ZHANG L, ZHANG X, SHAO Z, et al. Integrating Sentinel-1 and 2 with LiDAR data to estimate aboveground biomass of subtropical forests in northeast Guangdong, China[J]. International Journal of Digital Earth, 2023, 16(1): 158-182. doi: 10.1080/17538947.2023.2165180
[9] SHEN W, LI M, HUANG C, et al. Annual forest aboveground biomass changes mapped using ICESat/GLAS measurements, historical inventory data, and time-series optical and radar imagery for Guangdong Province, China[J]. Agricultural and Forest Meteorology, 2018, 259: 23-38. doi: 10.1016/j.agrformet.2018.04.005
[10] SHEN W, LI M, HUANG C, et al. Quantifying live aboveground biomass and forest disturbance of mountainous natural and plantation forests in northern Guangdong, China, based on multi-temporal Landsat, PALSAR and field plot data[J]. Remote Sensing, 2016, 8(7): 595/1-24.
[11] SHEN W, LI M, HUANG C, et al. Mapping annual forest change due to afforestation in Guangdong Province of China using active and passive remote sensing data[J]. Remote Sensing, 2019, 11(5): 490/1-21.
[12] SHEN W, LI M, WEI A. Spatio-temporal variations in plantation forests' disturbance and recovery of northern Guangdong Province using yearly Landsat time series observations(1986-2015)[J]. Chinese Geographical Science, 2017, 27(4): 600-613. doi: 10.1007/s11769-017-0880-z
[13] HUANG C, GOWARD S N, SCHLEEWEIS K, et al. Dynamics of national forests assessed using the Landsat record: case studies in eastern United States[J]. Remote Sensing of Environment, 2009, 113(7): 1430-1442. doi: 10.1016/j.rse.2008.06.016
[14] KENNEDY R E, YANG Z, COHEN W B. Detecting trends in forest disturbance and recovery using yearly Landsat time series: 1. LandTrendr—Temporal segmentation algorithms[J]. Remote Sensing of Environment, 2010, 114(12): 2897-2910. doi: 10.1016/j.rse.2010.07.008
[15] ZHU Z, WOODCOCK C E. Continuous change detection and classification of land cover using all available Landsat data[J]. Remote Sensing of Environment, 2014, 144: 152-171. doi: 10.1016/j.rse.2014.01.011
[16] VERBESSELT J, HYNDMAN R, NEWNHAM G, et al. Detecting trend and seasonal changes in satellite image time series[J]. Remote Sensing of Environment, 2010, 114(1): 106-115. doi: 10.1016/j.rse.2009.08.014
[17] KENNEDY R, YANG Z, GORELICK N, et al. Implementation of the LandTrendr algorithm on Google Earth Engine[J]. Remote Sensing, 2018, 10(5): 691/1-10.
[18] 尹雄, 陈帮乾, 古晓威, 等. 基于GEE平台LandTrendr算法的海南岛森林扰动快速监测方法及分析[J]. 地球信息科学学报, 2023, 25(10): 2093-2106. https://www.cnki.com.cn/Article/CJFDTOTAL-DQXX202310013.htm YIN X, CHEN B Q, GU X W, et al. Rapid monitoring of tropical forest disturbance in Hainan Island based on GEE platform and LandTrendr algorithm[J]. Journal of Geo-Information Science, 2023, 25(10): 2093-2106. https://www.cnki.com.cn/Article/CJFDTOTAL-DQXX202310013.htm
[19] 毛学刚, 姚瑶, 范文义. 基于Landsat长时间序列的森林扰动参数提取与树高估算[J]. 林业科学, 2019, 55(3): 79-87. https://www.cnki.com.cn/Article/CJFDTOTAL-LYKE201903009.htm MAO X G, YAO Y, FAN W Y. Extraction of forest disturbance parameters and estimation of forest height based on long time-series Landsat[J]. Scientia Silvae Sinicae, 2019, 55(3): 79-87. https://www.cnki.com.cn/Article/CJFDTOTAL-LYKE201903009.htm
[20] ZHANG X, HUANG G, LIU L, et al. Ecological and economic analyses of the forest metabolism system: a case study of Guangdong Province, China[J]. Ecological Indicators, 2018, 95: 131-140. doi: 10.1016/j.ecolind.2018.07.022
[21] 广东省林业局. 林业概况[EB/OL]. (2023-05-25)[2023-12-23]. http://lyj.gd.gov.cn/news/special/Survey/content/post_4186939.html. [22] YOUNG N E, ANDERSON R S, CHIGNELL S M, et al. A survival guide to Landsat preprocessing[J]. Ecology, 2017, 98(4): 920-932. doi: 10.1002/ecy.1730
[23] 王思, 张路路, 林伟彪, 等. 基于MODIS-归一化植被指数的广东省植被覆盖与土地利用变化研究[J]. 生态学报, 2022, 42(6): 2149-2163. https://www.cnki.com.cn/Article/CJFDTOTAL-STXB202206008.htm WANG S, ZHANG L L, LIN W B, et al. Study on vegetation coverage and land-use change of Guangdong Province based on MODIS-NDVI[J]. Acta Ecologica Sinica, 2022, 42(6): 2149-2163. https://www.cnki.com.cn/Article/CJFDTOTAL-STXB202206008.htm
[24] ZHU Z, WANG S, WOODCOCK C E. Improvement and expansion of the Fmask algorithm: cloud, cloud shadow, and snow detection for Landsats 4-7, 8, and Sentinel 2 images[J]. Remote Sensing of Environment, 2015, 159: 269-277. doi: 10.1016/j.rse.2014.12.014
[25] United States Geological Survey. USGS EROS archive-digital elevation-Shuttle Radar Topography Mission(SRTM)[EB/OL]. (2018-07-30)[2024-01-06]. https://www.usgs.gov/centers/eros/science/usgs-eros-archive-digital-elevation-shuttle-radar-topography-mission-srtm-1?qt-science_center_objects=0#qt-science_center_objects.
[26] KUMAR L, MUTANGA O. Google Earth Engine applications since inception: usage, trends, and potential[J]. Remote Sensing, 2018, 10(10): 1509/1-15.
[27] ZHANG X, LIU L, CHEN X, et al. GLC_FCS30: Global land-cover product with fine classification system at 30 m using time-series Landsat imagery[J]. Earth System Science Data, 2021, 13(6): 2753-2776. doi: 10.5194/essd-13-2753-2021
[28] 林义辉, 薛春泉. 广东省雨雪冰冻灾害森林生态修复工程规划与技术[J]. 广东林业科技, 2009, 25(5): 102-106. https://www.cnki.com.cn/Article/CJFDTOTAL-GDLY200905021.htm LIN Y H, XUE C Q. The planning and technology of post-frost forest ecological rehabilitation in Guangdong Province[J]. Forestry and Environmental Science, 2009, 25(5): 102-106. https://www.cnki.com.cn/Article/CJFDTOTAL-GDLY200905021.htm
[29] WU J, WANG T, PAN K, et al. Assessment of forest damage caused by an ice storm using multi-temporal remote-sensing images: a case study from Guangdong Province[J]. International Journal of Remote Sensing, 2016, 37(13): 3125-3142. doi: 10.1080/01431161.2016.1194544
[30] 李怡. 广东省沿海防护林综合效益计量与实现研究[D]. 北京: 北京林业大学, 2010. LI Y. Quantitative on comprehensive benefit of Guangdong coastal shelterbelt and implementation research[D]. Beijing: Beijing Forestry University, 2010.
[31] 杨振意, 樊晶, 刘春燕, 等. 基于SWOT-AHP的广东省林业有害生物监测策略分析[J]. 热带林业, 2023, 51(3): 36-41. https://www.cnki.com.cn/Article/CJFDTOTAL-RDLY202303005.htm YANG Z Y, FAN J, LIU C Y, et al. Strategic analysis of forest pest monitoring in Guangdong Province based on SWOT-AHP[J]. Tropical Forestry, 2023, 51(3): 36-41. https://www.cnki.com.cn/Article/CJFDTOTAL-RDLY202303005.htm
[32] 罗碧珍. 林火干扰对广东省亚热带森林生态系统碳库的影响研究[D]. 哈尔滨: 东北林业大学, 2021. LUO B Z. Effects of forest fire disturbance on carbon pools of subtropical forest ecosystem in Guangdong Province, China[D]. Harbin: Northeast Forestry University, 2021.
[33] XIAN Y, LU Y, MUSYIMI Z, et al. Tracking the role of policies and economic factors in driving the forest change trajectories within the Guangdong-Hongkong-Macao Region of China: a remote sensing perspective[J]. Land, 2021, 10(1): 87/1-18.
[34] 广东省林业局. 中共广东省委、广东省人民政府关于巩固绿化成果, 加快林业现代化建设的决定[EB/OL]. (1994-01-17)[2024-01-21]. https://lyj.gd.gov.cn/gab/tzwj/content/post_4323951.html. [35] ZHOU Z, CHOKKALINGAM U. Lessons learned and success of initiatives to rehabilitate degraded forests in Guangdong Province, China[J]. International Journal of Sustainable Development & World Ecology, 2010, 17(3): 263-270.
[36] 中华人民共和国农业农村部. 中华人民共和国水土保持法[EB/OL]. (1991-06-29)[2024-01-21]. https://www.moa.gov.cn/gk/zcfg/fl/200601/t20060120_539622.htm. [37] 广东省林业局. 广东省林地保护管理条例[EB/OL]. (1998-09-18)[2024-01-06]. https://lyj.gd.gov.cn/government/law/content/post_1883502.html. [38] 广东省林业局. 广东省林业发展"十五"计划[EB/OL]. (2004-04-29)[2024-01-06]. https://lyj.gd.gov.cn/government/Information/plan/content/post_1883723.html. [39] 广东省林业局. 广东省林业发展"十一五"和中长期规划[EB/OL]. (2005-10-01)[2024-01-06]. https://lyj.gd.gov.cn/old_gkml/content/post_2189427.html. [40] 广东省林业局. 中共广东省委、广东省人民政府关于加快建设林业生态省的决定[EB/OL]. (2005-03-04)[2024-01-06]. https://lyj.gd.gov.cn/government/law/content/post_1883739.html. [41] 广东省林业局. 广东省林业发展"十二五"规划[EB/OL]. (2011-03-11)[2024-01-06]. https://lyj.gd.gov.cn/old_gkml/content/post_2189634.html. [42] 广东省林业局. 邓海光对《关于全面推进新一轮绿化广东大行动的决定》作起草说明[EB/OL]. (2013-09-10)[2024-01-06]. https://lyj.gd.gov.cn/news/forestry/content/post_1860472.html. [43] 刘珊, 曾锋, 隋宏, 等. 广东省林业四大重点生态工程建设存在问题和对策[J]. 热带林业, 2019, 47(2): 8-11. https://www.cnki.com.cn/Article/CJFDTOTAL-RDLY201902004.htm LIU S, CENG F, SUI H, et al. The problems and countermeasures of the four eco-forestry key projects in Guangdong Province[J]. Tropical Forestry, 2019, 47(2): 8-11. https://www.cnki.com.cn/Article/CJFDTOTAL-RDLY201902004.htm
[44] 柯善新, 胡觉, 黄湘南. 广东省"十四五"期间森林资源保护与发展思考[J]. 中南林业调查规划, 2019, 38(3): 5-10;24. https://www.cnki.com.cn/Article/CJFDTOTAL-ZLDF201903003.htm KE S X, HU J, HUANG X N. Thought on protection and development of forest resources in Guangdong Province in the 14th Five-Year Plan period[J]. Central South Forest Inventory and Planning, 2019, 38(3): 5-10;24. https://www.cnki.com.cn/Article/CJFDTOTAL-ZLDF201903003.htm
[45] 王湘龙. 广东省第四次森林资源二类调查主要结果分析[J]. 林业与环境科学, 2020, 36(1): 73-77. https://www.cnki.com.cn/Article/CJFDTOTAL-GDLY202001011.htm WANG X L. Analysis of the fourth forest resources survey in Guangdong[J]. Forestry and Environmental Science, 2020, 36(1): 73-77. https://www.cnki.com.cn/Article/CJFDTOTAL-GDLY202001011.htm
-
期刊类型引用(7)
1. 王洁,吕奕飞. 基于支持向量机的通信网络攻击行为分类检测方法. 信息与电脑(理论版). 2024(06): 41-43 . 百度学术
2. 涂珂. 基于攻击流量的网络安全漏洞检测技术. 自动化技术与应用. 2024(09): 89-92+179 . 百度学术
3. 江山杉. 基于改进FastICA算法的工控网络恶意节点攻击检测系统设计. 微型电脑应用. 2024(09): 49-53 . 百度学术
4. 张涛. 基于对抗机器学习的工业控制网络欺骗攻击行为检测系统设计. 计算机测量与控制. 2024(10): 298-304 . 百度学术
5. 宁安安,张俊,年梅. 基于自编码器的网络游戏流量分类. 计算机系统应用. 2023(07): 113-120 . 百度学术
6. 谢从贵. 一种融合实例和聚类信息的网络入侵攻击分类研究. 常熟理工学院学报. 2023(05): 29-35 . 百度学术
7. 沈广东. 基于改进决策树算法的DNS流量异常动态检测. 黑龙江工业学院学报(综合版). 2022(05): 72-76 . 百度学术
其他类型引用(1)