Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

基于主成分分析和优化聚类算法的行驶工况研究

张林平, 李风军

张林平, 李风军. 基于主成分分析和优化聚类算法的行驶工况研究[J]. 华南师范大学学报(自然科学版), 2021, 53(2): 121-128. DOI: 10.6054/j.jscnun.2021035
引用本文: 张林平, 李风军. 基于主成分分析和优化聚类算法的行驶工况研究[J]. 华南师范大学学报(自然科学版), 2021, 53(2): 121-128. DOI: 10.6054/j.jscnun.2021035
ZHANG Linping, LI Fengjun. A Study of Driving Conditions Based on Principal Component Analysis and Optimization Clustering Algorithm[J]. Journal of South China Normal University (Natural Science Edition), 2021, 53(2): 121-128. DOI: 10.6054/j.jscnun.2021035
Citation: ZHANG Linping, LI Fengjun. A Study of Driving Conditions Based on Principal Component Analysis and Optimization Clustering Algorithm[J]. Journal of South China Normal University (Natural Science Edition), 2021, 53(2): 121-128. DOI: 10.6054/j.jscnun.2021035

基于主成分分析和优化聚类算法的行驶工况研究

基金项目: 

国家自然科学基金项目 12061055

国家自然科学基金项目 61662060

宁夏自然基金项目 2020AAC03030

详细信息
    通讯作者:

    李风军,Email:fjli@nxu.edu.cn

  • 中图分类号: U467; TP399

A Study of Driving Conditions Based on Principal Component Analysis and Optimization Clustering Algorithm

  • 摘要: 针对模糊C均值聚类算法容易陷入局部最优以及传统的主成分分析法没有完全体现出用数量较少的综合指标来代替多个指标的问题,提出了一种改进的主成分分析和利用遗传模拟退火算法优化后的模糊C均值聚类算法相结合的聚类算法(GSA-FCM),从而构建汽车行驶工况图:首先,利用改进的主成分分析法对特征参数矩阵进行处理;然后,采用GSA-FCM聚类算法对运动学片段进行聚类;最后,选择合适的片段合成最终工况图. 并且,对GSA-FCM聚类、传统的K均值聚类的合成工况与实际工况中的特征参数进行有效性验证,与NEDC标准测试工况进行比对. 实验结果表明:GSA-FCM聚类合成工况与实际工况的特征参数的平均相对误差为6.46%,说明GSA-FCM聚类算法的聚类效果明显、误差小,所合成的行驶工况可以代表该城市的汽车行驶状况.
    Abstract: As the fuzzy C-means clustering algorithm is easy to fall into local optimum and the traditional principal component analysis (PCA) does not fully reflect replacement of multiple indexes with a small number of composite indicators, an improved principal component analysis and a genetic simulated annealing algorithm are proposed to optimize the fuzzy C-means clustering algorithm (GSA-FCM), so as to build the driving condition. First of all, the improved PCA is used to deal with the characteristic parameter matrix. Then, GSA-FCM clustering algorithm is used to cluster the kinematics fragments. Finally, the appropriate fragments are selected to synthesize the final working pattern. Moreover, the effectiveness of the characteristic parameters in the synthesis conditions of GSA-FCM clustering and traditional K-means clustering algorithm and the actual conditions were verified and compared with that of the standard test conditions of NEDC. The experimental results show that the average relative error of characteristic parameters between the condition synthesized with GSA-FCM clustering algorithm and the actual condition is 6.46%, which indicates that the clustering effect of GSA-FCM clustering algorithm is obvious and the error is small, and the synthesized driving condition can represent the actual driving condition of the city.
  • 随着经济的快速发展,汽车保有量不断增加, 给城市交通带来了沉重的压力,并使得汽车排放成为中国主要城市空气污染的主要来源[1]. 行驶工况是量化汽车排放的一个重要概念,能充分反映汽车的实际行驶模式,从而获得可靠的汽车排放估计. 随着路网密度的改善,研究者越来越关注实际驾驶条件与各种车辆认证和监管机构所使用的标准行驶工况之间的差距.

    汽车行驶工况作为一种被广泛采用的燃油经济性、排放和行驶里程评价基准,可以方便车辆设计和对新兴车辆技术性能评价,得到学者的广泛研究. 如:采用马尔科夫随机过程理论,构建了行驶工况图[2-4];采用一种改进的马尔科夫蒙特卡罗方法构建了北京市的行驶工况图[5];利用主成分分析和K均值聚类算法构建了行驶工况图[6-9];提出了一种构造“行程段”的方法,构造了印度客车的行驶工况图[10];利用多岛遗传算法(MIGA)与序列二次规划法(SQP)组合优化,对FCM聚类的初始聚类中心进行优化,从而构建了汽车行驶工况图[11];利用粒子群优化算法优化了FCM的聚类中心,从而构建了行驶工况图[12];利用主成分分析法和模糊C均值聚类算法,拟合了汽车行驶工况图[13];利用自组织映射神经网络与粒子群聚类相结合的方法构建了汽车行驶工况图[14]. 上述研究方法虽然均构建了较理想的行驶工况图,但仍有需要改进的地方. 如:传统的主成分分析法可以达到降维的目的,但是没有完全体现出用数量较少的综合指标来代替原来多个指标的目的;对于模糊C均值聚类算法而言,在聚类过程中容易陷入局部最优,而遗传模拟退火算法可以防止其陷入局部最优.

    鉴于此,本文改进了主成分分析,并将遗传模拟退火算法与模糊C均值聚类算法相结合成一种聚类算法(GSA-FCM),从而构建更合理的汽车行驶工况图. 最后,将合成工况与实际工况的特征参数进行比对.

    主成分分析法(Principal Component Analysis, 简称PCA)是一种数据降维的方法[15]. 其基本思想是用一组信息不重叠且数量较少的综合指标来代替原来多个具有一定相关性的指标,使其可以最大程度地反映原指标所代表的信息, 即达到压缩数据的目的. 由于传统的PCA算法对原始数据进行了Z- Score标准化,没有完全展现各变量之间的差异信息,所以,本文对原始数据进行Min-Max标准化:设原始数据为X =(xij)n×p,则yij=(xij-min xj)/(max xj-min xj) (i=1, 2, …, nj=1, 2, …, p),可得标准化后的矩阵Y =(yij)n×p;然后,对Y进行主成分分析.

    模糊C均值聚类算法(Fuzzy C-means Algorithm,简称FCM或FCMA)是模糊聚类中应用最广泛的聚类方法之一[16],即给定聚类数目,通过优化目标函数得到每个样本点属于每一类的隶属度[17],从而达到聚类的目的. 设有n个样本xi (i=1, 2, …, n),可以分为k类,隶属矩阵U =(uij)n×kuij是[0, 1]中的随机数,并采取下列步骤来确定隶属矩阵和聚类中心:

    (1) 对隶属矩阵U初始化:

    ki=1uij=1(j=1,2,,n);

    (2) 计算聚类中心:

    ci=nj=1umijxj/nj=1umij,

    其中,ci为第i类聚类中心, m∈[1, ∞]为加权指数;

    (3) 计算目标函数值:

    J(U,c1,c2,,cc)=ki=1Ji,

    其中

    Ji=ki=1nj=1umijd2ij,

    这里,ci为第i类聚类中心, dij= ‖ ci-xj ‖为第i类聚类中心与数据样本之间的欧式距离;

    (4) 重新计算隶属矩阵U

    uij=1kk=1(dij/dkj)2/(m1);

    (5) 如果目标函数值小于某个确定的阀值,则算法停止. 否则重复步骤(2)至步骤(4),直到满足终止条件.

    传统的遗传算法可以在全局求解最优解,但是迭代次数大、收敛速度慢. 通过引入模拟退火方法,可以提高进化过程中种群的多样性,避免算法陷入局部最优[18],而模糊C均值聚类算法与K均值聚类算法在聚类过程中均易陷入局部最优,所以,本文采用遗传模拟退火算法(Genetic-Simulated Annealing,GSA)来优化模糊C均值聚类算法. 首先对种群中的个体进行选择、交叉、重组、变异,然后参与模拟退火,反复迭代,直到满足终止条件为止. 从而找到最优的初始聚类中心进行模糊C均值聚类,提高聚类效果. 具体流程如下:

    Step 1: 设定各个参数值(例如初始温度、变异概率等);

    Step  2: 创建初始种群N(t);

    Step  3: 利用式(3)计算初始种群个体的目标函数值;

    Step  4: 代数计数器初始化gen=0;

    Step  5: 个体的选择select(N(t));

    Step  6: 个体的重组recombine(N(t));

    Step  7: 个体的变异mutation(N(t));

    Step  8: 个体的模拟退火;

    Step  9: 若满足终止条件则输出最优个体,否则转到Step 4, 直到满足终止条件;

    Step  10: 得到最优的初始聚类中心;

    Step  11: 用模糊C均值聚类算法进行聚类.

    汽车行驶工况的构建过程主要为运动学片段的划分、计算特征参数值、主成分分析、聚类、选择合适的片段合成工况. 本文以2019年全国研究生数学建模D题所提供的某市轻型汽车实际道路行驶所采集的493 467个数据为样本,构建该市汽车行驶工况图.

    运动学片段是指连续采集的数据从速度为零开始,到下一个速度为零为止. 特征参数是指能够反映车辆行驶特性变量的参数. 本文采用2019年全国研究生数学建模D题定义的4种工况[19],具体如下:

    怠速:v=0,且发动机一直以低速运转的行驶过程;

    加速:a≥0.1m/s2的行驶过程;

    减速:a≤-0.1m/s2的行驶过程;

    匀速:|a|≤0.1m/s2非怠速的行驶过程.

    特征参数的选取见表 1.

    表  1  所选特征参数
    Table  1.  The seleced characteristic parameters
    符号表示 符号说明 符号表示 符号说明
    tc 怠速时间/s ta 加速时间/s
    tu 匀速时间/s td 减速时间/s
    vm 平均速度/(hm·h-1) vm 平均行驶速度/(hm·h-1)
    vmax 最大速度/(hm·h-1) vsd 速度标准差/(hm·h-1)
    amax 最大加速度/(m·s-2) asd 加速度标准差/(m·s-2)
    am 平均加速度/(m·s-2) dm 平均减速度/(m·s-2)
    dmin 最小减速度/(m·s-2) dsd 减速度标准差/(m·s-2)
    qc 怠速时间比/% qa 加速时间比/%
    qu 匀速时间比/% qd 减速时间比/%
    下载: 导出CSV 
    | 显示表格

    本文所用特征参数的具体计算公式如下:

    ai,i+1=vi+1viti+1ti×10003600=vi+1vi3.6(i=0,1,,k1),T=k1i=1(ti+1ti),qc=tcT,qa=taT,qu=tuT,qd=tdT,am=ki=1aik,dm=ki=1|di|k,asd=1k1ki=1a2i,dsd=1k1ki=1d2i,amax

    其中,ai, i+1表示第i时刻到第i+1时刻的加速度,vi表示第i时刻的速度,ti表示第i时刻,k表示GPS所测车速的总个数.

    利用Matlab 2017b编程软件可得2 348个片段的特征参数值,部分片段的特征参数值见表 2.

    表  2  部分片段的特征参数值
    Table  2.  The characteristic parameter values of some fragments
    片段 tc/s ta/s td/s tu/s dm/(m·s-2) dmin/(m·s-2) dsd/(m·s-2)
    1 15 26 19 7 -0.581 9 -0.111 1 0.447 0
    2 120 111 86 52 -0.494 2 -0.111 1 0.419 2
    3 25 48 35 11 -0.619 8 -0.111 1 0.585 9
    2 346 3 7 7 2 -0.567 9 -0.138 9 0.340 5
    2 347 28 41 22 17 -0.642 7 -0.111 1 0.506 4
    2 348 139 244 181 171 -0.405 5 -0.111 1 0.363 8
    片段 vm/(km·h-1) vm/(km·h-1) vmax/(km·h-1) vsd/(km·h-1) amax/(m·s-2) asd/(m·s-2) am/(m·s-2)
    1 7.020 6 7.956 7 17.400 0 5.244 4 0.425 2 1.250 0 0.242 5
    2 26.113 8 35.522 4 56.500 0 18.499 1 0.382 1 1.083 3 0.227 6
    3 20.258 3 25.589 5 45.200 0 14.252 4 0.443 9 1.194 4 0.273 2
    2 346 4.150 0 5.533 3 11.500 0 3.650 6 0.559 5 0.861 1 -0.561 7
    2 347 20.314 7 26.050 6 38.700 0 14.343 9 0.342 8 1.250 0 -0.642 7
    2 348 53.004 2 56.702 2 87.400 0 24.802 4 0.301 5 2.500 0 -0.405 5
    注:数据来源为“2019年全国研究生数学建模D题”.
    下载: 导出CSV 
    | 显示表格

    利用传统的PCA算法[20]和本文改进的PCA算法,分别对所得的2 348个片段进行降维处理,可得14个主成分的贡献率. 由结果(表 3)可知:(1)改进后的PCA算法所得的第一主成分的贡献率比传统的PCA算法的高出14%. (2)改进后的PCA算法可以达到用数量较少的指标来代替原来多个指标的目的:传统的PCA算法所得的前5个主成分的累积贡献率达到了87.37%,而改进的PCA算法所得的前3个主成分的累积贡献率就已经达到了89.51%.

    表  3  各主成分贡献率
    Table  3.  The contribution rates of each principal component  %
    主成分 传统的PCA算法 改进的PCA算法 主成分 传统的PCA算法 改进的PCA算法
    1 41.09 55.45 8 1.59 0.19
    2 19.37 22.91 9 1.10 0.07
    3 12.01 11.15 10 0.90 0.03
    4 8.45 5.32 11 0.54 0.01
    5 6.45 3.40 12 0.16 6.28E-03
    6 5.27 1.01 13 0.11 1.37E-03
    7 2.80 0.40 14 0.08 1.18E-36
    下载: 导出CSV 
    | 显示表格

    利用主成分分析可以得到2 348个运动学片段的前3个主成分的得分,部分运动学片段的前3个主成分得分见表 4.

    表  4  部分运动学片段主成分得分
    Table  4.  The principal component scores of kinematics fragments
    片段 第一主成分 第二主成分 第三主成分
    1 -2.069 5 -0.289 9 -0.338 7
    2 -0.843 5 -0.770 1 -0.154 6
    3 -1.304 4 -0.567 8 -0.521 4
    4 -0.677 3 -0.495 8 -0.508 8
    2 345 -0.794 3 0.725 1 -0.057 6
    2 346 -2.322 3 -0.418 8 -0.384 5
    2 347 -1.364 2 -0.544 5 -0.522 2
    2 348 0.480 1 -0.506 2 0.265 2
    下载: 导出CSV 
    | 显示表格

    使用传统的K均值聚类算法[21],对2 348片段的前3个主成分得分进行聚类. 由聚类结果(图 1)可知:2 348个运动学片段被分为3类,分别为579个第1类的运动学片段、843个第2类的运动学片段、926个第3类的运动学片段,聚类的整体效果较好,但是比较离散. 聚类中心具体值见表 5.

    图  1  K均值聚类结果
    Figure  1.  The K-means clustering results
    表  5  K均值聚类中心
    Table  5.  The K-means clustering center
    运动学片段的类别 聚类中心
    第一主成分 第二主成分 第三主成分
    第1类 -1.355 1 0.435 3 -0.377 2
    第2类 -0.797 8 -0.289 7 -0.408 3
    第3类 -1.976 4 -0.230 1 -0.357 2
    下载: 导出CSV 
    | 显示表格

    利用GSA-FCM聚类算法对2 348片段的前3个主成分得分进行聚类,由聚类结果(图 2)可知:2 348个运动学片段被划分为3类,虽然有部分点比较分散,但是相比K均值聚类算法,整体聚类效果更加明显,说明使用GSA优化FCM聚类算法的初始聚类中心,可以防止FCM聚类陷入局部最优,达到更好的聚类效果. 各类的聚类中心如表 6所示.

    图  2  GSA-FCM聚类结果
    Figure  2.  The GSA-FCM clustering results
    表  6  GSA-FCM的聚类中心
    Table  6.  The GSA-FCM clustering center
    类别 聚类中心
    第一主成分 第二主成分 第三主成分
    第1类 -1.997 6 -0.179 2 -0.339 7
    第2类 -1.293 1 0.079 4 -0.400 0
    第3类 -0.888 1 -0.214 5 -0.422 8
    下载: 导出CSV 
    | 显示表格

    在行驶工况的合成中,最重要的就是运动学片段的选择,合适的运动学片段可以呈现聚类所得的每一类运动学片段所代表的行驶状况. 所以,本文采用如下步骤选取运动学片段:

    (1) 对每类所属运动学片段的特征参数进行Min-Max标准化处理,并求出每类运动学片段的特征参数之和,记为A

    (2) 计算每类所属运动学片段每个特征参数的平均值,并对其进行Min-Max标准化后求和,记为B

    (3) 计算AB的绝对误差,按升序排列;

    (4) 计算每类片段所用的时间在所有片段所用总时间中的比例,从而确定每一类别在合成行驶工况里所占的时间,计算公式如下:

    {t_i} = \frac{M}{T}\sum\limits_{m = 1}^{{n_i}} {{t_{i, m}}, } (1)

    其中,ti表示第i (i=1, 2, 3)类运动学片段在最终构建工况曲线中所占的时间,M表示最终构建工况所用的时间,ti, m表示第i (i=1, 2, 3)类运动学片段中第m个运动学片段所用的时间,ni表示第i (i=1, 2, 3)类运动学片段总数;

    (5) 根据时间比例从每类运动学片段中选择绝对误差最小的片段合成最终工况图.

    根据上述步骤,合成工况所用的时间一般为1 200~1 300 s. 由式(1)可得选取3类运动学片段所用时间分别为642.105 0~695.613 7 s、332.686 3~360.410 1 s、225.208 7~243.976 1 s.

    由2种聚类算法所合成的行驶工况图(图 3图 4)可知:利用传统的K均值聚类算法所得的行驶工况图中怠速状态较多;利用GSA-FCM聚类算法所得的行驶工况图显示汽车的行驶速度大部分为0~20 km/h,处于低速状态,高速行驶情况较少,与实际情况相符.

    图  3  K均值聚类合成工况图
    Figure  3.  The operating conditions of K-means clustering synthesis
    图  4  GSA-FCM最终拟合工况图
    Figure  4.  The working condition fitted with GSA-FCM

    在合成工况之后,需要检验该工况是否具有代表性. 本文基于特征参数的误差进行比对,即选择平均速度、平均加速度和平均减速度等9个具有代表性的特征参数为评价指标,分别计算原始数据合成的实际工况与GSA-FCM聚类算法、传统的K均值聚类算法所合成工况的特征参数值并进行误差分析. 由结果(表 7)可知:GSA-FCM聚类算法有1个指标的相对误差较大,其他8个指标的相对误差均在10%以下,所有特征值的平均相对误差仅为6.46%;传统的K均值聚类算法有6个指标的相对误差大于10%,平均相对误差为16.17%. 由此可知:利用GSA-FCM聚类算法所合成的行驶工况图的误差小、精度高,可以反映原始数据所蕴含的工况信息.

    表  7  基于特征参数的实际工况与合成工况分析
    Table  7.  The analysis of actual working condition and synthetic working condition based on characteristic parameters
    特征参数 实际工况 合成工况
    GSA-FCM聚类 传统的K均值聚类
    vm/(km·h-1) 16.25 15.59(4.06%) 10.96(32.57%)
    vm/(km·h-1) 21.72 20.89(3.85%) 17.76(18.24%)
    am/(m·s-2) 0.51 0.47(7.41%) 0.51(0.54%)
    asd/(m·s-2) 0.43 0.40(6.19%) 0.48(12.31%)
    dm/(m·s-2) -0.60 -0.55(7.81%) -0.56(6.23%)
    qc/% 32.99 29.78(9.73%) 44.33(34.37%)
    qa/% 29.65 30.48(2.81%) 22.83(23.00%)
    qd/% 25.02 25.74(2.87%) 20.48(18.13%)
    qu/% 12.34 14.00(2.87%) 12.35(0.12%)
    注:括号内数据为合成工况与实际工况的相对误差.
    下载: 导出CSV 
    | 显示表格

    将GSA-FCM聚类算法合成的工况与NEDC标准测试工况加以比对,由于行驶工况图主要由速度与时间决定,故本文选择vmvmqcqaqdqu进行比对. 由结果(表 8)可知:NEDC标准测试工况的各指标值都与该城市实际工况的差异较大,故NEDC标准测试工况不能代表该城市汽车的行驶状况;利用GSA-FCM聚类算法所合成的行驶工况与实际工况之间的相对误差小,与该城市汽车的行驶状况相符.

    表  8  合成工况与NEDC标准测试工况对比
    Table  8.  The comparison of synthetic conditions and NEDC standard test conditions
    特征参数 实际工况 GSA-FCM聚类合成工况 NEDC工况
    vm/(km·h-1) 16.25 15.59 33.60
    vm/(km·h-1) 21.72 20.89 44.05
    qc/% 32.99 29.78 23.81
    qa/% 29.65 30.48 23.81
    qd/% 25.02 25.74 17.63
    qu/% 12.34 14.00 34.75
    下载: 导出CSV 
    | 显示表格

    本文提出一种改进的主成分分析和利用遗传模拟退火算法优化后的模糊C均值聚类算法相结合的聚类算法(GSA-FCM),以构建汽车行驶工况图. 并将该聚类算法和传统的K均值聚类算法所合成的行驶工况的特征参数值与实际工况的特征参数值进行比较,所得平均相对误差分别为6.46%、16.17%,充分说明使用GSA-FCM聚类算法所合成的行驶工况图的误差小、精度高. 由GSA-FCM聚类算法合成的工况、NEDC标准测试工况与实际工况的对比结果可知:实际工况与NEDC工况存在显著的差异, 与GSA-FCM聚类合成工况差异较小, 说明NEDC工况图不能代表该市汽车的行驶状况, 而GSA-FCM聚类合成工况与该市汽车的行驶状况更相符.

  • 图  1   K均值聚类结果

    Figure  1.   The K-means clustering results

    图  2   GSA-FCM聚类结果

    Figure  2.   The GSA-FCM clustering results

    图  3   K均值聚类合成工况图

    Figure  3.   The operating conditions of K-means clustering synthesis

    图  4   GSA-FCM最终拟合工况图

    Figure  4.   The working condition fitted with GSA-FCM

    表  1   所选特征参数

    Table  1   The seleced characteristic parameters

    符号表示 符号说明 符号表示 符号说明
    tc 怠速时间/s ta 加速时间/s
    tu 匀速时间/s td 减速时间/s
    vm 平均速度/(hm·h-1) vm 平均行驶速度/(hm·h-1)
    vmax 最大速度/(hm·h-1) vsd 速度标准差/(hm·h-1)
    amax 最大加速度/(m·s-2) asd 加速度标准差/(m·s-2)
    am 平均加速度/(m·s-2) dm 平均减速度/(m·s-2)
    dmin 最小减速度/(m·s-2) dsd 减速度标准差/(m·s-2)
    qc 怠速时间比/% qa 加速时间比/%
    qu 匀速时间比/% qd 减速时间比/%
    下载: 导出CSV

    表  2   部分片段的特征参数值

    Table  2   The characteristic parameter values of some fragments

    片段 tc/s ta/s td/s tu/s dm/(m·s-2) dmin/(m·s-2) dsd/(m·s-2)
    1 15 26 19 7 -0.581 9 -0.111 1 0.447 0
    2 120 111 86 52 -0.494 2 -0.111 1 0.419 2
    3 25 48 35 11 -0.619 8 -0.111 1 0.585 9
    2 346 3 7 7 2 -0.567 9 -0.138 9 0.340 5
    2 347 28 41 22 17 -0.642 7 -0.111 1 0.506 4
    2 348 139 244 181 171 -0.405 5 -0.111 1 0.363 8
    片段 vm/(km·h-1) vm/(km·h-1) vmax/(km·h-1) vsd/(km·h-1) amax/(m·s-2) asd/(m·s-2) am/(m·s-2)
    1 7.020 6 7.956 7 17.400 0 5.244 4 0.425 2 1.250 0 0.242 5
    2 26.113 8 35.522 4 56.500 0 18.499 1 0.382 1 1.083 3 0.227 6
    3 20.258 3 25.589 5 45.200 0 14.252 4 0.443 9 1.194 4 0.273 2
    2 346 4.150 0 5.533 3 11.500 0 3.650 6 0.559 5 0.861 1 -0.561 7
    2 347 20.314 7 26.050 6 38.700 0 14.343 9 0.342 8 1.250 0 -0.642 7
    2 348 53.004 2 56.702 2 87.400 0 24.802 4 0.301 5 2.500 0 -0.405 5
    注:数据来源为“2019年全国研究生数学建模D题”.
    下载: 导出CSV

    表  3   各主成分贡献率

    Table  3   The contribution rates of each principal component  %

    主成分 传统的PCA算法 改进的PCA算法 主成分 传统的PCA算法 改进的PCA算法
    1 41.09 55.45 8 1.59 0.19
    2 19.37 22.91 9 1.10 0.07
    3 12.01 11.15 10 0.90 0.03
    4 8.45 5.32 11 0.54 0.01
    5 6.45 3.40 12 0.16 6.28E-03
    6 5.27 1.01 13 0.11 1.37E-03
    7 2.80 0.40 14 0.08 1.18E-36
    下载: 导出CSV

    表  4   部分运动学片段主成分得分

    Table  4   The principal component scores of kinematics fragments

    片段 第一主成分 第二主成分 第三主成分
    1 -2.069 5 -0.289 9 -0.338 7
    2 -0.843 5 -0.770 1 -0.154 6
    3 -1.304 4 -0.567 8 -0.521 4
    4 -0.677 3 -0.495 8 -0.508 8
    2 345 -0.794 3 0.725 1 -0.057 6
    2 346 -2.322 3 -0.418 8 -0.384 5
    2 347 -1.364 2 -0.544 5 -0.522 2
    2 348 0.480 1 -0.506 2 0.265 2
    下载: 导出CSV

    表  5   K均值聚类中心

    Table  5   The K-means clustering center

    运动学片段的类别 聚类中心
    第一主成分 第二主成分 第三主成分
    第1类 -1.355 1 0.435 3 -0.377 2
    第2类 -0.797 8 -0.289 7 -0.408 3
    第3类 -1.976 4 -0.230 1 -0.357 2
    下载: 导出CSV

    表  6   GSA-FCM的聚类中心

    Table  6   The GSA-FCM clustering center

    类别 聚类中心
    第一主成分 第二主成分 第三主成分
    第1类 -1.997 6 -0.179 2 -0.339 7
    第2类 -1.293 1 0.079 4 -0.400 0
    第3类 -0.888 1 -0.214 5 -0.422 8
    下载: 导出CSV

    表  7   基于特征参数的实际工况与合成工况分析

    Table  7   The analysis of actual working condition and synthetic working condition based on characteristic parameters

    特征参数 实际工况 合成工况
    GSA-FCM聚类 传统的K均值聚类
    vm/(km·h-1) 16.25 15.59(4.06%) 10.96(32.57%)
    vm/(km·h-1) 21.72 20.89(3.85%) 17.76(18.24%)
    am/(m·s-2) 0.51 0.47(7.41%) 0.51(0.54%)
    asd/(m·s-2) 0.43 0.40(6.19%) 0.48(12.31%)
    dm/(m·s-2) -0.60 -0.55(7.81%) -0.56(6.23%)
    qc/% 32.99 29.78(9.73%) 44.33(34.37%)
    qa/% 29.65 30.48(2.81%) 22.83(23.00%)
    qd/% 25.02 25.74(2.87%) 20.48(18.13%)
    qu/% 12.34 14.00(2.87%) 12.35(0.12%)
    注:括号内数据为合成工况与实际工况的相对误差.
    下载: 导出CSV

    表  8   合成工况与NEDC标准测试工况对比

    Table  8   The comparison of synthetic conditions and NEDC standard test conditions

    特征参数 实际工况 GSA-FCM聚类合成工况 NEDC工况
    vm/(km·h-1) 16.25 15.59 33.60
    vm/(km·h-1) 21.72 20.89 44.05
    qc/% 32.99 29.78 23.81
    qa/% 29.65 30.48 23.81
    qd/% 25.02 25.74 17.63
    qu/% 12.34 14.00 34.75
    下载: 导出CSV
  • [1] 胡鸿飞. 南京市轻型车实际行驶工况与检测标准工况比较研究[D]. 南京: 东南大学, 2017.

    HU H F. Comparative study on the actual driving cycl of light vehicle in Nanjing and testing standard cycls[D]. Nanjing: Southeast University, 2017.

    [2]

    SHI Q, ZHENG Y B, WANG R S, et al. The study of a new method of driving cycles construction[J]. Procedia Engineering, 2011, 16: 79-87. doi: 10.1016/j.proeng.2011.08.1055

    [3] 李友文, 石琴, 姜平. 基于马尔科夫过程的行驶工况构建中数据处理与分析[J]. 合肥工业大学学报(自然科学版), 2010(4): 16-19. https://www.cnki.com.cn/Article/CJFDTOTAL-HEFE201004004.htm

    LI Y W, SHI Q, JIANG P. Data processing and analysis in driving cycle construction based on Markov process[J]. Journal of Hefei University of Technology(Natural Science), 2010(4): 16-19. https://www.cnki.com.cn/Article/CJFDTOTAL-HEFE201004004.htm

    [4] 曹骞, 李君, 刘宇, 等. 基于马尔科夫链的长春市乘用车行驶工况构建[J]. 吉林大学学报(工学版), 2018, 48(5): 67-74. https://www.cnki.com.cn/Article/CJFDTOTAL-JLGY201805008.htm

    CAO Q, LI J, LIU Y, et al. Construction of passenger vehicle driving cycle based on Markov chain in Changchun[J]. Journal of Jilin University(Engineering and Techno-logy Edition), 2018, 48(5): 67-74. https://www.cnki.com.cn/Article/CJFDTOTAL-JLGY201805008.htm

    [5]

    ZHANG J, WANG Z P, LIU P, et al. Driving cycles construction for electric vehicles considering road environment: a case study in Beijing[J]. Applied Energy, 2019, 253: 113514/1-14.

    [6]

    YANG Y, LI T Z, HU H F, et al. Development and emissions performance analysis of local driving cycle for small-sized passenger cars in Nanjing, China[J]. Atmospheric Pollution Research, 2019, 10(5): 1514-1523. doi: 10.1016/j.apr.2019.04.009

    [7] 胡志远, 秦艳, 谭丕强, 等. 基于大样本的上海市乘用车行驶工况构建[J]. 同济大学学报(自然科学版), 2015, 43(10): 1523-1527. doi: 10.11908/j.issn.0253-374x.2015.10.011

    HU Z Y, QIN Y, TAN P Q, et al. Construction of driving cycle of passenger vehicles in Shanghai based on large sample[J]. Journal of Tongji University(Natural Science), 2015, 43(10): 1523-1527. doi: 10.11908/j.issn.0253-374x.2015.10.011

    [8] 王昊, 章桐, 宋珂. 上海市行驶工况构建与研究[J]. 内燃机与配件, 2018(13): 35-38. doi: 10.3969/j.issn.1674-957X.2018.13.015

    WANG H, ZHANG T, SONG K. Construction and research of driving cycle in Shanghai[J]. Internal Combustion Engine & Accessories, 2018(13): 35-38. doi: 10.3969/j.issn.1674-957X.2018.13.015

    [9] 高建平, 任德轩, 郗建国. 基于全局K-means聚类算法的汽车行驶工况构建[J]. 河南理工大学学报(自然科学版), 2019, 38(1): 112-118. https://www.cnki.com.cn/Article/CJFDTOTAL-JGXB201901017.htm

    GAO J P, REN D X, XI J G. Vehicle driving cycle construction based on global K-means clustering algorithm[J]. Journal of Henan Polytechnic University(Natural Science Edition), 2019, 38(1): 112-118. https://www.cnki.com.cn/Article/CJFDTOTAL-JGXB201901017.htm

    [10]

    MAYAKUNTLA S K, VERMA A. A novel methodology for construction of driving cycles for Indian cities[J]. Transportation Research Part D: Tronsport and Environment, 2018, 65: 725-735. doi: 10.1016/j.trd.2018.10.013

    [11] 高建平, 高小杰. 改进模糊C均值聚类法的车辆实际行驶工况构建[J]. 河南科技大学学报(自然科学版), 2017, 38(6): 21-27. https://www.cnki.com.cn/Article/CJFDTOTAL-LYGX201706005.htm

    GAO J P, GAO X J. Construction of vehicle driving cycle based on improved fuzzy C-means clustering method[J]. Journal of Henan University of Science and Technology(Natural Science Edition), 2017, 38(6): 21-27. https://www.cnki.com.cn/Article/CJFDTOTAL-LYGX201706005.htm

    [12] 石琴, 王楠楠, 仇多洋. 粒子群优化的模糊聚类方法在车辆行驶工况中的应用[J]. 中国管理科学, 2011, 19(2): 110-115. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGGK201102015.htm

    SHI Q, WANG N N, QIU D Y. Application of fuzzy clustering method based on particle swarm optimization in vehicle driving condition[J]. Chinese Journal of Management Science, 2011, 19(2): 110-115. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGGK201102015.htm

    [13] 刘应吉, 夏鸿文, 姚羽, 等. 组合主成分分析和模糊C均值聚类的车辆行驶工况制定方法[J]. 公路交通科技, 2018, 35(3): 79-85. https://www.cnki.com.cn/Article/CJFDTOTAL-GLJK201803011.htm

    LIU Y J, XIA H W, YAO Y, et al. Vehicle driving cycle determination method combined principal component analy-sis and fuzzy C-means clustering[J]. Journal of Highway and Transportation Science and Technology, 2018, 35(3): 79-85. https://www.cnki.com.cn/Article/CJFDTOTAL-GLJK201803011.htm

    [14] 张林平, 李风军. 基于运行大数据的汽车行驶工况构建与分析[J]. 宁夏师范学院学报, 2020, 41(10): 76-89. https://www.cnki.com.cn/Article/CJFDTOTAL-GYSB202010012.htm

    ZHANG L P, LI F J. Construction and analysis of vehicle driving cycle based on operation big data[J]. Journal of Ningxia Normal University, 2020, 41(10): 76-89. https://www.cnki.com.cn/Article/CJFDTOTAL-GYSB202010012.htm

    [15] 邬友, 夏玫. 样本处理方法对BP网络泛化能力影响的比较研究[J]. 内蒙古师范大学学报(自然科学汉文版), 2015(4): 520-522. doi: 10.3969/j.issn.1001-8735.2015.04.022

    WU Y, XIA M. Comparative study on the influence of sample processing methods on BP network generalization ability[J]. Journal of Inner Mongolia Normal University(Natural Science Edition), 2015(4): 520-522. doi: 10.3969/j.issn.1001-8735.2015.04.022

    [16] 陈佳妮, 段文英, 丁徽. 模糊C-均值聚类分析在基因表达数据分析中的应用[J]. 森林工程, 2010, 26(2): 54-57. https://www.cnki.com.cn/Article/CJFDTOTAL-SSGC201002014.htm

    CHEN J N, DUAN W Y, DING H. Application of fuzzy C-means clustering analysis in gene expression data analy-sis[J]. Forest Engineering, 2010, 26(2): 54-57. https://www.cnki.com.cn/Article/CJFDTOTAL-SSGC201002014.htm

    [17] 刘小芳. 点密度加权FCM算法的聚类有效性研究[J]. 计算机工程与应用, 2006, 42(15): 20-22. https://www.cnki.com.cn/Article/CJFDTOTAL-JSGG200615005.htm

    LIU X F. Clustering effectiveness of point density weighted FCM algorithm[J]. Computer Engineering and Applications, 2006, 42(15): 20-22. https://www.cnki.com.cn/Article/CJFDTOTAL-JSGG200615005.htm

    [18] 刘秋菊, 王仲英, 刘素华. 基于遗传模拟退火算法的模糊聚类方法[J]. 微计算机信息, 2006, 22(5): 270-272. doi: 10.3969/j.issn.1008-0570.2006.05.099

    LIU Q J, WANG Z Y, LIU S H. Fuzzy clustering method based on genetic simulated annealing algorithm[J]. Microcomputer Information, 2006, 22(5): 270-272. doi: 10.3969/j.issn.1008-0570.2006.05.099

    [19] 阿瑟. 2019华为杯研究生数学建模竞赛D题[EB/OL]. (2019-09-30)[2020-08-20]. https://www.jianshu.com/p/71681684666b.
    [20] 鲁晨. 主元分析(PCA)理论分析及应用[J]. 图像处理学报, 2007(8): 38-41.

    LU C. Theory analysis and application of principal component analysis (PCA)[J]. Journal of Image Processing, 2007(8): 38-41.

    [21]

    MACQUEEN J. Some methods for classification and analy-sis of multivariate observations[C]//Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability. Berkeley, California: University of California Press, 1967: 281-297.

  • 期刊类型引用(9)

    1. 周英超,王保林,李连强,田瑛,蒙心蕊. 基于聚类和马尔可夫链的货车实际工况构建方法研究. 重庆交通大学学报(自然科学版). 2024(01): 116-124 . 百度学术
    2. 刘泽奇,朱雄,王庆华,彭良峰,黄刚. 基于用户公共道路大数据的工况分类方法研究. 汽车科技. 2024(06): 53-58 . 百度学术
    3. 刘继隆,李乐,俞俊. 基于改进K-means聚类的汽车行驶工况构建方法研究. 农业装备与车辆工程. 2023(05): 105-109 . 百度学术
    4. 崔海龙,车兆伟. 基于应用场景的冷藏车工程工况分析. 农业装备与车辆工程. 2023(07): 139-143 . 百度学术
    5. 周达左,陶洪峰. 基于改进FCM聚类算法的混合建模方法在苯酚浓度预测中的应用. 化工自动化及仪表. 2023(06): 889-892+899 . 百度学术
    6. 姜俊昭,杨文豪,彭彬,郭婷,徐业凯,王国卓. 基于能耗加权策略的燃料电池汽车续驶里程预测. 汽车工程. 2023(12): 2357-2365+2329 . 百度学术
    7. 奇格奇,李丹,段梦媛,关伟,马继辉. 考虑电动公交在途特性的电池状态梯次划分. 中国公路学报. 2022(08): 44-54 . 百度学术
    8. 陈琳. 面向语音特征提取的英语机器人识别方法构建. 自动化与仪器仪表. 2022(08): 234-239 . 百度学术
    9. 林小霞,黄顺红,张晓菲,洪瑞安. 基于Zigbee的门禁管理与网络请销假系统研究. 自动化与仪器仪表. 2021(12): 155-159 . 百度学术

    其他类型引用(3)

图(4)  /  表(8)
计量
  • 文章访问数:  535
  • HTML全文浏览量:  362
  • PDF下载量:  92
  • 被引次数: 12
出版历程
  • 收稿日期:  2020-09-21
  • 网络出版日期:  2021-04-28
  • 刊出日期:  2021-04-24

目录

/

返回文章
返回