基于多模型融合的互联网信贷个人信用评估方法

白鹏飞, 安琪, Nicolaas Frans de Rooij, 李楠, 周国富

白鹏飞, 安琪, Nicolaas Frans de Rooij, 李楠, 周国富. 基于多模型融合的互联网信贷个人信用评估方法[J]. 华南师范大学学报(自然科学版), 2017, 49(6): 119-123. DOI: 10.6054/j.jscnun.2017170
引用本文: 白鹏飞, 安琪, Nicolaas Frans de Rooij, 李楠, 周国富. 基于多模型融合的互联网信贷个人信用评估方法[J]. 华南师范大学学报(自然科学版), 2017, 49(6): 119-123. DOI: 10.6054/j.jscnun.2017170
Internet Credit Personal Credit Assessing Method Based on Multi-model Ensemble[J]. Journal of South China Normal University (Natural Science Edition), 2017, 49(6): 119-123. DOI: 10.6054/j.jscnun.2017170
Citation: Internet Credit Personal Credit Assessing Method Based on Multi-model Ensemble[J]. Journal of South China Normal University (Natural Science Edition), 2017, 49(6): 119-123. DOI: 10.6054/j.jscnun.2017170

基于多模型融合的互联网信贷个人信用评估方法

基金项目: 

国家自然科学基金委员会-荷兰国家基金机构间合作重点项目(NSFC-NWO);教育部长江学者和创新团队发展计划资助;广东省引进创新科研团队计划资助;广东省科技计划项目;广东省引进第四批领军人才专项资金项目;广东省引进创新科研团队计划资助;国家高等学校学科创新引智计划111引智基地(光信息创新引智基地)

详细信息
    通讯作者:

    白鹏飞

  • 中图分类号: TP39

Internet Credit Personal Credit Assessing Method Based on Multi-model Ensemble

  • 摘要: 针对网络个人信用有效评分缺失的问题,分析了互联网信贷个人信用评估数据的特点,选用支持向量机、随机森林和XGBoost分别建立了信用预测模型,并对3种单一模型进行了投票加权融合. 基于互联网信贷数据的特点,在特征工程中对样本集特征进行了离散化、归一化和特征组合等处理. 为增加对比,对实验数据集进行了FICO评估核心Logistic回归分析. 实验结果表明:3种单一算法性能均优于Logistic回归,XGBoost表现优于支持向量机和随机森林模型,预测相对准确;投票融合模型的表现比单一模型更好,模型分辨能力更优秀,预测精度更高,更适用于互联网信贷个人信用评估.
    Abstract: To solve the problem of the missing of the effective scores of online personal credits, the characteristics of internet personal credit assessment data are analyzed. Support vector machine (SVM), random forest (RF), and XGBoost have been adopted to establish the credit forecasting model in the paper, respectively.The voting fusion of the proposed models is conducted. Based on the data characteristics of internet credit data, discretization, normalization, and feature combination are adopted to experimental data set in feature engineering. In order to improve the contrast, the logistic regression analysis-the core of FICO assessment is carried out. The experimental results show that the performance of the three established algorithm are better than logistic regression. XGBoost performs better than SVM and RF model in the accuracy prediction. The performance of voting fusion model is better than that of single model, with outstanding model resolution and prediction accuracy, which is more suitable for internet personal credit assessment.
  • 期刊类型引用(12)

    1. 赵健,郭青. 互联网小额信贷违约风险识别模型研究:基于集成学习方法. 华北水利水电大学学报(社会科学版). 2025(02): 54-62 . 百度学术
    2. 任军霞,陈瑞勇,叶宇轩,孙秀文,唐嘉成,李响. 基于FPFF-Blending模型融合的个体工商户信用评价研究. 征信. 2023(04): 64-71 . 百度学术
    3. 杨沛衡,吴东鹏,徐典. 基于改进分类组合的个人信贷信用风险预测模型研究. 中国集体经济. 2022(07): 102-105 . 百度学术
    4. 李宁,汪丽娜. 基于随机森林回归算法的用水总量影响因素解析——以广东省为例. 华南师范大学学报(自然科学版). 2021(01): 78-84 . 百度学术
    5. 黄宝凤,祁婷婷. 基于特征衍生的个人信用风险评估组合模型研究. 征信. 2021(07): 51-57 . 百度学术
    6. 黄宝凤,祁婷婷. 基于特征工程的个人信用风险评估组合模型. 中国统计. 2021(06): 37-39 . 百度学术
    7. 张雷,王家琪,费职友,罗帅,隋京岐. 基于RF-SMOTE-XGboost下的银行用户个人信用风险评估模型. 现代电子技术. 2020(16): 76-81 . 百度学术
    8. 林卫明,曹杰. 基于超参数优化和集成算法的个人信用评估研究. 徐州工程学院学报(自然科学版). 2020(04): 67-74 . 百度学术
    9. 陆健健,江开忠. 基于XGBoost算法模型的金融客户信用评估研究. 软件导刊. 2019(04): 133-136 . 百度学术
    10. 任利强,张立民,王海鹏,郭强. 关于电力系统供电短期负荷预测仿真研究. 计算机仿真. 2019(10): 103-108 . 百度学术
    11. 邱耀,杨国为. 基于XGBoost算法的用户行为预测与风险分析. 工业控制计算机. 2018(09): 44-45 . 百度学术
    12. 房子程. 互联网信贷与传统信用卡消费的共存与发展研究. 现代商业. 2018(08): 87-88 . 百度学术

    其他类型引用(79)

计量
  • 文章访问数:  1554
  • HTML全文浏览量:  195
  • PDF下载量:  198
  • 被引次数: 91
出版历程
  • 收稿日期:  2017-03-05
  • 修回日期:  2017-07-26
  • 刊出日期:  2017-12-24

目录

    /

    返回文章
    返回