首页  思维导图  详情

金融智能风控

2022-03-19 19:01:30   0  举报





AI智能生成

111

产品架构图

作者其他创作

大纲/内容

0.信用管理基础

信用

指先买后付，即使用信用值来预支金钱以购买相应服务

管理

指通过策略对用户信用度进行评估并进行决策

策略：风控建模

风控术语

基础指标：年化百分率，账龄，逾期天数...

风险指标: 延滞率，不良率，负债比,...

目标：指运用技术手段，对信息风险进行规避，利用模型输出未来事件的期望轨迹

数据采集

资质类数据

比较典型的有年龄，性别，家庭状况，此外还有收入，资产信息

借贷类数据

包括多头和征信，分别指在其他平台可能有负债严重的倾向和征信机构分析出的分数

授权信息

用户授权后由贷款平台或第三方数据源采集的数据，包括指纹，通讯商，电商，出行数据等

平台表现

包括用户在借款平台的行为评分卡，催收评分卡，历史还款表现等

埋点数据

贷款平台在APP中抓取的贷款行为

架构

信贷风控架构

2.机器学习模型

基本概念

定义

通过构建任务形式通过机器迭代经验风险来降低结构风险来达到学习的策略

模型学习

模型，策略，算法

模型分类

生成方法

给定输入X产生输出Y的生成关系

判别方法

由数据直接学习决策函数或者条件概率分布

算法选择

结果是否离散

分类

回归

是否有标签

监督学习

半监督学习

无监督学习

策略

极大似然估计，矩估计等

模型评价

误差值=偏差+方差+噪声

偏差：度量了模型的期望预测与真实结果的偏离程度

方差：度量了同样大小的训练集变大导致的学习能力的变化

噪声：刻画问题本身的难度

训练程度与误差值

算法分类

分类

KNN,LR,SVM,DT,RF,XGboost,lightGBM....

回归

GLM(广义线性回归），LASSO回归，knn回归，RFR...

聚类

kmeans，DBscan，均值偏移，EM算法,GMM...

特征工程

特征清洗

清洗异常

业务专家识别

统计推断

采样，权重

过采样，欠采样

权重平衡

预处理

单个特征

归一化，离散化，哑变量处理，one-hot，数据变换

多个特征

降维

PCA降维，LDA降维

特征选择

Filter

方差选择

相关性

皮尔逊相关系数

斯皮尔曼相关系数

肯德尔相关系数

逐步回归

F检验

回归策略：前向选择，后向消除，双向消除

检验标准

AIC(赤池信息准则）

BIC(贝叶斯信息准则）

5.拒绝推断

原因

风险分析的本质是使用样本样本来估计总体分布，但局部样本无法充分表征总体的分布，会产生幸存者偏差

作用

一种对拒绝用户进行推理归纳，从而得到该部分群体标签分布的方法

常见方法

数据验证

对打分低于通过阈值的客群，抽取部分拒绝样本进行放款试验

缺点周期长，可能有收益损失

标签分裂

同生表现

利用其他机构或者平台其他产品线的标记结果进行分析

多规则交叉

使用多条规则综合判断阈值，而不是常规的一条规则筛选拒绝用户

数据推断

硬截断法

用已知标签的样本训练，对未知标签的拒绝样本进行预测，并按照一定比例标为正样本，其余是灰度样本

模糊展开法

将拒绝样本依照概率复制两条样本进行全量训练

重新加权法

利用样本分布特点，调整已知好坏标签样本的权重

外推法

基于数据分析修正模型偏差，引入人工修正，设置经验风险因子

迭代再分类法

通过多次迭代的形式，直到某个指标收敛，最终获取拒绝样本的逾期概率

7.上线部署与监控

追踪

模型上线后，每个月月初对全量客户打分，持续跟进模型表现

前端监控

当月新增客户分数等级分布

当月新增客户决策变量PSI

当月新申请客户分数PSI

...

后端监控

最新已有表现月份逾期客户占比

最新已有表现模型KS值

最新已有表现月份前5%,10%低分段客群坏客户命中率

...

上线部署

模型更新

模型训练好的参数文件部署到线上，实时获取最新标签数据，在线训练，实时更新参数

 收藏

立即使用

数据车间

 收藏

立即使用

金融智能风控

 收藏

立即使用

流程图

梦梦

职业：研究生

去主页





0 条评论

下一页

为你推荐

查看更多

