毕设流程图
2022-02-19 21:08:34 2 举报
流程
作者其他创作
大纲/内容
Precision精确率
①流失标签哑编码 ②数值类型标准化③样本不平衡SMOTE调整
随机森林调试参数①threshold特征选择阈值②n_estimator 随机森林中的分类器的个数
模型评价
①特征与特征间的相关性分析
Roc-auc曲线下面积
客户付费信息
XGBoost调试参数①max_depth树的深度②min_child_weight最小叶子结点样本权重和③subsample样本抽样比例 ④colsample_bytree样本特征抽样比例
模型搭建
运营商服务信息
网格搜索法确定阈值
划分训练集和测试集
F1-score精确率和召回率的调和平均
包裹式-递归消除法
Embedded-随机森林
数据探索性分析
特征选择
RFECV-logistic
RFECV-SVC
Recall召回率
XGB-BFS_XGBoost
②特征与流失分类的相关性分析
结果分析及建议
模型参数调试
客户属性
绘制学习曲线寻找阈值
查看数据缺失、重复、异常情况
原始数据
逻辑回归调试参数①solver优化方法②C 正则化参数③class_weight分类模型中各种类型的权重
Accuracy准确率
嵌入式-best_Fscore
据评分结果反向选择适合该模型的特征选择方法
过滤式-方差发散性
SVC调试参数① gamma核函数参数②C 正则化参数③degree多项式poly函数的维度④kernel 核函数
数据处理
模型评分
0 条评论
下一页