特征工程
2023-05-06 14:06:00 0 举报
AI智能生成
特征工程全部产品功能
作者其他创作
大纲/内容
数据探索
统计特征
离散数据特征统计
众数
熵
计数
连续数据统计特征
最大值
最小值
平均值
方差
特征选择
过滤式(Filter)
方差选择法
相关系数法
互信息法
卡方检验
特种重要性评估
随机森林特征重要性
线性模型特征重要性
离散值特征分析
特征生成
one-hot编码
特征编码
特征预处理
缺失值处理
缺失值删除(dropna)
删除实例
删除特征
缺失值填充(fillna)
用固定值填充
用均值填充
用众数填充
用前后值填充
用插值法填充
用KNN进行填充
random forest进行填充
使用fancyimpute包中的其他方法
缺失值作为数据的一部分不填充
异常值处理
特征异常平滑
重复值处理
数据格式处理
数据采样
归一化
Min-Max
标准化
z-score标准化
StandardScaler标准化
均值方差法
定义:特征工程或特征提取或特征发现是利用领域知识从原始数据中提取特征(特性、属性、属性)的过程。其动机是利用这些额外的特征来提高机器学习过程的结果的质量,而不是只提供原始数据给机器学习过程。
自由主题
特征转换
特征尺度变换
Log化
abs
sqrt
PCA
特征离散
特征异常平滑
奇异值分解
0 条评论
下一页