机器学习期末
2023-10-23 20:59:50 12 举报
AI智能生成
dd
作者其他创作
大纲/内容
第一章绪论
数据挖掘简介
数据挖掘是人工智能和数据库领域研究的热点问题
数据分析和数据挖掘
数据分析是数学与计算机科学相结合的产物
数据挖掘的主要任务
关联分析、数据建模预测、聚类分析、离群点检测
数据挖掘的数据源
数据库数据、数据仓库、其他类型数据
数据挖掘使用的技术
统计学、机器学习、数据库系统与数据仓库
数据挖掘存在的主要问题
在很多领域取得巨大成功,但依然存在一些具有挑战性的问题
第二章python数据分析与挖掘基础
python程序概述
基础数据类型、变量和赋值、运算符和表达式、字符串、流程控制、函数
内建数据结构
列表、元组、字典、集合
pandas统计分析基础
pandas中的数据结构、索引对象、查看DataFram的常用属性、
DataFram的数据查询与编辑、pandas数据运算、排序、汇总与统计、
数据分组与聚合、pandas数据读取与存储
DataFram的数据查询与编辑、pandas数据运算、排序、汇总与统计、
数据分组与聚合、pandas数据读取与存储
Matplotlib图表绘制基础
Matplotlib简介、Matplotlib绘图基础、设置pyplot的动态rc参数、文本注解、pyplot中常用的绘图
第三章认识数据
属性及其类型
属性、属性类型
数据的基本统计描述
中心趋势度量、数据散布度量
数据可视化
基于像素的可视化技术、几何投影可视化技术、基于图符的可视化技术、
层次可视化技术、可视化复杂对象和关系、高维数据可视化、python数据可视化
层次可视化技术、可视化复杂对象和关系、高维数据可视化、python数据可视化
数据对象的相似性度量
数据矩阵和相异性矩阵、标称属性的相似性度量、二元属性的相似性度量、数值属性的相似性度量、
序数属性的相似性度量、混合类型属性的相似性、余弦相似性、距离度量python实现
序数属性的相似性度量、混合类型属性的相似性、余弦相似性、距离度量python实现
第四章数据预处理
数据预处理的必要性
原始数据中存在的问题、数据质量要求
数据清洗
数据清洗方法、利用pandas进行数据清洗
数据集成
数据集成过程中的关键问题、利用pandas合并数据
数据标准化
离差标准化数据、标准差标准化数据
数据归纳
维归纳、数量归纳、数据压缩
数据变换与数据离散化
数据变换的策略、python数据变换与离散化
第五章回归分析
回归分析的概述
回归分析的定义与分类、回归分析的过程
一元线性回归分析
一元线性回归方法、一元线性回归模型的参数估计、一元线性回归模型的误差方差估计、一元回归模型的主要统计检验、一元线性回归的python实现
多元线性回归
多元线性回归模型的参数估计、多元线性回归模型、多元线性回归的假设检验及其评价、多元线性回归的python实现
逻辑回归
逻辑回归模型、逻辑回归的python实现
其他回归分析
多项式回归、岭回归、lasso回归、逐步回归
2020020430054陈永峻
0 条评论
下一页