机器学习期末
2023-10-23 20:59:50 12 举报
AI智能生成
dd
作者其他创作
大纲/内容
数据挖掘是人工智能和数据库领域研究的热点问题
数据挖掘简介
数据分析是数学与计算机科学相结合的产物
数据分析和数据挖掘
关联分析、数据建模预测、聚类分析、离群点检测
数据挖掘的主要任务
数据库数据、数据仓库、其他类型数据
数据挖掘的数据源
统计学、机器学习、数据库系统与数据仓库
数据挖掘使用的技术
在很多领域取得巨大成功,但依然存在一些具有挑战性的问题
数据挖掘存在的主要问题
第一章绪论
基础数据类型、变量和赋值、运算符和表达式、字符串、流程控制、函数
python程序概述
列表、元组、字典、集合
内建数据结构
pandas中的数据结构、索引对象、查看DataFram的常用属性、DataFram的数据查询与编辑、pandas数据运算、排序、汇总与统计、数据分组与聚合、pandas数据读取与存储
pandas统计分析基础
Matplotlib简介、Matplotlib绘图基础、设置pyplot的动态rc参数、文本注解、pyplot中常用的绘图
Matplotlib图表绘制基础
第二章python数据分析与挖掘基础
属性、属性类型
属性及其类型
中心趋势度量、数据散布度量
数据的基本统计描述
基于像素的可视化技术、几何投影可视化技术、基于图符的可视化技术、层次可视化技术、可视化复杂对象和关系、高维数据可视化、python数据可视化
数据可视化
数据矩阵和相异性矩阵、标称属性的相似性度量、二元属性的相似性度量、数值属性的相似性度量、序数属性的相似性度量、混合类型属性的相似性、余弦相似性、距离度量python实现
数据对象的相似性度量
第三章认识数据
原始数据中存在的问题、数据质量要求
数据预处理的必要性
数据清洗方法、利用pandas进行数据清洗
数据清洗
数据集成过程中的关键问题、利用pandas合并数据
数据集成
离差标准化数据、标准差标准化数据
数据标准化
维归纳、数量归纳、数据压缩
数据归纳
数据变换的策略、python数据变换与离散化
数据变换与数据离散化
第四章数据预处理
回归分析的定义与分类、回归分析的过程
回归分析的概述
一元线性回归方法、一元线性回归模型的参数估计、一元线性回归模型的误差方差估计、一元回归模型的主要统计检验、一元线性回归的python实现
一元线性回归分析
多元线性回归模型的参数估计、多元线性回归模型、多元线性回归的假设检验及其评价、多元线性回归的python实现
多元线性回归
逻辑回归模型、逻辑回归的python实现
逻辑回归
多项式回归、岭回归、lasso回归、逐步回归
其他回归分析
第五章回归分析
2020020430054陈永峻
python数据挖掘与机器学习
0 条评论
回复 删除
下一页