机器学习基础
2023-08-29 21:01:30 11 举报
AI智能生成
机器学习基础
作者其他创作
大纲/内容
数据
算法
CPU主要适合I\\O密集型的任务
计算密集型的程序
易于并行的程序
GPU主要适合计算密集型任务
计算力
人工智能发展必备三要素
机器学习是人工智能的一个实现途径
深度学习是机器学习的一个方法发展而来
人工智能和机器学习,深度学习的关系
机器学习概述
1956
人工智能元年
第一是起步发展期:1956年—20世纪60年代初
第二是反思发展期:20世纪60年代—70年代初
第三是应用发展期:20世纪70年代初—80年代中
第四是低迷发展期:20世纪80年代中—90年代中
第五是稳步发展期:20世纪90年代中—2010年
第六是蓬勃发展期:2011年至今
发展历程
人工智能的发展历程
指机器感知环境的能力
计算机视觉(CV)
可用于理解、组织和分类结构化或非结构化文本文档
主要任务有句法分析、情绪分析和垃圾信息检测
文本挖掘/分类
利用机器的力量自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)
机器翻译
指识别语音(说出的语言)并将其转换成对应文本的技术
语音识别
自然语言处理(NLP)
机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理
固定机器人
移动机器人
分类
机器人
主要分支
从数据中自动分析获得模型,并利用模型对未知数据进行预测
机器学习
一行数据
样本
一列数据
特征
有些数据有目标值(标签值),有些数据没有目标值
数据类型一:特征值+目标值(目标值是连续的和离散的)
聚类算法
数据类型二:只有特征值,没有目标值
类型构成
用于训练,构建模型
训练集:70% 80% 75%
训练数据
在模型检验时使用,用于评估模型是否有效
测试集:30% 20% 25%
测试数据
数据分割
数据集
1.获取数据
缺失值
异常值
2.数据基本处理
使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程
概念
会直接影响机器学习的效果
意义
特征提取
特征预处理
特征降维
包含的内容
3.特征工程
选择合适的算法对模型进行训练
4.机器学习(模型训练)
结果达到要求,上线服务
没有达到要求,重新上面步骤
5.模型评估
工作流程
机器学习工作流程
输入数据是由输入特征值和目标值所组成
定义
函数的输出可以是一个连续的值
回归
输出是有限个离散值
监督学习
输入数据是由输入特征值组成,没有目标值
无监督学习
训练集同时包含有标记样本数据和未标记样本数据
半监督学习
实质是make decisions 问题,即自动进行决策,并且可以做连续决策
强化学习
算法分类
准确率: 预测正确数量与总样本数量的比例
精确率
召回率
F1-Score
AUC指标
分类模型评估
分支主题
- 相对均方误差(RSE): (预测值 减 真实值的平方和) 除以 (真实值的均值 减 真实值的平方和)
fi是预测值, yi是真实值
- 相对绝对误差(RAE): ( 预测值 减 真实值的绝对值的和) 除以 (真实值的均值 减 真实值的绝对值的和)
- 误差越小越好.
回归模型评估
欠拟合
过拟合
拟合
模型评估
输入 -> 多个层(每一个层有多个节点) -> 输出
神经网络
深度学习
mkvirtualenv -p ai
创建虚拟环境
pip install 包==版本号
安装
1. workon ai
2. Jupyter notebook
启动
- 作用: 可以编写单元格中代码或文档(MarkDown)
- 多光标操作: ctrl + 鼠标左键单击
- 回退: ctrl(CMD) + z
- 代码补全: Tab
- 注意需要安装扩展插件
- 注释/取消注释: ctrl(CMD) + /
命令
编辑模式
- 进入: Esc/ 单击单元格左边
- 代码模式: Y
- markdown模式: M
- 在上面添加cell: A
- 在下面添加cell: B
- 删除当前cell: DD
- 回退: Z
命令模式
两种模式
Jupyter Notebook使用
机器学习环境安装与使用
机器学习-01
0 条评论
下一页
为你推荐
查看更多