【人工智能认证】机器学习基础
2023-03-10 09:11:37 2 举报
AI智能生成
根据阿里云人工智能助理工程师认证ACA内容整理
作者其他创作
大纲/内容
人工智能、机器学习和深度学习的关联
人工智能 > 机器学习 > 深度学习
一个目标
三者目标相同,即给机器赋予人的智能,让机器能够像人一样地思考问题,做出决策
两种途径
【机器学习】是实现【人工智能】的一种途径。让机器使用算法解析数据、从中学习数据特征,并进行归纳判断
【深度学习】是【机器学习】的一类重要方法。采用多层非线性函数(即神经网络)学习特征,并进行判断,属于机器学习解决图像、语音、文本等领域问题的一个重要分支
机器学习的定义
通过技术的手段,利用已有的数据(经验)开发可以用来对新数据进行预测的模型
主要研究能产生模型的算法
机器学习的方向
基于【学习方式】划分
有监督学习
应用场景:分类、回归
无监督学习
应用场景:关联分析、聚类
强化学习
应用领域:机器人控制、机器人视觉、自然语言处理
基于【学习策略】划分
传统机器学习
深度学习
机器学习任务
【分类】任务
将【不同的类别】进行分开
预测的变量是【离散的】
【回归】任务
找到一个【空间】,使得数据点尽可能的【落在空间】上
预测的变量是【连续的】
区别
输出不同
分类输出【类别】,输出为【离散值】和【定性值】
回归输出【预测值】,输出为【连续值】和【定量值】
目的不同
分类的目的是寻找【决策边界】
回归的目的是寻找【最优拟合】
常见函数
损失函数
定义
用来评估模型的预测值与真实值的【不一致程度】,是一个【非负实值】函数
特点
值越【小】,说明预测值与真实值越【接近】
【不同的算法】可能使用的【损失函数不同】
优化函数
定义
通过调节参数使误差函数值最小
常见优化函数
批量梯度下降
小批量梯度下降法
随机梯度下降法
牛顿法
动量优化发
适用性梯度算法
均方根传播算法
AdaDelta算法
Adam算法
3种梯度下降法特点对比
批量梯度下降法BGD
优点:易收敛
不足:每次学习使用整个样本集,学习一次的时间长
适用场景:样本量小
随机梯度下降法SGD
优点:学习一次时间短,每次学习使用随机单个样本
不足:下降会出现损失函数波动且难收敛
适用场景:样本量大
小批量梯度下降法MBGD
优点:结合了BGD和SGD的优点,弱化了缺点,减少收敛所需的迭代次数
不足:Batch Size选择不当会有问题
适用场景:一般情况
常见评估指标
分类任务
混淆矩阵
定义:也称误差矩阵,是表示【精度评价】的一种标准格式,用【n行n列】的矩阵形式来表示
准确率
定义:衡量分类正确的比例
精确度
定义:又叫查准率,指被预测为正样本的样本中预测正确的占比
召回率
定义:又叫查全率,指被正确检测出来的真实样本占所有真实样本的比例
F1分数
定义:权衡精确度和召回率
回归任务
均方误差MSE
定义:又叫L2范数损失,通过计算真实值和预测值的差值的【平方和】的均值衡量
平均绝对误差MAE
定义:又叫L1范数损失,通过计算真实值和预测值的差值的【绝对值】的均值衡量
均方根误差RMSE
定义:表示预测值和真实值差值的样本【标准差】
无监督任务
兰德系数
互信息
轮廓系数
经典算法
过拟合与欠拟合
过拟合与欠拟合用来度量模型泛化能力的直观表现
欠拟合:模型在训练集、测试集上均表现不佳的情况
过拟合:在训练集上表现很好,到了验证和测试阶段就很差
线性回归算法
定义:利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法
任务类型:回归
应用场景:异常指标监控、农业贷款预测
逻辑回归算法
定义:一种广义线性回归,在线性回归的基础上添加非线性变换,使得逻辑回归输出值为离散型
任务类型:分类
应用场景:学生考试成绩预测、雾霾天气预测
朴素贝叶斯算法
定义:基于贝叶斯定理与特征条件独立假设的分类方法
任务类型:分类
应用场景:垃圾邮件分类、舆情分析
K近邻算法
定义:从训练集中找到与新实例最近的K个实例,根据K个实例来进行预测
任务类型:分类、回归
应用场景:约会匹配、商品推荐
支持向量机算法
定义:一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面
任务类型:分类
应用场景:心脏病预测、用户窃电识别
决策树算法
定义:决策树是一种以树结构形式来表达的预测分析模型
任务类型:分类、回归
应用场景:银行贷款预测、动物识别
集成算法
定义:通过构建和结合多个机器学习算法(基学习器)完成学习任务
重要条件:基学习器学习结果之间存在差异
任务类型:
应用场景:土地覆盖测绘、恶意软件检测
聚类算法
定义:属于无监督学习的一种,使同一类的数据尽可能聚集到一起,不同数据尽量分离
任务类型:聚类
应用场景:非人恶意流量识别、新闻主题聚类
0 条评论
下一页