统计学习方法概论
2016-10-22 14:05:16 0 举报
AI智能生成
统计学习方法是机器学习的核心,它主要研究如何从数据中学习模型和知识。统计学习方法包括监督学习、无监督学习、半监督学习和强化学习等。在监督学习中,我们需要有标签的数据来训练模型;而在无监督学习中,我们只有无标签的数据。半监督学习则是介于两者之间的一种方法,它可以利用一部分有标签的数据来提高模型的性能。强化学习则是一种通过与环境交互来学习最优策略的方法。这些方法都有各自的优缺点和适用范围,需要根据具体问题来选择合适的方法。
作者其他创作
大纲/内容
定义
计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析
方法
强化学习
半监督学习
监督学习
(极其重要的统计学习分支)
(极其重要的统计学习分支)
任务
学习一个模型,使模型能够对任意给定的输入,对其相应的输出做一个好的预测
研究的问题
标注问题(输入输出变量均为变量序列)
作用:对观测序列给出标记序列作为预测
分类问题(输出变量为有限个离散点)
作用:根据特性将数据“分门别类”
回归问题(输入输出变量均为连续变量)
作用:预测输入变量和输出变量之间的关系
模型
一般形式
决策函数: Y= f(X)
条件概率分布: P(Y|X)
分类
生成模型
模型表示给定输入X产生输出Y的生成关系
判别模型
对于给定的输入X,模型有确定的输出Y
基本假设
X,Y具有联合概率分布
过程
学习过程
利用给定的训练数据集,通过学习(或训练)得到一个模型
预测过程
对于给定的测试样本集中的输入,由模型给出相应的输出
非监督学习
三要素
(构建一种统计学习方法就是
确定具体的统计学习三要素)
(构建一种统计学习方法就是
确定具体的统计学习三要素)
模型
所要学习的条件概率分布或决策函数
策略
考虑按照什么样的准则学习或选择最优的模型
函数
损失函数
度量模型一次预测的好坏
风险函数
度量平均意义下模型预测的好坏
风险
经验风险
模型f(X)关于训练数据集的平均损失
结构风险
经验风险+表示模型复杂度的正则化项/罚项
方法
正则化
结构化风险最小策略的实现
交叉验证
把给定的数据切分成训练集、验证集和测试集来训练测试模型
算法
求解最优模型具体的计算方法
泛化能力
泛化误差
衡量一个学习机器推广未知数据的能力,即根据从样本数据中学习到的规则能够应用到新数据的能力
0 条评论
下一页