人工智能技术应用方向分类知识点
2022-10-21 13:33:07 0 举报
AI智能生成
人工智能技术应用方向分类知识点
作者其他创作
大纲/内容
1.新时代开启
机器学习
定义
通过机器模拟人类认知能力
如何学习
从数据中
监督学习
无监督学习
从行为中
强化学习
AI运用
医疗/安全/制造/自动驾驶
AI历史
第一次浪潮(1956-1974)
1964~1966 第一个自然语言对话程序 ELIZA
第二次浪潮(1980-1987)
专家系统
解决具体领域问题
第三次浪潮(2011-)
模型和算法发展
统计学习
支持向量机
概率图模型
横空出世
1950年: :图灵测试
1951: 闵斯基 第一个神经网络机器 SNARC
1955年:搜素推理
2.察异辨花
2.1分类
图像、视频,文字,声音
2.2 提取特征
特征向量
特征点和特征空间
特征点:表示的点
特征空间:特征点组成
2.3分类器
特征向量到预测类别的函数
训练分类器
训练
算法:感知器
优化:调整参数使得损失函数最小
损失函数:度量分类器输出错误程度的数学化
算法:支持向量机
特征空间上分类间隔最大分类器
2.4
应用
评判好坏
测试
实际使用
2.5多类别分类
归一化指数函数
分支主题一个向量压缩到另外一个向量中,使每个元素在0,1之间,并且元素和为1
2.6分类实际运用
人脸预测/癌症预测
3.图像识别
3.1基于手工特征的图像分类
计算机辨识图像
矩阵(matrix)
像素(pixel)
小格子
分辨率:格子行数*列数
图像特征
人类:快速分辨
机器:卷积运算
边缘特征提取
例:方向梯度直方图
3.2基于神经网络的图像分类
深度神经网络结构
多个顺序连接层
卷积层
1.第一层卷积层:图像输入
2.第二层卷积层~:前一层的特征图输入
特征图转换为特征向量
全连接层
对特征向量变换
归一化指数层
分类网络的最后一层
非线性激活层
卷积层和全连接层的变换效果保留
池化层
减少计算和参数数量
人工神经网络与生物神经网络
算法:反向传播
1.链式传播
2.随机梯度下降
3.3深度神经网络的发展与挑战
深度的“深“
2010年 ALEX net:5卷积层
2016年:polynet:10卷积层
深度的“难“
过犹不及
过拟合
训练集OK, 迎合数据 在新数据上表现不好
欠拟合
能力有限 表现不好
梯度消失
批处理化
跨层连接
3.4图像分类实际运用
3.4.1 人脸识别
4.声音区分
4.1听声
人耳:接受频率范围:85~1100HZ
声音数字化
采样/量化/编码
声音
1.语音
2.音乐
有节奏
理解声音
响度
音调
音色
共振峰
4.2音乐风格分类
计算机“耳中”的风格
梅尔频率倒谱系数
维数低
刻画不同频率的能量高低
5.识别视频
5.1图像到视频
视觉暂留
光照射到视网膜上 可以保留一段时间让人产生画面延续印象
视频
数百张照片连续拍摄
5.2视频行为识别
难点
同一类别行为差异大
行为定义不明确
环境背景差异大
行为识别特征
运动
光流
计算运动的要素
计算:2帧之间的相同点对应
5.3基于深度学习的视频行为
单帧识别
视频
识别:像素分量
水平
垂直
时间长:时序分段网络
时间短:双流卷积神经网络
6.分门别类
6.1 首次接触事物
监督学习
无监督学习
6.2 K均值聚类
聚类
数据在特征空间的聚集情况分成不同的组
算法
随机选取K个样本
每个样本划分给最近的聚类中心对应的类别,得到新划分方法
重新计算每类样本聚类中心
6.3实际运用-人群分类
人脸检测
人脸转正
特征提取
6.4层次聚类和生物聚类
每个样本单独成1列
重复合并最相似2个类
7.理解文本
7.1任务特点
潜在语义分析
文档:独立的文本
主题:文档的主要内容
7.2文本特征
词袋模型
中文分词
停止词与低频词
词频率
逆文档频率
文档频率的负对数
7.3发掘文本中潜在主题
主题模型
核心:文档词频=主题比重*主题词频
矩阵乘法运算
7.4基于文本的搜索与推荐
8.创作图画
8.1数据空间和数据分布
数据空间
数据分布
生成对抗网络
潜在空间
8.2生成网络
随机点变化为数据集相似的图片
8.3判别网咯
输入不同图片提高判断能力
8.4生成对抗网络
生成网络和判别网络互相训练
0 条评论
下一页
为你推荐
查看更多