《数学之美》读书笔记
2022-04-30 09:10:45 26 举报
AI智能生成
包含《数学之美》第三版核心概念和内容
作者其他创作
大纲/内容
自然语言处理*
方案
统计
有向图
大数定理
判断句子是否合理
规则
技巧
古德-图灵统计
有噪声更精准
分词
方案
最少词数匹配
分词后句子出现概率最大
TF-IDF
关键词频率
归一化
逆文本频率指数
有限状态机
应用
识别地址
相关理论
工程上简单实用的方法最好
费马小定律
正确的数学模型应该形式上是简单的
一个正确的模型可能一开始不如一个精致的错误模型
大量数据对研发重要
正确的模型也会受噪声干扰
最大熵模型:不把鸡蛋放在篮子里
bloom过滤器
区块链、密钥、量子密钥
人工智能的边界/数学的边界
信息指纹
判断数组内容相同
相似hash
记录URL
人工神经网络
特点
有向权值图
神经元只能对输入变量做一次变换
结构:输入、神经元、输出
google 大脑
通信模型
信息源
信道
接收者
信息论
信息熵
不确定性越大熵越大
信息是消除系统不确定性的唯一办法
H(X)=-E P(x)logP(x)
条件熵
增加了额外信息H(X)>=H(X|Y)
互信息
两个随机事件的量化度量
I(X;Y)=H(X)-H(X|Y)
处理词的二义性
相对熵
衡量两个取值为正数的函数相似性
两篇文章词频分布相对熵小,可能抄袭
最大熵模型
预测时,对未知的情况不做任何假设
文法分析
搜索引擎
道
下载网页
爬虫
图论
hash
建立索引
排序
网页质量排名
page rank
二维矩阵迭代
用户偏好
相关性排序
TF-IDF
权威性
文献检索
布尔代数
索引
反作弊
出链向量相关性
Clique 互链
分类问题
用特征向量
余弦定理
优化
分母缓存
只考虑非0元素
删除虚词
位置加权
一次算出所有新闻相关性
矩阵奇异值分解
输入法
拼音转汉字
最短路径
个性化语言模型
贝叶斯网络
简化
蒙特卡洛方法
互信息
隐马尔可夫
无监督
训练算法
鲍姆-韦尔奇算法
解码算法
维特比算法
扩展
条件随机场
文法分析
估算犯罪
概率引申:逻辑回归模型
维特比算法
引申 Dijkstra
引申 Bellman-Ford
0 条评论
下一页