概率论与数理统计
2023-02-22 11:47:03 0 举报
AI智能生成
大学概率论与数理统计所有知识点
作者其他创作
大纲/内容
设是次重复独立实验中事件发生的次数,是事件在每次实验中发生的概率,则对于任意正数 0\" contenteditable=\"false\",有:span class=\"equation-text\" data-index=\"6\" data-equation=\"\\lim_{n\\to \\infty}P\\left(\\left|\\frac{n_\\text{A}}{n}-p\ight| 或:
伯努利大数定理
设有随机变量:span class=\"equation-text\" contenteditable=\"false\" data-index=\"0\" data-equation=\
辛钦大数定律
设有随机变量:span class=\"equation-text\" data-index=\"0\" data-equation=\
切比雪夫大数定理
关系
5.1 大数定律
设随机变量span class=\"equation-text\" data-index=\"0\" data-equation=\
棣莫弗-拉普拉斯定理(中心极限定理的一种)
设随机变量:span class=\"equation-text\" data-index=\"0\" data-equation=\
林德伯格-莱维定理
5.2 中心极限定理
5 大数定律与中心极限定理
一个统计问题总有它明确的研究对象,研究对象的全体称为总体
总体中每个成员称为个体
总体与个体
从总体中随机抽取个个体,这些个体组成的集合称为样本,称为样本容量,通常记作:span class=\"equation-text\" data-index=\"2\" data-equation=\
样本要简单,或者说有样本中的个体相互独立,学习前面概率的时候就知道,如果独立的话计算就会比较简单
如此才能根据样本推断总体的情况,用数学的话来说就是样本和总体的分布相同,简称为同分布。比如说对于总体有span class=\"equation-text\" contenteditable=\"false\" data-index=\"0\" data-equation=\
样本要有和总体一样的随机性,或者说能代表总体
原则
简单随机样本
样本
6.1 总体和样本
6.2 经验分布函数
完全由样本所决定的量叫作统计量
定义
设span class=\"equation-text\" data-index=\"0\" data-equation=\
样本均值
中位数
样本方差和样本标准差
样本均值、方差和方差的关系
几个统计量
6.3 统计量与样本数字特征
0) & n & 2n\\\\ \\\\ T=\\frac{X}{\\sqrt{\\left(X_{1}^{2}+\\cdots+X_{n}^{2}\ight) / n}} & \\begin{array}{c}p(x)=\\frac{\\Gamma\\left(\\frac{n+1}{2}\ight)}{\\sqrt{n \\pi} \\Gamma\\left(\\frac{n}{2}\ight)}\\left(1+\\frac{x^{2}}{n}\ight)^{-\\frac{n+1}{2}}\\\\(-\\infty x 1)\\end{array} & \\begin{array}{c} \\frac{n}{n-2}\\\\ (n2)\\end{array}\\\\ \\\\ F=\\frac{\\left(Y_{1}^{2}+\\cdots+Y_{m}^{2}\ight) / m}{\\left(X_{1}^{2}+\\cdots+X_{n}^{2}\ight) / n} &\\begin{array}{c}{p(x)=\\frac{\\Gamma\\left(\\frac{m+n}{2}\ight)\\left(\\frac{m}{n}\ight)^{m / 2}}{\\Gamma\\left(\\frac{m}{2}\ight) \\Gamma\\left(\\frac{n}{2}\ight)} x^{\\frac{m}{2}-1}} \\\\ {\\left(1+\\frac{m}{n} x\ight)^{-\\frac{m+n}{2}}}\\end{array} & \\begin{array}{c}{\\frac{n}{n-2}} \\\\ {(n2)}\\end{array} & \\begin{array}{c}{\\frac{2 n^{2}(m+n-2)}{m(n-2)^{2}(n-4)}} \\\\ {(n4)}\\end{array}\\\\ \\\\ \\hline\\end{array}\"
卡方分布
分布
如何理解方差分析和F分布
三大抽样分布
span class=\"equation-text\" contenteditable=\"false\" data-index=\"0\" data-equation=\
如何通俗易懂的说明t分布 和f分布和卡方分布呢?
上分位点
样本均值的分布
样本的分布
样本方差的分布
定理一
样本均值、标准差分布
定理二
其中:
样本均值差的分布
样本方差比的分布
定理三
6.4 一些统计量的分布
6 数理统计的基本知识
样本阶矩是随机变量阶矩的一致估计
span style=\
相关性质
发展出了点估计的矩法,也称为矩估计
若总体为离散型随机变量,其分布律为:span class=\"equation-text\" data-index=\"1\" data-equation=\
离散
若总体X为连续型随机变量,其概率密度函数为:span class=\"equation-text\" data-index=\"0\" data-equation=\
连续
如何通俗地理解概率论中的「极大似然估计法」?
最大似然估计
7.1 点估计
因为抽取样本的时候我们并不能控制到底抽到什么样本值,唯一可能可控的是样本容量(有些情况下连样本容量都不能随意控制,比如地震的样本)。所以人们希望在样本容量增大时,估计的精度可以不断地提高。
一致性是对估计量最基本的要求
一致性
若估计量span class=\"equation-text\" data-index=\"0\" data-equation=\
无偏性
设估计量span class=\"equation-text\" data-index=\"0\" data-equation=\
有效性
7.2 点估计的优劣
设总体的分布函数含有一个未知参数(为的可能取值范围),对于给定值span class=\"equation-text\" data-index=\"4\" data-equation=\
置信区间
7.3 区间估计
7.4 正态总体均值的区间估计
7.5 正态总体方差的区间估计
7.6 两个正态总体均值差的置信区间
7.7 两个正态总体方差比的置信区间
7.8 单侧置信区间
7 参数估计
概要
8.1 假设检验的基本概念与方法
8.2 正态总体下的假设检验
8.3 两个正态总体均值与方差的假设检验
8.4 整体分布函数的假设检验
8 假设检验
在一定条件下必然发生的现象称为确定性现象
在一定条件下可能出现也可能不出现的现象称为随机现象
确定性现象和随机现象
可以在相同的条件下重复地进行
进行一次试验之前不能确定哪一个结果会出现
随机试验 的所有可能结果组成的集合称为 的font color=\"#ff0000\
随机试验与样本空间
由一个样本点组成的单点集
基本事件
复合事件
试验中必然会出现的结果.记为Ω
必然事件
试验中不可能出现的结果.记为
不可能事件
随机试验 的样本空间 Ω 的子集称为 的font color=\"#ff0000\
随机事件
1.1 随机试验与随机事件
并运算:
交运算:
差运算:
补运算:如果,则为的补
交换律
结合律
分配率
摩根定律
性质
事件的运算
事件之间的关系
事件的关系
1.2 事件间关系及运算
在相同的条件下进行次试验,在这次试验中事件发生的次数称为事件发生的频数。比值称为事件发生的频率,并记成。
性质
在相同的条件下进行次试验,事件在这次试验中发生了次,如果当增大时,事件发生的频率稳定在某一常数附近摆动,就称常数为事件发生的概率,记为:
概率的统计定义
频率
1.3 随机事件的概率
(1)样本空间有限
(2)样本点的出现等可能
满足下面两个特点的随机试验称为等可能概型或古典概型
计算
数清楚和Ω里面有多少样本点,这称为计数
如果某件事需经个步骤才能完成,做第步有种方法,做第步有种方法,做第步有种方法,则完成这个事件总共有种方法。
乘法原理
如果某件事有种办法去完成,第种办法有种方法,第种办法有种方法,第种办法有种方法,则完成这个事件总共有种方法。
加法原理
从个不同元素中任取个元素排成一排(不能重复选择元素,要考虑元素的先后顺序),称为一个排列(Permutation)。按乘法原理,此种排列共有种,记作,可以读作:。若,称为全排列,全排列数共有个,记为。
排列
从个不同元素中任取个元素并成一组(不区分顺序),称为一个组合(Combination),组合总数为:可以读作:
组合
计算的核心知识点(复习中学的知识)
1.4 古典概型
当随机试验的样本空间是某个区域,并且任意一点落在度量 (长度、 面积、体积) 相同的子区域是等可能的,则事件 的概率可定义为
说明
1.5 几何概型
举例子
非负性公理
规范性公理
设span class=\"equation-text\" contenteditable=\"false\" data-index=\"0\" data-equation=\
可加性公理
三大公理
概率的定义:已知某样本空间,对于其中任一事件,定义函数,满足三大公理,则称为概率函数,称为事件的概率。
公理中出现的概率函数是把样本空间span class=\"equation-text\" data-index=\"1\" data-equation=\"Ω\" contenteditable=\"false\
抛掷硬币:正面的概率=
解决三大流派的纠纷
意义
空集的概率是零
若是span class=\"equation-text\" data-index=\"0\" data-equation=\
概率的有限可加性
任意事件,有
(1)
(2)
设为两个事件,若是的子集,则可推出
包含的概率
任意两个事件,有
对于任意两个事件,有:
加法公式
基于概率公理的6个性质
1.6 概率公理化定义
设和是样本空间中的两事件,若 0\" contenteditable=\"false\",则称:为“假设条件为时的的概率”,简称条件概率。也常写作:
设为两两不相容的事件,即,有:
条件概率的三大公理
条件概率
0\" contenteditable=\"false\",则:
根据条件概率定义得到
乘法公式
对于两个随机事件,如果满足:则称A与B相互独立,或简称A与B独立,否则称A与B不独立或相依。
独立性的定义
两两独立≠相互独立
多个事件相互独立
事件的相互独立性
1.7 条件概率与乘法公式
某样本空间只包含两个元素,span class=\"equation-text\" data-index=\"0\" data-equation=\
伯努利分布
在数学中,类似于扔一次硬币这样的“是非题”称为一次伯努利试验,像上面这样独立地重复扔次硬币(做同样的“是非题”次),就称为重伯努利试验
对于重伯努利实验,如果每次得到“是”的概率为,设随机变量:X=得到“是”的次数,则称:span class=\"equation-text\" data-index=\"2\" data-equation=\
二项分布
1.8 伯努利概型
全概率公式
对于随机事件,若,有:
设为样本空间的一个分割,则有:
怎样用非数学语言讲解贝叶斯定理(Bayes's theorem)?
贝叶斯定理
朴素贝叶斯分类器
应用:朴素贝叶斯分类器
逆概率公式(贝叶斯公式)
1.9 全概率公式与逆概率公式
1 随机事件及其概率
定义在样本空间上的实值函数:span class=\"equation-text\" data-index=\"1\" data-equation=\
,即一切满足的组成的集合
随机变量的定义
随机变量的函数值是实数轴上孤立的点(有限个或者无限个),则称为离散随机变量
离散随机变量
如果随机变量的函数值是实数轴上某个区间上所有的值(也可以是span class=\"equation-text\" contenteditable=\"false\" data-index=\"0\" data-equation=\
连续随机变量
2.1 随机变量
设为离散型随机变量,其全部可能值为span class=\"equation-text\" data-index=\"1\" data-equation=\
还可写作列表的形式:所以也称为的概率分布列,或者简称为概率分布。有时候也如下表示:,读作服从的概率分布。
概率质量函数(PMF)
在数学中,类似于扔一次硬币这样的“是非题”称为一次伯努利试验,像上面这样独立地重复扔n次硬币(做同样的“是非题”次),就称为重伯努利试验
对于随机变量的概率质量函数:span class=\"equation-text\" data-index=\"1\" data-equation=\
泊松分布的定义
在此时间段内,此事件发生的概率相同(在实际应用中大致相同就可以了)
平稳性
事件的发生彼此之间独立(或者说,关联性很弱)
独立性
把切分成足够小的区间,在内恰好发生两个、或多个事件的可能性为(或者说,几乎为)
普通性
泊松分布的条件
泊松分布
设有件产品,其中有件不合格品,随机抽取件产品,设随机变量:则其中含有件不合格产品的概率为:span class=\"equation-text\" data-index=\"5\" data-equation=\
超几何分布
对于重伯努利实验,如果每次得到“是”的概率为,设随机变量:=首次得到“是”时进行的试验次数,则称:span class=\"equation-text\" data-index=\"3\" data-equation=\
几何分布
常见的离散随机变量
2.2 离散型随机变量及其概率分布
如果函数满足下列两个条件(对应了概率的三大公理):非负性:规范性(暗含了可加性),因为是连续的,所以通过积分相加:则称其为概率密度函数(Probability Density Function,简写为PDF)。
期望
方差
连续随机变量的概率密度函数为,则:称为的累积分布函数。
累积分布函数(CDF)
2.7 概率密度函数(PDF)
如果连续随机变量的概率密度函数为:span class=\"equation-text\" data-index=\"1\" data-equation=\
均匀分布
若随机变量X的概率密度函数为:span class=\"equation-text\" data-index=\"0\" data-equation=\
指数分布的定义
期望和方差
s+t|X s) &=\\frac{P(Xs+t)}{P(X s)}=\\frac{e^{-\\lambda (s+t)}}{e^{-\\lambda s}}\\\\ \\\\ &=e^{-\\lambda t}=P(X t)\\end{aligned}\"
性质:无记忆性
分布之间的关系
指数分布
如果连续随机变量X的概率密度函数为:span class=\"equation-text\" data-index=\"0\" data-equation=\
正态分布的定义
因为要逼近二项分布才引入了正态分布,但随着这个问题研究的深入,发现不光二项分布,很多别的分布最终也会变为正态分布,甚至很多不同的分布混合在一起最终也会变为正态分布……正态分布是这些分布的最终归宿,这是一个很惊人的结论,这就导致正态分布的地位大大提高,基本可以算是概率论的中心。这个结论称为中心极限定理,它导致的结果是,我们在现实生活中会观察到非常非常多的正态分布
中心极限定理
我们称span class=\"equation-text\" data-index=\"0\" data-equation=\"\\mu=0、\\sigma=1\" contenteditable=\"false\
标准正态分布
如果span class=\"equation-text\" data-index=\"0\" data-equation=\
重要结论
如果有span class=\"equation-text\" data-index=\"0\" data-equation=\
上分位点
正态分布
常见的连续随机变量
2.3 连续型随机变量及其概率密度
设是一个随机变量,是任意实数,函数:因为是把概率分布函数累加起来,所以称为累积分布函数(Cumulative Distribution Function,或者缩写为CDF),也简称为分布函数。
举例子:伯努利分布的累积分布函数
定义累积分布函数主要是为了计算上的便利,以下常见计算都可以CDF来完成: a)\\quad&\\quad 1-F(a) \\quad\\\\ \\quad P(a_1
定义累积分布函数的理由
2.4 分布函数
设是连续随机变量,其概率密度函数为是另外一个随机变量。若严格单调,其反函数有连续导函数,则的概率密度函数为:span class=\"equation-text\" data-index=\"5\" data-equation=\
随机变量函数的定理
2.5 随机变量函数的概率分布
2 随机变量及其分布
二维随机变量
如果二维随机向量span class=\"equation-text\" contenteditable=\"false\" data-index=\"0\" data-equation=\
离散型随机向量及其概率分布
对于某二维随机变量span class=\"equation-text\" contenteditable=\"false\" data-index=\"0\" data-equation=\
连续型随机向量及其概率密度
联合累积分布函数
二维正态分布
3.1 二维随机向量及其分布
如果二维连续随机变量span class=\"equation-text\" data-index=\"0\" data-equation=\
边缘分布函数
如果二维离散随机变量span class=\"equation-text\" data-index=\"0\" data-equation=\
边缘分布律(边缘概率质量函数)
边缘分布密度(边缘概率密度函数)
3.2 边缘分布
条件分布律(条件概率质量函数)
设二维连续型随机变量span class=\"equation-text\" data-index=\"0\" data-equation=\
条件分布密度(条件概率密度函数)
3.3 条件分布
3.4 随机变量的独立性
设为两个相互独立的离散随机变量,取值范围为,则其和的概率质量函数为:这个概率等式称为离散场合下的卷积公式。
卷积公式
随机变量的和的分布
设是相互独立的个随机变量,各自的累积分布函数为:span class=\"equation-text\" data-index=\"2\" data-equation=\
随机变量的极值的分布
3.5 随机变量的函数分布
3 随机向量
离散型
连续型
推出:
若为常数,则:
常数的期望
设是随机变量的函数(是连续函数)。(1)若为离散随机变量,则(设下式中的级数绝对收敛):(2)若为连续随机变量,则(设下式中的积分绝对收敛):
一维随机变量
设是随机变量span class=\"equation-text\" data-index=\"1\" data-equation=\
多维随机变量
随机变量函数的期望
对于任意常数有:
齐次性
对于多维也成立:
对于任意两个函数有:
可加性
线性的数学期望
独立的数学期望
对任意随机变量与都有:
施瓦茨不等式
重要不等式
4.1 数学期望
令,则:
推导过程:
简化计算公式
常数的方差
非线性的方差
独立的方差
存在常数使得
方差为0
标准差
常见随机变量的方差
扩展阅读
4.2 方差
如何通俗地解释协方差
很显然会有:span class=\"equation-text\" data-index=\"0\" data-equation=\
可以通过下式来化简运算:span class=\"equation-text\" data-index=\"0\" data-equation=\
化简
对于任意的二维随机变量span class=\"equation-text\" data-index=\"0\" data-equation=\
数乘
不相关的充要条件
根据刚才的性质:span class=\"equation-text\" data-index=\"0\" data-equation=\
独立必不相关
对于二维随机变量span class=\"equation-text\" contenteditable=\"false\" data-index=\"0\" data-equation=\
有界性让比较有了一个范围,我们可以得到如下结论: 0\" contenteditable=\"false\":正相关,且的时候,正相关性最大,称为完全正相关span class=\"equation-text\" data-index=\"2\" data-equation=\"\ho :负相关,且的时候,负相关性最大,称为完全负相关:不相关
有界性
存在常数 使得
线性相关
相关系数
4.3 协方差与相关系数
的数学期望是的一阶原点矩
原点矩
的方差是的二阶中心矩
中心矩
一维随机变量
的协方差span class=\"equation-text\" data-index=\"1\" data-equation=\
二维随机变量
4.4 矩
4 随机变量的数字特征
概率论与数理统计
0 条评论
回复 删除
下一页