概率论与数理统计
2021-09-10 08:30:43 0 举报
AI智能生成
研、数一、概率论与数理统计、详细整理
作者其他创作
大纲/内容
概率论
随机事件
运算
形式:和(并),积(交),差,逆
法则:交换、结合、分配、对偶、吸收、分解
关系
相互独立
独立重复实验
包含、相等、互不相容、对立、完备事件组
概率
定义与性质
一种度量。
公理化定义:非负性、规范性、可列可加性
公理化定义:非负性、规范性、可列可加性
性质:
非负性、有界性、有限可加性
加法公式、减法公式、求逆公式
条件概率
乘法公式、全概率公式、贝叶斯公式
概形
等可能概型
古典概型
几何概型
n重伯努利概型
随机变量
一维随机变量
定义与分类
取值依赖于某个随机试验的结果,并随试验结果的不同而不同的变量
连续型随机变量、离散型随机变量、组合型随机变量
随机变量的分布
分布函数
F(x) = P{X≤x} (-∞<x<+∞)
概率分布是随机变量取值与对应的概率的总称【离散型】;
而【连续型】不能直接得到这种“对应”的分布,故类比定义了“概率密度的概念”;
而分布函数与这两个概念(概率分布和概率密度)不存在并列关系,是对随机变量取值与对应概率的另外一种表达形式。
而【连续型】不能直接得到这种“对应”的分布,故类比定义了“概率密度的概念”;
而分布函数与这两个概念(概率分布和概率密度)不存在并列关系,是对随机变量取值与对应概率的另外一种表达形式。
概率分布与概率密度
离散型的概率分布(或分布律)
连续型的概率密度
常见分布
离散型
0-1分布
二项分布
几何分布
超几何分布
泊松分布
连续型
均匀分布
正态分布
一般正态分布
标准正态分布
随机变量函数的分布
Y=g(X)的分布:F_Y(y)=P{Y≤y}=P{g(X)≤y}
多维随机变量
二维随机变量的分布
分布函数
联合分布函数
F(x, y) = P{(X≤x)∩(Y≤y)} = P{X≤x, Y≤y} (-∞<x, y<+∞)
边缘分布函数
F_X(x) = P{X≤x} = P{X≤x, Y<+∞} = F(x, +∞) (-∞<x<+∞)
F_Y(y) = P{Y≤y} = P{X≤+∞, Y<y} = F(+∞, x) (-∞<y<+∞)
F_Y(y) = P{Y≤y} = P{X≤+∞, Y<y} = F(+∞, x) (-∞<y<+∞)
概率分布和概率密度
离散型
联合概率分布、边缘概率分布、条件概率分布
连续型
联合概率密度、边缘概率密度、条件概率密度
常见分布
二维均匀分布
二维正态分布
随机变量的独立性
概念
P{X≤x, Y≤y} = P{X≤x} P{Y≤y},
F(x, y) = F_X(x)F_Y(y)
F(x, y) = F_X(x)F_Y(y)
充分必要条件
离散型
P{X = xi, Y = Yj} = P{X = xi} P{Y = Yj}, 即pij=pi.p.j
连续型
f(x, y) = f_X(x) f_Y(y)
性质
1. m个随机变量独立,则k(2<=k<=m)个随机变量也相互独立;
2. m个随机变量独立,则他们的函数也相互独立;
3. 若两个随机变量独立,则一个关于另一个的条件分布就是其无条件分布
2. m个随机变量独立,则他们的函数也相互独立;
3. 若两个随机变量独立,则一个关于另一个的条件分布就是其无条件分布
二维随机变量函数的分布
U=g(X, Y)的分布:F_U(u)=P{g(X, Y)≤u}
常见的二维连续型随机变量函数的分布
Z=X+Y
Z=X-Y(Y-X)
Z=XY
Z=max(X,Y)
Z=min(X,Y)
随机变量的数字特征
数学期望、方差、协方差、相关系数
DX = E(X^2)-(EX)^2
Cov(X, Y) = E(XY) - E(X)E(Y)
ρ = Cov(X, Y)/(DX)^0.5/(DY)^0.5
Cov(X, Y) = E(XY) - E(X)E(Y)
ρ = Cov(X, Y)/(DX)^0.5/(DY)^0.5
独立可以推出不相关,反之不行;
X, Y 服从二维正态分布或0-1分布,则两者等价;
X, Y 服从二维正态分布或0-1分布,则两者等价;
矩
一维
k阶原点矩:E(X^k)
数学期望EX是X的一阶原点矩
k阶中心矩:E(X-EX)^k
方差DX是X的二阶中心矩
二维
k+l阶混合原点矩:E(X^kY^l)
k+l阶混合中心距:E[ (X-EX)^k (Y-EY)^l) ]
协方差Cov(X ,Y)是X与Y的混合二阶中心矩
大数定理和中心极限定理
依概率收敛(P - 收敛)
n→∞lim P{ |Yn - a| < ε } = 1,对任意ε>0,a为常数;
随机变量序列依概率收敛于a,记为Yn—P—>a;
随机变量序列依概率收敛于a,记为Yn—P—>a;
切比雪夫不等式
一个重要的不等式,一个引理
一个重要的不等式,一个引理
X的期望和方差均存在,对于任意ε > 0,有
P{ |X - EX| ≥ ε } ≤ DX/ε^2,或
P{ |X - EX| ≤ ε } ≥ 1 - DX/ε^2
P{ |X - EX| ≥ ε } ≤ DX/ε^2,或
P{ |X - EX| ≤ ε } ≥ 1 - DX/ε^2
大数定理
切比雪夫大数定律
n个相互独立的随机变量,数学期望和方差均存在,且方差有公共上界,
则均值依概率收敛于期望的均值
则均值依概率收敛于期望的均值
伯努利大数定律
n个随机变量服从参数为n和p的二项分布,即Xn~B(n, p),A出现的频数为μn,
则频率依概率收敛于成功率
则频率依概率收敛于成功率
幸钦大数定律
n个随机变量独立同分布,期望存在,
则均值依概率收敛于期望
则均值依概率收敛于期望
中心极限定理
是概率论中一切关于
“随机变量之和在一定条件下的极限分布是正态分布”
的总称
是概率论中一切关于
“随机变量之和在一定条件下的极限分布是正态分布”
的总称
列维-林德伯格定理(独立同分布的中心极限定理)
棣莫夫-拉普拉斯定理(二项分布以正态分布为其极限分布)
数理统计
基本概念
总体与个体
1. 所研究对象的某项数量指标X取值的全体称为总体;
2. 随机变量X的分布函数和数字特征称为总体的分布函数和数字特征;
3. 总体中的每个元素称为个体。
2. 随机变量X的分布函数和数字特征称为总体的分布函数和数字特征;
3. 总体中的每个元素称为个体。
样本、样本值与样本容量
1. n个相互独立且与总体X(设X分布函数为F)同分布的随机变量
称为来自总体X或分布函数F的简单随机样本,简称样本;
2. n为样本容量;
3. 随机变量的观测值称为样本值,又称为总体X的n个独立的观测值;
(样本指一组随机变量,样本值指一组具体的统计数据,样本容量指观测值的个数)
称为来自总体X或分布函数F的简单随机样本,简称样本;
2. n为样本容量;
3. 随机变量的观测值称为样本值,又称为总体X的n个独立的观测值;
(样本指一组随机变量,样本值指一组具体的统计数据,样本容量指观测值的个数)
样本的概率分布
(即简单随机样本)
(即简单随机样本)
1. 联合分布函数为单个分布函数的乘积;
2. 联合概率密度为单个概率密度的乘积;
3. 联合概率分布为单个概率分布的乘积;
2. 联合概率密度为单个概率密度的乘积;
3. 联合概率分布为单个概率分布的乘积;
统计量
(样本的函数)
(样本的函数)
概念
1. 统计量是样本的函数:T=f(X1, X2, ..., Xn),不依赖于任何未知参数;
2. 作为随机变量的函数,统计量也是随机变量;
3. 样本的数字特征是最常用的统计量;
2. 作为随机变量的函数,统计量也是随机变量;
3. 样本的数字特征是最常用的统计量;
抽样分布
(统计量的分布)
(统计量的分布)
概念
1. 统计量的分布称为抽样分布;
2. 抽样分布可能含有未知参数;
3. 有时(当样本的函数含有未知参数但其分布不依赖于未知参数时)
将含有未知参数的样本的函数的分布也称为抽样分布。
2. 抽样分布可能含有未知参数;
3. 有时(当样本的函数含有未知参数但其分布不依赖于未知参数时)
将含有未知参数的样本的函数的分布也称为抽样分布。
来自正态总体的三个
常用统计量的分布
(独立同标准正态分布
的n个随机变量)
常用统计量的分布
(独立同标准正态分布
的n个随机变量)
χ^2分布
1. 典型模式:随机变量平方的和服从自由度为n的卡方分布,即χ^2~χ^2(n);
2. 性质:期望和方差为n和2n;可加性;
3. 分位点:上α分位点即,随机变量取到大于该值的概率为α;
2. 性质:期望和方差为n和2n;可加性;
3. 分位点:上α分位点即,随机变量取到大于该值的概率为α;
t分布
1. 典型模式:X服从正态分布,Y服从自由度为n的卡方分布,则X处于根号下Y除以n服从t分布,t~t(n);
2. 性质:概率密度函数是偶函数;t分布以标准正态分布为其极限分布;t^2~F(1, n);
3. 分位点:上α分位点即,随机变量取到大于该值的概率为α;
2. 性质:概率密度函数是偶函数;t分布以标准正态分布为其极限分布;t^2~F(1, n);
3. 分位点:上α分位点即,随机变量取到大于该值的概率为α;
F分布
1. 典型模式:X,Y分别服从自由度为n1和n2的卡方分布,则X除以n1比Y除以n2服从F分布,即F~(n1, n2);
2. 性质:如果F~(n1, n2),则1/F~(n2, n1);F[1-α](n1, n2) = 1 / Fα(n2, n1);
3. 分位点:上α分位点即,随机变量取到大于该值的概率为α;
2. 性质:如果F~(n1, n2),则1/F~(n2, n1);F[1-α](n1, n2) = 1 / Fα(n2, n1);
3. 分位点:上α分位点即,随机变量取到大于该值的概率为α;
正态总体的样本均值
和样本方差的分布
和样本方差的分布
单个正态总体
样本均值和样本方差的独立性以及分布
两个正态总体
样本均值差与样本方差比的抽样分布
X(n)=max(X1, X2, ... , Xn) 和
X(n)=min(X1, X2, ... Xn)的分布
X(n)=min(X1, X2, ... Xn)的分布
Fmax(x)=P{max(X1, X2, ... ,Xn) ≤ x} = [F(x)]^n
Fmin(x)=P{min(X1, X2, ... ,Xn) ≤ x} = 1 - [1 - F(x)]^n
Fmin(x)=P{min(X1, X2, ... ,Xn) ≤ x} = 1 - [1 - F(x)]^n
常用统计量
(样本矩)
(样本矩)
样本均值、样本方差、样本标准差、样本k阶原点矩,样本k阶中心距
1. 样本均值的期望等于总体的期望;
2. 样本均值的方差等于总体的方差除以样本容量;
3. 样本方差的均值等于总体的方差;
2. 样本均值的方差等于总体的方差除以样本容量;
3. 样本方差的均值等于总体的方差;
参数估计
点估计
(求估计量)
(求估计量)
基本概念
估计量、估计值
方法
1. 矩估计法:样本矩=总体矩求解
2. 极大似然估计法:样本似然函数求极大值(具有不变性)
2. 极大似然估计法:样本似然函数求极大值(具有不变性)
评选标准
1. 无偏性:估计值的期望等于真值;
2. 有效性:估计值的方差更小,更有效;
3. 一致性(相合性):估计值依概率收敛于真值,称为一致估计量(相合估计量);
2. 有效性:估计值的方差更小,更有效;
3. 一致性(相合性):估计值依概率收敛于真值,称为一致估计量(相合估计量);
区间估计
(求置信区间)
(求置信区间)
基本概念
置信水平1-α,显著性水平α,单(双)侧置信区间
基本步骤
构造含样本以及未知参数的分布已知的随机变量
正态总体均值(或均值差)、方差(或方差比)
及与其相联系的数字特征的置信区间
及与其相联系的数字特征的置信区间
确定合适的枢纽量
假设检验
基本概念
假设检验问题与检验法、原假设与备择假设、检验统计量、拒绝域和临界点
检验的基本思想和原理
显著性水平:α;
只控制犯第一类错误,而不考虑犯第二类错误的概率的检验法,称为显著性检验。
只控制犯第一类错误,而不考虑犯第二类错误的概率的检验法,称为显著性检验。
两类错误
去真(第一类错误),取伪(第二类错误)
检验的一般步骤
1. 提出H0,H1;
2. 选择统计量,在H0成立下求出分布;
3. 给定α,在H0成立下确定临界值和否定域;
4. 由样本值计算统计量的值,若落入否定域,则拒绝,反之接受。
2. 选择统计量,在H0成立下求出分布;
3. 给定α,在H0成立下确定临界值和否定域;
4. 由样本值计算统计量的值,若落入否定域,则拒绝,反之接受。
参数检验
单个正态总体
期望μ、方差σ^2的检验
两个正态总体
期望μ1,μ2、方差σ1^2,σ2^2的检验
0 条评论
下一页