概率论与数理统计
2021-06-18 14:51:55 6 举报
AI智能生成
根据22考研全书编写,带公式
作者其他创作
大纲/内容
一,随机事件和概率
I.随机事件,事件的关系和运算
随机事件
重复进行;结果可知且不唯一;结果无法预知
事件关系
相等
A=B
包含(A发生B必然发生)
Subtopic
互斥(互不相容)
AB=ø
对立
A∪B=Ω,A∩B=ø
事件运算
并/和
A∪B或A+B
交/积
A∩B或AB
差
A-B
非/bar
Subtopic
事件的运算规律
Subtopic
Subtopic
Subtopic
Subtopic
Subtopic
II.概率及概率公式
概率
定义
概率性质
Subtopic
条件概率
Subtopic
事件A发生下事件B发生的概率
独立性
两个事件
P(AB)=P(A)P(B)
三个事件
P(AB)=p(A)P(B)
P(AC)=p(A)P(C)
P(BC)=p(B)P(C)
P(ABC)=p(A)P(B)P(C)
五大公式
加法公式:P(A∪B)=P(A)+P(B)-P(AB)
P(A∪B∪C)=P(A)+P(B)+P(C)
-p(AB)-P(AC)-P(BC)-P(ABC)
减法公式:P(A-B)=P(A)-P(AB)
乘法公式:若P(A)>0,P(AB)=P(A)P(A|B)
完备事件组:B₁,B₂…满足
全概率公式:对于完备事件组,若有
贝叶斯公式:对于完备事件组,若有
III.古典概型&伯努利概型
古典概型:P(A)=A中样本数/样本总数
伯努利概型
伯努利实验:每次实验只用两个结果:A和Ã,进行n次为n伯努利实验
二项概率公式:n重伯努利实验发生k次概率为:
二,随机变量及概率分布
I.随机变量及其分布函数
定义
在样本空间Ω上的实质函数X=X(ω),ω∈Ω,称X(ω)为随机变量
离散型随机变量
取值为有线多个或者无穷可数个
概率分布/分布律
分布函数
对任意实数x,X的分布函数:F(x)=P{X≤x},-∞<x<+∞
性质
F单调不降,右连续
P(X=x)=F(x)-F(x-0)
Subtopic
其它
0≤F(x)≤1
P(x₁<X≤x₂)=F(x₂)-F(x₁)
连续型随机变量
概率密度:f(x),要求非负可积
分布函数:
性质
F(x)连续
F(x)单调不减,因为F'(x)=f(x)≥0
Subtopic
常用分布
0-1分布
可看成单次伯努利实验
X~B(n,p)二项分布
可看成多次伯努利实验
几何分布
则称X为服从参数p的几何分布
超几何分布
则称X为服从参数n,N,M的超几何分布
X~P(λ)泊松分布
k=0,1,2…;常数λ>0
泊松定理
若n↑会导致p↓,则
X~U(a,b)均匀分布
区间(a,b),则X~U(a,b)
Subtopic
区间[a,b],则X~U[a,b]
Subtopic
Subtopic
性质
Subtopic
落入[c,d]可能性为该区间长度与[a,b]的比例
X~E(λ)指数分布
Subtopic
Subtopic
性质:无记忆性
P{X>t}=P{X>t+s | X>s }=e^(-λt)
X~N(μ,σ²)正态分布
又叫高斯分布
Subtopic
Subtopic
标准正态分布:X~N(0,1)时,分布函数
正态分布标准化:
Φ(-x)=1-Φ(x),Φ(0)=1/2
性质
Subtopic
Subtopic
Subtopic
随机变量函数Y=g(x)的分布
离散型
Y也是离散型,此时只需要根据分布律写出P{Y=g(xk)}=pk
连续型
公式法
f=g(x)单调,导数不为0的可导函数,h(y)
为它的反函数,(α,β)为x可能区间上的值域
定义法
Subtopic
子主题
三,多维随机变量及其分布
二维随机变量及分布
二维随机变量
定义
性质
F(-∞,y)=F(x,-∞)=F(-∞,-∞)=0,F(+∞,+∞)=1
F(x,y)关于x,y单调不减右连续
P{a<X≤b,c<Y≤d}=F(b,d)+F(a,c)-F(b,c)-F(a,d)
概率分布/分布律:
边缘分布
Subtopic
条件分布
二维离散型
边缘分布:
对应j个元素的和
对应i个元素的和
条件分布:
二维连续型
定义
性质
(X,Y)落在D内的概率为
边缘密度
Subtopic
条件密度
f(x,y)在点(x,y)连续,fY(y)连续且fY(y)>0,则
随机变量的独立性
定义
F{x,y}=FX(x)FY(y)
充要条件
离散型:
连续型:
均匀和正态
二维均匀分布
定义:如果A为有界区域的面积,如果概率密度为
Subtopic
二维正态分布
概率密度
Subtopic
Subtopic
若xy无关
性质
Subtopic
X,Y相互独立的充分必要条件:ρ=0
Subtopic
Subtopic
两个随机变量Z=g(X,Y)的分布
X,Y均离散
X,Y均连续
Subtopic
X离散,Y连续
把X用全概率公式展开
Subtopic
Z=max{X,Y}
等价于X和Y都不大于z
分支主题
Z=min{X,Y}
等价于X和Y都不小于z
Subtopic
四,随机变量的数字特征
数学期望与方差
E(X)
离散型
Subtopic
连续型
Subtopic
性质
E(C)=C
E(CX)=CE(X)
E(X±Y)=E(X)±E(Y)
如XY独立,E(XY)=E(X)E(Y)
随机变量函数
Y=g(X)
离散
Subtopic
连续
Subtopic
Z=g(X,Y)
离散
Subtopic
连续
Subtopic
D(X)
Subtopic
Subtopic
标准差
性质
D(C)=0
D(aX+b)=a²D(X)
XY相互独立,D(X±Y)=D(X)+D(Y)
常见
X~B(n,p)二项分布
E(X)=np
D(X)=np(1-p)
X~P(λ)泊松分布
E(X)=λ
D(X)=λ
X~U(a,b)均匀分布
E(X)=(a+b)/2
D(X)=(b-a)²/12
X~E(λ)指数分布
E(X)=1/λ
D(X)=1/λ²
X~N(μ,σ²)正态分布
E(X)=μ
D(X)=σ²
矩协方差和相关系数
矩
k阶原点矩
E(X^k)
k阶中心矩
E{[X-E(X)]^k}
k+l阶混合矩
Subtopic
k+l阶混合中心矩
Subtopic
cov(X,Y)-协方差
cov(X,Y)=E{[X-E(X)][Y-E(Y)]}
性质
展开形式:cov(X,Y)==E(XY)-E(X)E(Y)
D(X±Y)=D(X)+D(Y)±2cov(X,Y)
cov(X,Y)=cov(Y,X)
cov(aX,bY)=abcov(X,Y)
cov(X₁+X₂,Y)=cov(X₁,Y)+cov(X₂,Y)
相关系数
Subtopic
如果D(X)D(Y)=0则
性质
Subtopic
Subtopic
独立与不相关
独立→不相关,反之不成立
对二维正态(X,Y),相互独立,不相关,ρ=0三者互为充要条件
五,大数定理和中心极限定理
切尔雪夫不等式
E(X),D(X)存在,对任意ε>0,有
依概率收敛
X₁,X₂…为随机变量序列,A为常数,若对任意ε>0有
切尔雪夫大数定理
X₁,X₂…两两不相关,方差收敛于常数,则对任意ε>0
Subtopic
伯努利大数定理
X~B(n,p),n=1,2…,对于任意ε>0
辛钦大数定理
X₁,X₂…独立同分布,期望E(X)=μ,则对任意ε>0
Subtopic
拉普拉斯中心极限定理
X~B(n,p),n=1,2…,对于任意X有
Subtopic
林德伯格中心极限定理
X₁,X₂…独立同分布,期望E(X)=μ,D(X)=σ²,则对任意实数x有
近似看做
六,数理统计的基本概念
基本知识
总体
总体
随机变量
总体分布
X的概率分布
总体数字特征
X数字特征
个体
总体中的每个元素
样本
简单随机样本(样本)
X1,X2…Xn独立同分布
样本容量
n
样本值(观测值)
x1,x2,…xn
统计量
样本均值
样本方差
其他
标准差S
k阶原点矩
k阶中心矩
性质
E(X拔)=E(X)=μ
D(X拔)=D(X)/n=σ²/n
E(S²)=D(X)=σ²
以概率分布
*数学三*
经验分布函数
30+年未考
常用抽样分布
χ²分布(χ²~χ²(n))
读作卡方分布
X₁,X₂,…,Xn相互独立服从N(0,1),记作χ²~χ²(n)(典型模式)
性质
E(χ²)=n,D(χ²)=2n
χ₁²~χ²(n₁),χ₂²~χ²(n₂),χ₁²与χ₂²相互独立,χ₁²+χ₂²~χ²(n₁+n₂)
α分位点
t分布(T~t(n))
X和Y相互独立,X~N(0,1),Y~χ(n²),记作T~t(n))(典型模式)
性质
t分布概率密度是偶函数
n很大时近似N(0,1)
偶函数t1-α(n)=-tα(n)
α分位点
F分布(F~F(n₁,n₂))
X和Y相互独立,X~χ²(n₁),Y~χ²(n₂),记作F~F(n₁,n₂)
正态总体抽样分布
一个正态总体
X~N(μ,σ²),X₁,X₂~Xn是来自总体的样本,样本均值为
Subtopic
X拔与S²独立,且
Subtopic
Subtopic
两个正态总体
X~N(μ₁,σ₁²)和Y~N(μ₂,σ₂²),X₁,X₂…Xn和Y₁,Y₂…Yn来自X和Y且相互独立,
样本均值分别为X拔和Y拔,样本方差为S₁²和S₂²
Subtopic
σ₁²=σ₂²,则
Subtopic
Subtopic
七,参数估计
点估计
点估计
用样本X₁,X₂…Xn构造的估计量θ帽(X₁,X₂…Xn)
来估计参数θ称为点估计
估计量
θ帽(X₁,X₂…Xn)
估计值:估计量取得的值
无偏性
如果E(θ帽)=θ,称θ帽是θ的无偏估计量。
有效性
如果θ₁帽和θ₂帽都是无偏估计量,且D(θ₁帽)≤D(θ₂帽),
则称θ₁帽比θ₂帽更有效,或者是它的更有效估计量
一致性
如果θ帽依概率收敛于θ,则称θ帽是θ的一致估计量
估计量的求法
和区间估计
矩估计法
Subtopic
此为l 阶矩估计,常用1阶矩估计
一阶无参数再上升到2阶
最大似然估计法
Subtopic
一阶求导
二阶求偏导
提示:通过求导不一定能求出θ的具体值,此时需要进一步判定
若导数大于0,说明单调递增,取θ能取到的最大值
若导数小于0,说明单调递减,取θ能取到的最小值
区间估计
置信区间P{θ₁<θ<θ₂}=1-α
称随机区间(θ₁,θ₂)为参数θ的置信水平为1-α的置信区间
区间下限:θ₁
区间上限:θ₂
置信水平(置信度):1-α
区间包含参数的概率
一个正态的区间估计
求μ
已知σ²
Subtopic
已知σ²
Subtopic
求σ²
未知μ
Subtopic
已知μ
Subtopic
二个正态的区间估计
几乎不考
八,假设检验
*数学一*
假设
基本假设H0
可以加上备选假设
两类错误
第一类错误(弃真)
拒绝真实的假设
第二类错误(纳假)
接受不真的假设
假设检验
根据样本辨别H0的真伪,
做出拒绝或者接受的决定
显著性检验
显著性水平(检验水平)
犯第一类错误的概率α
表现对第一类错误的控制程度
值越小表示控制越好
显著性检验
只控制第一类错误概率α的检验
解题步骤检验步骤
提出假设H0或者
确定统计量U
确定拒绝域
代入T到置信范围
拒绝域
单测检验(例如H0:λ<40;H1λ≥40)
拒绝域为α/2
双侧检验(例如H0:λ=40;H1:λ≠40)
拒绝域为α
临界点:拒绝域的边界
一个正态的区间检验
求μ
已知σ²
统计量
已知σ²
Subtopic
求σ²
未知μ
Subtopic
已知μ
Subtopic
二个正态的区间检验
几乎不考
注意大纲规定与部分教材的区别
概率分布F(x)=P(X≤x)
有的书本是X<x
指数分布
有的书本可能是1/λ
样本方差
有的书本可能是1/n
0 条评论
下一页