chapter4统计推断基础
2019-05-22 09:49:45 1 举报
AI智能生成
数理统计 Hogg
作者其他创作
大纲/内容
估计量E
参数估计量
无偏估计量
极大似然估计量
非参数估计量
定义<br>
不跟X的分布形式有关,所阐述的直方图称为非参数估计量
应用
pmf的直方图估计
空间有限
空间无限
划分规则为最后一组Am的频数为之后所有的频数之和的2倍
pdf的直方图估计
给定h,求落入到两侧内的总数占比
置信区间CI
定义
置信区间
置信系数
置信系数CC:区间包含θ的概率,即1-α
测量效率
CC of CI一致时,比较CI的期望长度,作为置信区间的测量效率
应用
正态分布
特性:样本量不限,可以使用正态分布或者T分布(更为保守)作为中枢变量
均值CI
σ已知用正太;σ未知用s近似后,t分布;
均值之差CI
方差已知,或样本量大:做随机变量差的正态分布,之后同上
方差未知(但方差之间满足一定比例的关系)且样本量小:
学生T分布<br>
4.2.23;4.2.24;4.2.25
方差CI
均值未知:学生定理(c),卡方分布作中枢 变量<br>
4.2.18(b)
均值以知:正态分布;或者卡方n分布
4.2.18(c)
方差商CI<br>
4个参数均未知<br>
构造F分布
4.2.27
非正态分布
特性:大样本,分布不限(CLT)<br>
比例p的置信区间
伯努利分布,用CLT近似,最后用p(hat)代替p
4.2.20
比例之差的置信区间
置信区间
gamma分布β的置信区间
服从卡方(6n)分布
顺序统计量OS<br>
分布(只适用于连续型随机变量)
联合分布
<br>
边际分布<br>
<br>
二元联合分布
<br>
理解
采用分块的思想
衍生定义
极差
Yn-Y1
中程数
(Y1+Yn)/2
中位数
Y(n+1)/2
分位数<br>
定义
X的P分位数为
k=[n+1]P,Yk 为εp的点估计
称Yk为样本P分位数点,或者称为样本100P百分位数<br>
应用
样本五数概括法
Y1, Q1, Q2, Q3, Yn
box and whisker<br>
<br>
要素
Q1, Q3, Q2, UF , LF
上下围栏 UF,LF:h=1.5*(Q3-Q1),UF=Q3+h,LF=Q1-h
离群值outlier
潜在离群值(围栏外面的点)
4.4.2 分布的潜在离群值<br>
离群值(2h之外i的点)
qq图
分位数的置信区间
考察i < [n+1]P < j, 及事件 Yi < ep <Yj<br>
(4.4.6)<br>
理解
其实是一个二项分布如果计εp左边为成功,那么成功的概率为p,失败的概率为1-p
Yi,Yj的意思是说,成功的个数不少于i个,失败的个数不少于(n-j+1)个。也即成功的个数介于i到j-1个之间
特殊应用
习题4.1.19、20
X,Y两个分布,求U=min{X,Y},V=max{X,Y}的联合分布<br>
习题4.4.25
P(Yi<εp<Yj)的计算转换的问题<br>
假设检验HT
定义
假设
H0:Null Hypothesis<br>
H1:Alternative Hypothesis<br>
simple hypothesis<br>
composite hypothesis<br>
双边检验
两类错误<br>
type 1 Error
H0成立,拒绝H0
type 2 Error <br>
H1成立,接受H0
一般来说,type1 错误更糟糕,所以是在保持type1的时候对type2 做修订
临界区域CR<br>
定义:随机样本函数属于C,拒绝H0;随机样本函数不属于C,接受H0
理解
CR可以视作一种直观的Decision Rule<br>
区域C的α-size
在H0成立的情况下,样本落入拒绝域的概率最大值
定义
或称为临界区与有关的显著性水平 significance level(检验显著化水平)
所以decision rule的构建 都与α有直接关系
功效函数(势)Power function<br>
定义
在满足α-size一样的情况下,使得第二类错误的概率最小,即功效函数最大化
p-value(观察显著化水平)
H0成立时的观察的‘尾’概率
p-value就是用来判断H0假设是否成立的依据。
应用<br>
二项成功比例检验<br>
例4.5.2
大样本均值检验
例4.5.3
正态μ检验(σ未知)
例4.5.4
大样本均值μ的双边检验
例 4.6.1、3
绝对拒绝规则
p-value
4.6.7
4.6.5
Chi-square 检验
定义
Qk-1 近似趋近于 卡方k-1(证明无需掌握)
证明过程运用到CLT
拟合优度检验(Goodness of fit test)
CR: Qk-1 > c时,拒绝H0,其中c由显著化水平决定
理解
依据总体分布状况,计算出分类变量中各类别的期望频数,与分布的观察频数进行对比,判断期望与观察频数是否有显著差异
练习题4.7.1,2,3,4
应用
齐性卡方检验
适用条件:对两个多项式分布是否相同进行检验
估计量, 服从卡方(k-1)
理解
分布是否相同,即同一指标下,两个分布的方差不能太大
练习题4.7.5
列联表问题
适用条件:对两组属性的独立性进行检验
估计量, 服从卡方[(a-1)(b-1)]
理解
0 条评论
下一页
为你推荐
查看更多