卡方检验/属性统计方法/百分比检验列联表分析/交叉表分析
2019-05-15 18:30:24 16 举报
AI智能生成
卡方检验,北师大第三版
作者其他创作
大纲/内容
配合度检验
检验单一变量的实际观测次数分布与某理论次数是否有差别,总体分布是否与某种分布相符合
统计假设
研究假设
实际观测数与某理论次数之间差异显著
虚无假设
实际观测数与理论次数之间无差异或相等
表示
公式
自由度
影响因素
1.分类项数
2.统计量个数
分类或分组项数减去统计量个数
通常情况下,只用“总数”这一统计量,故为分类项减一。
检验计量数据时(拟合优度检验),用到三个统计量,分组数目减3
应用
检验无差假说
指各项分类的实际数之间没有差异,假设各项分类之间的机会相等,概率相等
因此理论次数按概率相等的条件计算。即理论次数=总数/分类项数
检验假设分布的概率
资料正态分布的理论次数按正态分布概率,其他分布按各假定的分布计算。
连续变量分布的拟合性检验(吻合性检验/分布你和检验)
将测量数据整理成次数分布表,画出次数分布曲线图,根据次数分布曲线,判断选择恰当的理论分布
或选择某一直线或曲线的理论分布函数方程式计算理论次数
比率/百分数的配合度检验
最后将计算的卡方值乘以N/100后再查卡方表
二项分布
当np>5时公式
将实计数换算成比率
不用比率则用实计数
实计数与比率的关系
连续性校正
期望次数小于5时,比例的显著性检验不能用正态近似而应用二项分布概率计算
两项分类的配合度检验应使用连续性校正公式计算,概率值接近显著性水平时,用二项分布计算的结果更准确
三项或以上分类时某一单元格理论次数小于5,用基本公式计算
独立性检验/双因子检验/双母总体检验/列联表分析
两个或两个以上因素多项分类的计数资料,研究两类变量之间的关联性和依存性问题
因素多于两个以上为多维列联表
一般问题与步骤
统计假设
虚无假设是二因素或多因素之间是独立的或无关联,备择假设是二因素或多因素之间有关联或差异显著,一般多用文字叙述很少用统计符号
理论次数的计算
用列联表推算出来,可用概率解释
二因素或两样本其各行或各列数目的和,即每一项分类的数目与总数的比值,为比率
公式
自由度
两因素为(R-1)*(C-1)
统计方法
独立样本
基本公式
不用理论次数的基本公式
结果解释
卡方小于表,接受原假设,认为无关联,相互独立的差异不显著
卡方大于表,拒绝虚无假设,有关联,不独立,差异显著
四格表独立性检验
独立样本四格表
各单元理论次数大于等于5
基本公式或简捷公式
任意一格理论次数小于5
用连续矫正公式
允许四格中有一格的实际次数出现0
费舍精确概率检验法
求双侧概率须乘以2
相关样本四格表
检验公式
R*C表独立性检验
基本公式
允许有的格实计数为0,最小的理论次数为0.5,其中2*C表的最小理论次数为1
如果最小理论次数小于0.5或1,采用合并项目的方法,不用连续校正公式
多重列联表分析
将其中一个变量作为分层变量或控制变量,分别就控制变量每一个水平下另两个变量所形成的列联表进行比较分析
同质性检验与数据合并
分析几种因素之间是否有实质上的差异,判断几次重复实验结果是否同质
对两个样本同一个变量的分布状况的检验
对两个样本同一个变量的分布状况的检验
双总体指的是两个样本代表的母总体,自变量是研究者操纵的变量,即设计变量,因变量则为反应变量
单因素分类数据
步骤
列联表形式的同质性检验
与前面方法相同
计数数据的合并方法
两格及四格数据的合并
1.简单合并法
条件
比率接近,小样本齐性
2.卡方相加法
反应不灵敏,对相同比率方向的各分表分辨力较差
3.X值相加法
条件
方法
4.加权法
条件
方法
5.分表理论次数合并法
使问题复杂化
R*C数据的合并
1.简单合并法
要求比率接近且各样本齐性
2.分表理论次数合并法
将分表的理论次数相加为总表的理论次数,实计数合并为总表的实计数,而不是总表计算
对象
计数数据
处理一个因素两项或多项分类的实际观察频数与
理论频数分布是否一致,有无显著性差异
理论频数分布是否一致,有无显著性差异
实际频数/观察频数
实际数/实计数
得到的计数资料
理论次数/期望次数
根据概念原理、某种理论次数分布或经验次数分布计算除的次数
假设
1.分类相互排斥,互不相容
2.观测值相互独立
3.期望次数的大小
每个单元格中的期望次数至少5个以上,分类不超过20%类别的
理论次数可以小于5,理论次数较小的特殊四个表中应运用多项检验
理论次数可以小于5,理论次数较小的特殊四个表中应运用多项检验
人数过少时处理方法
第一,单元格合并法
第二,增加样本数
第三,去除样本法
第四,使用矫正公式
p296
类别
配合度检验/无差假说检验
检验一个因素多项分类的实际观察数与某理论次数是否接近
对连续数据正态性进行检验时,称为正态吻合性检验
独立性检验
检验两个或两个以上因素各种分类之间是否有关联或是否具有独立性的问题
三个变量时使用多维列联表分析
同质性检验
检定不同人群母总体在某一个变量的反应是否有显著性差异
没有差异母总体同质,有差异异质
基本公式
样本观测次数或百分比与理论或总体次数的差异性
实际观测次数与某理论次数之差的平方和再除以理论次数,理论次数越大,接近的越好
一旦卡方值大于某一临界值,即显著,可以查表获得。
期望次数的计算
期望次数是虚无假设成立时的数值
独立性检验和同质性检验中,两个变量样本无关联时,期望值为列联表中个单元格的理论次数,即两个边缘次数的积除以总次数
取样注意出现有偏样本
相关源分析
2*C的离析
分解为独立的2*2表
步骤
分解为非独立的2*2表
R*C的离析
1.对认为差异不显著的两个项目分解出一个表,进行卡方检验,不显著就合并,
在与另一项组成新的分解表,直到新的分解表显著
在与另一项组成新的分解表,直到新的分解表显著
2.显著后分解为四格表进行分析
0 条评论
下一页