非参
2021-12-24 09:08:42 0 举报
AI智能生成
非参数检验
作者其他创作
大纲/内容
分类数据(变量之间的关联分析)
卡方独立性检验
适用条件
检验变量之间是否独立
公式
原理
假设:pij = pi.*p.j
卡方齐性检验
原理
强调列变量比例分布在各个区组之间是否一致
假设:pi1 = pir = pi.
自由主题
适用条件
公式
Fisher精确性检验
适用条件
原理
与brown-mood类似
也是列个2*2的表
但是表里面只是正常数据而已 不是大于中位数那些
但是表里面只是正常数据而已 不是大于中位数那些
计算公式&
统计量
统计量
记住区别brown——mood 他是根号n-1 这里是根号n
优缺点
Mantel-Haenszel检验
适用条件
需要分层的时候
比如不同医院;城市和农村
比如不同医院;城市和农村
原理
先按层计算差异,再将各层差异综合比较,从而做出综合判断
计算公式&
统计量
统计量
就是分别求层 最后加总再和卡方比较
优缺点
Ridit检验
适用条件
对某个抽象数进行测量
原理
取一个样本数多的组或将几组数据汇总成参照组 根据参照组的样本结构
将原来各组响应数变换为参照得分,利用ridit得分进行各处理之间强弱的公平比较
将原来各组响应数变换为参照得分,利用ridit得分进行各处理之间强弱的公平比较
使用的是累积概率得分表示各顺序真实的强弱顺序
注意假设:H0:A1,A2....Ar之间没有强弱顺序
H1:至少存在一对Ai,Aj使得Ai!=Aj
H1:至少存在一对Ai,Aj使得Ai!=Aj
计算公式&
公式
公式
计算复杂大概率不考
优缺点
定量or定序的样本的关联分析
Sperman秩相关检验
适用条件
可用于非线性;不需要正态假定;不受均值(极端值)影响
两变量
原理
分别算出x和y的秩,如果x,y具有同步性,则它们的秩也会有同步性
公式
n是x或者y的个数 反正它们一一对应都一样 R是x的秩 Q是y的秩
原始公式:只是把x和y换成它们对应的秩还有秩平均
和pearson的区别
Pearson需要正态假定还有系数基于均值易受极端值影响
公式
kendall t检验
适用条件
两变量
原理
从变量协同的角度说明是否相关
使用数对(x,y)的乘积判断
对x先排序 但是求Nc和Nd的时候看的是y的秩 比当时位置y大的个数就是Nc;比他小的就是Nd
计算公式
其实算t的时候就知道它们的关系了;还要算Z是为了保障显著,就是检验可靠性的意味
子主题
多变量Kendall协和系数检验
适用条件
多变量
判断几个变量之间是否存在相关关系
原理
H0假定下各变量之间没有相关性;
所以是按变量(区组)排序的!!!
所以是按变量(区组)排序的!!!
然后对每个处理(标题行不是变量的)求秩和
后计算协同系数w(0~1)
公式
k是变量个数!!!!
公式全都记一记 到时候看数据来用
子主题
Kappa一致性检验
适用条件
对同一对象进行多组/不同方法的评判
评分是分类或者顺序变量
原理
注意假设:H0两个方法不一致
H1两个方法一致
H1两个方法一致
实际期望p0 一致性期望pe
算出K之后还要算Z来保障不显著来确保有效性
公式
简单来说就是p0是对角线元素相加
其他的是除了对角线元素外对应元素相乘之和
检验是否显著!!!
不解的点
kappa和M-H检验的区别是?kappa不也可以分层吗?
不同的方法不同的医生不也是分层吗???
不同的方法不同的医生不也是分层吗???
题型
选择5*2'
填空5*2’
简答4*5'
计算4*15'
非参检验和参数检验的区别
参数
对分布有假定
针对参数做的假设
只能用于等距数据和比例数据
数检验要利用到总体的信息(总体分布、总体的一些参数特征如方差)
,以总体分布和样本信息对总体参数作出推断
,以总体分布和样本信息对总体参数作出推断
非参数
对分布无假定
针对总体分布情况做的假设
主要用于记数数据。也可用于等距和比例数据,但精确性就会降低。
不需要利用总体的信息(总体分布、总体的一些参数特征如方差),
以样本信息对总体分布作出推断
以样本信息对总体分布作出推断
单一样本检验
中心位置推断
符号检验
符号检验
使用条件
思想
中位数!!! 大于中位数s+;小于中位数s-
一定要注意双侧or单侧!!!
只考虑了方向
计算公式
or统计量
or统计量
一般算p值
大样本近似
一定要记得修正!!!!
coxstaut趋势检验
使用条件
思想
直接考虑趋势问题,考虑生成一些数对,数对的间隔相同,数对的间隔c由样本量n决定
计算公式or
统计量
统计量
算到c后 算d = 前面的数-后面的数
然后s+为正的数目;s-为负的数目
之后算法和符号检验同 算p
然后s+为正的数目;s-为负的数目
之后算法和符号检验同 算p
大样本
与符号检验一致 该修正的时候记得一定要修正
游程检验
适用条件
0/1二元序列 检验是否随机or是否与顺序无关
思想
若0/1出现规律性不强则为随机性;不可忽略序列长度和0/1个数,因此有R游程长度
计算公式or
统计量
统计量
因为不能太分散and太密集 所以一定是双边检验!!!!
小样本:直接查表
大样本
记公式!!!!!n1+n0=n
也可以检验两样本问题 两样本是否有随机
两个样本混合排好秩
然后定义:如样本一全为1 样本二全为0
分位数检验
将符号检验的中位数(样本分位数为0.5)换成样本的分位数 就是分位数检验
秩和检验
wilcoxon符号秩检验
适用条件
检验对称中心!!!但要要明白的是中位数!=对称中心
一定用的是中位数!!!(或许有坑他给了平均数)
一定用的是中位数!!!(或许有坑他给了平均数)
对称中心
左右两边数目相同
左右数据对称分布
思想
找到中位数之后,个数和他相减的绝对值排序(注意相同秩取平均值),然后用相减后但没取绝对值的正负来加总s+(正数的秩和)
考虑方向和大小(体现在秩和)
计算公式or
统计量
统计量
大样本
记得还是要修正!!!!w大于or小于Ew都修正(大于修正0.5;小于修正-0.5)
正态计分检验
只是把wilcoxon的秩和检验换成正态分位点检验
分布检验
卡方拟合优度检验
注意这是样本的卡方检验 后面第五章是变量的卡方检验
适用条件
样本
思想
实际值(频数)与期望值(频数)的平方除以期望值,
统计量
不足缺点
只能检验离散数据 或者把连续数据化成离散数据再检验(这样做精度不高)
K-S正态性检验
连续型数据的检验
适用条件
思想
算出经验分布,并且和理论分布作差,最大的距离如果通过检验 则说明通过(查表的)
统计量
D = max|Fn(x)-F(x)|
不足
lilefor正态性检验
KS检验的拓展
拓展的地方在于用样本均值和样本方差代替总体的~
两样本检验
位置检验
Brown-mood
适用条件
思想
符号检验的两样本推广
只检验方向
混合秩排序 后与混合之后的中位数比较
计算公式or
统计量
统计量
精确分布的话算p值
算p的时候用超几何分布
不懂得点
一般还是算大样本吧
大样本
Mann-whitney检验
适用条件
样本独立
数据至少为定序的
两样本有类似的分布
不一定对称
思想
wilcoxon检验的两样本推广
方向+大小
也是混合秩
计算公式or
统计量
统计量
算Wy的时候要注意
这个公式有点怪 做练习的时候先按单样本Wilcoxon那样先把+的(>中位数的)加起来
记得这个Wy要算多几遍 多做一些习题
大样本
尺度检验
Mood
适用条件
两样本的均值相等
思想
构造出M统计量 是秩与秩的期望的平方加总
类似方差
混合秩
计算公式
or统计量
or统计量
样本量m+n<30的时候考虑修正
子主题
Mose
适用条件
没有限制
思想
随机分组
分组原则:每组里面的观测值要相同
组数可以不同
组数可以不同
求每组的离差平方和
这一步方差的思想体现出来
将求出来的离差平方和混合求秩
每组样本(设第一组有m1样本)分别求在混合秩里面的和S
再计算TM =S-[m1(m1+1)]/2
再计算TM =S-[m1(m1+1)]/2
相当于对离差平方和做W-M-W检验
计算公式or
统计量
统计量
子主题
多组样本数据位置推断
完全随机设计CRD
单因素方差分析
K-W检验
(H检验)
(H检验)
适用条件
数据分布连续
分布相似
原理
混合排秩 然后按各自样本组求和
若差异过大 则两组数据中心样本位置差异大
计算公式&
统计量
统计量
优缺点
Dunn两比较检验
适用条件
拒绝K-W检验后要知道是哪两个总体位置差异大
原理
两组样品的平均秩相减的绝对值/两组样本的标准误SE
计算公式&
统计量
统计量
Dij~N(0,1) 但α* = α/n(n-1)
子主题
J-T检验(趋势问题)
适用条件
如果可以先判断趋势的 就直接用J-T检验不用K-S
原理
两样本wilcoxon的推广
计算公式&
统计量
统计量
完全随机区组设计CBD
(加入了实验材料的异质性)
(加入了实验材料的异质性)
Friedman秩方差检验
适用条件
原理
区组间排序
区组间不具有可比性
公式
b是区组 k是处理
求的是处理的秩和 因为区组内排序,区组的秩和是一致的
记住统计量
优缺点
Hollander-Wolfe检验
适用条件
当Friedman拒绝时 要知道是哪两个总体有差异时用
原理
和Dunn类似
计算公式&
统计量
统计量
方差公式一定要记得!!!
Dij~N(0,1) 但α* = α/n(n-1)
子主题
随机区组的调整秩和检验(H-L检验)
适用条件
区组数很大处理很小的时候
b>2k
b>2k
原理
去除区组效应
用区组的均值或者中位数作为区组效应的估计值
后用观测值和估计值相减来反映差异
化成无区组情况的时候就用回K-S检验
后用观测值和估计值相减来反映差异
化成无区组情况的时候就用回K-S检验
公式
优缺点
Cochran检验
适用条件
处理0/1等二元数据
原理
利用和计算 不排序了
且因为样本是二项分布 所以样本的处理组和为二项分布
公式
这个公式里面 列和是处理 行和是区组
优缺点
均衡不完全随机区组设计
Durbin检验
适用条件
适用于列联表里面出现缺失数据
原理
k是处理 但r是列联表里面除了缺失剩下来的处理数(每行/列)
b是区组 但t是列联表里面除了缺失剩下来的区组数(每行/列)
b是区组 但t是列联表里面除了缺失剩下来的区组数(每行/列)
计算的时候是按处理求秩和
公式
优缺点
人生目标
人生愿景\目标
记住!要去头部券商工作!!
卡方齐性和卡方独立性的缺点是:
观测数不能很少
观测数不能很少
0 条评论
下一页