【高级心理统计与测量】
2019-04-08 15:52:20 2 举报
AI智能生成
心理统计与测量
作者其他创作
大纲/内容
心理统计与测量
一、常见数据特点与初步整理
特点
1.随机性与变异性
2.离散型
3.规律性
分类
数据的分类是选择统计分析方法的重要前提
1
计数数据
计算个数的数据,班级数/人数等,不连续、非负整数
测量数据
指借助于一定测量工具或依据一定测量标准所获得的数据;如身高/体重/时间/考试分数等
2
离散数据
离散数据是指其数值只能用自然数或整数单位计算,只能按计量单位数计数,这种数据的数值一般用计数方法取得。
连续数据
指在一定区间内可以任意取值、数值是连续不断的、相邻两个数值可作无限分割(即可取无限个数值)的数据。
3量表水平不同
称名数据
只能标示一事物与其他事物在属性上的不同或类别上的差异。例如用0、1表示男女
顺序数据
也叫等级数据。如班级成绩排名。对顺序数据可以排序,但不能进行加减乘除。
等距数据
它具有相等的单位,但没依旧绝对的零点。如温度。可以进行加减,但不能进行乘除。
等比数据
有相等的单位,也有绝对的零点。如身高、体重、反应时。可以进行加减乘除。
通过心理测量获得的大多数据(如智力、能力倾向、人格测验的分数)都是等级数据
测量数据的整理
测量数据的分类是将连续数整理成次数分布表,主要是依数值大小将数据排序,并列成次数分别表,标出相应次数
制作次数分布表
(1)求全距
全距
(2)确定组数K
一般10~20组,常取12~16组,公式:K=1.87 x(N-1)2/5
(3)求组距I
组距(i)
i=全距/K,取近似整数值
(4)确定分组的精确上、下限
(5)登记次数
(6)标出组中值
组中值
次数分布图
直方图
以矩形的面积表示连续性随机变量的次数分布
折线图,即次数多边形
柱状图(条形图)和直方图有何区别?
数据的描述
集中量数(集中趋势)
算术平均数
定义
是反映一组数据分布集中趋势的量数,它等于所有数据之和除以数据的个数。算数平均数为应用最普遍的一种集中量数,由各单位数值之和除以单位数目而成。
优点
反应灵敏,计算简便,较少受抽样变动的影响。
缺点
当出现数据性质不同或者包含极端数据或者数据模糊不清时,应避免采用。
条件要求
数据同质性(相同测量工具获得的数据)、数据取值必须明确、数据的离散程度不易过大
中数
如果一组数据中有重复数值,如何确定其中数?(举例说明)
重复数据位于中间
重复数据不位于中间
几何平均数
众数(适用条件)
众数可以通过观察的方法直接得到,也可用积分的方法求出。众数不够稳定,易受样本变动的影响,但较少受极端数据的影响,反应不灵敏。因此在有极端数据时,可以使用众数。
离散量数(离中趋势)
方差:是反映一组数据离散趋势的量数,它等于一组数据离差平方的平均数。
标准差
变异系数/差异系数(公式及应用)
平均差
四分差
数据一致性测量
相关系数
表示两列变量相关程度的数量指标。样本相关系数用r表示,总体相关系数用p表示。
相关的程度:完全相关【1/-1】、不完全相关【(-1~1)】、不相关【0】
相关方向:正相关(0~1]、负相关[-1~0)
解释时应注意
1)指标值,不是等距的测量值2)大小表明了相关程度,符号只表示方向的不同3)相关关系不是因果关系
各类相关系数
积差相关/皮尔逊相关
适用条件:两列变量为正态变量,且呈线性关系的测量资料。
具体来说,计算积差相关系数需满足条件:1)数据是成对的,且成对数据的数目不少于30对2)两列变量都是正态分布的变量3)两列变量之间的关系是线性的
等级相关
斯皮尔曼相关
适用于两列变量均为等级变量的呈线性相关的资料
肯德尔和谐系数
适用于k个评价者,评价n个事物的等级变量资料,多用于评分者信度分析
适用于等级变量的资料
点二列相关(适用条件)
适用于一列为正态变量的连续数据,另一列为二分名义变量的资料
二列相关
适用于两列变量都为正态变量,但其中一列变量被人为地分成两类资料。
二、数据的分布及总体参数的估计
数据的分布
正态分布
标准正态分布
均值=0,方差=1的正态分布
简述正态分布与标准正态分布的区别与联系。
联系:正态分布可以通过标准化处理,转化为标准正态分布。具体方法是使用 将原始数据转化为标准分数。
区别
正态分布的平均数为μ,标准差为σ;不同的正态分布可能有不同的μ值和d值,正态分布曲线形态因此不同。
标准正态分布平均数μ=0,标准差σ=1,μ和σ都是固定值;标准正态分布曲线形态固定。
正偏态分布
频数分布的高峰向左偏移,长尾向右侧延伸称;平均数>均值>众数
负偏态分布
频数分布的高峰向右偏移,长尾向左侧延伸称;平均数<均值<众数
以X=u为对称轴的对称曲线;钟形
X左右一个标准差范围面积0.6826;2个标准差~0.95;3个标准差0.99
众数=中数=均值
二项分布(其平均数与标准差的意义)
两个对立事件的概率分布
抽样分析
总体
样本
统计量
总体参数的估计原理
即:样本统计量的抽样分布
样本平均数的分布
概念:从正态分布的总体中可无限抽取大小为n的样本,这无限多个样本的平均数的分布
标准误:样本平均数的标准差
总体分部是正态分布或近似正态分布,总体方差已知,样本平均数的分布为【正态分布】
总体分布是正态分布或近似正态分布,总体方差未知时,用样本方差代表整体方差,则样本样本平均数的分布为【t分部】(自由度为n-1)
区间估计
概念:是指用数轴上一段距离,表示未知参数可能落入的范围。
置信度(1-α,置信水平):指所估计的总体参数落入置信区间的可靠程度。
置信区间:指在某一置信度时总体参数可能落入的区间。
点估计(条件)
概念:当总体参数不清楚时,用一个特定值(一般用样本统计量)对其估计。
优良的点估计应满足的条件:无偏性、一致性、有效性、充分性
点估计与区间估计的对比
概念
点估计优点能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。
区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。
总体参数的估计
总体平均数
总体正态,方差已知
总体正态,方差未知
t分布
总体方差与方差差异的区间估计
三、假设检验
基本问题
假设检验
虚无假设
也叫“原假设”“零假设”“无差假设”,是与研究假设相反的假设,根据检验结果予以拒绝或接受的假设,以H0表示。
备择假设
与虚无假设对立的假设,又称为科学假设、对立假设,以H1表示。
统计检验力(1-b)
假设检验的两类错误
a错误:又称I型错误,是指虚无假设为真时,拒绝虚无假设所犯的错误。
b错误:又称II型错误,是指虚无假设为假时,接受虚无假设所犯的错误。
α错误和β错误相互之间的关系是:α大时,β小;α和β不能同时减少。
α+β=1(不一定!)
α与β是在两个前提下的概率。 α是拒绝H0时犯错误的概率(前提是H0为真)β是接受H0时犯错误的概率(H0为假为前提)
显著性水平
显著性水平是估计总体参数落在某一区间内,可能犯错误的概率,用α表示。
小概率事件原理:小概率事件在一次实验中几乎不可能发生。即:概率<α
单侧检验
双侧检验
基本过程
1)建立虚无假设H0和研究假设H1;2)选择适当的检验统计量3)规定显著性水平,并根据检验的类型查出临界值;4)计算检验统计量的值5)比较临界值与统计值并进行决策:临界值大于统计值,则接受H0,拒绝H1;反之,则拒绝H1,接受H0。
平均数与平均数显著性检验
平均数显著性检验
平均数差异显著性检验
常用检验及适用条件
1)Z检验:常用于总体正态分布、方差已知或大样本的平均数的显著性和差异的显著性检验2)t检验:常用于总体正态分布、总体方差未知的平均数的显著性检验,平均数差异的显著性检验3)X2检验:常用于计数数据的检验、样本方差与总体方差的差异检验等情况。4)F检验:常用于独立样本的方差的差异显著性检验。
非参数方法
两个平均数差异的显著性检验比一个平均数显著性检验增多了哪些前提条件
方差与方差显著性检验
方差显著性检验
相关系数及其差异的显著性检验
计数数据的检验
X2检验/卡方检验(类别)
配合度检验:检验一个因素多项分类的实际观察数与某理论是否接近
独立性检验:用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立性的问题
同质性检验:主要目的在于检定不同人群母总体在某一个变量的反应是否具有显著差异。
常用于计数数据的检验、样本方差与总体方差的差异检验等情况
列联表的合并
品质相关
推论统计
根据样本所提供的信息,运用概率的理论进行分析和论证,在一定可靠程度上,对总体分布特征进行估计和推测
从假设检验的过程看,统计推断有什么特点?
1)统计指标变异的客观性;2)抽样误差的必然性3)推断统计的风险性;4)统计结论的可靠性与平均规律性
四、各类研究设计的方差分析
设计的效应模型(自变量取样方式不同)
随机模型
固定模型
混合模型
完全随机实验设计的方差分析
单因素
多因素
适用条件
方差分析的步骤
非参数方差分析/等级方差分析
方差条件不满足时应用
随机化区组设计的方差分析
随机化完全区组设计(单选)
随机化不完全区组设计
析因设计的方差设计(特点)
拉丁放设计的方差分析(适用条件)
五、一元线性回归
回归分析
任务
回归系数
标准回归系数
回归方程
确定系数/测定系数
回归方程的显著性检验
通过回归的方差分析来完成
简述相关分析和回归分析的区别和联系。
两者均为研究及度量两个或两个以上变量之间关系的方法
回归分析是以数学方式表示变量间的关系
相关分析则是检验或度量这些关系的密切程度。
两者相辅相成
确定变量之间是否存在关系,这是回归与相关分析的共同起点。
分析变量之间关系的密切程度时,一般使用相关系数,这个过程叫相关分析。
确定变量之间数量关系的可能形式,找出表达它们之间依存关系的合适的数学模型,并用这个数学模型来表示这种关系形式,则叫回归分析。
一、心理测量学绪论
发展历史(单选)
实验/科学心理学 冯特 1879年
高尔顿遗传理论测量;首先提出“测验”、“心理测量”两个术语
卡特尔个体差异研究;心理测量第一次出现于心理学文摘中
比纳-心理测量鼻祖;第一个智力测验常模量表-比纳西蒙智力量表
基本概念
测量
量表
命名量表
顺序量表
等距量表
比例量表
心理测量
根据一定的法则用数字对人的行为加以确定。即根据一定的心理学理论,使用一定的操作程序,给人的行为确定出一种数量化的价值。
心理测量的性质
间接性
相对性
客观性
测量的标准化问题
测验标准化
含义
按照严格的科学程序去编制和使用的测量称之为标准化测量
为了减少误差,就要控制无关因素对测验目的的影响,这个控制的过程,称作标准化。
提高标准化的方法
内容:标准化的首要条件,是对所有受测者施测相同的或等值的题目。
施测:为了使测验条件相同,必须有统一的指导语和时间限制。
评分:即客观评分。客观性意味着在两个或两个以上的受过训练的评分者之间有一致性。
常模:一个标准化测验,不但内容、施测和评分要标准化,对分数的解释也必须标准化。
按功能
能力测验
成就测验
人格测验
按目的
描述性测验
诊断性测验
预示性测验
速度测验和难度测验
速度测验
速度测验是指在测验过程中限定时间,看在特定时间段里完成任务的速度,因而题目并没有超过被试的能力水平,测的是反应速度。
难度测验
难度测验则是指在测验过程中不限时间,即一般每一题目都有时间去做,但有些题目不见得能做出来,测的是解题的最高能力。
两者的区别
测量目标不同
速度测验测的是被试的反应速度,而难度测验测的是被试解题的最高能力。
测验限定不同
速度测验在于测量被试作业的快慢,它的测题难度相等,但严格限制时间,看规定时间内所完成的题目数量。
难度测验是不限时间,即一般每一题目都有时间去做,难度测验包含不同难度的题目。
按性质
结构性测验
投射性测验
概念:指向受测者提供一些未经组织的刺激情境,让他在不受限制的情境下,自由表现出他的反应,通过分析反应的结果,便可推断他的人格结构
1)测验材料没有明确的结构和固定意义,其结构和意义完全由受测者自己决定2)受测者有广泛的反应方式,可作多种反应3)受测者不知道测验的目的4)可同时测量几个人格纬度,并对结果作整体性分析
功能
基本功能:测量个体间的差异或同一个体在不同场合下的反应
二、心理测验的编制
一般程序/步骤
1. 确定测验目的
测量对象,测量目标,测量目的
2. 制定编题计划
3. 编写题目(项目)
收集有关资料,选择项目形式(考虑测验目的和材料性质,接受测验的团体特点以及各种实际因素),编写具体题目
4. 项目的预测验和分析
5. 合成测验
项目的选择、编排和复本
6. 将测验标准化
标准化
评分:标准化的第三个要素是客观评分。客观性意味着在两个或两个以上的受过训练的评分者之间有一致性。
常模
一个标准化测验,不但内容、施测和评分要标准化,对分数的解释也必须标准化。
7. 对测验的鉴定
信度
测量的可靠性或一致性。一个测验在标准化的过程中,必修确定它的信度,多采用相关法,以相关系数表示信度的高低
效度
指测量的有效性或正确性,这是对测量工具的最基本要求。测量一个测量工具有没有效,就是看它所测量的是不是它要测的东西
8. 编写测验说明书
为了使测验能够合理地实施和应用,在正式测验编写完成后,还要编制一份说明书
1. 本测验的目的和功用
2. 编制测验的理论背景以及选择题目的依据
3. 测验的实施方法、时限及注意事项
4. 测验的标准答案和评分方法
5. 常模资料,包括常模表、常模适用的团体及对分数如何做解释
6. 测验的信度效度资料,包括信度系数、效度系数及这些数据是在什么情境下得到的
三、测验的实施和计分
标准化心理测验实施
标准化心理测验实施的最基本要求是:使所有的被测者都在相同条件下表现自己的真正行为。
预先规定的施策指导语,标准的时限,合适的施策环境和条件,科学应用计算机辅助的测验实施;以及在实施过程中控制好可能影响测试结果的任何其他因素(如回答被试问题的方式,陈述指导语的语调、声调、速度甚至面部表情等)
测验的误差
误差
在测量中与目的无关的变异所引起的不准确或不一致的现象
类别/形式
随机误差
信度、效度
系统误差
过失误差
来源(已考)
测验内部
主要来源于题目取样
由施测过程
物理环境,主试方面,意外干扰,评分计分
受测者(已考)
测验的经验
练习因素
应试动机
测验焦虑
反应定势
也称反应方式/风格,指独立于测验内容的反应倾向,即由每个人回答问题习惯的不同,而使得有相同能力的被试获得不同的分数。
生理因素
如何控制
四、测验结果的解释
标准分数/导出分数
为了使原始分数有意义,同时为了使不同的原始分数可以比较,必须把它们转换成具有一定的参照点和单位的测验量表上的数值,通过统计方法将原始分数转化到量表上的分数叫做导出分数
常模参照分数
常模团体
标准参照测验
内容参照分数
结果参照分数
解释心理测验分数时应注意哪些问题。
原始分数
为了使分数有意义,同时为了使不同的原始分数可以比较,必须把他们转换成具有一定的参照点和单位的测验量表上的数值。有了导出分数才能对测验结果做出有意义的解释。
分数的解释包括两个方面的问题
如何使分数具有意义
如何将有意义的信息传达给当事人
五、测验的信度与效度
重测信度
复本信度
分半信度/内部一致性系数
α系数
同质性信度/内在一致性信度
因素分析是决定测验同质性的最好方法
评分者信度
信度系数/决定系数(影响因素)
受试者方面
主试者方面
测验内容方面
施策情境方面
其他:被试样本、题目数量、测验难度、间隔时间等
分类及检测方法
表面效度
内容效度
专家判断、统计分析、经验法
构想效度
测验内方法、测验间方法(相容效度、区分效度、因素效度)、研究测验的实证效度、考察实验变量对测验分数的影响、搜集某些变异上的证据。
效标效度/实证效度/实用效度
相关法、区分法、命中率、功利率
影响效度的误差来源
测验组成方面
测验实施方面
被试反应方面
六、项目分析
难度
指项目的难易程度。指标通常以通过率表示
区分度
项目特征曲线
项目与效标的相关
点二列相关
φ 相关
鉴别指数
极端组的划分
七、常见测验类型
(一)学绩测验
教师主管测验的评价
编拟题目较为容易
能测量较为高级的心智活动
缺点:题目太少,不能代表全部教材;没有固定答案,难以客观。
(二)智力测验
一般智力测验
智力
智力的结构
二因素论-斯皮尔曼
多因素论-桑代克
层次结构模型-弗农
三维结构模型-吉尔福特
智力测验
比纳量表
斯坦福比纳量表
比率智商 IQ=(智力年龄/实际年龄)x 100
韦克斯勒量表
离差智商 IQ=100+15(X-Xo)/S
婴幼儿智力测验
(三)人格测验
自陈量表
明尼苏达多相人格测验 MMPI
16种人格因素测验 16PF
爱德华个性偏好量表 EPPS
艾森克人格问卷 EPQ
NEO人格调查表
投射测验
理论基础:以心理动力(精神分析人格理论)
基本假设
联想法
罗夏克墨迹测验
构造法
主题统觉测验 TAT
完成法
选排法
表露法
评价
评定量表
情境测验
0 条评论
回复 删除
下一页