SPSS 数据格式
2020-03-19 15:12:04 0 举报
AI智能生成
SPSS初级
作者其他创作
大纲/内容
SPSS 数据格式
(转换)变量级别
分组
计算变量(非连续值)
1:定义新变量
2:定义筛选条件
等级变量/等级合并(连续)
数值类型(水平、分类、分组)
1:连续变量转换为离散
2:例如年龄
3:定义输出变量名
4:旧值为变量的条件
5:新值表示定义新变量名的值
字符串类型
需要在新旧计算筛选过程中,勾选【输出变量为字符串】
连续性变量离散化
1:重编码过程是通过定义筛选条件精确分组
2:有规律的分组(等距分组、等样本量分组)
1:转换->可视离散化(分箱)
2:设定被离散后的新变量
3:生成分割点,依据最小值和最大值,选择合理的等距
4:等间距 = 全距 ÷ 组数
最优离散化过程
1:对于可视离散构成进一步自动化
2:将原有的一个或多个连续变量按照该分类变量间差异最大化的优化原则离散化分类
3:用于建模中因变量为分类变量,需要对自变量进行离散化(分类化)
3:将字符 与 数值变量转化
1:自动重新编码
4:时间序列模型
个案需要按照时间序列排序
分析中可能需要相应的变量值前移或后移
转换 - 转换值(变动值)
查找与计数:转换- 对个案内的值计数
排序:转换-个案排秩
排序的依据
排序的分组
(数据)文件级别
选择个案:对全部数据取出一部分数据
个案排序:排序依据
汇总:根据分类变量对个案进行分组
数据文件的重构与转置
长型数据格式:每次测量都为一个CASE记录
宽型数据格式:每次一测量分别使用变量进行记录
1:重构是将长型数据转宽型数据
2:是将某行转为使用变量记录
3:或者将多个变量依据个案的标识转为一个测量值
变量属性
名称
类型
数值型
宽度
小位数
标签
值
缺失
对齐
列
测量
定类尺度(名义)
定序尺度(序号)
角色
调查问卷
开放题录入
指定类型
小数
单选题录入
开放题录入基础上录入“值”
字符串代码 + 值标签
半开放
含有 “其他,请指出”单项的单选题
使用两个变量对其进行定义
第一个变量, “其他,请指出”,作为一个可选择项
第二个变量,“其他,请指出”的具体内容
第二个变量,讲没有选择该项的被访问者作为缺失值处理
多选题(多重相应)
多重二分法
1:对应每一个选项都要定义一个变量
2:均为二分类,选中与未选中
3:拒绝回答都被视为未选中
4:变量值标签的定义应该一致,避免混乱
多重分类法
1:对于选项数量较多,二分法录入会导致很多录入“未选中”
2:利用多个变量对一个多选题的答案进行定义
3:有多少个变量由被访者实际可能给出的最多答案数而定
4:数据缺失在多重分类法中最为常见的情况
设定多选题变量集
1:SPSS对于录入的多选题,SPSS认为是若干分散的变量,并不认为是多选题
2:Tables模块 可以保存定义的多选题变量及
3:多重相应可以定义多选题变量集信息但是不能再SPSS数据文件中保存
0 条评论
回复 删除
下一页