统计学大纲
2020-11-15 20:35:13 5 举报
AI智能生成
统计学脉络
作者其他创作
大纲/内容
数据分析所用方法
描述统计
推断统计
统计数据类型
计量尺度
分类数据
顺序数据
数值型数据
收集方法
观测数据
实验数据
被描述现象与时间的关系
截面数据
时间序列数据
几个基本概念
总体与样本
参数和统计量
变量
分类变量
顺序变量
经验变量
随机变量
非随机变量
理论变量
数值型变量
数据的图表展示(描述统计)
数据预处理
数据审核
数据筛选
数据排序
顺序统计量
数据透视表
品质数据的整理与展示
分类数据的整理与图示
频数和频数分布
分类数据的图示
条形图
帕累托图
饼图
环形图
顺序数据的整理与图示
累积频数和累积频率
顺序数据的图示
累计频数分布图
数值型数据的整理与图示
数据分组
下限,上限,组距,组中值
数值型数据的图示
分组数据:直方图
未分组数据:茎叶图,箱线图
时间序列数据:线图
多变量数据的图示
散点图
气泡图
雷达图
合理使用图表
鉴别图形优劣的准则
统计表的设计
概率与概率分布
随机事件及其概率
随机事件的几个基本概念
随机事件
必然事件
不可能事件
事件的概率
概率的古典定义
结果有限
等可能
概率的统计定义
主观概率定义
关于概率计算的几个例子
概率的性质与运算法则
概率的基本性质
概率的加法法则
条件概率与独立事件
条件概率
乘法公式
独立性
全概率公式及贝叶斯公式
离散型随机变量及其分布
随机变量的概念
离散型随机变量的概率分布
离散型随机变量的概率分布
离散型随机变量的期望值与方差
期望值
方差与标准差
离散系数
均值和方差在财务分析中的应用
二项分布和泊松分布
连续型随机变量的概率分布
概率密度与分布函数
正态分布
统计量及其分布
统计量
统计量的概念
常用统计量
样本均值
样本方差
样本变异系数
样本k阶矩
样本k阶中心矩
样本偏度
样本峰度
次序统计量
充分统计量
关于分布的几个概念
抽样分布
渐进分布
随机模拟获得的近似分布
由正态分布导出的几个重要分布
卡方分布
t分布
F分布
样本均值的分布与中心极限定理
样本比例的抽样分布
两个样本平均值之差的分布
关于样本方差的分布
样本方差的分布
两个样本方差比的分布
参数估计
参数估计的基本原理
估计量与估计值
点估计与区间估计
置信度置信水平置信系数
评价估计量的标准
无偏性
有效性
一致性
一个总体参数的区间估计
总体均值的区间估计
正态总体、方差已知或非正态总体,大样本
正态总体、方差未知、小样本
总体比例的区间估计
总体方差的区间估计
两个总体参数的区间估计
两个总体均值之差的区间估计
两个总体均值之差的估计:独立样本
大样本的估计
小样本的估计
两个总体均值之差的估计:匹配样本
两个总体比例之差的区间估计
两个总体方差比的区间估计
样本量的确定
估计总体均值时样本量的确定
估计总体比例时样本量的确定
假设检验
假设检验的基本问题
假设问题的提出
假设的表达式
两类错误
弃真错误α
又称显著性水平
取伪错误β
假设检验的流程
利用P值进行决策
单侧检验
左单侧检验
右单侧检验
一个总体参数的检验
检验统计量的确定
样本量
总体标准差是否已知
总体均值的检验
样本量大
样本量小,总体标准差已知
样本量小,总体标准差未知
总体比例的检验
总体方差的检验
两个总体参数的检验
检验统计量的确定
两个总体均值之差的检验
两方差都已知
两方差未知n较小
两个总体比例之差的检验
检验两总体比例相等的假设
检验两个总体比例之差不为零的假设
两个总体方差比的检验
检验中的匹配样本
检验问题的进一步说明
关于检验结果的解释
单侧检验中假设的建立
分类数据分析
分类数据与卡方统计量
分类数据
卡方统计量
拟合优度检验
列联分析:独立性检验
列联表
独立性检验
列联表中的相关测量
φ相关系数
列联相关系数
V相关系数
数值分析
列联分析中应注意的问题
条件百分表的方向
卡方分布的期望值准则
方差分析
方差分析引论
方差分析及其有关术语
因子或因素,水平或处理
方差分析的基本思路和原理
图形描述
误差分解
误差分析
方差分析中的基本假定
问题的一般提法
单因素方差分析
数据结构
分析步骤
提出假设
构造检验的统计量
计算个样本的均值
计算全部观测值的总均值
计算各误差平方和
统计决策
方差分析表
关系强度的测量
方差分析中的多重比较
双因素方差分析
双因素方差分析及其类型
无交互作用的双因素方差分析
数据结构
分析步骤
有交互作用的双因素方差分析
数据的搜集
数据来源
调查数据
概率抽样
简单随机抽样
分层抽样
整群抽样
系统抽样
多阶段抽样
非概率抽样
方便抽样
判断抽样
自愿样本
滚雪球抽样
配额抽样
概率抽样与非概率抽样比较
搜集数据的基本方法
自填式
面访式
电话式
上述数据搜集方法的选择
实验数据
实验组和对照组
实验中的若干问题
实验中的统计
数据的误差
抽样误差
非抽样误差
抽样框误差
回答误差
无回答误差
调查员误差
测量误差
误差的控制
随机误差(见讲义)
系统误差(见讲义)
一元线性回归
研究数值型自变量与数值型因变量之间的关系
变量间的关系,相关分析
研究是否有线性关系
函数关系
一一对应
相关关系
不是唯一对应,有一定规律但不能用函数关系表示
通过大量数据的观察和研究可以推断出变量之间存在一定的客观规律
相关关系的描述与测度
是否存在关系
存在什么关系
存在什么关系
散点图
直观上是否有相关关系
关系强度如何
相关系数
pearson相关系数
r的取值范围
r有对称性
r的数值大小与xy的原点及尺度无关
r仅描述线性关系强弱,不描述非线性关系
r不一定意味着xy有因果关系
样本所反映的关系能否代表总体变量之间的关系
显著性检验
提出假设
构建t统计量
双侧检验
刻画关系强度
回归分析
用数学表达式通过最小二乘法处理样本数据得出必要参数,进行总体回归方程的拟合,最后用一个数学表达式表示两变量之间的关系
最终目的是根据所建立的估计方程用自变量x来估计或预测因变量y的取值。
最终目的是根据所建立的估计方程用自变量x来估计或预测因变量y的取值。
建立模型
一元线性回归模型的基本形式
通过两参数最小二乘估计表达式
计算得到两参数β0β1
计算得到两参数β0β1
得出估计的回归方程
考察回归直线的拟合优度
计算判定系数进行度量
SSR/SST
估计的标准误
排除x对y的线性影响之后,y随机波动大小的度量
显著性检验
线性关系的检验——F检验
方程线性关系的显著程度
F=MSR/MSE
回归系数的检验——t检验
回归分析结果的评价
子主题
利用回归方程进行预测
回归模型经过检验并符合要求之后就可以进行预测,用方程来预测因变量
点估计
区间估计
y的平均值的置信区间估计
y的个别值的预测区间估计
残差分析
进行残差分析的必要性,来源于建立回归模型时,预先假定ε是期望值为0、方差相等且服从正态分布的一个随机变量
但如果假定不成立,那么所做的检验与预测可能站不住脚,而确定ε是否成立的方法之一就是进行残差分析
但如果假定不成立,那么所做的检验与预测可能站不住脚,而确定ε是否成立的方法之一就是进行残差分析
残差与残差图
标准化残差
数据的概括性度量(简单描述统计)
集中趋势的度量
分类数据:众数
顺序数据:中位数和四分位数
数值型数据:平均数
简单平均数与加权平均数
几何平均数
众数、中位数和平均数的比较
三者关系
特点,应用场合
离散程度的度量
分类数据:异众比率
顺序数据:四分位差
数值型数据:方差和标准差
极差
平均差
方差和标准差
相对位置的度量
标准分数
经验法则
切比雪夫不等式
相对离散程度:离散系数
偏态与峰态的度量
偏态及其测度
峰态及其测度
多元线性回归(非重点,仅名词,无计算)
多元线性回归模型
多元回归模型与回归方程
估计的多元回归方程
参数的最小二乘估计
回归方程的拟合优度
多重判定系数
估计标准误差
显著性检验
线性关系检验
回归系数检验和推断
多重共线性
多重共线性及其所产生的问题
多重共线性的判别
多重共线性问题的处理
利用回归方程进行预测
变量选择与逐步回归
变量选择过程
向前选择
向后剔除
逐步回归
时间序列分析和预测
时间序列及其分解
时间序列的描述性分析
图形描述
增长率分析
时间序列预测的程序
确定时间序列的成分
确定趋势成分
确定季节成分
选择预测方法
预测方法的评估
平均误差
平均绝对误差
均方误差
平均百分比误差和平均绝对百分比误差
平稳序列的预测
简单平均法
移动平均法
指数平滑法
趋势型序列的预测
线性趋势预测
非线性趋势预测
指数曲线
多阶曲线
季节型序列的预测
复合型序列的分解预测
确定并分离季节成分
计算季节指数
分离季节成分
建立预测模型并进行预测
指数
基本问题
指数概念
指数分类
按照考察对象的范围不同,可分为个体指数和总指数
按照所反映指标的性质不同,可分为数量指标指数和质量指标指数
按照计算形式的不同,可分为简单指数和加权指数
指数编制中的问题
选择项目
确定权数
计算方法
总指数编制方法
简单指数
简单综合指数
简单平均指数
加权指数
加权综合指数
加权平均指数
指数体系
总量指数体系分析
平均数变动因素分解
几种典型的指数
居民消费价格指数
股票价格指数
消费者满意度指数
综合评价指数
综合评价与综合评价指数
综合评价指数的构建方法
0 条评论
下一页