SBE11eC010203
2015-06-17 16:10:52 0 举报
Reading Note of SBE11e
作者其他创作
大纲/内容
对单变量进行汇总
Dot Plot (点位图/打点图)
Quartiles
Relative Frequency Distribution
Chebyshev's Theorem
Scatter Diagram(散点图)
标准差相对于平均数之比例
均值公式中给予了每个观测值同等的重要性和权重. 但某些情况下需要给予每个观测值一个对应于其重要性的权重来计算均值
Frequency Distribution
z-Score
Coefficient of Variation (标准差系数)
度量: 数据位置
Variance(方差)
Empirical Rule(经验法则)
Skewness
度量: 数据相对位置
相关系数的范围为-1到1:(1) 与0越接近则线性关系也就越弱;(2) 与1越接近则越有正相关线性关系;(3) 与-1越接近则越有负相关线性关系.
Cumulative Relative Frequency Distribution
Percentile
数据\"四等分\"后的信息
用 最小值|第一四分位数|中位数|第三四分位数|最大值 五个数来表示汇总数据;
汇总Qualitative Data
Range
Correlation Coefficient
针对两个变量
Trendline (趋势线)
针对分组数据
Mean
Pie Chart (饼形图)
描述统计学 1表格法
提供了定量数据的另一种表格汇总方法
Covariance
探索性数据分析
Cumulative Percent Frequency Distribution
描述统计学 2图形法
SBE11e C01-C03
Variance的平方根;单位和观测值一致.
度量一个数据离平均值有多远(多少个标准差);可以用来检测异常值: z-Score 小于-3 和 大于3 的都可视为异常值.
探索性数据分析(Exploratory Data Analysis)技术
汇总两个定性变量数据
最容易测量;极易受异常值影响.
z = 2/3/4: 0.75/0.89/0.94 (可用于全部分布)
Crosstabulation交叉分组表
Ogive (累积曲线)
Percent Frequency Distribution
Mode
度量: 分布形态
Frequency Distribution频数分布
横轴: 数据值纵轴: 累积频数/累积相对频数/累积百分比频数
描述统计学 3数值法
度量数据中心位置
定义定量数据频数分布中的组: - 确定互不重叠分组的数目(组数: number of classes)- 确定每组宽度(组宽: width of classes) - 近似组宽=(数据最大值-数据最小值)/组数- 确定组限(class limit)- 组中值(class midpoint): 组下限和组上限的中间值.
针对单变量
显示相关性近似程度的一条直线
Cumulative Frequency Distribution
Standard Deviation
Inter-Quartile Range (IQR)
Stem-and-Leaf Display
对两个变量进行汇总
度量: 离散程度/变异程度
Bar Graph (柱状图)
Weighted Mean
显示两个定量变量间关系的图形法
z = 1/2/3: 0.68/0.95/几乎全部 (用于钟形分布)
数据是怎样在从最小值到最大值的这个区间内分布的.
两变量间线性关系的描述性度量; 协方差的缺点是依赖于对x和y测量的单位. 故需要引入相关系数.
描述数据的总体位置;超过3个以上的值就没有意义了.
汇总Quantitative Data
最简单的图表
Box Plot(箱形图)
五数概括法
Median
Simpson's Paradox (辛普森悖论)
中间50%数据的Range.
收藏
0 条评论
下一页