菜鸟数据分析Excel
2018-05-23 17:22:00 0 举报
AI智能生成
谁说菜鸟不懂数据分析
作者其他创作
大纲/内容
第三章 数据准备
理解数据
字段与记录
变量:字段是事物与现象的特征
数据、变量值:记录是是特征的具体表现
数据类型
字符型数据
数值型数据
数据表
数据表的设计要求
数据表由标题行和数据部分组成
第一行是表的列标题(字段名),列标题不重复
第二行起是数据部分,数据部分的每一行数据称为一个记录,并且数据部分不允许出现空白行或空白列
数据表中不能有合并单元格存在
数据表与其他数据之间应该留出至少一个空白行加一个空白列
数据表需要以一维的形式储存,但实际操作中数据往往以二维形式存在,此时应转化为一维数据储存
数据表的维度
数据来源
导入数据
导入文本数据
导入网站数据
问卷录入需求
数值型
单选题
多选题
二分法
多重分类法
排序题
开放性文字题
第四章 数据处理
何为处理数据
三心两意
信心
细心
平常心
诚意
合意
数据处理的内容
数据清洗
数据加工
数据清洗
重复数据处理
识别
COUNTIF函数识别
高级筛选
条件格式
数据透视表
删除
菜单删除重复项
排序删除重复项
筛选删除重复项
缺失数据处理
定位输入
平均值代替
统计模型计算
缺失数据删除
记录保留
Ctrl+G,Ctrl+Enter
查找替换
检查数据逻辑错误
利用IF函数检查错误
利用条件格式标记错误(OR公式)
数据加工
数据抽取
字段分列
菜单法
函数LEFT,RIGHT
字段合并
&大法+格式
CONCATENATE函数+text格式
字段匹配
VLOOKUP函数
如果出现#N/A
出现空格,嵌套用TRIM函数
数据类型或格式不一致,转换一下
数据计算
简单计算
函数计算
平均值AVERAGE()
总和SUM()
日期加减法DATE()
计算工龄DATEIF()
数据分组
VLOOKUP
行列转换
选择性粘贴
数值:去除公式、格式
公式:只黏贴公式,需注意绝对地址应用
格式:不用重新设置格式
运算区域:区域算数结合
多选题录入数据方式之间的转换
多重转二分
IF+ISNUMBER+HLOOKUP或SERACH
数据抽样
INT+RAND()+F5
第六章 数据展现
图标概览
作用
表达形象化
突出重点
体现专业化
图表基本款
表格
饼图
条形图
柱形图
折线图
散点图
根据关系选择图表
图示
排序
柱形图、条形图、气泡图
时间序列
柱形图、折线图
频率分布
柱形图、条形图、折线图
相关性
柱形图、条形图、气泡图、散点图
多重数据比较
雷达图
成分
饼图、柱形图、条形图、其他
制作流程
确定所要表达的主题或目的
确定哪种图表最适合你的目的
选择数据制作图表
检查是否真实有效的展示数据
检查是否表达了你的观点
表格也疯狂
突出显示单元格
开始、样式、条件格式
项目选取
数据条
图标集
迷你图
插入、迷你图
给图表换装
平均线图
图例在添加图表元素中
适用于和平均数对比
双坐标图
点击、设置数据系列格式、系列绘制在、次坐标轴、然后改成折线图
双柱图、设置占位柱子
适用于双元素数量等级差距较大
竖形折线图
市场研究、咨询等公司、展现产品功能、品牌形象在消费者心中的评价
比较多个产品和项目在每个指标的表现,一般为打分0-5,1-10
先插入带平滑曲线的散点图、在增加辅助列
表格图例
瀑布图
插入堆积柱形图、然后将占位数据隐藏、删除无用细节
企业经营、财务分析中应用较多
帕累托图
用来分析质量问题、寻找影响质量的主要因素
特殊的线柱图,柱形图数据按降序排列,折线图是累计百分比
折线起点为0,位于第一个柱子左下角,第二个点位于柱子的右上角
折线图最后一个点为100%,在图形的最右上角
旋风图
俩做法
同一事物在某个活动、行为影响前后不同指标的变化
同一事物在某个条件变化下(指标A变化),指标B也随之变化,具有因果关系,如价格与销量
两个类别之间不同指标的比较
人口金字塔图
人口构成模型、年轻型、成年型、老年型、用于调研地区的市场潜力,一种特殊旋风图
漏斗图
堆积条形图变种、(占位数据为最大值-环节值)/2
用来观察各环节转化率
矩阵图(散点图)
满意度散点图
发展散点图
改进难度气泡图
用于矩阵关联分析
第八章 数据报告
数据报告概述
原则
规范性
重要性
谨慎性
创新性
作用
展示分析结果
验证分析质量
提供决策参考
种类
专题分析报告
单一性、用户流失分析
深入性、重点突出深入分析
综合分析报告
全面性
联系性
日常数据报告
进度性
规范性
反应计划执行的基本情况
分析完成或未完成的原因
总结计划执行中的成绩和经验,找出存在问题
提出措施和建议
时效性
数据分析报告结构
总-分-总
标题页
常用标题类型
解释基本观点
概括主要内容
交代分析主题
提出问题
特点
直接
确切
简洁
目录页
分析背景与目的
分析思路
分析征文
总结与建议
前言
分析背景、目的
分析思路方法
正文
报告最长的主体部分
包含所有数据分析事实及观点
通过数据报表和相关文字结合分析
正文各部分具有逻辑关系
结论与建议
附录
注意事项
实事求是、反映真相
用词准确、避免含糊
篇幅适宜、简介有效
结合业务、合理分析
第一章 数据分析那些事儿
类型
描述性数据分析
探索性数据分析
验证性数据分析
作用
现状分析
原因分析
预测分析
步骤
明确分析目的及思路
分析框架体系化
经典营销理论
4P
用户使用行为
STP理论
SWOT
经典管理理论
PEST
5W2H
时间管理
生命周期
逻辑树
金字塔
SMART原则
数据收集
数据库
公开出版物
互联网
市场调研
数据处理
数据清洗
数据转化
数据提取
数据计算
数据分析
数据分析
浅层数据分析
数据挖掘
分类、聚类、关联、预测
数据展现
数据图表
报告撰写
误区
分析目的不明确
缺乏业务知识
追求高级分析方法
职业要求
懂业务
懂管理
懂分析
懂工具
懂设计
基本素质
态度严谨认真
好奇心强烈
逻辑思维清晰
擅长模仿学习
勇于创新
常用指标术语
平均数
绝对数与相对数
百分比与百分点
频数与频率
比例与比率
同比与环比
三字经
学习
了解、深入
记录、记忆
理论、实践
模仿、创新
方法
思路、方法
框架、细化
方法、工具
思考、动手
分析
业务、数据
假设、验证
总体、局部
总结、建议
第二章 结构为王-确定分析思路
数据分析方法论
方法论
数据分析前期规划
思路
维度、内容、指标
宏观
分析法
对比分析
交叉分析
相关分析
回归分析
聚类分析
微观
方法论的重要性
理顺分析思路,确保数据分析结构体系化
分解问题成关联部分,显示它们的关系
为后续数据分析开展指引方向
确保分析结果的有效应和正确性
常用的数据分析方法论
PEST分析法
政治
政治体制
经济体制
财政政策
税收政策
产业政策
投资政策
国防开支水平
政府补贴水平
民众对政治参与度
经济
GDP及增长率
进出口总额及增长率
利率
汇率
通货膨胀率
消费价格指数
居民可支配收入
失业率
劳动生产率
社会
人口规模
性别比例
年龄结构
出生率
死亡率
种族结构
妇女生育率
生活方式
购买习惯
教育状况
城市特点
技术
新技术的发明和进展
折旧和报废速度
技术更新速度
技术传播速度
技术商品化速度
国家重点支持项目
国家投入研发费用
专利个数
专利保护情况
5W2H
why
用户购买的目的是什么
产品在哪方面吸引用户
what
公司提供什么产品或服务
与用户需求是否一致
who
谁是我们的用户
用户有什么特点
where
用户在在哪里购买
用户在各地区的构成是怎样的
when
何时购买
多久再次购买
how
用户购买支付方式是怎样的
how much
用户花费的时间,交通等成本是多少
企业营销、管理活动、对于决策和执行性活动措施很有帮助
如用户购买行为,在分析框架中找到问题可量化的指标进行衡量和评价
逻辑树分析法
问题陈述
问题一
。。。
。。。
问题二
问题N
要素化
把相同问题归纳成要素
框架化
将各个要素组织成框架,遵守不重不漏原则
关联化
框架内的各要素保持必要的相互关系,简单不孤立
ps:利润下降分析
收入
客户少
质量变差
对手竞争
...
成本
材料成本
人工成本
广告成本
促销成本
...
其他
4P营销理论
产品
公司提供那些产品或服务,哪个销量最好
与用户需求是否一致
购买产品的都是什么人
价格
公司销售收入如何?增长?减少?
用户接受的合理价格是多少?
用户支付的方式是怎样的?
渠道
公司在各地区有多少销售渠道?覆盖率?
用户通过哪种渠道购买?
用户在各地区的构成是怎样的?
公司的渠道政策是否具有吸引力?
促销
投入多少资源?效果如何?
投入多少宣传广告?效果如何?
适用于了解公司的整体运营情况
用户行为理论
认知
网站访问
IP、PV、人均页面访问量、访问来源
熟悉
网站浏览
平均停留时长、跳出率、页面偏好
站内搜索
搜索访问次数占比
试用
用户注册
注册用户数、注册转化率
使用
用户登录
登录用户数、人均登录、访问登录比
用户订购
订购量、订购频次、内容、转化率
忠诚
用户黏性
回访者比率、访问深度
用户流失
用户流失数、流失率
第五章 数据分析
数据分析方法
现状分析(对比)
对比分析
定义
将两个或以上数据进行比较,分析他们的差异,从而揭示这些数据代表的事物发展变化情况和规律性
特点
可以非常直观的看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少
分类
静态横比
同一时间条件下对不同总体指标的比较、如不同部门、地区、国家
动态纵比
同一总体条件下对不同时期指标数值比较
实践
与目标对比
实际完成值与目标进行对比,属于横比
不同时期对比
纵比、与去年同时期比较同比、与上个月完成情况对比环比
同级部门、单位、地区对比
行业内对比
活动效果对比
注意要点
指标口径范围、计算方法、计量单位必须一致
对比的对象要有可比性
对比的指标类型必须一致
平均分析
定义
结合对比分析、反应总体在一定条件下某一数量特征的一般水平
作用
利用平均指标对比同类现象在不同地区、不同行业、不同类型单位之间的差异度,比总体指标更具有说服力
利用平均指标对比某些现象在不同历史时期的变化,更能说明其发展趋势和规律
平均指标
算数平均数、调和平均数、几何平均数、众数和中位数
综合评价分析
基本思想
多个指标转化为一个能够反应综合情况的指标来进行分析评价
特点
评价过程不是逐个指标顺次完成的,而是通过一些特殊方法将多个指标同时完成
在综合评价过程中,一般要根据指标的重要性进行加权处理
评价结果不是具有具体含义的统计指标,而以指数或分值表示参评单位综合状况的排序
步骤
确定综合评价指标体系,即包括哪些指标、是综合评价的基础和依据
收集数据,并对不同计量单位的指标数据进行标准化处理
确定指标体系汇总各指标的权重,以保证评价的科学性
对处理后的指标在进行汇总计算出综合评价指标数或综合评价分数
根据评价指数或分值对参评单位进行排序,并由此得出结论
离差标准化
权重确定
目标优化矩阵
纵轴横轴横向对比
专家访谈法、德尔菲法、层次分析法、主成分分析法、因子分析法、回归分析法
原因分析(细分)
分组分析
与对比法结合使用
VLOOKUP分组
自己分上下限和组距
结构分析
总体内各部分占总体的比例,相对指标,如市占有率
交叉分析
定义
分析两个字段(变量)之间的关系,同时将两个有一定联系的变量及其值交叉排列在一张表格内,形成交叉节点和交叉表
要素
行、列、交叉节点,行小结、列小计、总计
杜邦分析(财务)
利润下降
净资产收益率
总资产收益率
主营业务利润率
净利润
主营业务-成本+其他利润-成本
主营业务收入
总资产周转率
主营业务收入
资产总额
流动资产
长期资产
权益乘数
A市场占有率下降
A市场用户
三公司用户
A用户
业务1
业务2
B用户
C用户
漏斗图分析
业务流程最直接的分析方法、配合对比分析法有奇效
※矩阵关联分析
定义
根据事物(产品、服务)的两个重要属性(指标)作为分析的依据,进行分类关联分析,找出解决问题的分析方法
方法
属性A为横轴、属性B为纵轴形成坐标系,并将坐标轴按某一标准进行刻度划分,构成四个象限,将事物投射进象限交叉分析
分类
矩阵
发展矩阵
加入一个发展趋势维度(折线)
改进难易矩阵
加入难易度维度(气泡)
聚类分析
预测分析(预测)
回归分析
时间序列
决策树
神经网络
高级数据分析方法
产品研究
相关分析
对应分析
判别分析
结合分析
多维尺度分析
品牌研究
相关分析
聚类分析
判别分析
因子分析
对应分析
多维尺度分析
价格研究
相关分析
DSM价格分析
市场细分
聚类分析
判别分析
因子分析
对应分析
多维尺度分析
logistic回归
决策树
满意度研究
相关分析
回归分析
主成分分析
因子分析
结构方程
用户研究
相关分析
聚类分析
判别分析
因子分析
对应分析
logistic回归
决策树
关联规则
预测决策
回归分析
决策树
神经网络
时间序列
logistic回归
数据分析工具
数据透视表
术语
轴
数据分析表中的一个维度、如行列或页
数据源
创建数据透视表的数据表、数据库等
字段
数据信息的种类、相当于数据表中的列
字段标题
描述字段内容的标志,可通过拖动字段标题对数据透视表进行透视分析
透视
通过改变一个字段或多个字段的位置来重新安排数据透视表
汇总函数
excel用来计算表格中数据的值的函数,数值和文本的默认汇总函数分别是求和与计数
刷新
重新计算数据透视表,以反映当前数据透视状态
数据透视表小技巧
百分比、同比、环比
数据分组统计
日期型、数值型(固定组距,没有vlookup强)、文本型(需手工)
多选题分析
第七章 图表专业化
图表要素
图表标题
图例
单位
脚注
资料来源
各种图表的注意要点
饼图
从12点位置开始
不要用饼图分离
饼图不要用图例
不用标签连线
尽量不用3D
颜色填充要用白色边框线
不超过五个分区
复合饼图
插入二维饼图、将第二绘图区包含其他项
同时可设置,位置,值,百分比,自定义
柱形图
同一数据序列用同一种颜色
不要使用倾斜标签
纵坐标轴刻度从0开始
+数据标签,-网格线和纵坐标轴
条形图
同一序列使用相同的颜色
尽量让数据由大到小排列
不要使用倾斜的标签
最好添加数据标签
折线图
线要粗
不超过5条
标签不倾斜
纵坐标从0开始
预测的要加虚线
散点的要加数据标记
数据欺骗
虚张声势的增长,利用坐标轴起始点
3D效果的伪装
逆序排列的误导
一维图形障眼法
图表美化
三大原则
简约
整洁
对比
最大化数据墨水比
找出隐形的线
图表喜欢的数字格式Arial
突出对比:直线、箭头等
色彩
原色、二次色、三次色
相似色
邻近色
对比色
冷暖色
※色环
效率图表
模板
选中F11
标签工具Jwalk Chart Tools
修剪超大值
收藏
0 条评论
下一页