深入浅出数据分析
2021-06-08 18:04:12 13 举报
AI智能生成
读书笔记
作者其他创作
大纲/内容
DA
四大主要步骤
确定
确定问题
分解
分解问题和数据使期成为更小的组成部分
评估
对前两步了解到的情况作出各种结论
决策
把结论重新组合在一起作出建议或者作出一个决策
案例Acme化妆品
第一次方法通过数据表象
广告费用削减影响销售达标
建议广告费用恢复
实际
少女消费者市场饱和
过多假定少女消费是唯一购买者且仍然有能力购买更多
第一次结论
对外界假设和确信的观点取决于个人心智模型
统计模型取决于心智模型
错误心智模型导致分析胎死腹中
第二次确定环节用其它心智模型作契合
假设保湿霜的确是少女消费者喜爱
几乎把预算都给了Acme
Acme需要新的市场提升销量
没有竞品,迄今为止最好的产品
社会网络是最经济有效的方式
消费者愿意在保湿霜上花更多的钱
假设保湿霜处于竞争中失去客户的危险境地
消费者改用新的保湿霜产品,Acme需要夺回失地
Acme被认为“给傻子用的”
“干”皮肤在年轻人中日渐流行
社会网络营销是个无底洞,需要重投广告的怀抱
提高产品价格将损失市场份额
第二次分解环节
产品未直接卖给消费者
广告对销量的贡献模糊不清
少女消费者外还有谁可能购买
依然存在难以排解的不确定因素
第二次评估环节深入挖掘数据
新进原始数据“泛美批发公司”卖给了谁
下钻泛美数据发现男性用户
第二次决策环节
对新数据的挖掘尝试取决于自己的最佳判断
错误的假设是生效分析失败的主因
分析得出重大问题的答案,但明天又会有新情况
回顾问题、提炼模型、基于新模型观察,找规律而不是找特例
案例星巴仕
统计与分析基本原理比较法
比较越多分析结果越正确
比较分店
比较分类
问卷分类
处理观察研究数据控制混杂因素
无法得到顾客有多少钱的数据所以从其它维度突破
需要不断考虑混杂因素对分析结果的影响
地址这个因素需要单拿出来
想象哪些变量可能会影响分析结果
观察研究法的重点在于分析结论要有意义
观察研究法有很大局限性
管理混杂因素
原始数据中的小分评估被大分评估在汇总后被平均
除价值感其它都小范围波动
与东岸一起拉低了总体平均分
SOHO区顾客非常满意
做实验指出哪种策略最有效
降价
降价看销量与销售额的比较数据
销量的提升有可能不是降价带来的
没有控制组即没有比较
分实验组与控制组初版
西雅图实验组降价
soho与东岸做为控制组不变
缺点是苹果比橙子仍然有店址干扰
实验组与控制组升级版
将大的地理区域分成小的
控制组维持现状
实验1组降价
实验2组游说顾客(最终有效)
案例玩具故事
数据放大为可控和不可控因素
不可控
橡皮鱼和鸭利润
需要多少橡胶生产相关
需要多少时间用来生产相关
可控
生产多少鱼
生产多少鸭
约束条件分析决策变量
橡胶够500鸭或者400鱼
时间够400鸭和300鱼
鸭利润5鱼利润4
将数量作为约束变量放在一张图中
加入橡胶的供应量约束条件后放同一张图 500鸭代表鱼0,400鱼代表鸭0,出来 约束图
决策变量生产的橡皮鸭的数量
约束条件橡胶50000和时间400鸭+300鱼
目标是利润计算
利润跌穿
80条鱼卖光400头鸭只卖20头
模型只是在“你所规定的约束条件下”理想结果
按分析目标校正假设
生产端
时间、橡胶量、利润
售卖端
通过历史销售数据、变化规律、售卖策略提炼需求量
提防负相关变量
一种产品越多意味着另一种产品越少
节假日销售高峰有一种产品永远领先另一种
历史分析预测下个月鸭不超过150鱼不超过50加入新的约束条件
数据图形化
目光停留在和目标有关的数据无视其它
让数据美观不是分析要解决的问题
案例新军队
目标:网页风格带来最高营业额、最多浏览时间及最高回访率
案例地址
https://resources.oreilly.com/examples/9780596153946/blob/master/hfda_ch04_home_page1.csv
探索性数据分析使用散点图
发现因果关系
X轴自变量(原因)Y轴应变量(结果)
使用空心点容易看出重叠情况
让散点图多元化
浏览时间与营业额的散点图
页面浏览次数与营业额的散点图
回头率与营业额的散点图
0 条评论
回复 删除
下一页