数据分析理论+实战
2022-03-31 10:01:04 2 举报
AI智能生成
数据分析驱动互联网运营
作者其他创作
大纲/内容
课程价值
数据使用的能力组成
数据使用的能力模型
指标建模
什么是数据指标
对当前业务有参考价值的统计数据
常用的数据指标有哪些,如何定义的
用户数据
存量
DAU/MAU
DAU
自然日
MAU
单纯将日活累加而不去重是无价值的
MAU≠当月个日DAU之和
Active
基于事件上报统计
业务上报的定义:关键事件
有事件上报=该用户活跃
存在维护成本和沟通成本
user
认人
给每位客户一个专属ID
只适合强注册/登录环境,未登录的用户会被漏掉
认设备
用户数=访问过服务的设备数
无法对应设备背后的用户
在网页cookie中埋下一段长随机字符串,作为设备的唯一标识符
关于认人or认设备
无账号体系:认设备
业务场景强依赖登录:认人+认设备
不登录的用户对业务是否有价值:
NO:认人+认设备
YES :认设备
增量
新增用户
定义
合适的节点,定义”增“
渠道
点击
首页
注册
。。。(完成该流程)
用适当方法,定义”新“
基于设备
基于账号关联
健康程度
留存率
定义
了解某一渠道的质量-日留存
以日为单位衡量这个渠道来的用户当下&接下来的行为
观察整个大盘-周留存/月留存
以周、月为单位
二者对比
从哪来
渠道来源
行为数据
次数/频率
PV/UV、访问深度
pv、uv、转化率、访问深度
pv:页面浏览量-次数-不去重
uv:独立访问数-人数-去重
pv/pv;uv/uv:流程转化
pv/uv:不涉及流程转化
访问深度
用户对某些关键行为的访问次数
将网站内容/功能分成几个层级,以用户本次访问过最深的一层计算
路径走通程度
转化率
pv/pv;uv/uv:流程转化
pv/uv:不涉及流程转化
做了多久
访问时长
如何统计
web时代
页面打开时长
app时代
前台驻留时间
眼动仪,瞳孔与注意识别
为何统计
通过统计特殊事件,支持业务需求
统计视频被消费程度,评价内容质量
记录暂停/关闭页面时进度条的位置
质量
弹出率
用户来了只访问一个页面立马就走了,访问1个以上页面再走的人不算
整个网站产生的所有会话的弹出率,不是针对页面的
业务数据
总量
GMV、访问时长
人均
ARPU/ARPPU、人均访问时长
人数
付费人数/播放人数
健康程度
付费率、付费频次、观看率
被消费对象
SKU视角、被消费内容视角
选好数据指标的通用方法论
从业务的最终目标出发梳理业务模块
常见的拆解角度
如何搞大/搞频繁(手段)
有什么困难,我要通过什么特色方法来解决(工具)
判断业务模块所属的类型
根据省/杀时间、产品本身给用户带来价值/链接其他资源产生价值
工具模块
效率
内容浏览模块
质&量
交易模块
转化率
社区模块
活跃
根据业务模块所属类型选择数据指标
工具类
使用量
累积量,投入程度
目标达成率
是否正常运转
频次
能不能让用户养成习惯
交易类
详情页转化率
核心场景转化效率
金额
总的交易金额
客单价
单个用户价值
复购率
收入的持久度
内容浏览
浏览数
累计量
浏览广度
覆盖内容库存情况
浏览时长
占据用户多少时间
内容互动
用户对内容的情感
社区/社交类模块
发布量
用户创作的内容数量
互动量
用户与用户之间互动的次数
关系密度
用户与用户之间的关系
数据工具
计数与统计工具
通过代码与脚本统计日志
通过BI工具进行基本分析
流量导向
用户基本信息
用户从哪来
同一个来源有不同的媒介
用户来了干什么
用户行为流
有没有达成目标
用户导向
解决问题
来了干什么
单个用户的信息轨迹
会不会再来
单个行为对留存的影响
在哪流失的
用户漏斗
用户都是什么样的
用户属性列表,用户画像
优势
通过“屏幕录像”和行为序列观察,优势:从用户视角描述单个用户的行为轨迹
业务导向
解决的问题
流程是否顺畅
规模、频次如何
问题/原因何在
优势
商业逻辑上还原整个业务流程,从线上到线下
内容导向
哪些资源被消费
被消费的情况如何
内容表现质量如何
数据采集
埋点
困境一:自己理不清
要啥数据
有啥属性
困境二:RD听不懂
前端or后端采集?
跨越前-后端取值?
DRD 数据需求文档
埋点需求
埋点实施过程中的细节
明确埋点需求
归纳需求
产品自身的指标建模
交易模块
总金额
详情页转化率
业务部门的分析需求
入口点击率
来源渠道
选择适当的埋点属性
WWWHW
某个用户在某个时间、某个地方以某种方式解决了某个问题
who
唯一的身份标识
when
哪个节点的时间
哪个时区的时间
where
GPS
IP
自主填写(用户希望在哪)
how
设备、浏览器、版本、4g/wifi、哪个页面跳转的
what
购买、搜索、注册、投诉、退货
埋点位置选取
只能在前端发生就埋前端,否则建议后端采集
前端埋点的弊端
某些属性前端没有
改动依赖产品发版
事件上报时机尴尬
后端
业务数据
查关联表
前端送来的数据
技术数据
前端
调用API
取页面上的值
行为统计
校验
手段
抓包or后台查看
方法
DRD逐个对比
意义:数据不具备回溯性,信息损失,后续再补不回来
埋点文档的维护
是否在线
上线/下线时间
修改属性
数据采集实战
明确需求
产品自身指标建模
用户内容印象
各个内容的CTR
各个内容类型的曝光和点击需要能够分开查看
评论数和点赞数是否对阅读产生影响
业务部门分析需求
每个卡片配“不感兴趣”按钮
用户主动刷新/加载
主动滚到底部加载新内容次数
点击不感兴趣的次数何原因
埋点时间确定
指标
埋点
数据检验
其他类型数据采集
全埋点
无埋点
线下(第三方系统)数据采集(跨越物理界限采集数据)
电商
物流信息
客服跟进信息
教育
到课率
线下招生的客户信息
金融
地推、短信发送的客户(与新注册用户对比,验证推广效果)
竞品数据采集
明确目的
总结
埋点:一小段上报事件的代码
借助drd文档
需求
产品指标建模
业务部门需求
掌握常见的数据分析套路
埋点
事件触发的时机
埋点属性的设计
数据处理
导入文本文档
分列
简单分列
直接按照固定宽度、符号分列
复杂分列
找出每种异常情况规范化处理后再分列
数据清洗
筛选
排序
去重
数据的二次处理
VLOOKUP
快速呈现
数据透视表
表不如图:EXCEL常见图表
折线图
柱状图、柱状堆积图
饼图
堆叠折线图
数据可视化
RAWGraphs
高德地图
数据工具特色功能演示
GA
邮件日报
核心指标发送日报分享给团队
指标预警
重点指标异常自动提醒
数据注释
数据异常原因可以团队共享
神策
自定义指标
两个基础指标之间的加减乘除得到更直接的指标
百度统计
访客属性
兴趣分布
数据分析
9种数据分析方法
对比分析
比什么
绝对值
本身具备价值的数字
不易得知问题的严重程度
比例值
在具体环境中看比例才具备对比价值
易收到极端值影响
怎么比
环比
last period
与当前时间范围相邻的上个时间范围对比
对短期具备连续性的数据进行分析
相邻时间范围数字对当前指标的影响
同比
same period
与当前时间范围上层时间范围的前一范围中同样位置数据的对比
观察更为长期的数据集
观察周期内有更多干扰,希望可以消除
和谁比
和自己比
时间维度
不同业务线
过往经验
和行业比
自身因素/行业趋势
跌的少
涨的多
多维度拆解
不同视角去拆分、观察
拆解维度
渠道
城市
用户设备
使用场景
单一指标的构成、比例
分栏目的播放量
新老用户
针对流程进行拆解分析
不同渠道的浏览、购买转化率
不同省份的参与活动漏斗
还原行为发生时的场景
打赏主播的等级、性别、频道
是否在wifi或4g环境下
漏斗观察
运作原理
一连串向后影响的用户行为
安装
注册
阅读产品说明
选择产品
支付
坑
漏斗一定是有时间窗口的
根据业务实际情况选择对应的事件窗口
按天
对用户心智影响短期内有效
按周
业务复杂/决策成本高/多日才能完成
按月
决策周期更长
漏斗一定是有严格顺序的
完整的漏斗不能跳着看
漏斗的计数单位可以基于 用户、事件
何时基于用户
更关心整个业务流程的推动
何时基于事件
关心某一步具体的转化率
问题:无法获知事件流转的真实情况
结果指标的数据不符合预期
自查:是否只有这一个漏斗能达到最终目标
适用场景
适用
有明确的业务流程和业务目标
不适用
没有明确的业务流程,跳转流程复杂
分布情况
运作原理
从某个事件在不同维度中的分布来观察
常见的群体划分
事件频率
一天内的时间分布
消费金额区间
适用场景
已经知道一群用户完成了指定事件,继续按不同维度和价值对群体进行细分为不同躯体,分别维护
已经知道单个事件的完成次数,按照次数拆分到不同维度的分布情况,更清晰的了解该事件的完成情况
用户留存
为什么要看留存
了解某个渠道的质量
日留存
观察整个大盘
周/月留存
运作原理
精准留存
过滤进行过指定行为的用户ID,再计算
将用户分为不同群体观察
一般的计算方式
某段时间的用户ID与另一段时间的用户ID做交叉去重
产品运营技术每个环节都会产生影响
用户画像
对用户各类特征进行标识,贴上各类标签,分为不同群体,分别进行产品/运营动作
标签
基础属性
年龄、性别、生日、星座、身高、收入、职业
社会关系
是否有子公司、交友圈子等
行为特征
基本行为:注册时间、来源渠道等
业务行为:买过优惠商品、曾经优秀学员
业务相关
下单率、收藏商品、倾向产品品类、用户公司是做什么的等
标签来源
直接填写(问卷调查、个人资料填写等)
通过用户自己已有特征推得
做活动
简单的个性化运营
业务分析(拆解)
用户研究(准备)
通过用户身边的人判断
距离相近
行为相似
协同过滤,找到行为相似的用户
适用场景
市场营销
个性化运营
业务分析
用户研究
归因查找
运作原理
将事件拆解,并根据业务性质确定影响事件完成的关键部分
适用场景
对业务目标明确的进行归因
将目标达成分拆到各个模块,方便统计贡献
获悉达成当前指标的因素,指导业务提升
末次归因
转化路径短,事件关联性强
递减归因
转化路径长,非目标事件差异不大,没有完全主导的
首次归因
强流量依赖,拉人比后续所有事都重要
路径挖掘
行为事件
流入流出
适用场景
有明确的起始场景
希望观察场景之后发生了什么
有明确的结果目标
希望观察用户如何到达
运作原理:逐级展开事件的前一级,观察流向
行为序列
评估用户对产品的兴趣和依赖程度
运作原理:单一用户的所有行为以时间线的形式排列
适用场景
观察掩盖在统计信息之下更细致的信息,还原用户具体的使用场景
通过观察具体的行为特征,找到提升产品价值的机会点
5类常见业务场景
数据涨跌异动如何处理?
案例(数据涨跌)
跌(采取动作,减缓趋势)
问题是否严重(周/月同比)
服务器原因(产生断崖式下跌/按小时查看)
渠道问题(某个渠道远低于平时流量/渠道维度拆解)
关键词投放
缺货问题(某地区销量减少/当地动作相关)
涨(弄清原因,并放大)
如何评估渠道质量,确定投放优先级?
渠道评估
常见的渠道划分方式
来源
具体的流量实体
百度
头条
线下
。。。
媒介
推广中承载推广的实体
SEM
自然搜索结果
banner
。。。
其他参数
营销活动名称
广告关键词
。。。
渠道质量跟踪
1.选择关键事件
选取反应你产品目标人群会做的行为的数据
2.查看选择关键事件的用户来源
功能/内容上线后如何评估短期、长期价值、未来潜力?
评估价值
上线后价值明确
借助用户分群对比
转化关系复杂时
借助漏斗分析对比
转化关系明确
上线后关注其对产品价值的提升
精准留存对比
上线以探索更长期的产品潜力
分布分析
从对使用情况的促进作用来观察(产品核心功能使用频次)
占据用户一日时间段角度(使用场景,如时间端的分布)
了解数字背后的用户,以高质量拉新、精准运营、辅助产品设计
案例:如何了解数字背后的用户
用户画像
高质量拉新
从现有用户中找到“真正用户(高留存、核心行为频次、完成率高)”
找到“真正用户”特征
是谁(倒推地域、消费能力)
从哪来(电话访谈、调查)
按此特征,找到类似用户
用户画像
渠道来源
精准运营推送
运营资源盘活
出台推送的规则
精细化用户分群运营
千人?面
理想:每个标签推不同的内容
现实:在ROI上找个平衡点,选择出容易出成绩的
标签
人口统计学:性别、地域、年龄
业务相关:年级、BMI
运营位
推送内容与用户有关
向我说话
由我触发
与我有关
辅助产品设计
设计决策
谁--用户画像
在什么情况下--行为序列的属性
干什么&遇到什么问题--行为序列或屏幕录像
羊毛党盛行,如何找出?
抓作弊方法
找到1
发现数据异常
异常高且无理由的流量
工作人员观察
人工举报
找到模式
明确其目的
刷量
薅羊毛
spam
观察其特征
机刷
人肉刷
多:显著与普通用户相异的动作,如通过上商家变现,发布特定内容
少:留存低,非核心业务(如帮助页面)几乎不访问
找到N
RD(技术)爬取并人工审核
一网打尽
封:封禁、屏蔽、定向屏蔽
提高关键成本
前:注册7天后方可发帖
中:减少存在bug的商品的库存
后:提高提现的审核力度/周期
不做处理
流程
数据采集
指标建模
观测数据
数据分析
业务洞察
0 条评论
下一页