用户运营分析产品相关效果分析方法简介
2020-06-10 10:58:28 1 举报
AI智能生成
主要介绍假设检验和用户路径迁移
作者其他创作
大纲/内容
运营&产品相关效果分析方法简介
微观:运营活动的效果分析
使用场景
衡量运营活动效果和效率
指导运营方法更替和业务需求和目标
提升数据化运营专业性
分析方法
理论
假设检验
检验方法
T检验
F检验
卡方检验
非参数检验
检验种类
一个总体参数
两个总体参数
说人话的那种;公式自己可以去查
面对一个命题的时候,通常有两面性,对错,好坏或者有无效果,计有一个自己更倾向的答案,叫做备择假设,和对立的答案,叫做原假设;通过各种检验方案判断哪一个是正确的过程叫做假设检验
基本概念
弃真错误、取伪错误
弃真错误,原假设为真,但是检验结论拒绝了原假设,取伪就是相反;
显著水平
犯弃真错误的概率
置信区间
1-显著水平,也就是没有犯弃真错误的概率,也可以理解成容错概率,顺带插一一句,置信区间越小,那么容错空间也就越大,所以也就越不容易拒绝原假设
假设检验的基本步骤
1、提出原假设与备择假设2、从所研究总体中出抽取一个随机样本3、构造检验统计量4、根据显著性水平确定拒绝域临界值5、计算检验统计量与临界值进行比较
举个栗子
综合参考:https://zhuanlan.zhihu.com/p/124072225
T检验和F检验
比较两个均值(F检验视比较方差)的差异是否显著
在某次校园体检中,校长很关心初中一到三年年级学生在视力方面是否存在一定的差异?在医学领域中,可能需要为患者采取不同的医疗手段,对比患者在使用某种新型药物前后,对病情的治疗是否有显著的差异?
T检验和F检验 推荐阅读:https://zhuanlan.zhihu.com/p/30522466
卡方检验Chi-Square Test
用来检验两个变量的关系,通常用来检验某个变量和应变量的关系是否显著
卡方检验可以检验男性或者女性对线上买生鲜食品有没有区别;不同城市级别的消费者对买SUV车有没有什么区别;
强烈推荐阅读参考:https://www.zhihu.com/search?type=content&q=%E5%90%84%E7%A7%8D%E6%A3%80%E9%AA%8C%E6%96%B9%E6%B3%95%20%E6%98%93%E6%87%82
其他非参数检验
在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。
选读:https://zhuanlan.zhihu.com/p/49217262
有几个概念唠叨下
大小样本
大于等于30 为大样本
独立&相关样本
相关样本
前后两个样本之间存在一一对应关系
举个栗子:同时或者先后两个版本的分发人群,有交叉和重复,则前后结果有受影响,不为独立样本
独立样本
两个相互不影响的样本
举个栗子:A样本中的成员来自身份证号150开头的用户,B样本成员来自443开头的用户,A样本中的成员不论如何变动都不会对B成员构成影响,相反依然,则为两个独立样本
方差知不知道?
如果你知道的方差就是正态分布,如果不知道,就是T分布,如果不知道总体方差,并且我们假设未知的方差的倒数服从一个Gamma分布,那么将这无穷多个等均值,异方差的高斯分布叠加之后,就会得到T分布。也可以通俗的理解,因为未知时样本均值估计总体均值时没有已知总体方差时那样有把握,表现在具体方法上就是需要用更拖尾的T分布。大样本时用Z分布,小样本用T分布;
一个总体
举个栗子:牛牛圈的精华页优化,旧版本的转化率有47%,新版本全量发布上线,过一段时间统计,新版本的转化率51%,我们想了解到底哪个版本的更好?
两个总体
举个栗子:牛牛圈的精华页优化,两个新版本同时上线,流量无差异各50%,过一段时间统计,新版本1的转化率47%,版本2转化率51%,我们想了解到底哪个版本的更好?
计算方法不同
应用
ABtest
支持决策的工具
是典型的通过样本数据估计总体数据效果的方法,所以为了避免出现小概率错误,我们需要对AB测试的结果进行假设检验。
推荐阅读:https://zhuanlan.zhihu.com/p/79690021
ABtest的步骤
对两种检验的其他步骤相同
样本量计算
显著性检验
两样本比例
https://mp.weixin.qq.com/s?__biz=MjM5MjAwNTc2MA==&mid=2452698924&idx=1&sn=625efceb2aa564b1a5f82fa57e4169d9&chksm=b1697cc3861ef5d5b4be1aed556ce28958562f440b415cf1569e8231fdcced14cdeb74f48297&scene=21#wechat_redirect
两样本均值
https://jeffshow.com/category/a-b-%e6%b5%8b%e8%af%95
按照95%置信区间构造出来的区间,如果我构造出100个这样的区间,其中大约有95个会包含 均值
推荐阅读:https://www.zhihu.com/question/26419030
功效计算
统计检验正确的‘拒绝’你的“零假设”(Ho),的概率;统计功效的本质就是:1 - Beta !检验功效,只有power >= 80%时,才能得出结论(样本量不足),否则应延长测试。在实验结束前对数据进行统计检验往往会引发错误的结论,我们需要提前设计实验所需时长:即所需样本的数目。功效分析可以建立样本数量和统计灵敏度的数量关系,一方面提供达到一定精度所必须的样本数量,另一方面在给定样本数量后提供最高的精度。
推荐阅读:https://www.jianshu.com/p/d5ea74ca61f8;https://zhuanlan.zhihu.com/p/66329839
指标输入&输出
输入字段
两样本均值类
均值:x1 ,x2标准差:s1 ,s2 样本量:n1,n2
两样本比例类
结果输出字段
分析结果解读框架
font color=\"#c41230\
ABtest 的综合阅读
推荐阅读:https://jeffshow.com/caculate-abtest-required-sample-size.html
推荐阅读:https://jeffshow.com/science-theory-behind-abtest.html
双样本均值检验
双样本频数检验
实例ABtest
推荐阅读:https://blog.csdn.net/weixin_44508906/article/details/100067104
宏观:用户迁移路径监控
宏观监控用户流动方向和部分活动效果
体现用户质量变化和活跃变化
用户分类
质量(带来收入?)
低质量
不能等带来收入的人
未开户
中低质量
可能带来收入的人(目前尚无)
开户未入资
中高质量
已经带来收入的人(非融资融券和财富管理类)
入资,未使用衍生产品
高质量
可能带来更多收入的人(使用过融资融券和财富管理类的人)
入资,使用过衍生产品
活跃(带来访问?)
低活跃
0-5/30访问的人
高活跃
20+/30访问的人(每周近5+天)
中高活跃
12-19/30访问的人(每周近3+天)
中低活跃
5-11/30访问的人(每周近1+天的人)
指标输出
三维指标,质量&活跃标签用户的正负向流动用户情况和净增情况
理想结果和运营产品调控目标,正向流动值增加,负向值降低
输出结果
收藏
收藏
0 条评论
回复 删除
下一页