企业经营数据分析
2020-07-13 15:38:21 2 举报
AI智能生成
数据分析
作者其他创作
大纲/内容
企业中的数据
数据的定义
事物存在和发展的数字化记录
数据按描述内容分类
静态数据
描述对象本身
特征:不会经常变化,采集后,不断更新即可
动态数据
描述对象的活动行为
特征:不断叠加,新纪录不能覆盖旧纪录
数据类型
计算机识别类型
文本类
数值类
声音图片视频
特性
定类数据
不能比较大小
区分类别
定序数据
不能比较大小
MECE原则
案例
优、良、差
定距数据
比较大小
时间、温度
0值没有实际意义
定比数据
可以进行比较
0值有实际意义
数据结构
静态数据
动态数据
结构关系
运算关系
层级树形结构关系
集合关系
线性关系
树形结构关系
图形结构关系
数据质量
准确性
采集值与真实值的误差,误差越大
由【采集方法】决定
精确性
采集的精度有关,例如精确到厘米还是毫米
由【测量方法】和【手段】决定
真实性
正确性
取决于数据采集、处理过程的可控程度
采集方式
处理方式
计算方式
存储方式
应用方式
及时性
及时获取需要的数据
采集、处理效率;制度、流程 效率
即时性
数据源采集完毕立即加工呈现,就是 即时数据;即时数据可以转变为历史数据
完整性
应采集数据与实际采集数据的差异:员工信息表18项,填了10想
不仅有项目完整性,还有时间完整性
全面性
指数据采集的遗漏情况
MECE法则
相对的
关联性
各个数据集的关联关系
数据割裂或数据孤岛
影响企业数据价值
数据处理
脏数据
数据不规范
同一个数据不同的格式造成计算机识别困难
数据不一致
原因:同一条数据记录多个地方,更新后不一致,非【单维数据表】
方案:单维数据表
标准不统一
人的认知标准差异化
方案:给出分类,供用户选择
格式错误
录入了错误的格式
方案:增加校验机制
附加字段
年龄
这个部分,造成数据冗余
数据清洗
重要原则
给自己留下反悔的余地
尽量不要破坏原始数据,不直接修改原始数据
excel中【禁止🈲】使用【查找+替换】因为会破化原始数据 ,不能反悔
数据分析的目的&步骤
目的:
对过去发生的现象评估分析,找寻证据,在这个基础上对未来事物做预判,或指导未来行为
1、描述事物
2、提出问题或假设
3、寻找证据
对比、拆分、追溯、回归分析
4、归纳总结
总经经验
监控
洞察
探索发现
问题
产品问题
运营问题
数据问题
机遇
预测未来
5、方案输出
数据分析思路&技巧
明确分析目的
寻找问题根源,解释目前现象
寻找某种规律,指导目前产品
对比与对标
对比是识别事物的基本方法
对比
横向、纵向、多维度
历史对比
和自己
同级别对比
和别人
先总后分,逐层拆解
逐层拆分
一级拆分:利润=收入-支出;二级拆分:收入=单价*数量
逐维拆分
不同拆分思路,解决不同问题
总销售额
产品维度
销售数量*销售单价
销售维度
销售人员平均业绩*销售人员数量
店铺维度
单店平均销售额*店铺数量
客户维度
客户数量*单客户平均成交金额
关注细节,抽丝剥茧
细节的逻辑关系可能对结果产生终极影响
细节
心理因素
人类各种心理活动对结果的影响判单
年龄、文化、工作氛围、领导等因素都会对结果有影响
子主题 1
内外延伸,概念清晰
数据分析结论是所揭示的洞察的定型化总结
容易产生多种理解的概念要详细解释,不可以让概念产生歧义,衍生出错误的认知
可视化作图,按照认知规律展示
点图
相对位置,相关关系
气泡图
点图的延申,结构组合关系,相对关系
线图
变化趋势、变化特征、规律
柱形图、条形图
比较大小及结构关系
饼图
事务的结构、比例关系
面积图
展示累积效果、结构关系、结构变化
雷达图、扇形图
多维图表、描述事物多个维度的特征
识图的九个方法
辅助线
找差异,找变化
找奇异点,特殊群体
找转折点和拐点
找特征
找问题
what
who
when
where
how
找关系
找驱动
找规律
认知事物(分类)
认知事物的基本方法
案例:
客户大小
大客户
中客户
小客户
事情
事
情(人)
GE矩阵
市场增长速度
市场占有率
时间管理矩阵
重要
紧急
RFM模型
手段:解构事务的三要素
要素
属性
行为
方法
维度分类法
各个维度不相关
相关性系数严格控制在(-0.3,0.3)
如果相关性高,则需要对维度进进行【因子化拆分,使用统计学上的主成分分析法来计算因子】
简单才是最实用的
强调平行的维度标准
属性分类法
属性之间是并列非强相关关系
流程分析法
层级分析法
分类中的权重设定
寻找规律(聚类)
分类依据
聚集的目的
行为
活动
聚类的因子和主成分
主成分分析
步骤
1、确定聚类的标准变量
2、标准化事物描述变量
极值标准化
最大值标准化
最小值标准化
平均值标准化
方差标准化
3、距离计算方法计算相似性
4、设计聚类的算法或者程序
5、计算类之间的差异性一级保证类与类之间的距离最大化
6、根据商业需要,判别聚成几类
7、解读及描述分类
8、验证及投入实际工作
9、持续检验,对业务效果评估
10、算法改进和调整
聚类分类
有序聚类
地理勘测
时间聚类
股票指数
逻辑关系(发展规律)
数据分析的核心目的是掌握事务的发展规律
逻辑关系
随着时代等会有差异,要不断调整逻辑关系
构建逻辑关系模型,数据化管理公司
注意【因果】关系还是【共生】关系
技术
验证因果关系方法
相关系数
案例:对数据进行【描述分析】,并分别计算2010年和
逻辑回归
回归分析
预测
数据分析的终极目标
常用方法
经验法
经验丰富的优化师能够判别如何打广告更有效
招聘
专家预估法
类比法
用A的规律指导B
一个产品,经历三个大的版本迭代后,才定型
惯性法
人们行为习惯有一定惯性
时间序列分析
TSCI数学模型
逻辑关系法
知道事物间的逻辑关系,则根据一个变量推测另一个变量变化
口红销量与经济
整体分析-结构
案例
组织架构分析
科层组织
倒立组织
平台组织
组织资源分配
各类职工工资占比
不同公司:研发投入与销售收入对比
不同层级间的对比
总监级别
变动工资高,压力大
普通员工
变动工资低,动力小
组成要素与组成方式(结构)影响事物的根本属性
微小的工资下降影响员工积极性
事物的构成除了与要素有关,还与组合方式及过程有关
同样面粉,做出来面包和馒头
调整数据模型要素,以适应新的环境需求
【预期】管理比【实际】激励更有效-基准
基准是判别事物的标准
不同属性的职工的薪资结构不一样,影响不一样
对比基准不一样,心理感受不一样
关键要素与非关键要素
关键要素是【核心功能】,非关键要素是【不可或缺】的其它要素
不同组织,不同场景,不同部门,关键要素与非关键要素有差异
销售部关键要素是卖东西
生产部就是生产产品
采购部:价格、品质、交期是采购部负责的
财务部:
预算控制
最佳组合
规划求解
资源有限,通过合理配置资源,让产出最大化
产出确定,通过合理资源配置,让投入最小化
案例
最短路线
项目管理,关键路径管理
技术
连续优化问题
无约束条件
非线性等式
非线性最小二乘
球面规划
不可微分规划
有约束条件
线性规划
非线性规划
网络规划
离散优化问题
DEA模型
结构化效率分析
案例
产品成本结构是否合理,效率是否足够高,与竞争对手差异
产品生产效率影响因素模型【人机料法环】
人
能力
积极性
技术
态度
知识
机器设备
保养维护
状态
先进性
发挥率
物料
齐全
是否要等待
品质
顺序
是否二次加工
方法
合理性
最优
可替代方法技术
符合现代
环境
人的环境
设备
工人心情
产品品质
工艺环境
积累各种模型,定制化设计,形成数据库
不用每次从0开始
不会有显著性遗漏
职能部门数据分析案例
1、了解企业组织设定的原则
同样的部门,不同的公司差异巨大
因传统导致不合理
基层员工工资必须低于高层员工
人力资源中的数据分析
人力效能分析
人均产出率
人员费用产出效率
人员结构性分析
不同职能部门
不同层级的人才结构
不同教育水平的人才结构
不同年龄
某个年龄出现断层,会导致某个阶段公司出现人才断层
不同性别
不同工作年限
数据是表象,业务才是核心,数据是业务的一种体现。
【人】:对人性的理解和把控,对于数据分析非常重要
【规则】规则产生漏洞,漏洞吸引人性,人性引发业务操作,业务操作引发数据异常。这是连锁反应。
销售压货
【环境】对于行业的理解,对于管理的理解都非常重要
【管理】这不是数据分析书籍,更多的像是管理书籍
备注:这本书,就是可能引发数据分析师,多一些分析思路
0 条评论
下一页