《数据资产论》-王汉生
2021-05-05 15:21:32 0 举报
AI智能生成
【概述核心内容】本书深入浅出,从最基础的数据定义和数据价值开始,到回归分析、XY变量的选取,最后到数据资产定价、确权、交易、治理,做到了全面的剖析。
作者其他创作
大纲/内容
不确定性的无知与无奈
从不确定性开始
不确定性的已定义
不确定性的重要意义
不确定性产生的原因
什么是不确定性?
如果一个特定的个体对一个特定的事件无法绝对准确地预测其结果
老王老李猜花生米,不知道拳头里面有无花生米,则是不确定性
掷硬币
不确定性事件广泛存在
婚姻选择有着极大的不确定性
职业选择有着极大的不确定性
身体充满着不确定性
消费者行为具有很强的不确定性
个人世界里充满了不确定性
运营良好的企业面临大量的不确定性挑战
任命这样的CEO
融资方案好坏
企业应该如何扩张
开发什么产品
如何推广产品
不确定性推动科研
人类自身的产生繁衍就有很强的不确定性
孟德尔遗传定律
流感的不同症状、规律
社会也充满了无知的困惑
自然界也充满了不确定性
亚里士多德和伽利略的自由落体实验
牛顿力学三定律
不确定性创造商机
股票交易的风险
个性化推荐
产生不确定性的原因
无知
无奈
绝大多数不确定性现象都是无知和无奈的结合
天气预测
股票价格变化
人体重要的生理指标
数据的时代特征
数据的朴素定义
数据产业的定义
就是与数据相关的产业,是数据能够支撑规模化应用的产业
规模化案例:传统艺术创作,传统画家与深度学习机器画家
数据的朴素定义
数据就是电子化记录,电子化记录就是数据
数据的时代特征
中文文本是数据吗?
声音是数据吗?
图像是数据吗?
运营商数据
覆盖面广
精准到个人
内容丰富
集中度高
合作意愿强
支付交易数据
银联控制着大量的支付类数据
银行实际控制着大量的交易类数据
交易类数据另一个主要拥有者就是以淘宝、京东、万达为代表的的线上线下零售平台
手机数据
手机制造商(苹果、华为)是一个很大的数据采集方
APP和它背后的互联网企业也是重要的数据采集方
在手机面前人们没有隐私可言
位置是暴露的
购物是暴露的
社交是暴露的
社交网络数据
分类
描述网络的拓补结构
点是人,边是关系
网络拓补结构上的数据
点和边的属性
复杂的相关性
反映了一个人的社交资产
位置轨迹数据
具有巨大的产业意义
大众点评
美团
滴滴
存储的基本形式:经度和纬度
浏览日志数据
网络日志关乎网络安全
网络日志关于消费者画像和产品设计
朴素的数据价值观
数据分析的核心
因为数据蕴含着商业价值,所以人们关心数据
数据产品客户不认可,原因:价值不清晰
数据分析根本就没有创造价值
数据分析所产生的价值难以被客户感知
价值表现的三个方面
收入
数据分析使得卖豆浆多卖
数据分析使得电商网站转化率提高
支出
数据分析使得超市收银员合理排版,降低人力成本
风险
数据分析优化商业银行的网上申请系统的限制门槛
参照系
产生的价值难以被感知,因为缺乏一个可量化的参照系
对客户流失模型精准度的离奇要求
分级建立车险风险组,通过对比进行参照
重大设备维修保养,宕机次数下降
价值与业务场景
业务场景定义
价值创造所必需的一系列也元素与条件的集合
有业务场景就自动有价值
业务场景是一系列业务元素和条件
场景第一,数据第二,算法最后
便利店分析案例,先找到场景即战略目标(今年开100家分店),然后进行分店选址的数据分析
价值与商业模式
对商业模式的错误理解可能带来错误的数据分析方向
快捷酒店定价分析,分店与总店立场不同,导致提升收入的分析没有取得预计效果
物流企业货车油耗分析,通过分析降低直营模式下司机的偷油问题
可被归因的价值
数据之于价值的因果关系很模糊,则相应的产业发展空间就非常有限
互联网广告数据分析,因很难归因,所以天花板不高
回归分析的“道”与“术”
统计学不研究统计
统计学不是研究总体和样本
统计学是一门关于收集数据、分析数据并根据数据进行推断的科学和艺术——作者认为这个定义非常糟糕
统计学是关于收集数据的吗?
统计学是关于数据分析的吗?
统计学是科学和艺术吗?
统计学不研究统计,研究的是不确定性
回归分析与不确定性
回归分析由两部分组成:业务分析(道)和技术分析(术)
现有实践主要集中在回归分析的“术”,而作者认为“道”更重要
老王卖鼠药案例
回归分析与管理决策
回归分析中的不确定性简单拆分为“可被研究的无知”和“无法研究的不确定性”
点上网站会员业务改进案例
回归五式
线性回归
股票投资
消费者案例
医疗健康
0-1回归
互联网征信
网上购物
社交网络好友推荐
定序回归
消费者喜好程度
计数回归
RFM模型
生存回归
癌症病人
因变量与业务诉求
确定业务的核心诉求
Y称为因变量,是业务的核心诉求
航空公司案例
电商客户关系管理
车联网案例
纵横对比两步法
第一步是纵向对比
第二步是横向对比
不存在完美定义的Y
航空公司案例
车联网案例
小额贷款公司案例
客户关系管理案例
瞄准真实的业务目标
消费信贷企业举办的数据分析竞赛
中超联赛球员数据分析
瞄准原因而不是结果
购物中心案例
物联网案例
解释性变量与业务洞见
X就是业务洞见
X称为自变量,是对业务的深刻见解
房价案例
X决定竞争优势
车联网案例
互联网征信案例
运营实践产生X
4S店案例
制度设计保障X
公司数据分析部门案例
预测精度与产品设计
预测不准是常态
预测精度的改进
最根本的改进在于信息量即X变量的增加,尤其是相关信息即相关性高的X变量的增加
预测精度的界定
思路1:业务需求
量化投资
征信
保险
思路2:对比标杆
当前情况
竞争对手
大数定律与产品化
大数定律抓住三个关键词:样本量、统计量和极限值
机票预测网站Farecast
数据资产定价
必要性与挑战
必要性
场景1:数据交易
场景2:投融资
挑战
第一个挑战:数据确权
第二个挑战:交易标的
第三个挑战:价值测算
数据确权
方案1:双方分享所有权
方案2:区分所有权与使用权
交易标的
两个假设
交易标的假设:不能是产权,只能是某种使用权
有限使用权假设
数据资产交易标的形态
由于交易的不是产权,因此不能把原始数据直接拷贝给购买方
数据供给方需知道数据要做什么计算
价值测算
数据资产定价的基础是交易
数据资产交易
交易的内容与形式
两种方案
方案1:隐藏用户ID
方案2:数据汇总
两种思路
思路1:数据模糊化
思路2:问答模式
验证谁是谁
信贷场景
可替代性与套利交易
汽油柴油价格案例
实物资产套利非常困难
套利交易对于维护市场价格的准确性、稳定性具有重要的意义
一个假想的资产交易所
数据交易所与股票交易所的区别
真实的资本市场交易的是股票,而数据交易市场交易的是数据指数
股票交易所交易的是股权,数据交易市场交易的是使用权,而不是产权
股市交易体量巨大,但数据交易体量更大!
什么样的数据指数才能上市呢?
具备真实可验证的数据生产场景,能够持续产生原始数据
具备清晰可被监管的算法公式
拟上市的数据指数应该具备足够的市场需求来支撑足够的交易量
数据交易所成熟后,对数据产业带来的影响和变化
规范高效的数据交易市场会驱动数据交易合法化
规范高效的数据交易市场会极大地帮助企业盘活数据资源,完成数据资源资产化,促进数据化转型
规范高效的数据交易市场会极大地促进数据资产之间的市场竞争,让数据资产价格透明化,降低使用成本
规范高效的数据交易市场会极大地促进数据资源的高效利用
数据交易市场的形成还会极大地鼓励差异化竞争
数据治理与价值创造
数据治理时代
公司治理与数据治理
什么是公司治理?
老王卖鼠药
狭义上,公司治理就是要解决公司时间中资产所有者和实际经营者分离所产生的矛盾
广义上,公司治理就是对公司的所有相关者利益的协调与规范
什么是数据治理?
数据治理,不是对数据的治理,而是对数据资产的治理,是对数据资产所有相关方利益的协调与规范
数据资源资产化
按照会计准则,数据资产需要满足三个条件
由企业过去的交易或者事项形成
容易满足
企业过去正常经营的自然积累与产出
资源互换
企业拥有或者控制
有一定难度
数据产权不容易界定
预期会给企业带来经济利益
不容易满足
记录电子化
数据聚合
质量保证
真实性
完整性
精准性
数据确权与合规
数据确权
数据采集
合法正当原则
知情同意原则
必要性原则
被遗忘权
使用场景
使用手段
数据安全
价值创造与人才培养
讨论与总结
剑桥门事件
数据产业及其宝贵,但要做到合法合规
0 条评论
下一页