用户画像构建建模
2018-04-05 14:17:03 0 举报
AI智能生成
用户画像建模
作者其他创作
大纲/内容
如何构建用户画像
数据源分析
静态信息
用户相对稳定的信息,主要包括人口属性、社会属性,行为习惯,兴趣偏好和心理属性5个方面数据,这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗工作;
人口属性,包含年龄,性别,身高,地域,学历,收入和教育 社会属性,包括社会职务,婚姻状况,住房车辆,社交关系等等
行为习惯,包括运动,休闲旅游,酒店住宿,饮食起居等偏好
兴趣偏好,包括购物,游戏,体育,文化等
心理属性,生活方式,个性,需求动机,价值观,人生态度等, 最后的用户画像写出来就具备几个元素了:
姓名
照片 (看起来更真实)
年龄
家庭状况
收入
工作
用户场景/活动
计算机技能/知识
目标/动机
喜好
人生态度
兴趣偏好,包括购物,游戏,体育,文化等
心理属性,生活方式,个性,需求动机,价值观,人生态度等, 最后的用户画像写出来就具备几个元素了:
姓名
照片 (看起来更真实)
年龄
家庭状况
收入
工作
用户场景/活动
计算机技能/知识
目标/动机
喜好
人生态度
动态信息
用户不断变化的行为信息,如果存在上帝,每一个人的行为都在时刻被上帝那双无形的眼睛监控着,广义上讲,一个用户打开网页,买了一个杯子;与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等一样都是上帝眼中的用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多,如上图所示:浏览凡客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞“双十一大促给力”的微博消息。等等均可看作互联网用户行为。
用户行为数据建模
一个事件模型包括:时间、地点、人物三个要素,每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事
什么用户:关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。
什么时间:时间包括两个重要信息,时间戳+时间长度。时间戳,为了标识用户行为的时间点,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常采用精度到秒的时间戳即可。因为微秒的时间戳精度并不可靠。浏览器时间精度,准确度最多也只能到毫秒。时间长度,为了标识用户在某一页面的停留时间。
什么地点:用户接触点,Touch Point。对于每个用户接触点。潜在包含了两层信息:网址 + 内容。
网址:每一个url链接(页面/屏幕),即定位了一个互联网页面地址,或者某个产品的特定页面。可以是PC上某电商网站的页面url,也可以是手机上的微博,微信等应用某个功能页面,某款产品应用的特定画面。如,长城红酒单品页,微信订阅号页面,某游戏的过关页。
内容:每个url网址(页面/屏幕)中的内容。可以是单品的相关信息:类别、品牌、描述、属性、网站信息等等。如,红酒,长城,干红,对于每个互联网接触点,其中网址决定了权重;内容决定了标签。
注:接触点可以是网址,也可以是某个产品的特定功能界面。如,同样一瓶矿泉水,超市卖1元,火车上卖3元,景区卖5元。商品的售卖价值,不在于成本,更在于售卖地点。标签均是矿泉水,但接触点的不同体现出了权重差异。这里的权重可以理解为用户对于矿泉水的需求程度不同。即,愿意支付的价值不同。
什么事:用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏 等等。
目标分析
该阶段可以说是第二阶段的深入,要把用户的基本属性(年龄、性别、地域)、购买能力、行为特征、兴趣爱好、心里特征、社交网络大致标签化,关于“标签化”,一般采用多级标签、多级分类,比如第一级标签是基本信息(姓名、性别),第二级是消费习惯、用户行为;第一级分类有人口属性,人口属性又有基本信息、地理位置,等二级分类,地理位置又分工作地址、家庭地址的三级分类。,用户画像本质是对任何一个用户都能准确描述,用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。如,红酒 0.8、李宁 0.6。
标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。
权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。
{
"ID": 123456,
"姓名": "张建国",
"性别": "男",
"出生年月": 631123200,
"籍贯": "北京",
"居住地": "北京",
"教育背景": {
"学校":"北京大学",
"专业": "CS",
"入学年月":1220198400
"ID": 123456,
"姓名": "张建国",
"性别": "男",
"出生年月": 631123200,
"籍贯": "北京",
"居住地": "北京",
"教育背景": {
"学校":"北京大学",
"专业": "CS",
"入学年月":1220198400
0 条评论
下一页
为你推荐
查看更多