AnalysisCookieVisitPathDayHourMapReduce
2016-04-28 09:18:26 0 举报
AI智能生成
AnalysisCookieVisitPathDayHourMapReduce是一个数据处理过程,主要用于分析网站的访问路径、访问日期和访问小时。这个过程首先通过Map阶段将原始数据进行预处理,然后通过Reduce阶段对处理后的数据进行汇总和分析。在这个过程中,可能会使用到一些常用的数据分析方法,如聚类、分类、关联规则挖掘等。最终,这个过程可以帮助我们了解用户的访问习惯、网站的流量分布等信息,从而为网站的优化提供依据。
作者其他创作
大纲/内容
map端处理(每一条记录都是用户单次点击的行为)
map端输出value是页面浏览信息(用户id,ip地址,是否是新用户,渠道信息,浏览时间,浏览的url,上一个url,浏览行为,userAgent信息,是否从web到移动端,浏览移动端的标记(默认0移动端1微商城20),actionId,actionKey)
reduce端处理(同一个cookie用户的所有访问行为)
1.初始化属性:是否有www跳转到mobile的情况,会员id(userId),新访客(isNewcookie),客户端信息(userAgentInfo),平台(subSiteType),IP地址(ipAddress),是否包含移动端的访问(hasMobileVisit),是否包含v商城访问(hasVmallVisit),是否是太安堂网站(isTat),太安堂 wap(isTatWap)
2.获取cookieID,从map端输出的key中获取(平台+juid作为key)
3.封装该用户所有的浏览页面信息(list集合),totalValues记录pv,
4.获取最后的ip地址,新房客设置1,是否访问过移动端页面,是否访问过V商城,是否从官网跳转到移动端(是就获取对上一个URL),是否来自太安堂官网,设置会员ID(userid)
5.对该用户访问过的所有页面信息进行pv排序,通过访问时间比较
6.设置访问网站类型,如果是移动端访问的还得判断是否从网站跳转到移动端的
0 条评论
下一页
为你推荐
查看更多