美食场景分析方法与计算算法分享
2022-10-26 18:25:19 0 举报
AI智能生成
美食场景分析方法与计算算法分享
作者其他创作
大纲/内容
数据采集
高德地图poi爬取
美食点
酒店
商场
超市
城市边界
osm开源数据
osm道路图层
省公司反馈
沿街美食聚集区域
商业综合体
酒店
重点美食酒楼
不规则美食聚集区
数据汇聚
生成图层
美食点
酒店lt;br
商场
超市
图层合并
merge
生成buffer30m图层
merge_buffer
增加area字段并计算面积
生成点在面内的美食点
导入food_tagged表
复制美食点表并在后面增加父级字段
导入边界关联数据
计算点在面外的美食点
交集取反symdif,用来计算美食街
获取街道
获取城市边界
结合osm道路地图获取城市范围内的道路
按名称合并道路
增加长度字段,计算街道长度
删除无名道路
筛选长度小于0.1(十进制度decimal degrees,约10公里)
生成buffer40米图层
road_buffer
生成点在街里的美食点
街内美食点dbscan
100米8个
选美食街20个点
导入food_tagged表
如有交叉路口美食点,则在parent_address用“|”分隔记录
取food_tagged表父级为空
dbscan200米100个汇聚成不规则美食聚集区域
导入food_tagged表
数据分级
重点城市
沿街美食聚集区域
1、人均消费、评价、环境得分、评价人数去除噪
2、对归属于同一条沿街美食聚集区域的所有店铺,进行人均消费、评价、环境得分、评价人数4种因素的汇总,其中人均消费、评价、环境得分求平均值,评价人数求和
3、人均消费、评分、环境、评价人数,店铺数量5个因素得分进行归一化
4、按照人均消费、评分、环境、评价人数40%-- 20%--20%-- 20% 的比例计算出店铺档次分。并将店铺档次分进行归一
5、店铺数量、评价人数、店铺档次得分按照 20%--20%--60%的比例算出最终得分,存储在结果表score_final
6、对结果表score_final按照人均消费(cost)降序排序。将位于30%位置的人均消费数值,记录为cost_limit
7、取结果表里score_final的前30%,通过人均消费(cost)大于cost_limit,店铺数量(num_store)大于25、街道(length,通过area字段,由decimal degree单位转换为米,)长度大于300米同时满足的,得到列表1
8、按照评价人数(total)降序排序,取前30%,得到列表2
9、取列表1、列表2的并集并去重,得到沿街美食聚集区域最终列表,北京共得到50条沿街美食聚集区
不规则聚类美食场景
1、对属于不规则聚类美食场景的店铺的人均消费、评价、环境得分、评价人数去除噪,避免极值对结果的影响
2、对归属于同一不规则聚类美食场景的所有店铺,进行人均消费、评价、环境得分、评价人数4种因素的汇总,其中人均消费、评价、环境得分求平均值,评价人数求和
3、对每一不规则聚类美食场景的人均消费、评分、环境、评价人数,店铺数量5个因素得分进行归一化
4、按照人均消费、评分、环境、评价人数40%-- 20%--20%-- 20% 的比例计算出店铺档次分。并将店铺档次分进行归一
5、店铺数量、评价人数、店铺档次得分按照 20%--20%--60%的比例算出最终得分,存储在结果表score_final
6、输出不规则聚类美食场景详细得分列表
商业综合体
1-5步同不规则聚类美食场景
6、得到结果后将店铺数量小于等于6的商业综合体所包含的店铺从原始数据中清除,再次进行商业综合体分级,得到最终结果
7、重复1-5步骤
8、剔除商业综合体名称(对应结果表中parent_name)包含“装修”、“暂停”字段的数据,得到商业综合体列表
重点酒店
1、 剔除没有轮廓的酒店
2、 剔除包含“连锁酒店”字段的酒店
3、 取最低消费及平均消费的两者最大值排序,取TOP20%得出分级结果
4、 剔除酒店名称名称(对应结果表中name)包含“装修”、“暂停”字段的数据
重点美食餐厅
1、 排除店铺名称、店铺地址、店铺归属的美食场景名称(parent_name字段)中包含“装修”、“暂定”等字样的店铺
2、 排除评价人数低于100的店铺
3、 取人均消费排名的TOP4%列表、评价人数排名TOP2%列表,取并集,并去重
二三线城市分级
1、按照店铺数量分三档,分界线分别为30000、10000,高于30000为一线城市,低于10000为三线城市,中间为二线城市;一线城市参数集合采用38重点城市集合
2、不规则美食聚集区场景,源数据中没有,则可以为零,如果源表里有,结果中至少包含一个
3、沿街美食聚集区参数
对应步骤6
cost_limit
一线:30%,二线:20%、三线:20%
江苏更新
一线:30%,二线:10%、三线:10%
对应步骤7
包含店铺数量(沿街聚集美食聚集区定义)
一线:25、二线:23、三线:20
江苏更新
二三线25个
街长度(沿街聚集美食聚集区定义)
一线:300、二线:270、三线:240
江苏更新
二三线300
取清单前百分比
一线:30%、二线:30%、三线:30%
江苏更新
一线:30%、二线:10%、三线:10%
对应步骤8
评价人数top百分比门限(步骤8)
一线:30%、二线:30%、三线:30%
江苏更新
一线:30%、二线:10%、三线:10%
4、不规则美食聚集区参数
最终提取TOP百分比
一线:30%、二线:20%、三线:20%
江苏更新
二三线
10%
5、重点美食餐厅参数
评价人数
一线:100、二线:90、三线:80
江苏更新
一线:100、二线:90、三线:90
一线:取人均消费排名的TOP4%列表、评价人数排名TOP2%列表。二、三线:取人均消费排名的TOP2%列表、评价人数排名TOP1%列表
通报KPI/MR计算方法
KPI计算方法
高负荷待扩容
1、高负荷待扩容小区:ishighloadamp;nbsp; 0.5
2、高负荷待扩容场景:包括高负荷待扩容小区
高负荷预警
1、高负荷预警小区:isgaofuheyujingamp;nbsp; 0.5
2、高负荷预警场景:包括高负荷预警小区
计算方式
1、Sheet1:加入高负荷待扩容小区比例、高负荷预警小区比例,2、Sheet3:高负荷待扩容美食场景清单:后面加上这个场景对应的类型;3、Sheet5:高负荷预警美食场景清单:后面加上这个场景对应的类型;4、Sheet2、4、6:在小区后引入Indooramp;amp;outdoor,有站名也加上(补充)5、Sheet7:增加,原来说过的,高负荷待扩容及高负荷预警,只要出过的,进行一下标记记录,同时记录一下时间,后期原则上不允许删除;(补充)6、Sheet3、Sheet5:累计出现次数,本次全为1,下次如果再有再累加1;这样的话COUNT(name)代表本次是否有,新增的累计出现次数列代表历史出现过的月份数;(补充)7、统计数据中加入时间,加入全网;各Sheet中加入时间;
KPI通报字段
汇总指标
省名称
市名称
高负荷待扩容小区数量
高负荷待扩容小区比例
高负荷待扩容美食场景数量
高负荷待扩容美食场景比例
高负荷预警小区数量
高负荷预警小区比例
高负荷预警美食场景数量
高负荷预警美食场景比例
美食场景数量
服务小区数量
高负荷待扩容美食场景清单
省名称
市名称
高负荷待扩容美食场景名称
包含的服务小区数量
美食场景名称
最近出现时间
时间戳
出现次数
高负荷预警美食场景清单
省名称
市名称
高负荷待扩容美食场景名称
包含的服务小区数量
美食场景名称
最近出现时间
时间戳
出现次数
全量数据
CGI
服务小区中文名
省名称
市名称
美食场景名称
美食场景类型
美食场景类型代码
覆盖类型
高负荷待扩容小区
高负荷待扩容小区(1:是,0:不是)
高流量感知预警小区比例
高流量感知预警小区比例(1:是,0:不是)
最近出现时间
时间戳
MR计算方法
弱覆盖
1、重点美食酒楼,不计算MR覆盖相关内容
2、小区覆盖率(总MRO好样本/总MRO样本)
3、场景覆盖率(所有服务小区的总MRO好样本/所有服务小区的总MRO样本)
4、小区MRO覆盖率低于90%,记为弱覆盖小区
5、场景MRO覆盖率低于90%,记为弱覆盖场景
低于竞对
1、重点美食酒楼,不计算MR覆盖相关内容
2、低于竞对小区:移动覆盖率低于80%且竞对高于80% 或 移动覆盖率[80%,90%]且低于竞对5PP以上
3、低于竞对美食场景清单(低于竞对小区比例高于50%)
计算方式
1、重点美食酒楼,不计算MR覆盖相关内容;2、sheet1:分省统计表:覆盖率(总MRO好样本/总MRO样本),弱覆盖小区(MRO覆盖率低于90%)比例,弱覆盖美食场景数量及占比,低于竞对美食场景数量及占比;3、Sheet2:弱覆盖小区清单;4、Sheet3:弱覆盖美食场景清单(MRO覆盖率低于90%):省份、地市、名称、MRO覆盖率、美食场景类型名称;5、Sheet4:低于竞对小区清单:移动覆盖率低于80%且竞对高于80% 或 移动覆盖率[80%,90%]且低于竞对5PP以上6、Sheet5:低于竞对美食场景清单(低于竞对小区比例高于50%):省份、地市、名称、低于竞对小区比例、美食场景类型名称;7、sheet6:全量数据;8、Sheet7:弱覆盖、低于竞对小区清单,记录出现次数、出现时间;9、统计数据中加入时间,加入全网;各Sheet中加入时间;
MR通报指标
汇总指标
省名称
市名称
小区数
美食场景数
总MRO样本
总MRO好样本
覆盖率(总MRO好样本/总MRO样本)amp;nbsp;
弱覆盖小区(MRO覆盖率低于90%)数量amp;nbsp;
弱覆盖小区(MRO覆盖率低于90%)比例amp;nbsp;
弱覆盖美食场景数量amp;nbsp;
弱覆盖美食场景比例amp;nbsp;
低于竞对小区数量amp;nbsp;
低于竞对小区比例amp;nbsp;
低于竞对美食场景数量amp;nbsp;
低于竞对美食场景比例amp;nbsp;
弱覆盖美食场景清单(MRO覆盖率低于90%)
低于竞对美食场景清单(低于竞对小区比例高于50%)
全量数据
服务小区识别
38重点城市
服务小区识别
有轮廓边界的
商业综合体、星级酒店
宏蜂窝
范围内
进行关联
范围外
天线波瓣角
120%
按照扇形模拟
100米范围内
有交叉
进行关联
200米范围内
交叉面积占覆盖面积超过30%
进行关联
微蜂窝
轮廓范围内
全算
轮廓外扩
80米
美食街、不规则美食区域
宏蜂窝
轮廓范围内
进行关联
范围外
天线波瓣角
120%
按照扇形模拟
100米范围内
有交叉
进行关联
200米范围内
交叉面积占覆盖面积超过30%
进行关联
微蜂窝
暂不考虑
主要原因:该场景微蜂窝部署少,按照GIS规则填加后错的比正确的多太多
无轮廓边界
重点美食酒楼
宏蜂窝
中心经纬度200米范围
方位角120度包住
微蜂窝
暂不考虑
主要原因:该场景微蜂窝部署少,按照GIS规则填加后错的比正确的多太多
二三线城市
服务小区识别
有轮廓边界的
商业综合体、星级酒店
宏蜂窝
范围内
进行关联
范围外
天线波瓣角
120%
按照扇形模拟
100米范围内
有交叉
进行关联
200米范围内
交叉面积占覆盖面积超过30%
进行关联
微蜂窝
轮廓范围内
全算
美食街、不规则美食区域
宏蜂窝
轮廓范围内
进行关联
范围外
天线波瓣角
120%
按照扇形模拟
100米范围内
有交叉
进行关联
200米范围内
交叉面积占覆盖面积超过30%
进行关联
微蜂窝
暂不考虑
主要原因:该场景微蜂窝部署少,按照GIS规则填加后错的比正确的多太多
无轮廓边界
重点美食酒楼
宏蜂窝
中心经纬度200米范围
方位角120度包住
微蜂窝
暂不考虑
主要原因:该场景微蜂窝部署少,按照GIS规则填加后错的比正确的多太多
省份提交、核验及数据入库
下发
文件及内容
场景服务小区表
POI_LTE_FOOD_日期
场景表
数据库同步更新
1、更新Sheet名称
2、更新字段
3、增加后面两列
修改原有
统计表
反馈结果更新到数据库
图层文件
关注美食街TOP文件的打开问题
省份可修改内容
场景表
重点美食酒楼
可增加
不可删除
关店可以删
增加需要字段
经纬度
ID
写说明
省
城市
区
地址
备注
商业综合体
可增加
不可删除
关店可以删
增加需要字段
中心经纬度
ID
写说明
地址
边界
写说明
省
城市
区
备注
沿街美食聚集区
不可删除
可增加
增加需要字段
地址
typecode
省
城市
区
备注
重点酒店
可增加
不可删除
关店可以删
增加需要字段
经纬度
ID
写说明
区域
地址
边界
写说明
不规则
不可删除
不可增加
服务小区类
增加填写字段
李涛完善
需要与场景表对应填写
场景
重点美食酒楼
可增加微蜂窝
宏蜂窝不动
商业综合体
不允许动
沿街美食聚集区
可增加微蜂窝
宏蜂窝不动
重点酒店
不允许动
不规则
可增加微蜂窝
宏蜂窝不动
提交内容核验
核验内容
字段合规
服务小区表
相关字段
场景表
相关字段
填报有效性
服务小区表中场景
在场景表中都在
IDamp;amp;中文名
方式
工具发省里
确认无问题可反馈
反馈带截图
数据入库
入库条件
方式
结果通报
0 条评论
下一页