mobdi
2019-04-17 11:18:50 0 举报
AI智能生成
项目结构规划
作者其他创作
大纲/内容
sbin
mobdi
etl(存放etl清洗脚本)
22个etl清洗脚本
online(存放模型标签相关脚本)
etl_check
checkSourceData.sh
stg_base
device_language.sh
device_app_active.sh
android_device_info.sh(现脚本放在new_master中)
device_ip_info.sh(现脚本放在new_master中)
device_applist_master.sh(现脚本放在new_master中)
device_update_resvered_master.sh(现脚本放在new_master中)
refactor_new_applist.sh
device_tag_tf.sh
device_mintime_incr.sh(现脚本放在stg_rule中)
merge_active.sh(活跃数据的改进,将pv.log和run.log合并成一张表,现脚本放在after_mobdi中)
lbs_location
t_location.sh
pv.sh
log_wifi_info.sh
log_run_new.sh
location_info.sh
base_station_info.sh
auto_location_info.sh
device_staying_daily.sh
wifilist_explore.sh(现脚本放在new_master中)
ios_device_info.sh(现脚本放在new_master中)
device_lbs_poi_tmp.sh(处理lbs数据,生成对应的poi数据)
device_lbs_label.sh(lbs标签,统计设备每一天在同一地点的停留时间区间)
app_runtime.sh(当天设备活跃的applist,现脚本放在after中)
stg_model(存放模型前置脚本)
feature_category_installed_cnt_incr_new.sh
feature_device_info_master_incr_new.sh
public_pre_par_new.sh
profile_model(存放模型)
11个基础标签模型脚本
device_cluster.sh
device_nationality.sh
device_group_list.sh
submit_merge_2.sh(逻辑自洽)
rp_device_models_confidence_daily.sh(置信度增量表)
profile_full(存放运行full表脚本)
rp_device_full_view_pre.sh(profile_full前置脚本)
rp_device_full_view.sh(生成profile_full)
rp_device_demo_update.sh(生成近40天的模型画像数据)
rp_device_cate_preference.sh(计算设备app分类偏好度)
rp_device_models_confidence_full.sh(生成confidence_full)
tag(存放标签生成脚本)
online_tag
online_tool.sh(线上标签通用工具)
online_tool360.sh
financial(金融标签,可以被线上标签代替,待废弃)
sdk_professionLabel_active_profile.sh(周)
sdk_professionLabel_active_profile.sh(月)
sdk_professionLabel_active_3month.sh
sdk_professionLabel_install.sh
sdk_professionLabel_active_slope_week.sh
sdk_professionLabel_financial_installed.sh
financial_active.sh(rp_mobdi_app.timewindow_online_profile flag=15 除了信用卡还有金融)
financial_install.sh(rp_mobdi_app.timewindow_online_profile flag=14)
finance_timewindow.sh(多头借贷金融标签,可以被线上标签代替,待废弃)
multiloan_finance2es_http.sh(导入多头借贷timewindow_multiloan_finance到es)
ios_tag_list.sh(ios活跃标签)
timewindow_online_profile.sh(飞飞开发的线上标签代码,即将废弃)
installed_cate_profile.sh 分类在装计算rp_mobdi_app.installed_cate_profile
pay_installed.sh(rp_mobdi_app.timewindow_online_profile flag=10)
pay_install.sh(rp_mobdi_app.timewindow_online_profile flag=11)
pay_active.sh(rp_mobdi_app.timewindow_online_profile flag=12)
pay_active_3month.sh(rp_mobdi_app.timewindow_online_profile flag=12)
pay_active_slope.sh(rp_mobdi_app.timewindow_online_profile flag=16)
device_active_tag_tfidf.sh(根据活跃app全量计算标签的权重)
monthRun3day_device_tag_tfidf.sh(根据在装app全量计算标签(为了更新标签的idf),tfidf全量数据的计算)
game_lable.sh (游戏行业标签 rp_mobdi_app.timewindow_online_profile flag=17-21)
rp_device_label_profile_ios.sh(IOS 活跃兴趣标签)
offline_tag
ios_lbs_poi_mapping.sh(计算ios所在经纬度附近多种行业类型的poi信息)
device_lbs_poi_mapping_new_1.sh(计算餐饮的poi信息)
device_lbs_poi_mapping.sh(计算device所在经纬度附近多种行业类型的poi信息)
hotal_ios.sh(酒店ios线下标签)
car_ios.sh(汽车ios线下标签)
tour_ios.sh(景区ios线下标签)
hotal.sh(酒店android线下标签)
car.sh(汽车android线下标签)
tour.sh(景区android线下标签)
catering.sh(餐饮android线下标签)
cateringLbs_week_month.sh(即将废弃)
poi_3_summary.sh(生成老的ios线下标签,即将废弃)
extend_tag(衍生标签)
device_position_classify.sh(常去地是城市还是农村)
device_medical_location_count.sh(医疗健康)
device_install_cnt.sh(设备在装列表数(p2p借贷和现金贷))
bssid_sport_health.sh(运动健康)
sns_tag(社交标签)
ios_sns_info.sh (ios社交信息)
rp_device_sns_full_daily.sh(社交平台信息总表)
device_phone_sns_daily.sh(基于shareSDK采集的数据,维护微信账号和手机号的全量映射表)
id_mapping_monthly.sh(设备的社交账号信息汇总)
location_tag(工作地和居住地标签)
data_prepare.sh(工作地居住地数据准备)
first_dbscan.sh
final_work.sh(工作地计算最终结果)
final_home.sh(居住地计算最终结果)
union_work_home_place30.sh(工作地居住地,一个月)
union_work_home_place90.sh(工作地居住地,三个月)
rp_device_location_monthly_struct.sh(工作地居住地struct一个月)
rp_device_location_3monthly_struct.sh(工作地居住地struct三个月)
device_frequency.sh(常去地)
first_dbscan.sh(ios)
final_work.sh(ios工作地计算最终结果)
final_home.sh(ios居住地计算最终结果)
union_work_home_place_ios.sh(ios工作地居住地)
travel_tag(出行标签)
permanent_place.sh(ios常驻地计算)
device_location_current.sh(设备每日所在地)
permanent_place.sh(android设备常驻地)
travel_locations_daily.sh(出行中间表)
travel_preference.sh(出行偏好)
rp_device_outing.sh(设备出境表)
permanent_city_lbs_only.sh (mobdi商业地理 常驻省市计算)
device_tag(设备标签)
ios_info.sh (ios设备信息)
ios_location_info.sh(ios地理位置信息)
qc(以后所有qc的代码都会放到这里)
real_time_mobdi_qc(紧接着脚本执行的实时qc)
qc_before_view.sh 四张视图生成前的qc
after_mobdi_qc(mobdi运行完毕后的qc)
run_mobdi_monitor_counts_report.sh 监控表的行数和主键行数
run_mobdi_monitor_stats_report.sh 监控full表字段分布
mobdi_monitor_mapping.sh mapping表分区每日监控
hot_app_not_mapping_monitor.sh 安装量大的app不存在分类信息的发出告警
daily_active_report.sh(活跃报表定时统计发送)
mapping(存放mapping表生成逻辑)
app_pkg_mapping
weeklyRun_rp_app_name_info_v2_160.sh(渠道清理-生成包和app的映射关系表)
weeklyRun_app_pkg_mapping.sh(渠道清理-初步包名渠道清理)
weeklyRun_apppkg_info.sh(渠道分析-app信息-通过apppkg获取app_icon,app_name,cate_id,cate_name)
weeklyRun_cleanpkg_weekly_run.sh(渠道清理-生成渠道清理前后的包名及app_name的映射)
app_pkg_mapping_par_sqoop.sh(初步包名渠道清理,dm_sdk_mapping.app_pkg_mapping_par每次更新后,需要将该表插入到标签系统所用的mysql中以供外部使用)
apppkg_info.sh
app_detail_sdk.sh(APP详情,来自豌豆荚和应用宝爬虫,每天定时跑)
bssid_mapping
BssidMappingTask.sh
penetrance_ratio
app_active_monthly_penetrance_ratio.sh(mobdi渠道分析月表)
app_active_weekly_penetrance_ratio.sh(渠道分析周表)
app_active_daily_penetrance_ratio.sh(渠道报表日表)
phone_mapping
phone_mapping_full_monthly_update.sh(swap接口手机号定期插入mapping表,dm_sdk_mapping.phone_mapping_full)
id_mapping
ios_id_mapping_full_weekly.sh
ios_id_mapping_incr_step1.sh
ios_id_mapping_incr_step2_update_incr.sh
ios_id_mapping_incr_step3_merge_full.sh
android_id_mapping_full_weekly.sh
android_id_mapping_incr_step1.sh
android_id_mapping_incr_step2_update_incr.sh
android_id_mapping_incr_step3_merge_full.sh
device_duid_mapping
new_device_duid_mapping.sh
device_imsi_mapping
device_imsi_mapping.sh(device和imsi对应表)
exchange(存放外部交换数据的脚本)
bssid_exchange_data.sh(交换过来的数据,计算dw_mobdi_source.bssid_exchange的脚本)
distcp(各集群同步数据脚本)
view.sh(能能需求,将profile_full表移到10.6.162.2集群中)
sync_mapping_full.sh(同步 android_id_full、rp_app_name_info、pkg_name_mapping 到215集群)
sync_data.sh(同步full表和master表到215集群)
phone_contacts(通讯录相关脚本)
phone_contacts_dedup_full.sh(通讯录基础数据)
phone_label.sh(通讯录phone_label表生成)
phone_one_degree_relation.sh(生成GA联系人一度正反关系表)
device_phone_list.sh
kpi_qc
qc_dmp_start.sh(老kpi_qc,即将废弃)
run_monthly_reports.sh(kpi_qc月度报表的任务)
all_report_qc_run.sh
run_business_reports.sh(商业化报表的kpi_qc任务)
sort(分拣系统)
sort_app.sh(每个月自动导入待分拣app到mysql)
mobdi-spark2
pom.xml
src
main
com.mob.mobdi
online(基础标签模型spak代码)
stg_base
profile_model
tag(标签模型spark代码)
online_tag
offline_tag
qc(qc代码)
phone_contacts(通讯录代码)
test_tool(测试自动化工具代码)
lib(存放jar包)
conf
build.sh(项目编译脚本)
pom.xml
README.md
.gitignore
scalastyle_config.xml(scala代码校验文件)
version-change.sh(版本控制脚本)
0 条评论
下一页
为你推荐
查看更多
抱歉,暂无相关内容