数据治理流程实例:排污许可证企业基本信息
2023-06-05 13:52:36 0 举报
生态环境领域数据来源多样,数据质量低、业务复杂度高,本文档基于多个来源的数据,对“排污许可证排污单位基本信息”数据进行数据治理方案的撰写,对后续数据治理的详细工作进行指导。本文的针对ODS层(贴源数据层)、STD层(标准数据层)、DIM层(维度数据层)三个层级的数据治理过程展开了详细介绍。
作者其他创作
大纲/内容
DIM(维度数据层)-经过治理后的维度数据
标准化清洗
汇聚与治理
std_zf_ent执法企业基本信息
ent_id:企业idregion_id:地区标识region_code:地区代码region_name:地区名称industry_id:行业标识industry_code:行业代码industry_name:行业名称enter_code:污染源企业代码ent_name:污染源企业名称credit_code:统一社会信用代码legal_person_code:法人代码legal_person_name:法人名称longitude:经度latitude:纬度operate_address:生产经营场所地址ent_status:企业状态comment:备注说明update_time:更新时间update_by:更新者
std_xkz_raw_span style=\
pw_unit_id:排污单位iddataid:数据主键certificate_name:发证状态certificate_type:发证状态编码code_country:省级区域编码code_region:市级区域编码code_regiondetail:区县区域编码code_river:流域编码credit_code:统一社会信用代码pw_unit_id:排污单位名称fzdept:核发机关fzdeptid:许可证核发机关编码fztime:发证时间industry_code:行业代码industry_name:行业名称itemendtime:办结时间itemtype:申请类型name_country:省级区域名称name_region:市级区域名称name_regiondetail:区县区域名称name_river:流域名称operate_address:生产经营场所地址organcode:组织机构代码regaddress:注册地址spdeptid:提交审批级别编码splevel:提交审批级别times:有效期限xkzhfjgjb:许可证核发机关级别pw_xkz_code:排污许可证编号update_time:更新时间update_by:更新者
std_cp_rs_ent市场监督管理企业基本信息
lerepcertype:法定代表人证件类型lerepcerno:法定代表人证件号码lerepname:法定代表人countryapprovenameflag:是否国家核准名称grpshform:集团简称groupsonflag:是否集团子公司grpname:集团名称groupparentflag:是否集团母公司remarks:备注istransfer:是否迁移数据apprno:核准文号revdate:吊销日期fileid:档案编号aicid:登记管辖机关timestamp:时间戳is_lock:锁定状态enttypecategoryco:企业大类ssmjgfflag:是否是股份有限公司(上市)及募集设立的股份有限公司issuped:是否设立监事会isboard:是否设立董事会domother:住所其他domcounty:住所(区县)domcity:住所(市)domprov:住所(省)gid:业务流水号tradeterm:营业期限nameid:名称结果IDcountry:国别(地区)credit_code:统一社会信用代码apprdate:核准日期canrea:注销原因candate :注销日期insform:设立方式reccap:实收资本domdistrict:住所所在行政区划dom:住所ent_status:企业状态regorg:登记机关localadm:属地管辖机关opto:经营(驻在)期限至opfrom:经营(驻在)期限自opscope:经营(业务)范围opscotype:业务范围类型cbuitem:一般经营项目abuitemco:许可经营项目estdate:成立日期industry_code:行业代码industry_name:行业名称regcap:注册资本(金)enttype:市场主体类型regno:注册号ent_name:企业(机构)名称pripid:主体身份代码
ods_zdpwdw_qyml重点排污单位清单
xh:企业序号zq:镇区qyxxmc:企业详细名称tyshxydm:统一社会信用代码hylb:行业类别jglb:监管类别
dim_pw_xkz_ent_base排污许可发证单位基本信息
pw_unit_id:排污单位idpw_unit_name:排污单位名称credit_code:统一社会信用代码operate_address:生产经营场所地址longitude:经度span style=\
ods_span style=\
enterid:企业主键dataid:数据主键certificate_name:发证状态certificate_type:发证状态编码code_country:省级区域编码code_region:市级区域编码code_regiondetail:区县区域编码code_river:流域编码creditcode:统一社会信用代码devcompany:排污单位名称fzdept:核发机关fzdeptid:许可证核发机关编码fztime:发证时间hyid:行业编码hyname:行业类别itemendtime:办结时间itemtype:申请类型name_country:省级区域名称name_region:市级区域名称name_regiondetail:区县区域名称name_river:流域名称opeaddress:生产经营场所地址organcode:组织机构代码regaddress:注册地址spdeptid:提交审批级别编码splevel:提交审批级别times:有效期限xkzhfjgjb:许可证核发机关级别xkznum:许可证编码update_time:更新时间update_by:更新者
STD(标准数据层)-标准化清洗后的数据
ods_cp_rs_ent市场监督管理企业基本信息
lerepcertype:法定代表人证件类型lerepcerno:法定代表人证件号码lerepname:法定代表人countryapprovenameflag:是否国家核准名称grpshform:集团简称groupsonflag:是否集团子公司grpname:集团名称groupparentflag:是否集团母公司remarks:备注istransfer:是否迁移数据apprno:核准文号revdate:吊销日期fileid:档案编号aicid:登记管辖机关timestamp:时间戳is_lock:锁定状态enttypecategoryco:企业大类ssmjgfflag:是否是股份有限公司(上市)及募集设立的股份有限公司issuped:是否设立监事会isboard:是否设立董事会domother:住所其他domcounty:住所(区县)domcity:住所(市)domprov:住所(省)gid:业务流水号tradeterm:营业期限nameid:名称结果IDcountry:国别(地区)uniscid:统一社会信用代码apprdate:核准日期canrea:注销原因candate :注销日期insform:设立方式reccap:实收资本domdistrict:住所所在行政区划dom:住所opstate:经营状态regorg:登记机关localadm:属地管辖机关opto:经营(驻在)期限至opfrom:经营(驻在)期限自opscope:经营(业务)范围opscotype:业务范围类型cbuitem:一般经营项目abuitemco:许可经营项目estdate:成立日期industryco:行业代码industryphy:行业门类regcap:注册资本(金)enttype:市场主体类型regno:注册号entname:企业(机构)名称pripid:主体身份代码
dim_pw_xkz_ent_base-排污许可发证单位基本信息数据建模方案
序号
字段英文名
字段中文名
数据类型
数据格式
引用数据元标准
是否主键
备注
数据质量稽核规则
完整性
有效性
及时性
唯一性
准确性
一致性
非空约束
格式约束
值域约束
精度约束
1
pw_unit_id
排污单位id
字符型
A(255)
是
每72小时更新一次
唯一
需要与如下数据保持一致:排污许可证企业基本信息
2
pw_unit_name
排污单位名称
通过下列数据确保准确性:1.排污许可证发证企业基本信息2.市场监督管理企业基本信息3.执法企业基本信息4.污染源在线监测企业基本信息5.重点排污单位清单
3
credit_code
统一社会信用代码
长度必须为18位
4
operate_address
生产经营场所地址
通过以下数据确保数据准确性:1.排污许可证发证企业基本信息2.执法企业基本信息3.污染源在线监测企业基本信息
5
longitude
经度
数值型
6
latitude
纬度
7
pw_xkz_code
排污许可证编号
长度必须为26位
需要与如下数据保持一致:许可证发证信息
8
industry_code
行业代码
9
industry_name
行业名称
10
ent_status
企业状态
A(100)
1.正常运营2.停业(歇业)3.筹建4.当年关闭5.当年破产6.当年注销7.当年撤(吊)销8.其他
通过以下数据确保数据准确性:1.市场监督管理企业基本信息2.执法企业基本信息3.污染源在线监测企业基本信息
11
xkz_manage_type
排污许可证类别
重点管理、简化管理
需要与如下数据保持一致:许可证企业基本信息
12
is_key_supervise_unit
是否环境监管重点单位
是、否
需要与如下数据保持一致:重点排污单位清单
13
update_time
更新时间
时间型
yyyy-mm-dd hh:mm:ss
ODS(贴源数据层)-原始数据
std_zdpwdw_qyml重点排污单位清单
xh:企业序号zq:镇区ent_name:企业名称credit_code:统一社会信用代码industry_name:行业名称jglb:监管类别
std_xkz_raw_ent_base排污许可证发证企业基本信息
dataid:数据主键aircontrol:大气污染物控制指标aircontrolcode:大气污染物控制指标编码auditdepart:提交审批机关级别credit_code:统一社会信用代码pw_unit_name:排污单位名称devlegalperson:法定代表人devphone:固定电话devtelephone:移动电话engineeers:技术负责人pw_unit_id:排污单位IDindustry_code:行业代码industry_name:行业名称industrial:所属工业园区名称industrialcode:所属工业园区编码information:变更内容/事由isheavymetalarea:所在地是否属于重金属污染物特别排放限值实施区域ishppfname:是否有环评审批文件ismaintainname:是否有地方政府对违规项目的认定或备案文件isoperaname:是否投产ispark:是否位于工业园区isphosphorus:所在地是否属于总磷控制区ispollutantsname:是否有主要污染物总量分配计划文件isshortpermit:是否需整改issmallboiler:是否属于单台出力10吨/小时(7兆瓦)以下且合计出力20吨/小时(14兆瓦)以下的气体燃料锅炉排污单位isspecialname:所在地是否属于大气重点控制区域istotalnitrogen:所在地是否属于总氮控制区latitude:生产经营场所中心纬度longitude:生产经营场所中心经度maintainwh:认定或备案文件文号xkz_manage_type:许可证管理类别operate_address:生产经营场所地址operatime:投产日期organcode:组织机构代码pollutantswh:总量分配计划文件文号postcode:邮政编码qthyid:其他行业类别编码qthyname:其他行业类别regaddress:注册地址splevel:提交审批机关级别编码typename:变更类型watercontrol:水污染物控制指标watercontrolcode:水污染物控制指标编码update_time:更新时间update_by:更新者
std_wr_ps_base污染源在线监测企业基本信息
ent_id:企业ident_name:企业名称region_code:行政区划short_name:污染源简称longitude:经度latitude:纬度credit_code:社会信用代码ps_class_code int:企业类别代码regist_code:注册类型monitor_type_code:监控类型代码industry_code:行业代码industry_focus:环保重点行业enterprise_size:企业规模subjection_code:隶属关系代码area_code:区域编码valley_code:流域代码manufacture_date:投产日期operate_address:生产经营场所地址fax:传真ent_status:企业状态corporation_name:法人is_power30w:是否30kw企业comment:备注
ods_zf_ent执法企业基本信息
uid:污染源企业标识region_id:地区标识region_code:地区代码region_name:地区名称industry_id:行业标识industry_code:行业代码industry_name:行业名称enter_code:污染源企业代码enter_name:污染源企业名称usc_code:统一社会信用代码legal_person_code:法人代码legal_person_name:法人名称longitude:经度latitude:纬度address:生产经营场所详细地址enter_status:企业生产状态comment:备注说明update_time:更新时间update_by:更新者
ods_xkz_raw_ent_base排污许可证发证企业基本信息
dataid:数据主键aircontrol:大气污染物控制指标aircontrolcode:大气污染物控制指标编码auditdepart:提交审批机关级别creditcode:统一社会信用代码devcompany:单位名称devlegalperson:法定代表人devphone:固定电话devtelephone:移动电话engineeers:技术负责人enterid:企业IDhyid:行业类别编码hyname:行业类别industrial:所属工业园区名称industrialcode:所属工业园区编码information:变更内容/事由isheavymetalarea:所在地是否属于重金属污染物特别排放限值实施区域ishppfname:是否有环评审批文件ismaintainname:是否有地方政府对违规项目的认定或备案文件isoperaname:是否投产ispark:是否位于工业园区isphosphorus:所在地是否属于总磷控制区ispollutantsname:是否有主要污染物总量分配计划文件isshortpermit:是否需整改issmallboiler:是否属于单台出力10吨/小时(7兆瓦)以下且合计出力20吨/小时(14兆瓦)以下的气体燃料锅炉排污单位isspecialname:所在地是否属于大气重点控制区域istotalnitrogen:所在地是否属于总氮控制区latitude:生产经营场所中心纬度longitude:生产经营场所中心经度maintainwh:认定或备案文件文号management:许可证管理类别opeaddress:生产经营场所地址operatime:投产日期organcode:组织机构代码pollutantswh:总量分配计划文件文号postcode:邮政编码qthyid:其他行业类别编码qthyname:其他行业类别regaddress:注册地址splevel:提交审批机关级别编码typename:变更类型watercontrol:水污染物控制指标watercontrolcode:水污染物控制指标编码update_time:更新时间update_by:更新者
ods_wr_ps_base污染源在线监测企业基本信息
id:污染源idps_name:污染源名称region_code:行政区划short_name:污染源简称longitude:经度latitude:纬度credit_code:社会信用代码ps_class_code int:企业类别代码regist_code:注册类型monitor_type_code:监控类型代码industry_code:行业类别industry_focus:环保重点行业enterprise_size:企业规模subjection_code:隶属关系代码area_code:区域编码valley_code:流域代码manufacture_date:投产日期address:单位地址fax:传真build_status:建设状态corporation_name:法人is_power30w:是否30kw企业comment:备注
0 条评论
下一页