盒图
2020-12-07 19:15:58 447 举报
盒图是一种用于表示数据的图形,它由一个矩形盒子和多个与之相关的统计量组成。盒子的顶部和底部分别表示数据的上下限,盒子内部的横线表示数据的中位数,盒子两侧的竖线分别表示数据的四分位数。盒图还可以包括异常值、置信区间等信息,以帮助用户更好地理解数据分布情况。盒图可以直观地展示数据的离散程度、偏态和异常值等信息,因此在数据分析和报告中被广泛应用。
作者其他创作
大纲/内容
爬取疫情数据
存储到中间文件
删除冗余数据
T
保存该url进行后续破解
爬取航班数据
后续处理
F
得到网站url
数据是否不合理
略过
插补全该数据
对数据进行关联性验证
删除不合理数据
数据整理
Xpath解析数据
获取对应的scrapy工程
获取航班、疫情数据的网址url
删除不合需求的数据
数据处理
是否存在缺失值
是否获取到数据
是否是航班数据网站url
是否数据已有
遍历数据网站url
对数据进行唯一化标识
删除数据
数据是否冗余
修改数据格式
开启scrapy管道
将最终结果存入数据库
数据是否不与存储格式相同
删除该数据
数据是否不符合需求
0 条评论
下一页