邮件账单抓取解析流程
2017-03-21 17:23:35 0 举报
邮件账单抓取解析流程主要包括以下几个步骤:首先,通过电子邮件协议与邮箱服务器建立连接,登录邮箱账户。然后,使用邮件客户端或API接口搜索并下载账单邮件。接下来,对账单邮件进行预处理,如去除垃圾邮件、广告邮件等。之后,利用正则表达式或自然语言处理技术提取账单中的关键信息,如发件人、收件人、金额、日期等。最后,将提取到的信息进行整理和存储,以便后续的数据分析和处理。整个流程需要遵循相关法律法规,确保数据安全和隐私保护。
作者其他创作
大纲/内容
逐一获取detail
ID去重(总ID记数)
去除不需要下载的ID
解析失败报错(按银行)
是否获取全部关键词ID-list
展示
特殊卡种打上标签
Y
是否获取总ID数量的detail
从ID-list中逐一下载detail
JSON返回
后台(人工)
服务端(服务器)
信息完整
获取账单解析结果
N等待
筛选出指定范围的ID-list
逐一传输
账单解析
下载结果:1、爬虫规则变更2、终端网络不通3、成功解析结果:1、未解析(缺模板、出错)2、已解析(账单信息不全)3、已解析(成功)服务器:传输成功传输中断
传输
循环
邮件主题关键词、时间筛选
N
单一关键词泛匹配搜索(账单、银行、卡)
客户端(爬虫)
获取邮箱账单单个list
并发循环下载
缺模板、出错、账单信息不全
开始
获取到ID-list
0 条评论
回复 删除
下一页