gakki大作战
2017-04-07 00:37:35 0 举报
爬取某网站电影剧照大概流程图(初稿)
作者其他创作
大纲/内容
利用所获取的高清原图的链接
如果是最后一页
遍历:对每一个link列表的元素
返回第一步操作,遍历完之后便结束程序
如果不是最后一页
利用观察到的高清原图的链接的格式规律,写一个正则表达式将高清原图的链接爬取出来
判断当前页码,是否为最后一页
获取一个小图标页面的链接
最后一次遍历完后
将链接返回给第一步
将数据(图片)以二进制方式保存到本地
当link列表遍历完后
Ending
Star
获取小图标页面上的所有进入普通图标的链接,并将其添加入link列表中
不进行爬取下一页链接的操作
利用标签属性或者正则爬取下一页的链接
0 条评论
下一页