首页  流程图  详情

job-spider时序图

2017-04-14 17:04:25   0  举报





仅支持查看

为你推荐

查看更多



Job-Spider时序图展示了一个典型的网络爬虫工作流程。首先，用户通过命令行或图形界面启动爬虫程序。接着，爬虫程序初始化并设置相关参数，如目标网站、爬取深度等。然后，爬虫程序根据设置的参数开始爬取网页内容，提取所需的信息。在爬取过程中，爬虫程序会根据一定的策略判断是否需要继续爬取，如是否达到最大爬取深度、是否遇到反爬机制等。如果需要继续爬取，爬虫程序会更新当前状态并继续爬取下一页。最后，当所有页面都爬取完毕后，爬虫程序将提取到的信息进行整理和存储，并结束运行。整个过程遵循一定的顺序和逻辑关系，以确保爬虫程序能够高效地完成任务。

作者其他创作

大纲/内容

run()

cron

get()

子线程taskDone()

start()

spy

主线程cronJob

init()

onCreate()

entry