爬虫类图
2015-03-22 22:07:53 44 举报
爬虫类图是一种用于描述网络爬虫行为的图形化工具。它通常包括了爬虫的主要组件,如URL管理器、网页下载器、解析器和数据存储器等。这些组件之间通过箭头表示它们之间的交互关系。例如,URL管理器负责管理待爬取的URL列表,网页下载器从URL中获取网页内容,解析器从网页中提取有用的信息,而数据存储器则负责存储这些信息。此外,爬虫类图还可以显示爬虫的工作流程,帮助开发人员更好地理解爬虫的运行机制。总之,爬虫类图是一种非常有用的工具,可以帮助开发人员设计和优化网络爬虫。
作者其他创作
大纲/内容
DownloadPage
+getContentFormUrl(url:String):String
ReadImage
UrlQueue
+urlQueue:LinkedList+MAX_SIZE:int=10000
+ourElem():String+addElem():String+isEmpty():boolean+size():int+isContains():boolean
proxy
+proxyIP:String+cookieValue:Sring
VisitedUrlQueue
+VisitedUrlQueue:HashSet
+addElem():void+isContains:boolean+size():int
HrefOfPage
+getHerfofContent(content:String)
OptimizationUtils
+filter(content:String):String+rss()
Test
UrlDataHanding
+dataHanding(url:String)+run()
FunctionUtils
- pat:String- pattern:Patterntype- writer:BufferedWriter = null+depth:int = 0
0 条评论
下一页