数据收集
2017-03-10 23:59:04 9 举报
数据搜集方法
作者其他创作
大纲/内容
列表、表格或链接
是
通用化设计
需要cookie
启用cookie管理
否
R软件网络数据搜集
HTTP身份验证
文件下载链接
动态网页
URL变化
OAuth验证
搜集网页URL
搜集API数据
需要翻页
批量构建URL
API
结束
getURL函数中写入账户密码
获取网页数据
远程调用浏览器JavaScript翻页
网页结构完整
按照文档类型选用相应的提取方式
httr组件申请应用和令牌
下载可阅文件
远程调用浏览器
网页
API或网页
XPath定位
正则表达式清洗数据
readHTMLTable等函数提取
0 条评论
下一页