数据分析师
2017-11-22 16:35:33 86 举报
AI智能生成
数据分析师知识体系,需要的技能,第一版,可能不是很准确,欢迎指导
作者其他创作
大纲/内容
相关知识
面向对象
数据采集
采集工具
爬虫软件
八爪鱼
建立规则
程序语言
python
数据分析
数据挖掘
数据可视化
网络数据采集
创建简单爬虫
HTML解析
BeautifulSoup
初级了解
中级使用
完全理解
正则表达式
简单匹配
复杂匹配
API接口
方法
GET请求
POST请求
PUT请求
DELETE请求
种类
Google API
Twitter API
Baidu API
JSON解析
读取文档
Excel
PDF
文本文档
word/.docx
多线程
存储数据
媒体文件
CSV
MySQL
初级
增
删
改
查
中级
索引
视图
事物
关系型数据库
数据库设计
安全管理
表连接
内连接
外连接
左连接
右连接
全连接
交叉连接
高级数据采集
数据清洗
图形识别
文字识别
采集陷阱
远程采集
Java爬虫
C++爬虫
C#爬虫
数据清洗
方法
完整性
唯一性
权威性
合法性
字段类型合法规则
字段内容合法规则
异常处理
一致性
度量
维度
单位
频度
数据
工具
python
Excel
数据存储
数据库
MySQL
高级操作
Oracle
...
数据仓库
操作型数据仓库
数据框架
处理工具
ETL技术
kettle
分析性数据仓库
数据提取
抽取方式
全量抽取
增量抽取
数据提取的步骤
理解数据和数据的来源
获取相关知识和技术
整合与检查数据
去除错误或不一致的数据
建立模型和假设
实际数据挖掘工作
测试和验证挖掘结果
解释和应用
实现流程
数据挖掘
数学知识
统计学
微积分的基本概念
离散、连续、多维随机变量及分布
数学期望
方差、标准差
相关系数
挖掘工具
Hadoop
Storm
HPCC
建模
机械学习
监督学习
回归
分类器
非监督学习
聚类
关联分析
特征工程
CS工程
数据结构
算法
C4.5
K-Meas
CART
神经网络
遗传算法
调试
提速
GPU
可维护
git
软件工程
数据分析
业务知识
对产品的理解
工具
SPSS
python
R语言
SAS
Excel
方法
描述性统计
缺失值填充
正太性检验
回归分析
一元线性分析
多元线性回归分析
loLogistic回归分析
其他回归分析
非线性回归
有序回归
加权回归
Probit回归
方差分析
单因素方差分析
多因素有交互方差分析
多因素无交互方差分析
协方差分析
假设检验
参数检验
非参数检验
可视化
工具
python
R
方法
2D区域
时态
多维
分层
网络
了解受众
思维
发散性思维
好奇心
数据展现
PPT
Excel
数据清洗
数据分析
可视化
word
数据应用
数据沟通能力
业务推动能力
项目工作能力
收藏
收藏
0 条评论
下一页