数据分析学习图谱
2023-05-15 20:40:52 0 举报
AI智能生成
数据分析学习图谱包括七个方面,即分析工具、可视化、机器学习、统计学、业务知识、软技能、进阶知识,每部分涉及知识体系、学习资源、工具平台等,适合数据分析、商业分析、经营分析、业务分析、数据科学相关从业者。
作者其他创作
大纲/内容
开始
插入
数据
审阅
视图
基本操作
sum
if
vlookup
lookup
find
date
days
choose
index
match
常用的10个函数
hlookup
offset
indirect
column
columns
row
rows
getpivotdata
transpose
查找和引用函数
iferror
and
or
not
逻辑函数
max
min
sumif
sumifs
count
counta
countif
countifs
countblank
average
averagea
averageif
averageifs
rank
frequency
product
sumproduct
isblank
large
small
stdev.s
stdev.p
substotal
统计函数
abs
ln
log
log10
sqrt
mod
power
int
rand
randbetween
round
ceiling
floor
floor.math
数学函数
datedif
year
month
day
hour
minute
second
today
now
weekday
weeknum
edate
eomonth
workday
networkdays
networkdays.intl
日期和时间函数
len
lenb
exact
left/leftb
right/rightb
mid/midb
find/findb(区分大小写)
search/searchb(不区分大小写,模糊)
replace/replaceb(位置)
substitute(内容)
trim
rept
concat
lower
upper
proper
textjoin
text
fixed
文本函数
isnumber
istext
islogical
isref
isodd
iseven
iserr
iserror
isna
type
信息函数
财务函数
工程函数
常用函数
数据透视表
可视化图表
录制宏与VBA
知识体系
方方格子社区
Excel Home
懒人Excel
W3CSchoool
微软官网Excel
学习资源
EasyCharts下载
EasyCharts
方方格子下载
方方格子
Excel必备工具箱
慧办公下载
慧办公
Excel易用宝下载
Excel易用宝
Kutools
插件
微软Excel下载
微软的Excel
WPS下载
金山的WPS
软件
Excel
切换
动画
放映
字体
图标
图片
音乐
视频
素材
排版
配色
审美
模板
设计
微软官网
微软官网PPT
51PPT
51PPT模版
优品PPT
优品PPT模版
比格PPT
站长素材
Officeplus
PPT模板&教程
The Stocks图片集合
The Stocks图片导航
搜图导航
跨境卖家导航amz123
Pixabay
Unsplash
Pexels
Stocksnap
VisualHunt
Photock
Pngimg
高清图片
阿里图标库iconfont
阿里iconfont
字节IconPark
FreeImages
Flaticon
IconFinder
Icons8
Think-cell下载
Think-cell
islide
PPT美化大师
OneKeyTools
非官方下载jb51
PA口袋动画
英豪工具箱lvyhTools
微软PPT下载
微软的PPT
PPT
布局
引用
章节
微软官网Word
页面
文本
图表
目录
参考文献
人大毕业论文排版
Word必备工具箱
Mathtype
Emoji Keyboard
Emoji Keyboard
grammarly
Office Tabs
Office Tabs
微软Word下载
微软的Word
Word
Visio
Office
create database
创建数据库
drop database
删除数据库
use database
使用数据库
alter database
修改数据库
数据库
create table
auto_increment
创建数据表
drop table
truncate table
删除数据表
desc/describe table
show create table
查看数据表
add column
drop column
change column
alter column
modify column
rename to
alter table
修改数据表
数据表
insert into table values
insert into table select
插入数据行
delete from table
删除数据行
select * from table
查询数据行
update table set k=v
更新数据行
数据行
tinyint
smallint
mediumint
bigint
float
double
decimal
数值类型
time
datetime
timestamp
日期时间
char
varchar
tinytext
mediumtext
longtext
tinyblob
mediumblob
blob
longblob
字符串
数据类型
+
-
*
/
%
算术运算符
=
!=
<>
>
>=
<
<=
<=>
between
not between
in
not in
exists
not exists
is null
is not null
any
all
like
rlike
regrep
比较运算符
xor
逻辑运算符
&
|
!
^
<<
>>
位运算符
运算符
not null
unique
primary key
foreign key
check
default
约束
普通索引
唯一索引
主键索引
组合索引
全文索引
索引类型
create index
alter table add
创建索引
drop index
alter table drop
删除索引
show index from table
查看索引
先drop再add
修改索引
索引
临时表
存储过程
游标
创建触发器
删除触发器
insert
delete
update
使用触发器
触发器
begin
rollback
commit
savepoint
rollback to
release
事务
安全管理
全文搜索
基础知识
select
from
where
group by
having
with rollup
asc
desc
order by
limit y offset x
limit
distinct
as
inner join
left join
right join
full outer join
cross join
join
_
$
\\
.
[...]
[^...]
?
{n}
()
\\w
\\W
\\s
\\S
\\d
\\D
\\b
\\B
\
\\t
\\v
\\f
不可见字符
转义符
regexp正则表达式
基础CTE
递归CTE
公共表表达式CTE
with as
union
union all
intersect
except
minus
集合运算
查询语句
avg
聚合函数
range/rows
precending/following
between...and...
unbounded
function() over(partition by order by)
row_number
dense_rank
lag
lead
first_value
last_value
nth_value
ntile
cume_dist
percent_rank
窗口函数
concat_ws
length
left
right
mid/substring/substr
replace
ltrim
rtrim
format
find_in_set
locate
upper/ucase
lower/lcase
lpad
rpad
repeat
reverse
space
strcmp
字符函数
curdate/current_date
curtime/current_time
now/sysdate/current_timestamp/localtime/localtimestamp
quarter
week
datediff
date_add/adddate
date_sub/subdate
timestampdiff
timediff
addtime
subtime
str_to_date
date_format
time_format
dayname
dayofweek
dayofmonth
dayofyear
yearweek
last_day
extract
%Y
%m
%d
%H
%i
%s
%y
%M
日期格式符
day_hour
year_month
间隔值interval
ceil/ceiling
truncate
greatest
least
pow/power
case when
ifnull
nullif
条件函数
bin
cast
coalesce
grouping
isnull
conv
json_extract
json_object
json_array
json_contains
高级函数
只select必要列
避免子查询
group by去重
不在索引列进行运算操作
where/order by/group by中考虑
最佳左前缀索引
避免使用not与不等式
驱动表是小表,被驱动表是大表
把重复关联键少的表放在join前面
用in代替or
避免分页查询
order by null
in内表小外表大
exists内表大外表小
in与exists
explain
先理解业务需求,再分析需求,最后设计出要查询出的数据
先做 SQL 设计,再按设计编写实施
字段、虚表命名见名知义,且保留as
做好代码逻辑缩进
关键字大小保持一致(因为大小写不敏感)
对于没有 Where 的,SQL语句拼接常加 where 1=1
delete或者update语句,加个limit,先操作部分,管控风险
设计创建表的时候,所有表及字段都加上相应的注释
修改或删除重要数据前,一定先备份
尽量把所有列的无值的默认值定义为NOT NULL,少空间
修改删除前 WHERE 查询一下数据,看是不是要删除的内容
MySQL表必须使用Innodb存储引擎
字符集统一使用UTF8
好习惯
SQL优化
菜鸟教程
菜鸟教程MySQL
新手教程begtut
MySQL8官方文档
MySQL8非官方中文文档
github搜MySQL
w3schools教程MySQL
Graphical-SQL-interview-questions
Hive_interview-question
经典50题sql-written
MySQL经典50题
笔试面试题
数据库内核月报
MySQL8非官方优化文档
《MySQL必知必会》
《SQL必知必会》
《MySQL是怎样运行的》
《高性能MySQL》
《MySQL技术内幕 : InnoDB存储引擎》
《数据库系统概念》第7版
书籍
牛客网
力扣网
SQLZOO
SQLFiddle
SQL Fiddle
练习平台
Workbench下载
MySQL Workbench
Navicat下载
MySQL Navicat
SQL Server下载
SQL Server
MySQL
MySQL知识体系
array
map
struct
named_struct
复杂数据类型
${variable_name}
变量默认值
参数变量
lateral view
行转列
grouping sets
with cube
grouping__id
grouping函数
多维度分析
collect_list
collect_set
percentile
percentile_approx
variance
corr
explode
json_tuple
stack
inline
内置表生成函数UDTF
get_json_object
split
str_to_map
translate
regexp_replace
regexp_extract
initcap
parse_url
levenshtein
ifnotnull
nvl
from_unixtime
unix_timestamp
to_date
add_months
next_day
yy/mm/dd/d/hh/mi
trunc
months_between
size
sort_array
map_keys
map_values
array_contains
集合函数
UDF
UDAF
UDTF
自定义函数
函数
赋予空值新的随机值
为空的值不参与关联
空值倾斜
启用两个作业,第一个作业处理没有倾斜的数据,第二个作业将倾斜的数据存到分布式缓存中,分到各个Map任务所在节点,在Map阶段完成join操作,避免shuffle,从而避免数据倾斜。
两表join时含有大量相同的key
set hive.map.aggr=true
set hive.groupby.skewindata = ture
参数调优
数据倾斜问题
合并小文件
分区表partitioned by
Hive SQL调优
HiveSQL教程-盖若
盖若HiveSQL教程
HiveSQL函数大全
HiveSQL官方函数大全
HiveSQL
标识符
保留字
注释
**
//
==
+=
-=
*=
/=
%=
**=
//=
:=
赋值运算符
~
成员运算符
is
is not
身份运算符
运算符优先级
行与缩进
命令行
基础语法
bool
complex
number
string
list
tuple
set
dictionary
数据类型转换
if...elif...else
if嵌套
match...case
逻辑判断
for
while
break
continue
while...else
for...else
pass
循环迭代
列表推导式
字典推导式
集合推导式
元组推导式
推导式
iter()
next()
yield
迭代器与生成器
定义函数
调用函数
参数传递
高阶函数
闭包函数
匿名函数
装饰器
函数式编程
模块导入
标准模块
包
模块
异常
input()
文件
输入输出
类
方法
类变量
实例变量
数据成员
方法重写
继承
实例化
运算符重载
面向对象
内建作用域
全局作用域
闭包函数外的作用域
局部作用域
作用域
数据处理分析
数据可视化
机器学习
爬虫
正则表达式
菜鸟教程Python
廖雪峰Python教程
Python官方文档
Python在线速查手册
南京大学python视频教程
github上Python100天
github草根学Python
github上awesome-spider
github上matplotlib-cheatsheets
github搜Python
w3schools教程Python
github上Python算法学习
interview_python
python_interview_question
python-interview
《剑指Offer》面试题Python实现
收集Python面试&练习题
收集Python面试&练习题
《利用Python进行数据分析》
《Python编程从入门到实践》
《Python Cookbook》
《Python Cookbook》中文
pandas
numpy
scipy
stats
collections
math
statistics
pandas_profiling
分析
matplotlib英文文档
matplotlib中文文档
matplotlib
seaborn英文文档
seaborn中文文档
seaborn
pyecharts
plotly
可视化
sklearn
statsmodels
keras
pytorch
tensorflow
模型
requests
bs4
quote
scrapy
selenium
urllib
os
shutil
pickle
json
csv
logging
sys
io
argparse
文件/系统
re
wordcloud
jieba
gensim
nltk
pillow
opencv
skimage
图像
random
threading
multiprocessing
queue
heapq
concurrent
asyncio
itertools
functools
hashlib
base64
unittest
timeit
pyforest
其他
常用包
力扣
PythonTip
编程可视化执行过程
jupyter_contrib_nbextensions插件
自带Jupyter
Anaconda下载
Anaconda
PyCharm下载
PyCharm
JupyterLab下载
Jupyterlab
VSCode
Python
通用方法
问卷研究
进阶方法
实验/医学研究
综合评价
计量经济研究
张文彤的初中级和高级教学视频
SPSSAU平台
SPSSAU案例数据下载
如何快速掌握SPSS-SPSSAU
《问卷统计分析实务:SPSS操作与应用》
《SPSS其实很简单》
SPSS26安装教程
SPSS
统计学&R学习资源
统计学&R学习资源
R语言资源整理
R语言入门学习路线与资源汇总
《R语言入门与实践》
《R语言实战》第2版
《R数据可视化手册》
《R数据科学》
R
R安装
RStudio
R
SAS
分析工具
基础折线图
堆积折线图
百分比堆积折线图
基础面积图
堆积面积图
百分比堆积面积图
折线图
基础柱状图
簇状柱状图
堆积柱状图
百分比堆积柱状图
双向柱状图
瀑布图
动态柱状图
柱状/条形图
基础饼图
圆环图
南丁格尔玫瑰图
旭日图
复合饼图
饼图
基础散点图
气泡图
P-P/Q-Q图
散点图
面积图地图
点状图地图
气泡图地图
热力图地图
轨迹地图
饼图地图
柱状图地图
地图
基础直方图
核密度图
帕累托图
直方图
径向折线图
径向面积图
径向柱状图
径向条形图
和弦图
极坐标系径向图
雷达图
漏斗图
小提琴图
箱线图
热力图
日历图
桑基图
河流图
进度条
仪表盘
指标卡
词云图
关系图
基础树状图
径向树状图
矩形树图
系统树图
凸树图
树状图
平行坐标系
双Y轴图
柱线图
联合分布图
日历热力图
复合条饼图
日历散点图
日历饼图
日历关系图
组合图
子弹图
茎叶图
曲面图
等高线图
3D图
K线图
数据可视化资源库
北京大学可视化与可视分析博客
w3xue中Tableau教程
Tableau官方培训视频
Tableau官网教程
Tableau Public
Tableau Public作品
makeovermonday
makeovermonday作品
Tableau
PowerBI
FineBI
BI工具
Python/R
Echarts
ECharts
AntV
Flourish
软件平台
数据图表
思维导图
基本流程图
泳道图/跨职能流程图
时间线流程图
业务流程图BPMN
数据流程图
系统流程图
流程图
组织结构图
甘特图
基础时间线图
比例尺时间线图
气泡时间线图
趋势线图
凹凸图
螺旋热图
扇形时间序列图
时间可视化图
象限图
象形分数图
象形柱状图
插画示意图
象形图
维恩图
鱼骨图
社交网络图
点图
表格/列表
哑铃图
原型图UI
日程表
用例图
类图
对象图
序列图
协作图
状态图
活动图
构件图
部署图
UML图
ER图
互联网人要了解的数据可视化
UI设计必备的导航网站
What is an Infographic
Flowing Data
Flowing Data
Information is Beautiful
Information is Beautiful
Information is Beautiful Awards
Information is Beautiful Awards
ProcessOn
Canva
百度脑图
Xmind
创客贴
信息图表
《用数据讲故事》
《Storytelling with Data》
《数据可视化之美》
《Beautiful Visualization》
《The Visual Display of Quantitative Information》
《商业仪表盘可视化解决方案》
《The Wall Street Journal Guide to Information Graphics》
算术平均数
平方平均数
几何平均数
调和平均数
平均数
中位数
众数
分位数
集中趋势
极差/全距
四分位数
四分位距
百分位数
方差
标准差
变异系数
异众比率
标准分数/z-score
基尼系数
离散程度
矩
期望/原点矩
方差/2阶中心矩
概念
左偏态/负偏态
右偏态/正偏态
正太分布
偏态/3阶中心矩
峰态/4阶中心矩
分布形态
描述性统计
随机变量
列联表
频率
概率
分布
期望
概率密度函数
累计分布函数
重要概念
伯努利分布/两点分布/0-1分布
二项分布/多重伯努利分布
泊松分布
超几何分布
几何分布
负二项分布
多项式分布
离散分布
均匀分布
Z分数
正太分布/高斯分布
标准正太分布
指数分布
连续分布
Z分布
卡方分布
T分布
F分布
统计推断四个分布
幂律分布
对数正太分布
伽马分布
贝塔分布
Dirichlet分布
其他分布
概率分布
伯努利大数定理
辛钦大数定理
切比雪夫大数定律
大数定律和中心极限定理
总体均值与样本均值
总体方差与样本方差
总体与样本
标准误
简单随机抽样
分层抽样
整群抽样
系统抽样
多级抽样
概率抽样
方便抽样/任意抽样
判断抽样/立意抽样
定额抽样/定额抽样
自愿抽样
滚雪球抽样
非概率抽样
抽样技术
刀切法
自助法
交叉验证
重抽样
抽样
矩估计法
最大似然估计法
最小二乘法
贝叶斯推断
点估计
统计量
置信区间
置信水平
估计量
有效性
无偏性
一致性/相合性
四个分布
Z分布+总体方差
大样本,方差已知
Z分布+样本方差
大样本,方差未知
小样本,近似正态,方差已知
T分布+样本方差
小样本,近似正态,方差未知
均值估计
大样本
比例估计
方差估计
一个总体区间估计
独立大样本,方差已知
独立大样本,方差未知
独立小样本,近似正态,方差已知
独立小样本,近似正态,方差未知
均值差估计
独立大样本
比例差估计
方差比估计
两个总体区间估计
区间估计
参数估计
零假设与备择假设
显著性水平
P值
统计功效
样本量
拒绝域与接受域
一类错误与二类错误
单边检验与双边检验
Z检验
单变量样本比例与总体比例是否一致
拟合优度卡方检验
多组分类样本的独立性
独立性卡方检验/列联分析
对同一批样本进行两种方法的检测
配对卡方
卡方检验
一组样本与一个值
总体均值已知,方差未知
单样本T检验
两组样本,数量相等(同一总体)
总体均值和方差都未知
配对样本T检验
两组样本,数量可以不等(不同总体)
独立样本T检验
正态图
P-P图
Q-Q图
正太性检验
独立样本需要
方差齐性检验
满足正太性和方差齐性用T检验
Welch法
Satterthwaite法
Cochran & Cox法
满足正太性不满足方差齐性用校正T检验
不满足正态性和方差齐性用Mann-Whitney U检验
数据方差相差太大用Mann-Whitney U检验
两组样本如何使用
注意事项
T检验
一个因素在变化
多组样本间的差异
单因素方差分析
双因素方差分析
多因素方差分析
满足正太性和方差齐性用F检验
满足正太性不满足方差齐性用校正F检验
多组间两两比较
SNK法/Q检验
多个实验组与一个对照组间的两两比较
Dunnett-t法
方差不齐时多组间的两两比较
Games-Howell法
多个样本均数的两两比较
多组样本如何使用
F检验/方差分析ANOVA
对应参数检验:Pearson相关系数
Spearman相关系数
对应参数检验:单样本T检验
单样本数据差异
对应参数检验:配对样本T检验
配对数据差异
Wilcoxon符号秩检验
对应参数检验:独立样本T检验
两组不同总体数据差异
Wilcoxon秩和检验/Mann-Whitney U检验
对应参数检验:方差分析/F检验
多组数据差异
Kruskal-Wallis H检验
检验一组样本是否来自于某个概率分布
两独立样本K-S检验
K-S检验
非参数检验
似然比检验LR
Wald检验
拉格朗日乘子检验LM
计量经济学中的三大检验
检验方法
假设检验
Pearson相关系数
Spearman秩相关系数
Kendall秩相关系数
相关系数检验
干扰因子
中介因子
对撞因子
干扰因素
自由度
误差与残差
相关性分析
线性回归
逻辑回归
多项式回归
逐步回归
Ridge回归
Lasso回归
ElasticNet回归
回归分析方法
回归系数检验
普通最小二乘法
相关性与因果性
回归分析
AR自回归
MA移动平均
指数平滑法
ARMA自回归移动平均
ARIMA差分整合自回归移动平均
HMM隐马尔可夫
时间序列
生存分析
统计图形
因果推断
可汗学院公开课
统计学-维基百科
《深入浅出统计学》2018出版
《赤裸裸的统计学》
《商务与经济统计》
《行为科学统计》
《统计学》
《为什么 : 关于因果关系的新科学》
统计学
缺失值
14种异常检测方法
异常值
最大最小归一化
归一化
标准化
二值化0-1
离散化
哑变量
独热编码one-hot
对数
指数
Box-Cox
映射
数据变换
衍生变量
特征预处理
无意义特征
缺失值比率
人工特征选择
方差选择法
卡方检验法
互信息法
过滤式Filter
递归特征消除法
完全搜索
启发式搜索
随机搜索
前向特征选择法
包裹式Wrapper
L1: Lasso回归
L2: Ridge岭回归
基于正则化
基于树模型(特征重要性)
深度学习
嵌入式Embedded
特征选择
欠采样/下采样
过采样/上采样
样本权重
数据增强
样本不平衡
特征工程
Lasso回归(L1)
Ridge回归(L2)
广义线性模型
K最近邻
支持向量机
ID3
C4.5
Cart
决策树
朴素贝叶斯
单模型
随机森林=决策树+Bagging
Bagging
AdaBoost
GBDT
XGBoost
LightGBM
CatBoost
提升树=决策树+Boosting
Boosting
Stacking
集成模型
有监督模型
K-Means
层次聚类
DBSCAN
谱聚类
均值漂移聚类
高斯混合模型
AP聚类
聚类
PCA主成分分析
LDA线性判别分析
因子分析
SVD奇异值分解
t-SNE
降维
Apriori
FP-Growth
关联规则
无监督模型
半监督模型
贝叶斯网络
贝叶斯
CRF条件随机场
概率图
MCMC马尔可夫链蒙特卡罗算法
EM算法
最大熵模型
概率模型
AHP层次分析法
熵权法
TOPSIS
模糊综合评价
灰色关联法
主成分分析
数据包络分析
综合评价法
PageRank
HITS
链接分析
LDA潜在狄利克雷分布
LSA潜在语义分析
PLSA概率潜在语义分析
主题模型
因果推断书籍
神经网络
模型方法
留出法
交叉验证法
自助法Bootstrap
评估方法
MAE
MSE
RMSE
MAPE
决定系数R方
校正决定系数
回归
混淆矩阵
Accuracy准确率
Precision精确率/查准率
Recall召回率/查全率
Fβ-Score和F1-Score
ROC
AUC
PRC
分类
用户生命周期值LTV
点击率CTR
转化率CVR
用户留存率CRR
用户流失率CCR
在线A/B测试
评价指标
模型评价
统计学-可汗学院
概率-可汗学院
线性代数-可汗学院
微积分-可汗学院
数学基础
斯坦福CS229课程
吴恩达的CS229速查表
斯坦福CS229速查表
吴恩达机器学习笔记
吴恩达机器学习课程
李宏毅机器学习课程
scikit-learn中文文档
ShowMeAI
面向机器学习的特征工程
机器学习100天练习
github上AiLearning
数据竞赛Top解决方案
cheatsheet-datacamp
数据科学笔记
cheatsheets-ai
ds-cheatsheets
AI cheetsheets
AI cheetsheets
cheetsheets制作-cheatography
cheat-sheets
cheat.sh命令行
awesome-cheatsheets中文速查表
overapi速查表
cheetsheet速查表
机器学习面试复习资源
机器学习面试1000题系列
机器学习面试150题
机器学习面试-七月在线
Data science interview
Data science interview
数据分析工程师面试
数据分析师面试
机器学习面试
《机器学习实战》第2版
《机器学习》周志华西瓜书
《统计学习方法》代码实现
《统计学习方法》李航
《集体智慧编程》
《机器学习公式详解》南瓜书
《概率论与数理统计》陈希孺
《线性代数及其应用》麻省理工
《普林斯顿微积分读本》
《The Element of Statistical Learning》
《Pattern Recognition and Machine Learning》
《An Introduction to Statistical Learning》
《Computer Age Statistical Inference》
Kaggle
和鲸社区
天池
维度
原子指标
复合指标
指标
粒度
口径
量纲
分析需求可行性与必要性
搭建分析框架
沟通需求
内部数据平台看板
SQL
第三方数据
数据获取
数据预处理
数据分析与建模
在线平台
分析报告撰写
数据分析流程
自然周期
用户生命周期
产品生命周期
生命周期
周期分析
趋势分析
维度拆解/指标构成拆解
漏斗分析
获取—激活—留存—收入—传播
AARRR模型的使用注意事项
AARRR模型
PRAPA模型
路径分析
杜邦分析
贡献度计算
公式拆解/业务流程拆解
MECE原则
结构分析
业务经验人为划定
平均值
二八法则
拐点法
3-sigma
6-sigma
统计方法
机器学习模型
阈值划分
分层分析
纵向对比
横向对比
年同比YoY
月环比MoM
周环比WoW
日环比DoD
基期对比
时间维度
空间维度
计划对比
经验值或理论值对比
对比维度
对比分析
矩阵分析/象限分析
留存分析
复购分析
同期群/群组分析
RFM分析
A/B测试
首次触点归因
末次触点归因
线性归因
时间衰减归因
基于位置归因/U型归因
自定义归因
传统归因分析
Shapley Value
马尔科夫链
Harsanyi Dividend
多分类算法
算法归因
多渠道归因分析
选择目标转化事件
选择待归因事件
选择时间窗口
选择归因模型
归因分析步骤
归因分析
UE模型
标签分析
画像分析
帕累托分析/ABC分类/二八分析
逻辑树分析
5W2H分析
WHWHORERE
人货场理论
认知—兴趣—购买—忠诚
AIPL模型
注意—兴趣—搜索—行动—分享
AISAS模型
注意—兴趣—欲望—记忆—行动
AIDMA模型
浏览首页—浏览详情页—提交订单—支付订单
电商漏斗模型
FAST模型
GROW模型
用户消费营销模型
麦肯锡七步分析法
商业模式画布
SWOT分析
PEST分析
STP分析
4P营销理论
4C营销组合
4S理论
4R理论
4V理论
4I理论
波特五力分析
BCG矩阵/波士顿矩阵
GE矩阵
KANO模型
重要紧急四象限
SMART原则
STAR原则
RACI模型
OKR法
PDCA
闭环思维
26个咨询常用分析模型
商业及营销世界最常用的23个模型
营销/商业/咨询/战略分析
描述统计
相关分析
聚类分析
交叉分析/列联表分析
购物篮分析
关联分析
方差分析
DID双重差分法
K2K
Propensity Score Matching
Coarsened Exact Matching
Matching方法
问卷分析
分类模型
统计学/机器学习
盈亏平衡分析
库存周转分析
敏感性分析
问卷
结构式访谈
半结构式访谈
完全开放式访谈
访谈
焦点小组
可用性测试
概念测试
卡片分类
日志研究
参与式设计
眼动测试
用户研究
标杆分析法
用户体验要素分析法
SWOT分析法
PEST分析法
四象限分析法/矩阵分析法
表格分析法/有无分析法
对比法
卡诺模型
评分法
功能拆解分析法
雷达图分析法
波特五力模型分析法
竞品画布分析法
5Why分析法
用户路径分析法
视觉表达分析法
需求探索分析法
竞品跟踪矩阵分析法
16种常见的竞品分析方法
手把手教你从0开始做竞品分析
竞品分析
案头研究Desk Research
实地调研Field Research
专家访谈
投行知识:行业研究方法总结
行业研究
分析思维方法
数据分析流程中的事项
指标异动归因
活动效果评估
广告投放评估
功能迭代评估
定价策略
策略方案评估
价值收益测算
A/B实验评估
业务效果评估
经营现状问题
目标制定与拆解
业务瓶颈与机会
异常数据排查
经营分析
数据分析体系
北极星指标
产品指标体系
广告指标体系
活动评估体系
数据指标体系
搭建报表看板
BI建设
数据监控体系
搭建数据体系
运营策略
流程优化
页面布局
功能增删
产品迭代
广告投放
市场拓展
用户增长
数据仓库建设
数据/算法建模
用户画像/标签建设
数据&决策支持
专题研究
商业模式
产品发展
战略研究
案例研究
商业分析
优先级排序
项目管理
沉淀文档输出知识
面试求职者
带新人
团队建设
月报/周报/日报
日常会议
工作内容&职责
《精益数据分析》
《增长黑客 : 如何低成本实现爆发式成长》
《硅谷增长黑客实战笔记》
《数据化管理 : 洞悉零售及电子商务运营》
《关键迭代:可信赖的线上对照实验》
RTA广告
oCPX
《计算广告 : 互联网商业变现的市场与技术》第2版
《电商数据分析与数据化运营》
电商
短视频
直播
游戏
餐饮
旅游
出行
酒店
电影
休闲玩乐
O2O
广告
信息流
媒体
互联网
风控
金融
汽车
咨询
快消/新零售/消费电子
运营商
制造业
房地产
医药
垂类行业
业务知识
《金字塔原理》
《学会提问》
《用图表说话》
《高效能人士的七个习惯》
美团四大名著
沟通能力
逻辑思维能力
快速学习能力
独立思考能力
数据敏感
跨团队协作
结构化思维
系统思考
抗压能力
业务能力
商业判断能力
理解能力
总结归纳能力
信息搜集能力
自驱力
文字表达能力
独立发现并解决问题能力
组织协调能力
项目推动能力
适应能力
商业洞察能力
同理心
用户思维
产品思维
互联网思维
运营思维
能力
团队合作精神
责任心
耐心细致
积极主动
工作认真
诚信正直
敬业精神
感兴趣/求知欲/立志发展
品质/性格
软技能
实体
度量
标签
下钻
上卷
ETL
基本概念
业务数据库
流量日志
三方数据
ODS数据源层
事实表Fact
维度表Dimension
DW数据明细层
DM数据轻度汇总层
主题报表
BI分析
数据挖掘
APP数据应用层
数仓分层
星形模型
雪花模型
维度建模法
第一范式1NF
第二范式2NF
第三范式3NF
Boyce-Codd范式BCNF
第四范式4NF
第五范式5NF
范式建模法
事件
说明
实体建模法
数仓建模
规范治理
架构治理
元数据治理
安全治理
数据生命周期治理
数据治理
零基础怎么去学习数据仓库
构建与优化数据仓库-阿里云
构建与优化数据仓库-阿里云DataWorks
数据仓库实战教程-阿里云
数据仓库-美团技术团队
数仓建设保姆级5W字教程
数据仓库学习资料-帆软
数据仓库学习笔记
《The Data Warehouse Toolkit》
《数据仓库工具箱 : 维度建模权威指南》第3版
《数据仓库》第4版
《数据中台:让数据用起来》
数据仓库
关系型数据收集
Sqoop
Kettle
DataX
用于实现数据的增量导入
Canal
NiFi
数据交换
非关系型流式数据收集
Flume
Logstash
Filebeat
基于Hadoop的用于监控分布式系统的数据收集系统
Chukwa
Scribe
Fluentd
Logtail
数据收集
分布式消息队列
Kafka
RabbitMQ
RocketMQ
ActiveMQ
Pulsar
消息系统
数据收集层
Hadoop分布式文件系统
HDFS
Google GFS
GPFS
Ceph
GlusterFS
BeeGFS
Alluxio
Lustre
PVFS
分布式列式存储数据库
Kudu
分布式文件系统
Oracle
Microsoft SQL Server
PostgreSQL
IBM DB2
SQLite
Microsoft Access
基于Hadoop的数据仓库
Hive
Spark SQL
Impala
Presto
Vertica
ClickHouse
国产:OceanBase、TiDB、openGauss、达梦、人大金仓
关系型数据库
Redis
Memcached
DynamoDB
键值数据库
分布式NoSQL数据库
Cassandra
基于HDFS的分布式列数据库
HBase
Google Cloud Bigtable
列式数据库
MongoDB
CouchDB
文档数据库
Neo4j
JanusGraph
NebulaGraph
Memgraph
图形数据库
分布式可扩展实时搜索和分析引擎
ElasticSearch
基于Lucene的全文搜索服务器
Solr
Splunk
搜索引擎数据库
非关系型数据库
Google Spanner
YugabyteDB
PingCAP的TiDB
VoltDB
CockroachDB
阿里的OceanBase
腾讯的TBase
腾讯的TDSQL
中兴通讯的GoldenDB
巨杉的SequoiaDB
NewSQL数据库
数据存储
Terracotta
Ignite
GemFire
GridGain
内存技术
数据存储层
YARN
Hue
Mesos
用于配置、管理和监控Hadoop集群
Ambari
Kubernetes/K8s
系统部署
分布式服务协调系统
ZooKeeper
Thrift
服务管理
管理Hadoop任务的流程调度工具
Oozie
Airflow
Aurora
Falcon
Linkedin开源的批量工作流任务调度器
Azkaban
资源调度
CM
Dr.Elephant
Ganglia
Zabbix
Eagle
监控管理
Ranger
Sentry
Atlas
管理服务
离线分布式计算框架
MapReduce
用Scala实现的数据分析集群计算框架
Spark
分布式流式实时计算引擎
Storm
分布式数据流处理框架
Flink
建立在YARN之上的数据处理分布式执行引擎
Tez
Kinesis
Trident
Apache S4
HaLoop
Samza
Apex
Beam
Heron
分布式编程
基于MapReduce/Tez实现的SQL引擎
Facebook开源的MPP系统SQL引擎
Cloudera开源的MPP系统SQL引擎
基于Spark实现的SQL引擎
SparkSQL
基于MapReduce/Tez实现的类SQL引擎
Pig
Kylin
全文检索引擎工具包
Lucene
基于Apache Lucene
Elasticsearch
Drill
Phoenix
Stinger
Tajo
Shark
HAWQ
查询引擎
数据计算层
Jupyter
Talend Open Studio
分析应用
Kibana
D3.js
Lumify
Pentaho
SpagoBI
Jaspersoft
Zeppelin
TensorFlow
Torch
Keras
Caffe
Theano
mxnet
Spark MLlib
基于MapReduce的数据挖掘算法库
Mahout
结合面向Hive的多种机器学习算法
Hivemall
Weka
Deeplearning4j
数据分析层
Amazon AWS
Microsoft Azure
Google Cloud Platform(GCP)
国内:阿里云、腾讯云、华为云、百度云
云平台
Apache最原始版本
Hadoop
Cloudera版本
CDH
Hortonworks版本
HDP
Cloudera新版本
CDP
大数据系统平台
Apache Beam
基于Hadoop的应用程序开发平台
Cascading
开发平台
平台
awesome-bigdata
大数据相关开源项目及组件汇总
数据库排名
《大数据之路:阿里巴巴大数据实践》
《大数据技术原理与应用》第2版
《大数据日知录》
大数据
MLP
BP神经网络
CNN
LeNet
AlexNet
VGG
ResNet
DenseNet
卷积网络
RNN
LSTM
GRU
Auto-Encoder
Encoder-Decoder
Seq2Seq
循环网络
普通模式K=V
键值对模式K!=V
加性模型
点积模型
缩放点积模型
双线性模型
注意力分布计算
软性注意力
注意力分布最大采样
注意力分布随机采样
硬性注意力
多头注意力
自注意力
Transformer
BERT
注意力机制
GAN
GCN图卷积网络
GAT图注意力网络
GAE图自编码器
GGN图生成网络
GSN图时空网络
GNN图神经网络
斯坦福CS224n课程
自然语言处理NLP
斯坦福CS231n课程
斯坦福CS223B课程
计算机视觉CV
数据科学DS(数据挖掘)
推荐系统RS(搜/推/广)
李宏毅强化学习课程
David Silver强化学习课程
David Silver强化学习课程
强化学习RL
知识图谱KG
大模型
研究方向
吴恩达深度学习
吴恩达深度学习笔记
斯坦福CS230课程
斯坦福CS230速查表
吴恩达深度学习课程
深度学习500问
深度学习面试宝典
深度学习面试-七月在线
算法工程师面试及资料
算法工程师机器学习面试
CS-Notes
github上面试项目集合
github上27个面试项目集合
coding-interview-university
深度学习面试
《深度学习入门:基于Python的理论与实现》
github上的《Deep Learning》
github上的《Deep Learning》数学推导、原理剖析与代码实现
《深度学习》(花书)
《动手学深度学习》
进阶知识
数据分析
0 条评论
回复 删除
下一页