数据分析技能知识笔记总结
2022-10-20 09:39:09 0 举报
AI智能生成
数据分析技能知识笔记总结
作者其他创作
大纲/内容
第一阶段 数据分析入门数据思维构建
基础语言入门
变量及数值类型
序列及通用操作
字典映射
条件判断及循环语句
函数
模块与包
数据读写
重点工具掌握
科学计算工具:Numpy
数据分析工具:Pandas
图表绘制工具:Matplotlib
空间分析工具:GIS
数据服务
数据分析方法
数据特征分析
数据处理
数学建模-蒙特卡洛思想
数据表达逻辑
数据可视化整体概述
Python图表数据可视化:Seaborn
关系网络数据可视化
空间数据可视化第五章
Python交互图表可视化:Bokeh
数据分析项目实战
城市餐饮店铺选址分析
知乎数据清洗整理和结论研究
视频网站数据清洗整理和结论研究
电商打折套路解析
中国姓氏排行研究
房价影响因素挖掘
中国城市资本流动问题探索
社会财务分配问题模拟
泰坦尼克号获救问题
国产烂片深度揭秘
婚恋配对实验
数据分析企业实战
网易游戏:数据时代的网络游戏设计与运营
网易严选:用户增长实践经验分享
网易教育:如果高效构建业务指标体系
网易有数:数据再汽车行业中的应用
硅谷实战:消费者行为分析机器预测
第二阶段 数据采集进阶
Python数据爬虫技巧
初识网页语言HTML
Javascript语言基础
网络资源访问工具:requests
网页信息解析方法:Xpath与BeautifulSoup
爬虫数据库:MongoDB
浏览器测试框架:Selenium
进阶技巧:代理及反爬机制
数据爬虫企业实战
基本静态网页数据采集-搞定80%的网页
如何从零开始构建数据采集工作流,以房地产平台数据为例
第三阶段 数据挖掘进阶
机器学习算法
数据预处理与特征工程
回归问题
常用评价指标MSE、RMSE、R-squared、MAE、MAPE
偏差方差两难全(Bias-Variance Tradeoff)
一元线性回归
损失函数
最小二乘法
多元线性回归
惩罚模型
线性回归模型操作演示
树回归模型
集成学习
Bagging与随机森林
GBM梯度调优模型
XgBoost模型
树回归及集成模型操作演示
分类问题
分类评价体系与常用评价体系(精度、错误率、查准率、AUC等)
逻辑回归模型
逻辑回归与梯度下降调优
逻辑回归与惩罚模型
线性回归模型操作演示
决策树模型基础
划分方法:信息增益法与基尼系数法
决策树的剪枝问题
Boosting算法与AdaBooost算法
KNN算法
支持向量机模型SVM
非线性分类模型操作演示
非监督模型
聚类算法:K-means聚类
主成分分析法
因子分析法
非监督模型操作实验
kaggle算法实战
纽约出租车车程用时预测
共享单车需求量预测
TalkingData定位手机机主年龄性别
基于城市厚数据下的房价预测
信用卡反欺诈预测模型问题
数据挖掘企业实战
特征工程:商业选址算法中的数据处理问题
精准营销:电商数据需求预测与分仓规划
风险评估:在线贷款申请预测模型
智能定价:基于服装销售数据的日常价格弹性分析
0 条评论
下一页