[机器学习系统]Pipeline
2017-02-24 09:30:43 0 举报
机器学习Pipeline是一种用于处理数据和构建模型的自动化工具。它包括一系列数据处理步骤,如数据清洗、特征工程、模型选择和评估等,以及将它们组合在一起的方法。Pipeline可以帮助用户快速地构建和部署机器学习模型,同时确保数据的一致性和可重复性。此外,Pipeline还可以通过集成不同的机器学习算法来提高模型的性能。总之,机器学习Pipeline是一种强大的工具,可以帮助用户更高效地开发和部署机器学习应用。
作者其他创作
大纲/内容
特征向量化
数据源
特征集合
预测
可视化
数据清洗/向量化
特征/模型验证
上传数据文件HDFSRDBHive
模型选择
Spark-MllibTensorFlow
Spark-MllibSpark-GraphX
Jupyter Notebook 环境
Spark 离线训练
Hadop HiveHDFSRDB
Spark-Streaming
模型/初始化参数加载
模型
训练
特征选择
Spark-Mllib
异构数据源
用户操作流
Spark 在线实时预测
模型/参数
Spark-SQLSpark-MllibMap-Reduce
0 条评论
下一页