2.Tableau之“数据”
2019-11-06 10:41:03 3 举报
AI智能生成
Tableau之“数据”
作者其他创作
大纲/内容
(一)数据基础
1.数据角色
(1)维度&度量
维度
维度是“类别”字段,是对数据进行切片/切块时的依据
图标颜色为“蓝色”
维度常常是离散的,离散字段在图表中形成标签
度量
度量是“指标”,是希望分析的数字
图标颜色为“绿色”
度量常常是连续的,连续字段在图表中形成轴
(2)离散&连续
离散
胶囊颜色为“蓝色”
离散字段在行列功能区时在视图中显示为标题
连续
胶囊颜色为“绿色”
连续字段在行列功能区时在视图中显示为轴
2.字段类型
文本
日期
日期和时间
地理值
布尔值
True/False
数字
地理编码
*记录数
*度量名称&*度量值
成对使用,目的是将处于不同列的数据用一个轴展示出来
3.字段类型转换
Tableau会自动分配字段类型,但需要在创建视图前对分配不规范的进行调整
(二)数据连接与管理
Tableau元数据管理(数据架构)
1.数据连接层(Connection)
数据连接层决定如何访问源数据和获取哪些数据
支持的数据源类型
①传统关系型数据源
MySQL、Oracle、IBM DB2等
②多维数据源(OLAP)
Oracle Essbase、Microsoft Analysis Service、Teradata OLAP Connector等
③Hadoop系统产品的数据源
Cloudera Hadoop、Hortonworks Hadoop Hive、MapR Hadoop Hive等
④Tableau数据提取
⑤Web数据源
Google Analysis、Google BigQuery、Salesforce等
⑥Excel、Access以及文本文件
2.数据模型层(Data Model)
关系型数据库中数据的建模工作
元数据管理
字段数据类型
字段角色(度量/维度)
字段默认值、别名
用户定义的计算字段、集、组
建模过程
①首先,对业务数据库进行ETL(数据抽取/转换/加载)
②然后,定义维度中的层级关系和属性,形成数据立方体(CUBE)
③Tableau可识别多维数据源中预先定义好的分层结构
*注:由于多维数据源特性,Tableau引入的多维数据源本身为一种聚合形式,无法再进一步聚合,且维度字段不能随意改变组织形式(分组、创建分层结构、角色转换)和参与计算,同时度量字段也不能使用分级和改变角色
3.数据可视化层(VizQL)
报表查询
图形分析
数据连接
1.连接文件数据源
EXCEL
ACCESS
2.连接服务器数据源
Oracle
ODBC(其他数据库)
3.复制粘贴输入数据
创建以Clipboard开头的临时文件
4.筛选数据
数据整合
1.多表连接
连接类型
以纵向方式将列添加至现有表
内连接/左连接/右连接/外连接
并集
以水平方式将行添加至现有表
Tableau不会去重
2.跨数据库数据集成
适用场景:不同类型数据存放在不同数据环境中,提取后整合成统一数据源用作分析
3.多数据源数据融合
适用场景:分别从两个数据源中取数,融合分析(但不整合成一个数据源)
数据源关系
主数据源
从数据源
先添加的为主,后添加的为从
多维数据源不能用作从数据源,只能用作主数据源
前置条件:数据源间必须有一个公共字段
Tableau自动读取名称相同字段作为公共字段
手动设置:数据>>编辑关系
融合类型
跨数据源取数展示
跨数据源数据计算
添加计算字段,跨数据库聚合函数
去除Null值:ZN函数
去除*号
4.连接至多维数据集
数据加载
创建数据提取
刷新数据提取
向数据提取添加行
优化数据提取
数据维护
查看数据
刷新数据
替换数据
删除数据
0 条评论
下一页