2章数据库系统
2021-09-08 14:33:09 4 举报
AI智能生成
数据库系统
作者其他创作
大纲/内容
数据库管理系统类型
用户级(用户可以看到的表)
概念级(DBA可以看到的表)
物理级(最接近物理存储)
三级抽象
外模式:外模式反映了数据库的用户观。
概念模式:反映了数据库系统的整体观
内模式:它是数据库的存储观
三级模式
物理独立性
逻辑独立性
两级独立性
数据库的结构与模式
即属性值的类型、取值范围或取值集合不同
属性冲突
同名异义、异名同义
命名冲突
结构冲突
用户的观点,主要用于设计
概念数据模型(E-R)
数据模型中的数据结构主要描述数据的类型、内容、性质以及数据间的联系等
数据结构
数据模型中数据操作主要描述在相应的数据结构上的操作类型和操作方式
数据操作
ID不能为空
实体完整性
在关系数据库中主要是值得外键参照的完整性
参照完整性
用户定义完整性是针对某一个具体关系的约束条件
自定义完整性
数据的约束条件
计算机系统的观点,主要用于实现DBMS
层次模型
网状模型
关系模型
面向对象模型
常用的模型
基本数据模型
数据模型
1NF:属性不可分
2NF:符合1NF,并且,非主属性完全依赖于码
3NF:符合2NF,并且,消除传递依赖(至少3个属性才可能传递)
BCNF:符合3NF,并且,主属性不依赖于主属性
4NF
数据的规范化(5NF)
增加冗余列
增加派生列
重新组表
水平分割
垂直分割
分割表
反规范化:为了提高查询或应用的性能而破坏NF
关系R与S的并是由属于R或属于S的元组构成的集合
∪
关系R与S的差是由属于R但不属于S的元组构成的集合
-
关系R与S的交是由属于R同时又属于S的元组构成的集合
∩
两个元组分别为n目和m目的关系R和S的笛卡尔积是一个(n+m)列的元组的集合。元组的前n列是关系R的一个元组,后m列是关系S的一个元组
×
取得关系R中符合条件的行
σ
取得关系R中符合条件的列
π
⋈
关系代数
学号→姓名
函数依赖
完全函数依赖
如果X→Y,但Y不完全函数依赖于X,则称Y对于X部分函数依赖
部分函数依赖
在R(U,F)中,如果X→Y,Y∉X,Y→Z,则称Z对X传递依赖
传递依赖
Armstrong公理
在关系中能唯一标识元组的属性集称为关系模式的超键
超键
不含有多余属性的超键称为候选键
候选键
用户选作元组标识的一个候选键称为主键
主键
如果关系模式R中的某些属性集不是R的候选键,而是关系模式S的候选键,则这个属性集对模式R而言是外键
外键
包含在任何一个候选键中的属性称为主属性,否则称为非主属性
主属性和非主属性
闭包
关系数据库规范化
数据库模式与范式
sql
数据操纵和使用
数据库设计的过程是将数据库系统与现实世界密切、有机地、协调一至地结合起来的过程
从数据结构即数据模型开始
静态结构设计与动态行为设计分离(表结构或视图)
试探性(方案很多找到合适的)
反复性(非一气呵成)
多步性(直观或单步)
数据库设计的特点
基于3NF
面向对象(一对多,多对一,多对多)
数据库设计的方法
数据流图
数据字典
需求分析
面向现实世界的、极易为 用户所理解的数据模型
E-R
视图设计
概念结构
DBMS
逻辑结构设计
文件结构、索引设计等,即设计数据库的内模式或存储模式
数据库物理设计
数据库设计的基本步骤
数据库设计
数据库的逻辑工作单位
原子性
使数据库从一个一致性状态变到另一个一致性状态
一致性
不能被其他事务干扰
隔离性
一旦提交,改变就是永久性的
持续性
特征
一个事务独占
x封锁
其他的事务可看不可改
S封锁
并发控制
反向扫描文件日志
事务故障
正向扫描日志文件
系统故障
装入最新的数据库后备副本,使数据库恢复到最近一次转储时的一致性状态
介质故障
计算机病毒
故障与恢复
事务管理(相当于进程)
并行数据库系统
数据源
数据的存储与管理
OLAP(联机分析处理)
前端工具
数据仓库体系结构
业务需求分析
逻辑模型设计
物理模型设计(转表)
数据仓库生成
数据仓库的开发与实施
自顶向下:以业务需求为首
自底向上:实验和基于技术原型入手
联合法
数据仓库的实现方法
多介质存储设备的管理技术
数据存储的控制
数据的并行存储与管理
可变长技术
锁切换技术
数据仓库相关的数据存储技术
数据抽取
存储管理
数据表现
方法论
数据仓库技术的发展趋势
数据仓库
自动预测趋势和行为(市场趋势)
关联分析
聚类(聚类与分类的不同在于,聚类所要求划分的类是未知的)
概念描述(决策树方法、遗传算法)
偏差检测
数据挖掘的功能
关联分析(如常买尿布的可能也是买奶粉)
序列分析
统计学
贝叶斯方法
神经网络方法
决策树方法
向量机
分类分析(可根据房屋的地理位置决定房屋的档次)
聚类分析
预测(预测常用的技术回归分析)
时间序列分析(趋势和季节性)
数据挖掘常用技术
问题定义
建立数据挖掘库
分析数据
调整数据
模型化
评价和解释
数据挖掘的流程
数据挖掘
易扩展
大数据量,高性能(无关系性,数据库的结构简单)
灵活的数据模型
高可用
常用指令
优点
缺点
RDB
AOF
Redis持久化
容灾备份
String: 缓存、计数器、分布式锁等。
List: 链表、队列、微博关注人时间轴列表等。
Hash: 用户信息、Hash 表等。
Set: 去重、赞、踩、共同好友等。
Zset: 访问量排行榜、点击量排行榜等。
在 Redis 中,常用的 5 种数据类型和应用场景如下
问题画像
Redis
常用的nosql数据库
NoSQL
大量
高速
多样
价值
大数据的特点(4v)
大数据
冷备份是将数据库正常关闭,在停止状态下
冷备份
不关闭数据库
热备份
物理备份
逻辑备份
备份
差异
增量
图
备份与恢复
数据的分布性
统一性
分片透明性
位置透明性
局部数据模型(逻辑透明性)
透明性
分布式数据库的特点
按DDBMS软件同构度来分
按局部自治度来分
按分布透明度来分
分布式数据库的分类
局部结点自治
不依赖中心结点
能连续操作
具有位置独立性(位置透明性)
分片独立性(分片透明性)
数据复制独立性
支持分布式查询处理
支持分布事务管理
具有硬件独立性
具有网络独立性
具有DBMS独立性
分布式数据库的目标
系统的可靠性和可用性好
坚固性好
增减节点
可扩充性好
就近访问
可改善性能
高度自制
自治性好
与集中式数据库相比
分布式数据库系统(DDB)
数据库系统(小莫)
0 条评论
下一页