Redis知识点总结
2021-07-12 17:36:32 336 举报
AI智能生成
Redis是一款开源的,支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。它常被用作缓存系统,以减少对数据库的访问并提高性能。其数据结构丰富,包括字符串、哈希表、列表、集合和有序集合等。此外,Redis还支持事务、管道、发布/订阅等特性。面试中可能会涉及的问题包括:如何设置和获取键值对、如何处理并发请求、如何实现分布式锁、如何优化性能等。掌握这些知识点,将有助于在面试中展示你对Redis的深入理解和实践能力。
作者其他创作
大纲/内容
概述
什么是Redis
C语言编写,开源高性能非关系型NoSQL的键值对数据库
存储键,五种不同类型的值之间映射
键
字符串
值
字符串、列表、集合、散列表、有序集合
应用缓存、分布式锁、支持事务、持久化、LUA脚本、LRU事件驱动、多种集群方案
Redis有哪些优缺点
优点
读写性能优异,读11万,写8万
支持持久化数据
RDB
AOF
支持事务
所有命令操作都是原子性
支持多个命令合并打包的原子执行(打包顺序执行,之间不执行别的命令,别的命令进入等待队列)
数据结构丰富
支持主从复制
主机自动将数据同步给从机,可以进行读写分离
缺点
受物理内存限制,不能作为海量数据高速读写
Redis适合的场景主要局限在较小数据量的高性能操作和运算上
不具备自动容错和恢复功能,主从机的宕机都会导致前端部分请求的失败
需要等待机器重启或者手动切换前端的IP才能恢复
主机宕机前,部分数据未同步从机,会引起数据不一致和数据丢失的问题
在线扩容较难
集群容量达到上线时再次扩容难度较大
为什么要用 Redis /为什么要用缓存
高性能
将用户访问的数据存在缓存中
高并发
将数据库中部分数据移到缓存中
直接操作缓存能够承受的请求是远远大于直接访问数据库
为什么要用 Redis 而不用 map/guava 做缓存?
redis与Map/guava的优势
以 Java 为例,使用自带的 map 或者 guava 实现的是本地缓存
最主要的特点是轻量以及快速,生命周期随着 jvm 的销毁而结束,并且在多实例的情况下,每个实例都需要各自保存一份缓存,缓存不具有一致性。
使用 redis 或 memcached 之类的称为分布式缓存
在多实例的情况下,各实例共用一份缓存数据,缓存具有一致性。缺点是需要保持 redis 或 memcached服务的高可用,整个程序架构上较为复杂。
Redis为什么这么快
完全基于内存
数据结构简单,操作也简单
采用单线程设计,避免上下文切换和竞争条件
新版有引入多线程操作,但仅是对一些删除操作采用使用多线程:对于一些大键值对的删除操作,通过多线程非阻塞地释放内存空间也能减少对 Redis 主线程阻塞的时间,提高执行的效率
使用多路I/O复用模型,非阻塞IO
使用底层模型不同,它们之间底层实现方式以及与客户端之间通信的应用协议不一样,
Redis 直接自己构建了 VM 机制 ,因为一般的系统调用系统函数的话,会浪费一定的时间去移动和请求;
Redis 直接自己构建了 VM 机制 ,因为一般的系统调用系统函数的话,会浪费一定的时间去移动和请求;
应用场景
计数器
可以对 String 进行自增自减运算
适合存储频繁读写的计数量
用户的访问次数、热点文章的点赞转发数量等
缓存(内容可以失效)
将热点数据放到内存中,设置内存的最大使用量以及淘汰策略来保证缓存的命中率
数据库缓存、会话缓存、全网页缓存(FPC)
查找表(内容不能失效)
消息队列(订阅/发布功能)
List 是一个双向链表,可以通过 lpush 和 rpop 写入和读取消息。
不过最好使用 Kafka、RabbitMQ 等消息中间件
分布式锁
redis支持的setnx实现分布式锁
官方推荐的RedLock分布式锁
数据类型
基本数据类型
字符串、整数、浮点数(String)
对字符串或字符串部分进行操作
对数据可以进行自增减操作
列表(List)
从两端压入或弹出元素;对单个或多个进行修剪操作;保留一定范围的元素
粉丝列表、文章的评论列表
集合(Set)无序集合
添加、获取、移除单个元素,检查一个元素是否存在,计算交、并、差集计算,在集合里面随机获取元素
比如交集,共同关注、共同粉丝、共同喜好
散列表(Hash)
添加、获取、移除、单个键值对;获取所有键值对;检查某个键是否存在
有序集合(ZSet)
添加、获取、删除元素;根据分值范围或成员获取元素;计算一个键的排名
特殊数据类型
地理位置(geospatial)
HyperLogLog 是用来做基数统计的算法
位存储(bitmaps)
pub/sub
stream
持久化的pub/sub
redis5.0新增
借鉴kafka的模式
数据结构
SDS动态字符串
多增加len记录字符串长度
自动扩展空间
空间不够的话,SDS 会自动扩展空间,避免了像 C 字符串操作中的覆盖情况;
有效降低内存分配次数
空间预分配
空间惰性释放
二进制安全
C 语言字符串只能保存 ascii 码,对于图片、音频等信息无法保存,SDS 是二进制安全的,写入什么读取就是什么,不做任何过滤和限制;
字典(相当于hash)
扩容
当 hash 表中 元素的个数等于第一维数组的长度时,就会开始扩容,扩容的新数组是 原数组大小的 2 倍。
不过如果 Redis 正在做 bgsave(持久化命令),为了减少内存也得过多分离,Redis 尽量不去扩容,
但是如果 hash 表非常满了,达到了第一维数组长度的 5 倍了,这个时候就会 强制扩容。
不过如果 Redis 正在做 bgsave(持久化命令),为了减少内存也得过多分离,Redis 尽量不去扩容,
但是如果 hash 表非常满了,达到了第一维数组长度的 5 倍了,这个时候就会 强制扩容。
缩容
元素个数低于数组长度的10%会缩容
缩容操作不会考虑bgsave
缩容操作不会考虑bgsave
跳跃表
压缩表(ziplist)
zset,hash会在元素比较少的时候采用压缩存储
压缩表是一块连续的内存空间,元素之间数据紧挨着没有空隙
快速列表(quicklist)
list+zipList
redis3.2引入用于替代ziplist 和 list
持久化
RDB(redis database缩写快照)
按照一定的时间将内存数据以快照的形式保存到硬盘中
优点
只有一个dump.rdb文件,方便持久化
容灾性好,一个文件可以保存在安全磁盘
性能最大化
fork 子进程来完成写操作,让主进程继续处理命令,所以是 IO 最大化。
使用单独子进程来进行持久化,主进程不会进行任何 IO 操作,保证了 redis 的高性能
使用单独子进程来进行持久化,主进程不会进行任何 IO 操作,保证了 redis 的高性能
相对于数据集大时,比 AOF 的启动效率更高
缺点
数据安全性低,隔一段时间进行持久化,如果持久化之间Redis发生故障,会有数据丢失的问题
AOF(append only file)
将redis执行的每次写命令记录到日志文件中,当重启Redis会重新将持久化的日志文件恢复
当开启两种方式备份时,优先使用AOF恢复数据
优点
数据安全,可以做到记录备份每一条数据
通过 append 模式写文件,即使中途服务器宕机,可以通过 redis-check-aof 工具解决数据一致性问题
rewrite模式会对过大的文件进行合并重写,删除其中的某些命令
缺点
AOF文件比RDB文件大,数据恢复启动时慢
如何选择合适的持久化方式?
同时使用两种持久化功能
在这种情况下,当 Redis 重启的时候会优先载入AOF文件来恢复原始的数据,
AOF文件保存的数据集要比RDB文件保存的数据集要完整。
AOF文件保存的数据集要比RDB文件保存的数据集要完整。
可以承受数分钟以内的数据丢失
可以只使用RDB持久化
定时生成RDB快照(snapshot)非常便于进行数据库备份
RDB 恢复数据集的速度也要比AOF恢复的速度要快
使用RDB还可以避免AOF程序的bug
只希望你的数据在服务器运行的时候存在
可以不使用任何持久化方式
Redis持久化数据和缓存怎么做扩容?
缓存扩容方式
使用一致性哈希实现动态扩容缩容
持久化数据扩容方式
必须使用固定的keys-to-nodes映射关系,节点的数量一旦确定不能变化。
否则(即Redis节点需要动态变化的情况),必须使用可以在运行时进行数据再平衡的一套系统——Redis集群
否则(即Redis节点需要动态变化的情况),必须使用可以在运行时进行数据再平衡的一套系统——Redis集群
过期/淘汰
Redis的过期键的删除策略
设置Redis中缓存的key的过期时间。Redis的过期策略、当Redis中缓存的key过期,Redis如何处理
过期策略
定时过期
到了时间就立即移除(对内存友好,但会占用大量cpu资源去处理过期的数据,从而影响缓存的响应时间和吞吐量)
惰性过期
只有当访问一个key时,才会判断该key是否已过期,过期则清除
该策略可以最大化地节省CPU资源,极端情况可能出现大量的过期key没有再次被访问,从而不会被清除,占用大量内存
定期过期
每隔一定的时间,会扫描一定数量的数据库的expires字典中一定数量的key,并清除其中已过期的key
expires字典:会保存所有设置了过期时间的key的过期时间数据
key是指向键空间中的某个键的指针
键空间是指该Redis集群中保存的所有键
value是该键的毫秒精度的UNIX时间戳表示的过期时间
该策略是前两者的一个折中方案。通过调整定时扫描的时间间隔和每次扫描的限定耗时,可以在不同情况下使得CPU和内存资源达到最优的平衡效果
Redis中同时使用了惰性过期和定期过期两种过期策略。
Redis key的过期时间和永久有效分别怎么设置?
EXPIRE
PERSIST
内存相关
MySQL里有2000w数据,redis中只存20w的数据,如何保证redis中的数据都是热点数据?
redis内存数据集达到某定值,需要额外申请内存空间,执行内存淘汰策略
Redis的内存淘汰策略有哪些?
全局键空间选择性移除
noeviction
内存不足时,新写入操作报错。但保证数据不会丢失,系统默认方式
allkeys-lru
在键空间中移除最近最少使用的key(常用)
allkeys-random
随机移除某个key
设置过期时间的键空间选择性移除
volatile-lru
移除最近最少使用的key
volatile-random
随机移除某个key
volatile-ttl
最接近淘汰时间的key
Redis主要消耗什么物理资源?
内存
内存回收默认使用LRU算法,可以配置淘汰策略
Redis的内存用完了会发生什么?
达到设定上限,Redis的写命令会返回错误信息(读命令正常)
通过 maxmemory 参数来限制最大可用内存
内存淘汰策略(需配置)
Redis如何做内存优化?
利用好List、Set、Hash、sorted set等集合类型数据,很多小的Key-Value可以用更紧凑的方式存放到一起。
尽可能使用散列表(hashes),散列表(存储数少)使用内存非常小,所以应尽可能将数据模型抽象到一个散列表中。
比如web系统中一个用户对象,不要为这个用户的名称,姓氏,邮箱,密码设置单独的key,而是应把这个用户的所有信息存储到一张散列表里
线程模型
Redis基于Reactor模式开发了网络事件处理器,这个处理器被称为文件事件处理器(file event handler)。它的组成结构为4部分:多个套接字、IO多路复用程序、文件事件分派器、事件处理器。因为文件事件分派器队列的消费是单线程的,所以Redis才叫单线程模型。
文件事件处理器使用 I/O 多路复用(multiplexing)程序来同时监听多个套接字, 并根据套接字目前执行的任务来为套接字关联不同的事件处理器。当被监听的套接字准备好执行连接应答(accept)、读取(read)、写入(write)、关闭(close)等操作时, 与操作相对应的文件事件就会产生, 这时文件事件处理器就会调用套接字之前关联好的事件处理器来处理这些事件虽然文件事件处理器以单线程方式运行, 但通过使用 I/O 多路复用程序来监听多个套接字, 文件事件处理器既实现了高性能的网络通信模型, 又可以很好地与redis 服务器中其他同样以单线程方式运行的模块进行对接, 这保持了 Redis 内部单线程设计的简单性。
文件事件处理器使用 I/O 多路复用(multiplexing)程序来同时监听多个套接字, 并根据套接字目前执行的任务来为套接字关联不同的事件处理器。当被监听的套接字准备好执行连接应答(accept)、读取(read)、写入(write)、关闭(close)等操作时, 与操作相对应的文件事件就会产生, 这时文件事件处理器就会调用套接字之前关联好的事件处理器来处理这些事件虽然文件事件处理器以单线程方式运行, 但通过使用 I/O 多路复用程序来监听多个套接字, 文件事件处理器既实现了高性能的网络通信模型, 又可以很好地与redis 服务器中其他同样以单线程方式运行的模块进行对接, 这保持了 Redis 内部单线程设计的简单性。
Reactor详解
事务
说说Redis的事务
通过multi\exec\watch执行的一组命令集合;事务支持一次执行多个命令,一个事务中所有命令都会被序列化。
在事务执行过程,会按照顺序串行化执行队列中的命令,其他客户端提交的命令请求不会插入到事务执行命令序列中。
在事务执行过程,会按照顺序串行化执行队列中的命令,其他客户端提交的命令请求不会插入到事务执行命令序列中。
总结
一次性、顺序性、排他性执行一个队列中的一系列命令
要点
- 不支持回滚;
- 一个事务中有命令错误则所有的都不执行;
- 出现运行错误,正确的命令会被执行
Redis事务的有哪些阶段?
- 开启事务multi
- 命令入队列
- 事务执行exec
事务执行过程中,如果服务端收到有EXEC、DISCARD、WATCH、MULTI之外的请求,将会把其他请求放入队列中排队
Redis事务相关命令有哪些?
multi
开启一个事务
exec
执行事务
discard
客户端可以放弃一个事务队列,并放弃执行事务,客户端会从事务状态退出
watch
命令用于监视一个(或多个) key ,如果在事务执行之前这个(或这些) key 被其他命令所改动,那么事务将被打断
乐观锁
unwatch
事务管理(ACID)
原子性(Atomicity)
事务是一个不可分割的工作单位,事务中的操作要么都发生,要么都不发生
单条命令是原子性执行的,事务出现运行错误时,正确命令会被执行,不会回滚
一致性(Consistency)
事务前后数据的完整性必须保持一致
隔离性(Isolation)
多个事务并发执行时,一个事务的执行不应影响其他事务的执行
Redis 是单进程程序,并且它保证在执行事务时,不会对事务进行中断,事务可以运行直到执行完所有事务队列中的命令为止。
因此,Redis 的事务是总是带有隔离性的。
因此,Redis 的事务是总是带有隔离性的。
持久性(Durability)
指一个事务一旦被提交,它对数据库中数据的改变就是永久性的,接下来即使数据库发生故障也不应该对其有任何影响
当服务器运行在AOF持久化模式下,并且appendfsync选项的值为always时,事务也具有持久性
Redis事务的其他实现方式有哪些?
基于LUA脚本
Redis可以保证脚本内的命令一次性、按顺序地执行,
其同时也不提供事务运行错误的回滚,执行过程中如果部分命令运行错误,剩下的命令还是会继续运行完
其同时也不提供事务运行错误的回滚,执行过程中如果部分命令运行错误,剩下的命令还是会继续运行完
基于中间标记变量
通过另外的标记变量来标识事务是否执行完成,读取数据时先读取该标记变量判断是否事务执行完成。
但这样会需要额外写代码实现,比较繁琐
但这样会需要额外写代码实现,比较繁琐
集群方案
Redis 主从架构(master-slave)
redis 主从复制的核心原理
Redis 主从架构(master-slave)
主要用来支撑读高并发,一主多从,主负责写,并将数据复制到其他slave节点,从节点负责读
所有读请求全部走从节点
redis replication -> 主从架构 -> 读写分离 -> 水平扩容支撑读高并发
redis replication 的核心机制
redis 采用异步方式复制数据到 slave 节点,slave node 会周期性地确认自己每次复制的数据量
一个 master node 是可以配置多个 slave node 的
slave node 也可以连接其他的 slave node
slave node 做复制的时候,不会 block master node 的正常工作
slave node 在做复制的时候,也不会 block 对自己的查询操作,它会用旧的数据集来提供服务;
但是复制完成的时候,需要删除旧数据集,加载新数据集,这个时候就会暂停对外服务;
但是复制完成的时候,需要删除旧数据集,加载新数据集,这个时候就会暂停对外服务;
slave node 主要用来进行横向扩容,做读写分离,扩容的 slave node 可以提高读的吞吐量
要点
建议必须开启 master node 的持久化
如果slave持久化,可能在 master 宕机重启的时候数据是空的,然后可能一经过复制, slave node 的数据也丢了。
master 的各种备份方案,也需要做
万一本地的所有文件丢失,从备份中挑选一份 rdb 去恢复 master,这样才能确保启动时,是有数据的,即使采用了后续讲解的高可用机制,slave node 可以自动接管 master node,但也可能 sentinel 还没检测到 master failure,master node 就自动重启了,还是可能导致上面所有的 slave node 数据被清空
redis 主从复制的核心原理
1. 当从库和主库建立master-slave关系后,会向主数据库发送PSYNC命令
2. 主库接收到PSYNC命令后会开始在后台保存快照(RDB持久化过程),并将期间接收到的写命令缓存起来
3. 当快照完成后,主Redis会将快照文件和所有缓存的写命令发送给从Redis
4. 从Redis接收到后,会载入快照文件并且执行收到的缓存的命令
5. 之后,主Redis每当接收到写命令时就会将命令发送从Redis,从而保证数据的一致
缺点
所有的slave节点数据的复制和同步都由master节点来处理,会照成master节点压力太大,使用主从从结构来解决
哨兵模式(sentinel)(主从复制的一种实现)
主要功能
集群监控
监控master和slaver的进程是否正常
消息通知
如果某个 redis 实例有故障,哨兵发警报消息通知管理员
故障转移
如果master node 挂了,自动转移到slave node 上
配置中心
如果故障发生转移,通知client客户端新的master地址
哨兵用于实现 redis 集群的高可用
本身也是分布式的,作为一个哨兵集群去运行,互相协同工作。
故障转移时,判断一个 master node 是否宕机了,需要大部分的哨兵都同意才行,涉及到了分布式选举的问题。
即使部分哨兵节点挂掉了,哨兵集群还是能正常工作的
哨兵的核心知识
哨兵至少需要3个实例保障自身的健壮性
哨兵集群+redis主从复制部署不能保证数据零丢失,只能保证高可用
尽量在测试环境和生产环境,都进行充足的测试和演练
官方Redis Cluster 方式
(服务器路由)
(服务器路由)
redis 集群模式的工作原理能说一下么?在集群模式下,redis 的 key 是如何寻址的?分布式寻址都有哪些算法?了解一致性 hash 算法吗?
哈希槽
Redis集群有16384个哈希槽,每个key通过CRC16校验后对16384取模来决定放置哪个槽,集群的每个节点负责一部分hash槽。
CRC16
通过异或操作来替代的一种除法取余操作
Redis Cluster是一种服务端Sharding技术,3.0版本开始正式提供。Redis Cluster并没有使用一致性hash,而是采用slot(槽)的概念,一共分成16384个槽。将请求发送到任意节点,接收到请求的节点会将查询请求发送到正确的节点上执行
方案说明
1. 通过哈希的方式,将数据分片,每个节点(主多从)均分存储一定哈希槽(哈希值)区间的数据,默认分配了16384 个槽位
2. 每份数据分片会存储在多个互为主从的多节点上
3. 数据写入先写主节点,再同步到从节点(支持配置为阻塞同步)
4. 同一分片多个节点间的数据不保持一致性
5. 读取数据时,当客户端操作的key没有分配在该节点上时,redis会返回转向指令,指向正确的节点
6. 扩容时需要把旧节点的数据迁移一部分到新节点
要点
在 redis cluster 架构下,每个 redis 要放开两个端口号,比如一个是 6379,另外一个16379
一个对外提供使用,一个用于节点间通讯
节点间通讯采用cluster bus 的通信,用来进行故障检测、配置更新、故障转移授权。
cluster bus 用了另外一种二进制的协议, gossip 协议,用于节点间进行高效的数据交换,占用更少的网络带宽和处理时间
cluster bus 用了另外一种二进制的协议, gossip 协议,用于节点间进行高效的数据交换,占用更少的网络带宽和处理时间
gossip协议
节点间内部通讯机制
集群元数据的维护有两种方式:集中式、Gossip 协议。redis cluster 节点间采用 gossip 协议进行通信。
分布式寻址算法
算法
hash slot(哈希槽) 算法(redis clustre采用)
hash 算法
比较适合固定分区或者分布式节点的集群架构
缺点
扩容或缩容会导致缓存重建
一致性 hash 算法(自动缓存迁移)
缺点
数据倾斜问题,无法控制节点分布的均匀性
一致性 hash 算法(自动缓存迁移)+ 虚拟节点(自动负载均衡)
解决数据倾斜问题,为每一个设置多个虚拟节点(实际应用一般设置32甚至更大),使得数据分布均匀。
应满足的条件
平衡性
单调性
分散性
负载
平滑性
优点
无中心架构,支持动态扩容,对业务透明
具备Sentinel的监控和自动Failover(故障转移)能力
客户端不需要连接集群所有节点,连接集群中任何一个可用节点即可
高性能,客户端直连redis服务,免去了proxy代理的损耗
缺点
运维复杂,数据迁移需要人工干预
只能使用0号数据库
不支持批量操作(pipeline管道操作)
分布式逻辑和存储模块耦合等
基于客户端分配
Redis Sharding是Redis Cluster出来之前,业界普遍使用的多Redis实例集群方法。其主要思想是采用哈希算法将Redis数据的key进行散列,通过hash函数,特定的key会映射到特定的Redis节点上。Java redis客户端驱动jedis,支持Redis Sharding功能,即ShardedJedis以及结合缓存池的
优点
非常简单,服务端的Redis实例彼此独立,相互无关联,每个Redis实例像单服务器一样运行,非常容易线性扩展,系统的灵活性很强
缺点
sharding处理放到客户端,规模进一步扩大时给运维带来挑战
客户端sharding不支持动态增删节点。服务端Redis实例群拓扑结构有变化时,每个客户端都需要更新调整。
连接不能共享,当应用规模增大时,资源浪费制约优化
连接不能共享,当应用规模增大时,资源浪费制约优化
基于代理服务器分片
客户端发送请求到一个代理组件,代理解析客户端的数据,并将请求转发至正确的节点,最后将结果回复给客户端
特征
透明接入,业务程序不用关心后端Redis实例,切换成本低
Proxy 的逻辑和存储的逻辑是隔离的
代理层多了一次转发,性能有所损耗
业界开源方案
Twtter开源的Twemproxy
豌豆荚开源的Codis
相关问题
Redis集群的主从复制模型是怎样的?
为了使在部分节点失败或者大部分节点无法通信的情况下集群仍然可用,所以集群使用了主从复制模型,每个节点都会有N-1个复制品
生产环境中的 redis 是怎么部署的?
Redis集群会有写操作丢失吗?为什么?
Redis并不能保证数据的强一致性,这意味这在实际中集群在特定的条件下可能会丢失写操作。
Redis集群之间是如何复制的?
异步复制
Redis集群最大节点个数是多少?
16384
Redis集群如何选择数据库?
Redis集群目前无法做数据库选择,默认在0数据库。
分区
Redis是单线程的,如何提高多核CPU的利用率?
可以在同一个服务器部署多个Redis的实例,并把他们当作不同的服务器来使用,在某些时候,无论如何一个服务器是不够的,
所以,如果你想使用多个CPU,你可以考虑一下分片(shard)
所以,如果你想使用多个CPU,你可以考虑一下分片(shard)
为什么要做Redis分区?
分区可以让Redis管理更大的内存,Redis将可以使用所有机器的内存。如果没有分区,你最多只能使用一台机器的内存。
分区使Redis的计算能力通过简单地增加计算机得到成倍提升,Redis的网络带宽也会随着计算机和网卡的增加而成倍增长。
分区使Redis的计算能力通过简单地增加计算机得到成倍提升,Redis的网络带宽也会随着计算机和网卡的增加而成倍增长。
你知道有哪些Redis分区实现方案?
客户端分区
在客户端就已经决定数据会被存储到哪个redis节点或者从哪个redis节点读取
大多数客户端已经实现客户端分区
代理分区
客户端将请求发送给代理,然后代理决定去哪个节点写数据或读数据。代理根据分区规则决定请求哪些Redis实例,然后根据Redis的响应结果返回给客户端。
redis和memcached的一种代理实现就是Twemproxy
查询路由(Query routing)
客户端随机地请求任意一个redis实例,然后由Redis将请求转发给正确的Redis节点。
Redis Cluster实现了混合形式的查询路由,不是直接将请求从一个redis节点转发到另一个redis节点,是在客户端帮助下直接redirected到正确的redis节点
Redis分区有什么缺点?
涉及多个key的操作通常不会被支持
例如你不能对两个集合求交集,因为他们可能被存储到不同的Redis实例(实际上这种情况也有办法,但是不能直接使用交集指令)
同时操作多个key,则不能使用Redis事务
分区使用的粒度是key,不能使用一个非常长的排序key存储一个数据集
(The partitioning granularity is the key, so it is not possible to shard a dataset with a single huge key like a very big sorted set)
(The partitioning granularity is the key, so it is not possible to shard a dataset with a single huge key like a very big sorted set)
当使用分区的时候,数据处理会非常复杂
例如为了备份你必须从不同的Redis实例和主机同时收集RDB / AOF文件
分区时动态扩容或缩容可能非常复杂
Redis集群在运行时增加或者删除Redis节点,能做到最大程度对用户透明地数据再平衡,但其他一些客户端分区或者代理分区方法则不支持这种特性
有一种预分片的技术也可以较好的解决这个问题
分布式问题
Redis实现分布式锁
单线程模式,采用队列模式将并发访问变成串行访问,且多客户端对Redis的连接并不存在竞争关系,Redis中可以使用SETNX命令实现分布式锁
SETNX命令(SET if not exists)
当且仅当 key 不存在,将 key 的值设为 value。 若给定的 key 已经存在,则 SETNX 不做任何动作
设置成功,返回 1 。设置失败,返回 0
流程
使用SETNX命令获取锁,若返回0(key已存在,锁已存在)则获取失败,反之获取成功
为了防止获取锁后程序出现异常进入死锁状态,需要为该key设置一个“合理”的过期时间释放锁,使用DEL命令将锁数据删除;
对应的如果处理耗时操作,也会涉及续命操作(在过期时间到达之前,修改过期时间,使得继续使用锁)
对应的如果处理耗时操作,也会涉及续命操作(在过期时间到达之前,修改过期时间,使得继续使用锁)
存在的问题
有效期导致的安全问题
A拿到的锁已经失效,但是还在操作资源,此时B服务拿到锁。则存在并发数据安全问题(AB服务同时访问资源)
解决方案:续命
另外线程异步通知更改加锁时间
优雅实现阻塞加锁
解决方案:mq通知
主从模式下,在master中拿到锁,还未同步至slave,master宕机导致的并发问题
如何解决 Redis 的并发竞争 Key 问题?
Redis 的并发竞争 Key 的问题是多个系统同时对一个 key 进行操作,但是最后执行的顺序和我们期望的顺序不同,这样也就导致了结果的不同
推荐一种方案:分布式锁(zookeeper 和 redis 都可以实现分布式锁)。(如果不存在 Redis 的并发竞争 Key 问题,不要使用分布式锁,这样会影响性能)
基于zookeeper临时有序节点可以实现的分布式锁。大致思想为
每个客户端对某个方法加锁时,在zookeeper上的与该方法对应的指定节点的目录下,生成一个唯一的瞬时有序节点
判断是否获取锁的方式很简单,只需要判断有序节点中序号最小的一个。 当释放锁的时候,只需将这个瞬时节点删除即可
同时,其可以避免服务宕机导致的锁无法释放,而产生的死锁问题。完成业务流程后,删除对应的子节点释放锁
在实践中,以可靠性为主,首推Zookeeper。
分布式Redis是前期做还是后期规模上来了再做好?为什么?
既然Redis是如此的轻量(单实例只使用1M内存),为防止以后的扩容,最好的办法就是一开始就启动较多实例。即便你只有一台服务器,你也可以一开始就让Redis以分布式的方式运行,使用分区,在同一台服务器上启动多个实例。
一开始就多设置几个Redis实例,例如32或者64个实例,对大多数用户来说这操作起来可能比较麻烦,但是从长久来看做这点牺牲是值得的。
这样的话,当你的数据不断增长,需要更多的Redis服务器时,你需要做的就是仅仅将Redis实例从一台服务迁移到另外一台服务器而已(而不用考虑重新分区的问题)。一旦你添加了另一台服务器,你需要将你一半的Redis实例从第一台机器迁移到第二台机器。
一开始就多设置几个Redis实例,例如32或者64个实例,对大多数用户来说这操作起来可能比较麻烦,但是从长久来看做这点牺牲是值得的。
这样的话,当你的数据不断增长,需要更多的Redis服务器时,你需要做的就是仅仅将Redis实例从一台服务迁移到另外一台服务器而已(而不用考虑重新分区的问题)。一旦你添加了另一台服务器,你需要将你一半的Redis实例从第一台机器迁移到第二台机器。
什么是 RedLock?
官方提出的redis分布式锁方案
集群环境下,依次从各个节点获取锁,半数以上节点获取成功才真正获取锁成功,否则释放已经获取的锁
特征
安全特性
互斥访问,即永远只有一个 client 能拿到锁
避免死锁
最终 client 都可能拿到锁,不会出现死锁的情况,即使原本锁住某资源的 client crash 了或者出现了网络分区
容错性
只要大部分 Redis 节点存活就可以正常提供服务
缓存
缓存异常
缓存穿透
大量请求的 key 不存在于缓存,请求直接到数据库,给持久层数据库造成压力
解决方法
接口增加参数校验,拦截无效请求
一些不合法的参数请求直接抛出异常信息返回给客户端
比如查询的数据库 id 不能小于 0
传入的邮箱格式不正确
缓存无效 key
如果缓存和数据库都查不到某个 key 的数据就写一个到 Redis 中去并设置过期时间
SET key value EX 60*5
可以解决请求的 key 变化不频繁的情况
如果黑客恶意攻击,每次构建不同的请求 key,会导致 Redis 中缓存大量无效的 key
未从根本上解决问题
非用此种方式解决缓存击穿问题
将无效的key的过期时间设置短一些
采用布隆过滤器
将所有可能存在的数据哈希到一个足够大的 bitmap 中,
一个一定不存在的数据会被这个 bitmap 拦截掉,从而避免了对底层存储系统的查询压力
一个一定不存在的数据会被这个 bitmap 拦截掉,从而避免了对底层存储系统的查询压力
布隆过滤
判断一个元素是否在集合中存在
存在一定的误判率;
过滤器越长误判率越小;
哈希函数越多,效率越差,误判率越小
过滤器越长误判率越小;
哈希函数越多,效率越差,误判率越小
参考
不了解布隆过滤器?一文给你整的明明白白
详细解析Redis中的布隆过滤器及其应用
详解布隆过滤器的原理、使用场景和注意事项
缓存击穿
缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,
当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞
当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞
这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,
并且回写缓存,导使数据库瞬间压力过大
并且回写缓存,导使数据库瞬间压力过大
缓存中没有,但数据库中有(一般为缓存时间到期)
解决方案
热点数据永不过期
加互斥锁
分布式锁
使用分布式锁,保证对于每个key同时只有一个线程去查询后端服务,其他线程没有获得分布
式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大
式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大
缓存雪崩
指在某一个时间段,缓存集中过期失效
马上就要到双十一零点,很快就会迎来一波抢购,这波商品时间比较集中的放入了缓存,假设缓存一个小时。
那么到了凌晨一点钟的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰。
于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。
那么到了凌晨一点钟的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰。
于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。
集中过期,倒不是非常致命,比较致命的缓存雪崩,是缓存服务器某个节点宕机或断网
解决方案
redis高可用
redis有可能挂掉,多增设几台redis,一台挂掉之后其他的还可以继续工作,搭建集群(异地多活)
限流降级
在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。
比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。
比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。
缓存降级
服务出现异常或非核心业务影响核心业务,仍然保证核心系统能使用,可以根据关键数据判断实现缓存降级或者手动降级
目的
保障核心业务可用
为了防止Redis服务故障,导致数据库跟着一起发生雪崩问题。因此,对于不重要的缓存数据,可以采取服务降级策略
数据预热
在正式部署之前,先把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。
在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。
在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。
缓存预热
方案
管理界面手动管理
系统启动时直接加载(数据量不大的情况)
定时任务刷新
给每个缓存增加是否失效标记,失效后马上刷新缓存
常用工具
redisson(官方推荐)
一个高级的分布式协调Redis客服端,能帮助用户在分布式环境中轻松实现一些Java的对象
Bloom filter, BitSet, Set, SetMultimap, ScoredSortedSet, SortedSet, Map, ConcurrentMap, List, ListMultimap, Queue, BlockingQueue, Deque,
BlockingDeque, Semaphore, Lock, ReadWriteLock, AtomicLong, CountDownLatch, Publish / Subscribe, HyperLogLog
BlockingDeque, Semaphore, Lock, ReadWriteLock, AtomicLong, CountDownLatch, Publish / Subscribe, HyperLogLog
功能简单,不支持字符串操作,不支持排序,事务,管道,分区等特性
促进使用者对Redis的关注分离,从而让使用者能够将精力更集中地放在处理业务逻辑上
jedis
redis的java客户端,提供比较全的redis命令操作
采用的直连,多个线程操作的话,是不安全的,如果想要避免不安全的,使用 jedis pool 连接池! 更像 BIO 模式
lettuce
在 SpringBoot2.x 之后,原来使用的jedis 被替换为了 lettuce
采用netty,实例可以再多个线程中进行共享,不存在线程不安全的情况!可以减少线程数据了,更像 NIO 模式
其他
redis为单线程应用,可以在一个节点部署多个redis提高CPU利用率
分区
如何保证缓存与数据库双写时的数据一致性?
你只要用缓存,就可能会涉及到缓存与数据库双存储双写,你只要是双写,就一定会有数据一致性的问题,那么你如何解决一致性问题?
如果你的系统不是严格要求缓存+数据库必须一致性的话,缓存可以稍微的跟数据库偶尔有不一致的情况,最好不要做这个方案
读请求和写请求串行化,串到一个内存队列里去,这样就可以保证一定不会出现不一致的情况
串行化之后,就会导致系统的吞吐量会大幅度的降低,用比正常情况下多几倍的机器去支撑线上的一个请求
还有一种方式就是可能会暂时产生不一致的情况,但是发生的几率特别小,就是先更新数据库,然后再删除缓存
Redis常见性能问题和解决方案?
1. Master最好不要做任何持久化工作,包括内存快照和AOF日志文件,特别是不要启用内存快照做持久化。
2. 如果数据比较关键,某个Slave开启AOF备份数据,策略为每秒同步一次(可配置为每执行一个命令就持久化一次)。
3. 为了主从复制的速度和连接的稳定性,Slave和Master最好在同一个局域网内。
4. 尽量避免在压力较大的主库上增加从库
5. Master调用BGREWRITEAOF重写AOF文件,AOF在重写的时候会占大量的CPU和内存资源,导致服务load过高,出现短暂服务暂停现象。
6. 为了Master的稳定性,主从复制不要用图状结构,用单向链表结构更稳定,即主从关系为:Master<–Slave1<–Slave2<–Slave3…,这样的结构也方便解决单点故障问题,实现Slave对Master的替换,也即,如果Master挂了,可以立马启用Slave1做Master,其他不变
一个字符串类型的值能存储最大容量是多少?
512M
Redis如何做大量数据插入?
Redis2.6开始redis-cli支持一种新的被称之为pipe mode的新模式用于执行大量数据插入工作。
背景
原有模式客户端发送的操作命令为“一问一答”中间存在多次网络往返(网络开销大,导致吞吐量低)
工作模式
一次性发送多条命名,并在执行完后一次性打包返回
通过减少客户端与 redis 的通信次数来实现降低往返延时时间;
Pipeline 实现的原理是队列,而队列的原理是先进先出,这样就保证数据的顺序性。
Pipeline 的默认的同步的个数为53个,也就是说 arges 中累加到53条数据时会把数据提交
Pipeline 实现的原理是队列,而队列的原理是先进先出,这样就保证数据的顺序性。
Pipeline 的默认的同步的个数为53个,也就是说 arges 中累加到53条数据时会把数据提交
redis需要在所有命名执行完之前缓存所有命名的执行结果
具体能够容忍的操作个数和socket-output 缓冲区大小/返回结果的数据尺寸都有很大的关系;
同时也意味着每个 redis-server 同时所能支撑的 pipeline 链接的个数,也是有限的,这将受限于 server 的物理内存或网络接口的缓冲能力。
同时也意味着每个 redis-server 同时所能支撑的 pipeline 链接的个数,也是有限的,这将受限于 server 的物理内存或网络接口的缓冲能力。
假如Redis里面有1亿个key,其中有10w个key是以某个固定的已知的前缀开头的,如果将它们全部找出来?
使用keys指令可以扫出指定模式的key列表。
追问:如果这个redis正在给线上的业务提供服务,那使用keys指令会有什么问题?
redis关键的一个特性:redis的单线程的。keys指令会导致线程阻塞一段时间,线上服务会停顿,直到指令执行完毕,服务才能恢复。
可以使用scan指令,scan指令可以无阻塞的提取出指定模式的key列表
但是会有一定的重复概率,在客户端做一次去重,但整体所花费的时间会比直接用keys指令长。
使用Redis做过异步队列吗,是如何实现的
使用list类型保存数据信息,rpush生产消息,lpop消费消息,当lpop没有消息时,可以sleep一段时间,然后再检查有没有信息
如果不想sleep的话,可以使用blpop, 在没有信息的时候,会一直阻塞,直到信息的到来。
如果不想sleep的话,可以使用blpop, 在没有信息的时候,会一直阻塞,直到信息的到来。
redis可以通过pub/sub主题订阅模式实现一个生产者,多个消费者,当然也存在一定的缺点,当消费者下线时,生产的消息会丢失。
Redis如何实现延时队列?
使用sortedset,使用时间戳做score, 消息内容作为key,调用zadd来生产消息,消费者使用zrangbyscore获取n秒之前的数据做轮询处理。
Redis回收进程如何工作的?
一个客户端运行了新的命令,添加了新的数据。
Redis检查内存使用情况,如果大于maxmemory的限制, 则根据设定好的策略进行回收
一个新的命令被执行,等等
所以我们不断地穿越内存限制的边界,通过不断达到边界然后不断地回收回到边界以下
如果一个命令的结果导致大量内存被使用(例如很大的集合的交集保存到一个新的键),不用多久内存限制就会被这个内存使用量超越。
Redis回收使用的是什么算法?
LRU算法
0 条评论
下一页