一、SDS
1,SDS源码解读
sds (Simple Dynamic String),Simple
的意思是简单,Dynamic
即动态,意味着其具有动态增加空间的能力,扩容不需要使用者关心。String
是字符串的意思。说白了就是用C语言自己封装了一个字符串类型,这个项目由Redis作者antirez
创建,作为Redis中基本的数据结构之一,现在也被独立出来成为了一个单独的项目,项目地址位于这里。
sds 有两个版本,在Redis 3.2
之前使用的是第一个版本,其数据结构如下所示:
typedef char *sds; //注意,sds其实不是一个结构体类型,而是被typedef的char* struct sdshdr { unsigned int len; //buf中已经使用的长度 unsigned int free; //buf中未使用的长度 char buf[]; //柔性数组buf };
但是在Redis 3.2 版本
中,对数据结构做出了修改,针对不同的长度范围定义了不同的结构,如下,这是目前的结构:
typedef char *sds; struct __attribute__ ((__packed__)) sdshdr5 { // 对应的字符串长度小于 1<<5 unsigned char flags; char buf[]; }; struct __attribute__ ((__packed__)) sdshdr8 { // 对应的字符串长度小于 1<<8 uint8_t len; /* used */ // 目前字符创的长度,使用1个byte uint8_t alloc; // 已经分配的总长度,使用1个byte unsigned char flags; // flag用3bit来标明类型,类型后续解释,其余5bit目前没有使用。使用1byte。 char buf[]; // 柔性数组,以' '结尾 }; struct __attribute__ ((__packed__)) sdshdr16 { // 对应的字符串长度小于 1<<16 uint16_t len; /* used,使用2byte */ uint16_t alloc; /* excluding the header and null terminator,使用2byte */ unsigned char flags; /* 3 lsb of type, 5 unused bits */ char buf[]; }; struct __attribute__ ((__packed__)) sdshdr32 { // 对应的字符串长度小于 1<<32 uint32_t len; /* used,使用4byte */ uint32_t alloc; /* excluding the header and null terminator,使用4byte */ unsigned char flags; /* 3 lsb of type, 5 unused bits */ char buf[]; }; struct __attribute__ ((__packed__)) sdshdr64 { // 对应的字符串长度小于 1<<64 uint64_t len; /* used */ uint64_t alloc; /* excluding the header and null terminator */ unsigned char flags; /* 3 lsb of type, 5 unused bits */ char buf[]; };
2,SDS的特点
- 二进制安全的数据结构,不会产生数据的丢失
- 内存预分配机制,避免了频繁的内存分配。当字符串长度小于 1M 时,扩容都是加倍现有的空间,如果超过 1M,扩容时一次只会多扩 1M 的空间。(字符串最大长度为 512M)
- 兼容c语言函数库
二、Redis中几种数据结构
redisDb 默认情况下有16个,每个 redisDb 内部包含一个 dict 的数据结构,dict 内部包含 dictht 数组,数组个数为2,主要用于 hash 扩容使用。dictht 内部包含 dictEntry 的数组,dictEntry 其实就是 hash 表的一个 key-value 节点,如果冲突通过 链地址法 解决
1,redisServer
数据结构 redisServer
是一个 redis 服务端的抽象,定义在server.h
中。 redisServer
中的属性非常多,以下为节选的一部分,简单介绍下
struct redisServer { /* General */ pid_t pid; /* Main process pid. */ ...... int hz; /* serverCron() calls frequency in hertz */ redisDb *db; dict *commands; /* Command table */ dict *orig_commands; /* Command table before command renaming. */ aeEventLoop *el; ...... char runid[CONFIG_RUN_ID_SIZE+1]; /* ID always different at every exec. */ ...... list *clients; /* List of active clients */ list *clients_to_close; /* Clients to close asynchronously */ list *clients_pending_write; /* There is to write or install handler. */ list *clients_pending_read; /* Client has pending read socket buffers. */ list *slaves, *monitors; /* List of slaves and MONITORs */ client *current_client; /* Current client executing the command. */ ...... };
hz
: redis 定时任务触发的频率*db
: redisDb 数组,默认 16 个 redisDb*commands
: redis 支持的命令的字典*el
: redis 事件循环实例runid[CONFIG_RUN_ID_SIZE+1]
: 当前 redis 实例的 runid
2,redisDb
redisDb
是 redis 数据库的抽象,定义在 server.h
中,比较关键的属性如下
typedef struct redisDb { dict *dict; /* 键值对字典,保存数据库中所有的键值对 */ dict *expires; /* 过期字典,保存着设置过期的键和键的过期时间*/ dict *blocking_keys; /*保存着 所有造成客户端阻塞的键和被阻塞的客户端 (BLPOP) */ dict *ready_keys; /* 保存着 处于阻塞状态的键,value为NULL*/ dict *watched_keys; /* 事物模块,用于保存被WATCH命令所监控的键 */ // 当内存不足时,Redis会根据LRU算法回收一部分键所占的空间,而该eviction_pool是一个长为16数组,保存可能被回收的键 // eviction_pool中所有键按照idle空转时间,从小到大排序,每次回收空转时间最长的键 struct evictionPoolEntry *eviction_pool; /* Eviction pool of keys */ int id; /* 数据库ID */ long long avg_ttl; /* 键的平均过期时间 */ } redisDb;
3,dict
dict
是 redis 中的字典,定义在 dict.h
文件中,其主要的属性如下
typedef struct dict { dictType *type; void *privdata; dictht ht[2]; //方便渐进的rehash扩容,dict的hashtable long rehashidx; /* rehashing not in progress if rehashidx == -1 */ unsigned long iterators; /* number of iterators currently running */ } dict;
ht[2]
: 哈希表数组,为了扩容方便有 2 个元素,其中一个哈希表正常存储数据,另一个哈希表为空,空哈希表在 rehash 时使用rehashidx
:rehash 索引,当不在进行 rehash 时,值为 -1
4,dictht
dictht
是哈希表结构,定义在 dict.h
文件中,其重要的属性如下
typedef struct dictht { dictEntry **table; unsigned long size; unsigned long sizemask; unsigned long used; } dictht;
**table
: key-value 键值对节点数组,类似 Java 中的 HashMap 底层数组size
: 哈希表容量大小sizemask
: 总是等于 size – 1,用于计算索引值used
: 哈希表实际存储的 dictEntry 数量
5,dictEntry
dictEntry
是 redis 中的 key-value 键值对节点,是实际存储数据的节点,定义在 dict.h
文件中,其重要的属性如下
typedef struct dictEntry { void *key; union { void *val; uint64_t u64; int64_t s64; double d; } v; struct dictEntry *next; } dictEntry;
*key
: 键对象,总是一个字符串类型的对象 SDS*val
: 值对象,可能是任意类型的对象。对应常见的5种数据类型:string,hash,list,set,zset*next
: 尾指针,指向下一个节点
三、数据类型
1,Redis数据对象结构
Redis 数据库中所有数据都以 key-value 节点 dictEntry 存储,其中 key 和 value 都是一个 redisObject
结构体对象,只不过 key 总是一个字符串类型的对象(SDS),value 则可能是任意一种数据类型的对象。 redisObject
结构体定义在 server.h
中如下所示
typedef struct redisObject { unsigned type:4; //占用4bit unsigned encoding:4; //占用4bit unsigned lru:LRU_BITS; /*占用24bit LRU time (relative to global lru_clock) or * LFU data (least significant 8 bits frequency * and most significant 16 bits access time). */ int refcount; //占用4byte void *ptr; //占用8byte 总空间:4bit+4bit+24bit+4byte+8byte = 16byte } robj;
可以看到该结构体中重要的属性如下,不同的对象具有不同的类型 type,同一个类型的 type 会有不同的存储形式 encoding
type
: 该属性标明了数据对象的类型,比如 String,List 等encoding
: 这个属性指明了对象底层的存储结构,比如 ZSet 类型对象可能的存储结构有 ZIPLIST 和 SKIPLIST*ptr
: 指向底层存储结构的指针
2,Redis数据类型及存储结构
Redis 中数据类型及其存储结构定义在 server.h
文件中
/* The actual Redis Object */ #define OBJ_STRING 0 /* String object. */ #define OBJ_LIST 1 /* List object. */ #define OBJ_SET 2 /* Set object. */ #define OBJ_ZSET 3 /* Sorted set object. */ #define OBJ_HASH 4 /* Hash object. */ #define OBJ_MODULE 5 /* Module object. */ #define OBJ_STREAM 6 /* Stream object. */ #define OBJ_ENCODING_RAW 0 /* Raw representation */ #define OBJ_ENCODING_INT 1 /* Encoded as integer */ #define OBJ_ENCODING_HT 2 /* Encoded as hash table */ #define OBJ_ENCODING_ZIPMAP 3 /* Encoded as zipmap */ #define OBJ_ENCODING_LINKEDLIST 4 /* No longer used: old list encoding. */ #define OBJ_ENCODING_ZIPLIST 5 /* Encoded as ziplist */ #define OBJ_ENCODING_INTSET 6 /* Encoded as intset */ #define OBJ_ENCODING_SKIPLIST 7 /* Encoded as skiplist */ #define OBJ_ENCODING_EMBSTR 8 /* Embedded sds string encoding */ #define OBJ_ENCODING_QUICKLIST 9 /* Encoded as linked list of ziplists */ #define OBJ_ENCODING_STREAM 10 /* Encoded as a radix tree of listpacks */
四、Redis中常用数据类型和结构
1,字符串对象String
OBJ_STRING
字符串对象底层数据结构一般为简单动态字符串(SDS),但其存储方式可以是 OBJ_ENCODING_INT
、OBJ_ENCODING_EMBSTR
和 OBJ_ENCODING_RAW
,不同的存储方式代表着对象内存结构的不同。
a)OBJ_ENCODING_INT
如果保存的字符串长度小于 20 并且可以解析为整数(值范围为:-2^63 ~ 2^63-1),那么这个整数就会直接保存在 redisObject
的 ptr
属性里
b)OBJ_ENCODING_EMBSTR
长度小于 44 (OBJ_ENCODING_EMBSTR_SIZE_LIMIT)的字符串将以简单动态字符串(SDS) 的形式存储,但是会使用 malloc 方法一次分配内存,将 redisObject 对象头和 SDS 对象连续存在一起。因为默认分配空间为64byte,而其中value为string类型采用sdshdr8中len、alloc、flags各占用1byte,buf以’