Level DB --- Cache

🕗 发布于 2024-12-12 02:25 数据库

class Cache是Level DB中的重要的数据结构，它是一个LRU（Least Recently Used） Cache的实现。这里面的判断条件主要是内存大小（而不是存储entry的个数）。当内存达到上界，会释放不被使用的entry（存储到lru_中的entry）。

HandleTable

说到class Cache先说class Handle Table，它是Level DB作者实现的一个hash map，对于相同哈希值碰撞，Handle Table使用了链地址法---即相同的hash值组成了一个链表，它要比C++ STL中的hash map快5%，同时，Handle Table不是一个通用的hash map，它是定制化LRUHandle（Cache中使用的结构体）使用的hash map，这也是它效率高的一个原因。

图1. Handle Table

核心函数

LRUHandle** FindPointer(const Slice& key, uint32_t hash) {
    //hash & (length_ - 1)，计算slot，ptr是hash值相同链表的head pointer
    LRUHandle** ptr = &list_[hash & (length_ - 1)];
    //遍历链表，寻找查询的key-value
    while (*ptr != nullptr && ((*ptr)->hash != hash || key != (*ptr)->key())) {
      ptr = &(*ptr)->next_hash;
    }
    return ptr;
}

//检索 key & hash 的 pointer
LRUHandle* Lookup(const Slice& key, uint32_t hash)

//插入新的entry
LRUHandle* Insert(LRUHandle* h)

//删除key & value 的 pointer
LRUHandle* Remove(const Slice& key, uint32_t hash) 

//当插入的key的数量达到一定的值，为了保证效率，会重新扩大slots（list_）的数量，
//slots数量增加，重新hash，每个slot的链表也会变小，加快链表遍历检索的效率
//这里为了进一步加快效率，我们也可以定义自己的Resize触发条件
void Resize()

Cache

Handle

Handle是Cache计算的entry句柄，它既存在于hash table中，也存在于双向链表（Least Recently Used由双向链表实现）中，它的嵌入方式如图2所示。

图2. LRU Handle

Handle在hash table中的组织形式如图1所示，在双向链表中的组织形式如图3所示。

图3. 双向链表

添加与删除

对于从双向链表中做删除操作很简单，只需要将重置handle的pre和next指针，如图4所示。

图4. 双向链表删除handle

void LRUCache::LRU_Remove(LRUHandle* e) {
  e->next->prev = e->prev;
  e->prev->next = e->next;
}

对于从双向链表中插入，需要插入到双向链表的head，如图5所示

图5. 双向链表插入handle

void LRUCache::LRU_Append(LRUHandle* list, LRUHandle* e) {
  // Make "e" newest entry by inserting just before *list
  e->next = list;
  e->prev = list->prev;
  e->prev->next = e;
  e->next->prev = e;
}

当内存达到上限的时候，将会循环从lru_中list next开始删除，如图6所示

图6. 当内存导到上限，逐个删除lru_中的least recently used handle

while (usage_ > capacity_ && lru_.next != &lru_) {
    LRUHandle* old = lru_.next;
    assert(old->refs == 1);
    bool erased = FinishErase(table_.Remove(old->key(), old->hash));
    if (!erased) {  // to avoid unused variable when compiled NDEBUG
      assert(erased);
    }
}

lru_ 和 in_use_

在设计上，Cache 用了2个双向链表lru_和in_use_，这么设计主要是从计算效率上考虑。当一个新的handle会存储到in_use_中，当这个handle被删除，它会转移到lru_中。而当这个handle需要再次被只用，就可以从lru_重新插入到in_use_，而不需要重新申请资源。

当需要释放资源的时候，直接从lru_中删除。

GUARDED_BY

#define GUARDED_BY(x) THREAD_ANNOTATION_ATTRIBUTE__(guarded_by(x))
#define THREAD_ANNOTATION_ATTRIBUTE_(x) __attribute__((x))

所以

#define GUARDED_BY(x) __attribute__((x))(guarded_by(x))

编译器会确保在访问特定变量之前必须先锁定相应的互斥量（mutex），从而防止多个线程同时访问该变量，导致数据竞争和不一致的问题‌。等于在编译的时候就做了临界区域的保护提醒。

代码中的EXCLUSIVE_LOCKS_REQUIRED也同理。

ShardedLRUCache

ShardedLRUCache，是用来进一步提升Cache的性能，因为Cache里面有临界区域影响了并发写，ShardedLRUCache等于是又做了一次分桶，用来提升并发写。

原文地址：https://blog.csdn.net/zhangsj1007/article/details/144317723

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：# issue 11 线程
下一篇：【C++】深入解析归并排序

.NET(C#) 如何配置用户首选项及保存用户设置
.NET(C#) 如何配置用户首选项及保存用户设置
阅读更多2024-12-14
【最新】北大数字普惠金融指数数据集-省市县（2011-2023年）
郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征[J].经济学(季刊),2020,19(04):1401-1418.时间跨度：省级和城市级指数时间跨度为2011-2
阅读更多2024-12-14
GESP202412 四级【Recamán】题解（AC）
a11ak−1−kkakak−1−kak−1k小杨想知道 Recamán 数列的前n项从小到大排序后的结果。手动计算非常困难，小杨希望你能帮他解决这个问题。
阅读更多2024-12-14
IDEA遇到EasyConnect中的网络资源无法访问的问题
版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.csdn.net/wanshanyu_/article/de
阅读更多2024-12-14
双目摄像头标定方法
此时已经完成标定，左下角为反投影误差，右边为外参可视化。将双目左右目拍的图像上传（左右目最好不少于20张）此时回到主页面，即可看到成功导出。把这些误差大的删除即可。
阅读更多2024-12-14
Servlet、omcat服务器架构与工作原理
Servlet是运行在服务器端的Java程序，它的主要职责之一是接收并处理来自客户端（如浏览器）的HTTP请求。当客户端发送一个请求到服务器时，Servlet可以解析请求中的信息，例如请求的URL路径
阅读更多2024-12-14
Vue生命周期钩子函数：深入解析与实践
作为高级Vue前端开发人员，对Vue组件的生命周期钩子函数有着深刻的理解是至关重要的。生命周期钩子函数是指在Vue组件的创建、更新、销毁等过程中，Vue自动调用的一系列方法。通过这些钩子函数，我们可以
阅读更多2024-12-14
安卓开发--使用android studio发布APP
app发布
阅读更多2024-12-14
数据结构与算法学习笔记----拓扑排序
@ author: 明月清了个风。
阅读更多2024-12-14
python 将数据保存到现有的Excel文件的新工作表
out_file = ‘query.xlsx’df1 = pd.DataFrame(out_data)若直接写入：df1.to_excel(out_file, index=False, sheet_n
阅读更多2024-12-14