Making Dynamic Page Coalescing Effective on Virtualized Clouds——论文泛读

🕗 发布于 2024-03-01 16:19 论文阅读虚拟化云

EuroSys 2023 Paper 论文阅读笔记整理

问题

在现代计算机系统中，转换后备缓冲器（TLB）容量不能与存储器容量相同的速率进行扩展[1，2]。地址转换开销已成为许多大内存工作负载的主要性能瓶颈[3-19]。在虚拟化云中，用硬件支持的嵌套分页支持内存虚拟化（例如，Intel的扩展页表[20]和AMD的嵌套页表[21]）。对于嵌套分页，为了解决TLB未命中问题，处理器需要遍历两层页表（即二维页面遍历），其成本可能是本地系统上TLB未中时遍历一层页表的6倍[12，20]。

大页是减少大内存工作负载的地址转换开销的主流方法，TLB条目可以缓存大页的页表条目（PTE），用于增加翻译地址数据量（例如，大页PTE的2MB与基本页面PTE的4KB）。显著增加了TLB覆盖范围，从而减少了TLB未命中，还可以减少页面遍历的步骤和页面遍历引起的内存读取。

为了创建大页，系统软件通常使用页面合并方法来动态组合连续的基本页，但它们在虚拟化平台上的有效性却受到了严重损害，因为需要二维页表遍历。本文发现，只有由主机大页支持的访客大页，才能有效地减少地址转换开销。现有的页面合并方法仅增加每层的大页，而没有考虑对大页对齐的跨层要求。当访客大页得到主机大页的支持时，称为对齐大页，可以充分发挥大页性能。当访客大页和主机大页未对齐时，称为错位大页，此问题可使性能降低67%。

本文方法

本文提出Gemini，设计为一个跨层解决方案，用于指导访客和主机中大页的形成和分配。一层的内存管理会感知到另一层的大页，并仔细管理与这些大页对应的内存区域。指导页面合并和大页分配时，首先考虑这些区域，然后再考虑其他内存区域。由于大页优先从这些区域形成和分配，而较少从其他区域分配，因此可以增加由主机大页支持的访客大页，而不会加剧大页带来的不利影响。

基于Linux/KVM和各种现实应用程序（如键值存储、web服务器和AI工作负载）中的原型实现的广泛评估表明，与最先进的页面合并方法相比，Gemini可以将TLB未命中率降低83%，并将应用程序性能提高126%。

实验

实验环境：DELLTM PowerEdgeTM T630，具有两个2.1GHz Intel Xeon E5-2620处理器，128GB DRAM，一个1.6TB SSD，一个Intel I350千兆网卡。每个处理器有8个物理核心，每个核心具有用于4KiB/2MiB页面的1536个L2 TLB条目，用于1GiB页面的4个数据TLB条目，用于4KiB页面64个数据TLB条目，用于2MiB/4MiB页面8个指令TLB条目，用于4KiBs页面64个指令TLB条目。

数据集：web服务器、数据库服务器、键值存储、人工智能工作负载、科学应用程序

实验对比：吞吐量、延迟、尾延迟、页面对齐数量、TLB缺失率

总结

针对虚拟化云场景，在主机端和访客端有不同的TLB，当二者的页面无法对其时会显著降低TLB性能。本文提出Gemini，用于指导访客和主机中大页的形成和分配。一层的内存管理会感知到另一层的大页，并仔细管理与这些大页对应的内存区域。指导页面合并和大页分配时，首先考虑对应区域，然后再考虑其他内存区域。由于大页优先从这些区域形成和分配，因此可以增加由主机大页支持的访客大页，而不会加剧大页带来的不利影响。

原文地址：https://blog.csdn.net/qq_36159989/article/details/136395696

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：实现更高能效的车规级肖特基功率整流器二极管NRVB140ESFT1G
下一篇：移动端app如何设计测试用例？

图书管理新纪元：Spring Boot进销存系统
1系统概述1.1 研究背景随着计算机技术的发展以及计算机网络的逐渐普及，互联网成为人们查找信息的重要场所，二十一世纪是信息的时代，所以信息的管理显得特别重要。因此，使用计算机来管理图书进销存管理系统的
阅读更多2024-10-18
GPU编程（1）GPU架构
风扇在下面，采用热管方式，用气体液体的转化来带走热量。包裹热管的是铜制散热板，外围是铝制格扇，更快排除热量。注意，不是每一个cuda核心可以支持整数计算。视频接口个pcie都是直接连接GPU。所有的供
阅读更多2024-10-18
单链表算法题(二）（超详细版）
前言 : 通过算法题，学习解决问题的思路，再面对类似的算法题时，能快速定位解决方案
阅读更多2024-10-18
开机启动项怎么设置？简单四个方法，轻松设置开机启动（新手教学）
您是否曾在启动计算机或笔记本电脑时，遇到一堆应用程序同时弹出，导致系统启动缓慢？如果您此刻有着同样的经历，您可能正面临所谓的软件开机自启动的情况。这些应用会在每次开机时自动运行，虽然有些程序是默认设置
阅读更多2024-10-18
今日股市集体狂飙，下周一呢？
受利好消息刺激，今日上午还在起伏不定的沪深股市，但到了下午开盘后不久，沪深两市股指大幅拉升，沪指一度收复3300点，创业板指盘中涨超10%，尾盘涨幅略有收窄。全A成交额重返2万亿上方，场内超5000股
阅读更多2024-10-18
Knee Injury Detection using MRI with Efficiently-Layered Network (ELNet)
磁共振成像（MRI）是一种广泛接受的膝部损伤分析成像技术。其捕捉膝部三维结构的优势使其成为放射科医生定位膝部潜在撕裂的理想工具。为了更好地应对日益增长的肌肉骨骼（MSK）放射科医生的工作量，患者分流的
阅读更多2024-10-18
数论的第二舞——卡特兰数
当然了，虽然主角是卡特兰数，但是我们该学的数论还是不能落下的，首先先来介绍一个开胃小菜。
阅读更多2024-10-18
基于SSM+微信小程序的电子点餐管理系统（点餐1）
基于SSM+微信小程序的电子点餐管理系统实现了管理员及用户。管理员实现了首页、个人中心、餐品分类管理、特色餐品管理、订单信息管理、用户管理、特价餐品管理、活动订单管理、系统管理。用户实现了首页、特色餐
阅读更多2024-10-18
【AI整合包及教程】EchoMimic：开创数字人新时代，让静态图像“活”起来！
这一技术的核心在于它能够同时使用音频和面部关键点进行训练，通过新颖的训练策略，不仅能够通过音频和面部关键点单独生成肖像视频，而且还能够通过音频和选定的面部关键点的组合生成肖像视频。EchoMimic的
阅读更多2024-10-18
【Flutter】基础入门：代码基本结构
通过这个简单的 Flutter 示例程序，我们可以快速了解 Flutter 的代码结构，理解每个部分的作用。
阅读更多2024-10-18

Making Dynamic Page Coalescing Effective on Virtualized Clouds——论文泛读

问题

本文方法

实验

总结

相关文章