mmap映射文件使用示例

🕗 发布于 2024-02-18 16:36 计算机软件工程软件开发 c++

mmap 零拷贝技术可以应用于很多场景，其中一个典型的应用场景是网络文件传输。

假设我们需要将一个大文件传输到远程服务器上。在传统的方式下，我们可能需要将文件内容读入内存，然后再将数据从内存复制到网络协议栈中，最终发送到远程服务器。这个过程中，涉及到了多次数据拷贝操作，增加了 CPU 的开销，降低了传输效率。

而使用 mmap 零拷贝技术，则可以将文件映射到内存中，然后直接将内存中的数据传输到网络协议栈中，避免了数据在内核和应用程序之间的复制，从而提高了传输效率。

具体实现步骤如下：

使用 open 系统调用打开文件，并获取文件描述符。
使用 fstat 系统调用获取文件的大小。
使用 mmap 系统调用将文件映射到内存中，并获取映射的地址和长度。
将内存中的数据传输到网络协议栈中，可以使用 sendto 系统调用将数据直接传输到网络中。
使用 munmap 系统调用解除内存映射。

通过使用 mmap 零拷贝技术，我们可以将文件内容直接传输到网络中，避免了数据在内核和应用程序之间的复制，提高了传输效率。这种技术在文件传输、多媒体流传输等场景下都可以发挥重要作用。

在这里插入图片描述

参数说明

参数fd为即将映射到内存空间的文件描述符，一般由open返回。同时fd也可以指定为-1，此时须指定flags参数中的MAP_ANON，表名进行的是匿名映射。
len是映射到调用进程地址空间的字节数，它从被映射文件开头offset个字节开始算起。
prot参数指定共享内存的访问权限，可指定为
PROT_NONE：映射区不可访问
或者以下几个值的或：
PROT_READ：可读
PROT_WRITE：可写
PROT_EXEC：可执行
flags参数影响映射存储区的多种属性：
MAP_FIXED: 返回值必须等于addr。因为这不利于可移植性，所以不建议使用此标志。如果未指定此标志，而且addr非0，则内核只把addr视为在何处设置映射区的一种建议，但是不保证会使用所要求的地址。将addr指定为0可获得最大可移植性。
MAP_SHARED: 这一标志说明了本进程对映射区所进行的存储操作的配置。此标志指定存储操作修改映射文件，也就是说，存储操作相当于对该文件的write。
MAP_PRIVATE: 本标志说明，对映射区的存储操作导致创建该映射文件的一个私有副本。所有后来对该映射区的引用都是引用该副本，而不是原始文件。（此标志的一种用途是用于调试程序，它将一程序文件的正文部分映射至一存储区，但允许用户修改其中的指令。任何修改只影响程序文件的副本，而不影响原文件）。
offset参数一般设置为0，表示从文件头开始映射，必须是page size的倍数。
参数addr指定文件应被映射到进程空间的起始地址，一般被指定为一个空指针，此时选择起始地址的任务留给内核来完成。返回值为最后文件映射到进程空间的起始地址，进程可以直接操作该地址。

以下是一个简单的 C 语言示例，演示了如何使用 mmap 和 sendto 进行文件传输，实现零拷贝：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <sys/mman.h>
#include <arpa/inet.h>

#define SERVER_IP "192.168.1.100"
#define SERVER_PORT 8888

int main() {
    int fd;
    struct stat sb;
    char *addr;

    // 打开文件
    fd = open("example.txt", O_RDONLY);
    if (fd == -1) {
        perror("open");
        exit(EXIT_FAILURE);
    }

    // 获取文件信息
    if (fstat(fd, &sb) == -1) {
        perror("fstat");
        exit(EXIT_FAILURE);
    }

    // 将文件映射到内存
    addr = mmap(NULL, sb.st_size, PROT_READ, MAP_PRIVATE, fd, 0);
    if (addr == MAP_FAILED) {
        perror("mmap");
        exit(EXIT_FAILURE);
    }

    // 创建 socket
    int sockfd = socket(AF_INET, SOCK_DGRAM, 0);
    if (sockfd < 0) {
        perror("socket");
        exit(EXIT_FAILURE);
    }

    // 设置服务器地址
    struct sockaddr_in server_addr;
    memset(&server_addr, 0, sizeof(server_addr));
    server_addr.sin_family = AF_INET;
    server_addr.sin_port = htons(SERVER_PORT);
    inet_pton(AF_INET, SERVER_IP, &server_addr.sin_addr);

    // 直接发送数据到网络
    sendto(sockfd, addr, sb.st_size, 0, (struct sockaddr *)&server_addr, sizeof(server_addr));

    // 解除内存映射
    if (munmap(addr, sb.st_size) == -1) {
        perror("munmap");
        exit(EXIT_FAILURE);
    }

    // 关闭文件和套接字
    close(fd);
    close(sockfd);

    return 0;
}

这个示例演示了如何打开文件，将文件映射到内存，然后直接通过 sendto 函数将数据发送到指定的网络地址。在这个过程中，避免了数据在内核和应用程序之间的复制操作，实现了零拷贝的效果。

mmap (Memory Mapped Files) 技术可以应用于多个场景：

文件传输：可以将文件映射到内存中，然后直接将内存中的数据传输到网络协议栈中，避免了数据在内核和应用程序之间的复制，提高了传输效率。
数据库管理：可以将数据库中的数据映射到内存中，从而加快数据的读取速度，并且避免了频繁的 I/O 操作。
大数据处理：可以将大量的数据映射到内存中，以便进行快速的数据处理和计算。
内存数据库：可以将内存中的数据映射到文件中，从而实现快速的数据持久化和恢复。

总之，mmap 技术可以应用于需要快速读取和处理大量数据的场景，能够提高系统的性能和响应速度。

原文地址：https://blog.csdn.net/HandsomeHong/article/details/136151673

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

趣味运动会随机分组指南
本文介绍了如何使用云分组小程序进行趣味运动会的随机分组，确保男女比例平均。首先，通过小程序创建分组并设置男女平均分配。成员可以通过扫码、点击链接或输入口令三种方式加入。加入后，成员可以看到自己的组别和
阅读更多2024-09-23
Python异步编程-asyncio详解
')"""输出:Hello ...... World!"""这个例子展示了如何使用asyncio库来编写并发代码。通过async和await
阅读更多2024-09-23
java项目开发1
配置环境变量在path里面新建，复制地址后确定关闭。在所用的盘里建文件夹MavenJar仓库。用记事本打开settings配置本地仓库。修改localRepository。manven安装,解压。点击
阅读更多2024-09-23
QT| “无法粘贴窗口部件”错误以及customplot
“无法粘贴窗口部件”错误的处理方案，以及customplot的安装和使用。
阅读更多2024-09-23
chapter3-基于jwt的分布式认证流程
接下来，因为是新开发一个功能模块，那么我们可以在新的分支下进行开发，将来方便对这部分代码进行单独管理，等开发完成了以后再合并分支到develop也是可以的。前端显示登陆页面登录页组件component
阅读更多2024-09-23
P4630 [APIO2018] 铁人两项（圆方树模版）
在此贴出适合我体质的模版，至于讲解，咱肯定讲的没小粉兔好o(╥﹏╥)o。圆方树相关的东西小粉兔讲的太详细了！
阅读更多2024-09-23
Unity 使用协程非阻塞执行程序
Unity协程是一种允许在不阻塞主线程的情况下暂停和恢复代码执行的功能，它通常用于处理延时操作、复杂逻辑处理、异步加载等场景。Unity的协程支持多种类型的等待操作，包括等待一段时间（`WaitFor
阅读更多2024-09-23
ERNIESpeed-128K在线智能聊天机器人项目（附源码）
基于百度千帆的智能聊天机器人项目，附源码
阅读更多2024-09-23
Algo-Lab 2 Stack & Queue ADT
因此，我们设置一个最小值的栈，他和存储的栈同步Push和Pop，只是，它每次push 的是栈目前存储的元素中的最小的值，这样就解决了 Pop 后的最小值问题了。是一个经典的T形火车问题，主要思路就
阅读更多2024-09-23
Vue 2&3进阶面试题：（第五天）
params一旦设置路由，params就是路由的一部分，如果这个路由有params传参，但是在跳转的时候没有传这个参数，会导致跳转失败或者页面会没有内容。例如有一个商品页面和一个详情页面，这样在两个页
阅读更多2024-09-23

mmap映射文件使用示例

参数说明

相关文章