当前位置：文江博客话题详情

如何在 Linux 中为内存映射文件提供写时扩展功能？

发布于 2024-11-28 04:58:58 字数 1251 浏览 5 评论 0原文

我正在致力于将一些代码从 AIX 移植到 Linux。部分代码使用 shmat() 系统调用来创建新文件。当在可写模式下与 SHM_MAP 一起使用时，可以将文件扩展到超出其原始长度（在我的情况下为零）：

当一个文件被映射到一个段上时，通过访问该段来引用该文件。内存分页系统自动处理物理 I/O。超出文件末尾的引用会导致文件以页面大小的增量进行扩展。文件不能扩展到下一个段边界之外。

（AIX 中的“段”是 256 MB 的地址空间块，“页”通常是 4 KB。）

我想要在 Linux 上执行以下操作：

保留一个大的-相当大的地址空间块（不一定要大到 256 MB，这些文件不是那么大）
设置页面保护位，以便在第一次访问未保护的页面时生成段错误之前被触碰过
发生页面错误时，清除“导致页面错误”位并为该页面分配提交的内存，允许导致页面错误的写入（或读取）继续进行
关闭共享内存区域时，将修改的页面写入文件

我知道我可以使用 VirtualProtect 函数、PAGE_GUARD 内存保护位和结构化异常处理程序。 Linux 上的相应方法是什么？也许有更好的方法在 Linux 上实现这种写时扩展功能吗？

我已经考虑过：

写入了多少文件
使用 mmap() 和一些固定的大尺寸，但我无法判断应用程序代码分配的匿名共享内存区域相当大的大小，但我同样无法判断有多少区域已被写入
mmap() 本身似乎没有提供任何设施来扩展支持文件的长度

当然我会只需对应用程序代码进行最少的更改即可完成此操作。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

゛清羽墨安 2024-12-05 04:58:58

这与我曾经做过的作业非常相似。基本上我有一个“页面”列表和一个“框架”列表以及相关信息。使用 SIGSEGV 我可以捕获故障并根据需要更改内存保护位。我将包含您可能会觉得有用的部分。

创建映射。最初它没有权限。

int w_create_mapping(size_t size, void **addr)
{

    *addr = mmap(NULL,
            size * w_get_page_size(),
            PROT_NONE,
            MAP_ANONYMOUS | MAP_PRIVATE,
            -1,
            0
    );

    if (*addr == MAP_FAILED) {
        perror("mmap");
        return FALSE;
    }

    return TRUE;
}

安装信号处理程序

int w_set_exception_handler(w_exception_handler_t handler)
{
    static struct sigaction sa;
    sa.sa_sigaction = handler;
    sigemptyset(&sa.sa_mask);
    sigaddset(&sa.sa_mask, SIGSEGV);
    sa.sa_flags = SA_SIGINFO;

    if (sigaction(SIGSEGV, &sa, &previous_action) < 0)
        return FALSE;

    return TRUE;
}

异常处理程序

static void fault_handler(int signum, siginfo_t *info, void *context)
{
    void *address;      /* the address that faulted */

    /* Memory location which caused fault */
    address = info->si_addr;

    if (FALSE == page_fault(address)) {
        _exit(1);
    }
}

增强保护

int w_protect_mapping(void *addr, size_t num_pages, w_prot_t protection)
{
    int prot;

    switch (protection) {
    case PROTECTION_NONE:
        prot = PROT_NONE;
        break;
    case PROTECTION_READ:
        prot = PROT_READ;
        break;
    case PROTECTION_WRITE:
        prot = PROT_READ | PROT_WRITE;
        break;
    }

    if (mprotect(addr, num_pages * w_get_page_size(), prot) < 0)
        return FALSE;

    return TRUE;
}

我无法公开提供所有这些内容，因为团队可能会再次使用相同的作业。

This is very similar to a homework I once did. Basically I had a list of "pages" and a list of "frames", with associated information. Using SIGSEGV I would catch faults and alter the memory protection bits as necessary. I'll include parts that you may find useful.

Create mapping. Initially it has no permissions.

int w_create_mapping(size_t size, void **addr)
{

    *addr = mmap(NULL,
            size * w_get_page_size(),
            PROT_NONE,
            MAP_ANONYMOUS | MAP_PRIVATE,
            -1,
            0
    );

    if (*addr == MAP_FAILED) {
        perror("mmap");
        return FALSE;
    }

    return TRUE;
}

Install signal handler

int w_set_exception_handler(w_exception_handler_t handler)
{
    static struct sigaction sa;
    sa.sa_sigaction = handler;
    sigemptyset(&sa.sa_mask);
    sigaddset(&sa.sa_mask, SIGSEGV);
    sa.sa_flags = SA_SIGINFO;

    if (sigaction(SIGSEGV, &sa, &previous_action) < 0)
        return FALSE;

    return TRUE;
}

Exception handler

static void fault_handler(int signum, siginfo_t *info, void *context)
{
    void *address;      /* the address that faulted */

    /* Memory location which caused fault */
    address = info->si_addr;

    if (FALSE == page_fault(address)) {
        _exit(1);
    }
}

Increasing protection

int w_protect_mapping(void *addr, size_t num_pages, w_prot_t protection)
{
    int prot;

    switch (protection) {
    case PROTECTION_NONE:
        prot = PROT_NONE;
        break;
    case PROTECTION_READ:
        prot = PROT_READ;
        break;
    case PROTECTION_WRITE:
        prot = PROT_READ | PROT_WRITE;
        break;
    }

    if (mprotect(addr, num_pages * w_get_page_size(), prot) < 0)
        return FALSE;

    return TRUE;
}

I can't publicly make it all available since the team is likely to use that same homework again.

回复收藏 0 原文