内存映射 mmap

发布于 2022-06-07 15:52:58 字数 4043 浏览 1057 评论 0

通常在 Unix 系统里有两种操作的数据类型:内存地址和流文件(stream)。通过操作内存地址的方法涉及的操作有 pointers、malloc/free 之类,而操作流文件涉及的方法有 read/write/seek 等系统调用或者 send/recv/etc 等 socket 操作。而 mmap 提供了结合上述两种类型的操作方式。简单来讲,mmap 可以创建一个内存映射(memory-mapped)类型的文件,可以直接在内存操作文件,而不需要使用通常的 read、wirte 这些系统 I/O 调用。这样的好处是避免了操作文件是频繁地系统调用。

使用方法

内存映射(memory-mapped)可以像字符串和文件对象一样操作,通过 mmap 来创建。

例子中采用的 hello.txt 文件如下:

Hello, i am Nisen,
Nice to meet you!
Goodbye.

mmap 构造器的格式

# Unix version
class mmap.mmap(fileno, length[, flags[, prot[, access[, offset]]]])

# Windows version
class mmap.mmap(fileno, length[, tagname[, access[, offset]]])

fileno 是流文件的描述符,length 指定映射文件到内存的 bytes 的长度,设置为0的话代表全部。Unix 接口中的 flags 指定这个创建出来的 mapping 是否对创建的进程私有,默认是共享的。prot 和 access 指定需要的内存保护(读写相关),其它参数的含义可以参照 文档

接下来让我们采用 Unix 的接口,做些实验吧。

例子1

import mmap

with open('hello.txt', 'r') as f:
  m = mmap.mmap(f.fileno(), 0, access=mmap.ACCESS_READ)
  print m.readline()
  m.close()

运行的结果如下:

Hello, i am Nisen,

python3.2以后mmap支持用with的方式操作

# New in version 3.2: Context manager support.
with open('hello.txt', 'r') as f:
  with mmap.mmap(f.fileno(), 0, access=mmap.ACCESS_READ) as m:
    print('First 10 bytes via read :', m.read(10))
    print('First 10 bytes via slice:', m[:10])

运行后的结果

python3 test.py
First 10 bytes via read : b'Hello, i am Nisen,\nNice to meet you!\nGoodbye.\n'
First 10 bytes via slice: b'Hello, i a'

例子2

常见的方法如下

with open('hello.txt', 'r+') as f:
  # 指定访问权限为write, 一共有3种权限指定:ACCESS_READ, ACCESS_WRITE, ACCESS_COPY
  m = mmap.mmap(f.fileno(), 0, access=mmap.ACCESS_WRITE)

  # 输出一行
  print m.readline()

  # 指针重置
  m.seek(0)

  # 查找"Nisen"出现的第一个地方,返回索引
  index = m.find('Nisen')
  print index

  m.seek(0)

  # 直接修改内容
  m[index: index+5] = "Rubby"

  # 将内存中的修改存到磁盘中的文件上
  m.flush()

  m.seek(0)
  print m.readline()

  # 关闭内存映射文件
  m.close()

运行结果如下:

➜ python test2.py
Hello, i am Nisen,

12
Hello, i am Rubby,

其它

  1. mmap 的 read() 方法在 python3.3 开始可以接受空参数,表示读取文件所有的内容
  2. 在创建 mmap 对象指定权限的时候,注意本来文件描述符拥有的权限。如果使用 open() 打开文件的权限指定了 r,用 mmap 创建映射对象时指定 ACCESS_WRITE ,那么会报 Permission denied 的错误
  3. 关于文件打开模式 r+ 和 w+ 的用法可以参考这里 这里
  4. 在多线程编程时,如果多个线程以只读的方式访问同一个文件,那么可以采用 mmap 创一个映射对象来减少内存的使用提升性能
  5. mmap 会将文件对象一次读取到连续内存空间上,如果文件过大导致找不到可用的内存空间,那么创建这个映射对象将会失败
  6. mmap 加快文件操作的例子可以参照 这里

参考资料

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据

关于作者

JSmiles

生命进入颠沛而奔忙的本质状态,并将以不断告别和相遇的陈旧方式继续下去。

0 文章
0 评论
84961 人气
更多

推荐作者

醉城メ夜风

文章 0 评论 0

远昼

文章 0 评论 0

平生欢

文章 0 评论 0

微凉

文章 0 评论 0

Honwey

文章 0 评论 0

qq_ikhFfg

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文