Python用for line in read(file,'rb'):处理超大文件时,想用多线程,该如何分配合适的文件偏移?
文件大概有80个G大小,想用多线程,我知道可以用f.seek()去设置偏移,以达到从不同的位置开始读入的效果
可是应该如何给每个线程分配一个合适偏移?
with open(r'file.txt', 'rb') as f:
for line in f:
dosomething(line)
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
可以现分割大文件,然后多线程处理被分割的各个小文件:http://www.jb51.net/article/5...
用 mmap 模块,像访问内存一样读写文件。