当前位置：文江博客话题详情

对压缩文件调用 File.readlines （或等效方法），而不先解压缩它们

发布于 2024-12-09 08:56:16 字数 222 浏览 0 评论 0原文

我正在尝试编写一个 rake 任务来扫描一些压缩的日志文件并提取一些数据，然后我可以使用这些数据来更新一些数据库记录。由于我们服务器上的空间限制，我无法解压所有文件并仅对它们调用 File.readlines，这是我通常会做的。

任何人都可以建议一种不涉及解压缩文件的替代方法吗？我需要做的基本上是扫描与特定正则表达式匹配的行，然后从匹配行之后的行中提取一些文本。它们都是 gzip 压缩的，因此是 .gz 文件。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

梦在深巷 2024-12-16 08:56:16

您可以使用 Ruby 打开 gzip 压缩文件，然后像正常打开文件一样执行搜索，如下所示：

require 'zlib'

Zlib::GzipReader.open("myfile.gz") { |gz|
  # place your code here, something like:
  p gz.readlines.grep /my-magic-marker/
}

这会将整个文件加载到内存中，请注意这一点。

You can open the gzipped file using Ruby, and perform your searching as if you had opened the file as normal, like this:

require 'zlib'

Zlib::GzipReader.open("myfile.gz") { |gz|
  # place your code here, something like:
  p gz.readlines.grep /my-magic-marker/
}

This will load the entire file in memory, beware of that.

回复收藏 0 原文

~没有更多了~

关于作者

断舍离

暂无简介

0 文章

0 评论

24 人气

关注发私信

已经忘了多久

文章 0 评论 0

关注

15867725375

文章 0 评论 0

关注

LonelySnow

文章 0 评论 0

关注

走过海棠暮

文章 0 评论 0

关注

轻许诺言

文章 0 评论 0

关注

信馬由缰

文章 0 评论 0

友情链接

文江博客

对压缩文件调用 File.readlines （或等效方法），而不先解压缩它们

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签