ruby如何去处理 20G的大文件?

发布于 2022-10-15 09:26:07 字数 108 浏览 16 评论 0

现在要分析一个日志文件,大小约20G.机器内存只有8G,无法全部读到内存中。
现在一行一行读取,但是速度很慢。

试过多线程等方式,反而更慢。

求解。。。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(8

孤芳又自赏 2022-10-22 09:26:07

时间是必须的,你不能指望20g很快就完成,你得想想为啥要等到20g?欠考虑就是要付出代价的。
想办法把文件分割成若干个小文件吧,然后处理。

千と千尋 2022-10-22 09:26:07

是什么分析需求,需要把全部日志放到内存里?

简单的需求一般可以line by line。

2022-10-22 09:26:07

日志按照天分割,一天差不多20G.

莫相离 2022-10-22 09:26:07

分割小一点吧。

风流物 2022-10-22 09:26:07

按照小时分割日志吧,或者按照分钟。。。

何必那么矫情 2022-10-22 09:26:07

欢迎新人加入。

空袭的梦i 2022-10-22 09:26:07

谢分享

阳光的暖冬 2022-10-22 09:26:07

用hadoop

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文