当前位置：文江博客话题详情

Ruby 读取不同文件大小的行读取

发布于 2024-07-14 22:12:20 字数 633 浏览 18 评论 0原文

我需要做一些文件大小至关重要的事情。这会产生

filename = "testThis.txt"
total_chars = 0
file = File.new(filename, "r")
file_for_writing = nil
while (line = file.gets)
  total_chars += line.length
end
puts "original size #{File.size(filename)}"
puts "Totals #{total_chars}"

像这样的

original size 20121
Totals 20061

奇怪结果为什么第二个结果不足？

编辑：回答者的预感是正确的：测试文件中有 60 行。如果我改变这条线，

  total_chars += line.length + 1

它就可以完美工作。但在 *nix 上这个改变会是错误的吗？

编辑：后续行动现在此处。谢谢！

I need to do something where the file sizes are crucial. This is producing strange results

filename = "testThis.txt"
total_chars = 0
file = File.new(filename, "r")
file_for_writing = nil
while (line = file.gets)
  total_chars += line.length
end
puts "original size #{File.size(filename)}"
puts "Totals #{total_chars}"

like this

original size 20121
Totals 20061

Why is the second one coming up short?

Edit: Answerers' hunches are right: the test file has 60 lines in it. If I change this line

  total_chars += line.length + 1

it works perfectly. But on *nix this change would be wrong?

Edit: Follow up is now here. Thanks!

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

陌生 2024-07-21 22:12:21

文件中存储了一些特殊字符来描述行：

Windows/DOS 上的 CR LF (0x0D 0x0A) (\r\n) 和
UNIX 系统上的 0x0A (\n)。

Ruby 的 gets 使用 UNIX 方法。因此，如果您读取 Windows 文件，则每读取一行就会丢失 1 个字节，因为 \r\n 字节会转换为 \n。

另外，String.length 也不能很好地衡量字符串的大小（以字节为单位）。如果字符串不是 ASCII，则一个字符可能由多个字节 (Unicode) 表示。也就是说，它返回字符串中的字符数，而不是字节数。

要获取文件的大小，请使用File.size(file_name)。

回复收藏 0 原文

怼怹恏 2024-07-21 22:12:21

我的猜测是您使用的是 Windows，并且您的“testThis.txt”文件具有 \r\n 行结尾。当文件以文本模式打开时，每一行结尾将转换为单个 \n 字符。因此，每行将丢失 1 个字符。

你的测试文件有 60 行吗？这与这个解释是一致的。

回复收藏 0 原文

不气馁 2024-07-21 22:12:21

行结束问题是最有可能的罪魁祸首。

还值得注意的是，如果文本文件的字符编码不是 ASCII，则两者之间也会存在差异。如果文件是 UTF-8，则这适用于英语和一些仅使用标准 ASCII 字母符号的欧洲语言。除此之外，文件大小和字符数可能会有很大差异（与字符数相比，文件大小最多可达 4 倍甚至 6 倍）。

依赖“1 个字符 = 1 个字节”只是自找麻烦，因为它几乎肯定会在某个时候失败。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

alipaysp_snBf0MSZIv

文章 0 评论 0

梦断已成空

文章 0 评论 0

瞎闹

文章 0 评论 0

凯凯我们等你回来

文章 0 评论 0

寄意

文章 0 评论 0

似梦非梦

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文