当前位置：文江博客话题详情

指定字符编码的方式有什么区别？

发布于 2024-12-20 14:11:23 字数 390 浏览 6 评论 0原文

我见过几种指定字符串编码的方法，如下：

# -*-coding: utf-8 -*-
#coding: utf-8
#encoding : utf-8
#!/usr/bin/env ruby -Ku
#!/usr/bin/env ruby -Eutf-8
编码.default_external = “utf-8”

还有其他的吗？有人可以告诉我它们的区别（如果有）以及它们的起源（如果有）吗？有旧的和新的吗？次要的和受欢迎的；贬值的和升值的？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

征﹌骨岁月お 2024-12-27 14:11:23

第二个和第三个基本相同，您在逐个文件的基础上指定编码。您只需要“编码”，但因为“编码”包含“编码”一词，所以它也有效。我不记得其他的了，但是 Peter Cooper 的 Ruby 1.9 演练回顾了其中的一些差异。

回复收藏 0 原文

君勿笑 2024-12-27 14:11:23

TL;DR 版本：使用 #coding: utf-8 或 #encoding: utf-8；它们是现代的，并且它们之间没有区别。

根据这篇最具启发性的文章，在 Ruby 1.9 中，神奇的注释必须是：

代码的第一行是注释，其中包含单词coding，后跟冒号和空格，然后是编码名称...

因此涵盖了 1, 2 & 。 3 并且可能还包括诸如 # foobarcoding: utf-8 之类的内容。这是 Ruby 1.9 的首选方法。

出于兼容性原因，保留了 Ruby 1.8 中的 hash bang -K* 开关，其中涵盖了 4。

数字 5 和 6 涵盖了略有不同的内容。我建议阅读上述链接的文章，了解外部和内部编码的确切工作原理。然而要点是，当您通过 IO 对象读取数据时，如何对数据进行编码以正确读取数据很重要。外部编码正是表达了这一点。因此，当您将外部编码设置为 UTF-8 时，您就意味着您正在读取的文件是以 UTF-8 编码的。内部编码是 Ruby 自动转码该操作生成的字符串的编码。

当未明确设置外部编码时，将使用您设置的默认值。这些默认值可以通过 hash bang 中的 -E 标志进行更改（数字 5；因此 5 和 6 的工作方式相同）。

传递-U会将内部编码设置为UTF-8（意味着字符串在读取时将自动转码为UTF-8）。