当前位置：文江博客话题详情

PHP UTF-8 file-encodings

以 UTF-8 格式保存所有源代码文件有什么缺点吗？

发布于 2024-10-30 15:08:24 字数 34 浏览 5 评论 0原文

如果相关的话（很可能是），它们是 PHP 源代码文件。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（4）

眸中客 2024-11-06 15:08:24

有一些陷阱需要注意：

PHP 不知道某些编辑器或 IDE 喜欢放在 UTF-8 文件开头的 BOM 字符。该字符表明该文件是UTF-8，但不是必需的，并且它是不可见的。这可能会导致处理 HTTP 标头的函数发出“标头已发送出去”警告，因为 PHP 会在看到 BOM 时将 BOM 输出到浏览器，这将阻止您发送任何标头。确保您的文本编辑器具有 UTF-8（无 BOM） 编码；如果您不确定，只需进行测试即可。如果空文件开头的不会触发警告，那就没问题。
默认字符串函数不支持多字节编码。这意味着 strlen 真正返回字符串中的字节数，而不是实际的字符数。在您开始使用 substr 之类的函数拼接非 ASCII 字符的字符串之前，这并不是什么大问题：当您这样做时，传递给它的索引引用字节索引而不是字符索引，并且这可能会导致您的脚本将非 ASCII 字符分成两部分。例如，echo substr("é", 0, 1) 将返回无效的 UTF-8 字符，因为在 UTF-8 中，é 实际上占用两个字节，而 substr 将返回一个无效的 UTF-8 字符。仅返回第一个。（解决方案是使用 mb_ 字符串函数，它们支持多字节编码。）
您必须确保您的数据源（如外部文本文件或数据库）也返回 UTF-8 字符串，因为 PHP 不会进行自动转换。为此，您可以使用特定于实现的方法（例如，MySQL 有一个特殊的查询，可让您指定期望结果的编码：SET CHARACTER SET UTF8 或类似的内容），或者，如果您找不到更好的方法，mb_convert_encoding 或 iconv 会将一个字符串转换为另一种编码。

回复收藏 0 原文

椵侞 2024-11-06 15:08:24

实际上，通常建议您将所有源保留为 UTF8。带有拉丁字符的常规代码的大小根本不重要，但可以防止任何特殊字符出现故障。

回复收藏 0 原文

紫﹏色ふ单纯 2024-11-06 15:08:24

如果您在字符串值等中使用任何特殊字符，则大小会稍大一些，但这并不重要。

尽管如此，我的建议是始终保留默认格式。我花了很多时间，因为格式保存出错，所有字符都改变了。

从技术角度来看，没有什么区别！

回复收藏 0 原文

七七 2024-11-06 15:08:24

非常相关的是，PHP 解析器可能会开始输出虚假字符，例如一个时髦的倒置问号。只需遵守规范即可，这是首选。

回复收藏 0 原文

~没有更多了~

关于作者

羁绊已千年

暂无简介

0 文章

0 评论

23 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

苦中寻乐

文章 0 评论 0

lueluelue

文章 0 评论 0

嗼ふ静

文章 0 评论 0

王权女流氓

文章 0 评论 0

与花如笺

文章 0 评论 0

残酷

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文