当前位置：文江博客话题详情

PHP - 检测用户提供的字符的字符集

发布于 2024-12-31 20:55:26 字数 237 浏览 0 评论 0原文

是否可以检测用户字符串的字符集？

如果没有，下一个问题怎么样？

是否有可靠的内置 PHP 函数可以准确判断用户提供的字符串（通过 get/post/cookie 等提供）是否在UTF-8 与否？换句话说，我可以做类似

is_utf8($_GET['first_name'])

的事情吗？这个函数是否可以产生一个 TRUE，而实际上 first_name 不是 UTF-8 格式？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

筑梦 2025-01-07 20:55:26

关于1：

您可以尝试mb_detect_encoding，但这几乎是一次尝试黑暗的。 “编码”字符串只是一堆字节。这样的字节序列通常在任意数量的不同编码中同样有效。因此，根据定义，不可能可靠检测到未知编码，您只能猜测。因此，存在诸如 HTTP 标头之类的元信息，它们应该传达所传输内容的编码。检查这些是否可用。

关于2：

mb_check_encoding($var, 'UTF-8') 会告诉你是否该字符串是有效的 UTF-8 字符串。据我所知，在 PHP 的最新版本中，它按照其表面上的说明进行操作。这仍然并不意味着该字符串一定是真正的 UTF-8 字符串，它只是意味着字节序列的顺序在 UTF-8 中有效。

回复收藏 0 原文

~没有更多了~