当前位置：文江博客话题详情

在 PHP 中使用 UTF-8 字符集 - 是否需要 mb 函数？

发布于 2024-08-11 11:53:49 字数 400 浏览 3 评论 0原文

在过去的几天里，我一直致力于将我的 PHP 代码库从 latin1 转换为 UTF-8。我读过两个主要的解决方案，要么用内置的多字节函数替换单字节函数，要么在 php.ini 文件中设置 mbstring.func_overload 值。

但后来我在堆栈溢出上遇到了 this 线程，其中 thomasrutter 的帖子似乎表明只要脚本和字符串文字以 UTF-8 编码，多字节函数实际上对于 UTF-8 来说并不是必需的。

我还没有找到任何其他证据证明这是否属实，如果事实证明我不需要将我的代码转换为 mb_functions 那么这将是一个真正的节省时间！有人能解释一下吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

计㈡愣 2024-08-18 11:53:49

据我了解这个问题，只要你的所有数据都是 100% utf-8 - 这意味着用户输入，数据库，以及 PHP 文件本身的编码（如果其中有特殊字符） - 这是 < Strike>true 搜索和比较操作为true。正如 @ntd 指出的，非多字节 strlen() 在包含多字节字符的字符串上运行时将产生错误的结果。

这是一篇关于编码基础知识的精彩文章。

回复收藏 0 原文

掀纱窥君容 2024-08-18 11:53:49

它们不是“必需的”，除非您使用它们替换的任何函数（并且您可能正在使用其中至少一个）或明确需要扩展的功能，例如 HTTP 处理。

在努力实现 UTF-8 合规性时，我总是回到 PHP UTF-8 Cheatsheet 添加了一项内容：需要更新 PCRE 模式才能使用 u 修饰符。

回复收藏 0 原文

稀香 2024-08-18 11:53:49

一旦您检查或修改多字节字符串，您就需要使用 mb_* 函数。一个非常简单的例子说明了原因：

$str = "abcžđščćöçefg";
mb_internal_encoding("UTF-8");

echo "strlen: ".strlen($str)."\n";
echo "mb_strlen: ".mb_strlen($str)."\n";

这会打印出：

strlen: 20
mb_strlen: 13

As soon as you're examining or modifying a multibyte string, you need to use a mb_* function. A very quick example which demonstrates why:

$str = "abcžđščćöçefg";
mb_internal_encoding("UTF-8");

echo "strlen: ".strlen($str)."\n";
echo "mb_strlen: ".mb_strlen($str)."\n";

This prints out:

strlen: 20
mb_strlen: 13

回复收藏 0 原文

蛮可爱 2024-08-18 11:53:49

thomasrutter 表示搜索不需要特殊处理。例如，如果您需要检查 UTF8 字符串的长度，我不知道如何使用普通的 strlen() 来做到这一点。

回复收藏 0 原文

墨落画卷 2024-08-18 11:53:49

mb_strtoupper 等函数可能也是必要的。 strtoupper 不会将 á 转换为 Á。

回复收藏 0 原文

抹茶夏天i‖ 2024-08-18 11:53:49

有许多函数期望字符串是单字节（有些甚至假设它是 iso-8859-1）。在这些情况下，您需要了解自己在做什么，并可能使用替换函数。有一个相当全面的列表： http://www.phpwact.org/php/ i18n/utf-8

回复收藏 0 原文

九命猫 2024-08-18 11:53:49

您可以使用 mbfunctions 库来扩展 PHP 中的多字节函数：

http://code.google.com /p/mbfunctions/

回复收藏 0 原文

酷遇一生 2024-08-18 11:53:49

你可以用这个
http://php.net/manual/en/mbstring.overload.php
设置在 php.ini 文件中，因此您无需更改代码。

但要小心，因为并不是所有的字符串函数都会自动改变。
这是一个：http://php.net/manual/en/function。 substr-replace.php

回复收藏 0 原文

~没有更多了~

关于作者

宫墨修音

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

在 PHP 中使用 UTF-8 字符集 - 是否需要 mb 函数？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（8）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

在 PHP 中使用 UTF-8 字符集 - 是否需要 mb 函数？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（8）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。