当前位置：文江博客话题详情

我应该重构所有框架以使用 mbstring 函数吗？

发布于 2024-12-21 17:45:01 字数 143 浏览 6 评论 0原文

我目前使用 mbstring.func_overload = 7 来处理 UTF-8 字符集。

我正在考虑重构所有 func 调用以使用 mb_* 函数。

您认为这是必然的吗？或者在 PHP 6 或更高版本中，多字节问题将以另一种方式解决？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

司马昭之心 2024-12-28 17:45:02

如果您正在使用其他人创建的库，则不建议使用。以下是三个原因。

重载可能会破坏不需要重载的库的行为。
您的框架可以在不超载的环境中被破坏。
依赖重载会减少框架的潜在用户，因为 2

1. 的一个很好的例子是使用 strlen 错误计算了 HTTP Content-Length 字段中的字节大小。原因是重载的strlen函数不返回字节数，而是返回字符数。您可以在 CakePHP 和 Zend_Http_Client。

编辑：
PHP 5.5 或 5.6 正在考虑弃用 mbstring.func_overload （来自 mbstring 维护者的邮件 2012 年 4 月）。所以现在您应该避免mbstring.func_overload。

对于各种平台处理多字节字符的推荐策略是直接使用 mbstring 或 intl 或 iconv。如果您确实需要后备函数来处理多字节字符，请使用function_exists()。

您可以在Wordpress和MediaWiki中查看案例。

WordPress： wp-includes/compact.php
MediaWiki : 后备类

一些 CMS 喜欢Drupal (unicocde.inc) 引入多字节抽象层。

我认为抽象层不是一个好主意。
原因是在很多情况下所需的处理多字节函数的数量低于 10 个，并且 umultibyte 函数易于使用，但如果安装了这些模块，则会降低将处理切换到 mbstring 或 intl 或 iconv 时的性能。

处理多字节字符的最低要求是mb_substr()并处理无效的字节序列。
您可以在上述 CMS 中看到 mb_substr() 的回退函数的情况。
我在以下位置回答了有关处理无效字节序列的问题：用问号替换无效的 UTF-8 字符，mbstring.substitute_character 似乎