当前位置：文江博客话题详情

PHP htmlspecialchars 函数中的 Unicode 替换字符

发布于 2024-12-17 04:18:56 字数 105 浏览 7 评论 0原文

在 htmlspecialchars 函数中，如果设置了 ENT_SUBSTITUTE 标志，则应该替换一些无效字符。

哪些字符被替换？无效字符和用于替换它的字符之间的映射是什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

我很OK 2024-12-24 04:18:56

只有一个通用替换字符：U+FFFD。如果您写出 UTF-8，则该代码点已正确编码。如果没有，您将获得相应的字符引用 �。

不存在可逆映射。根据定义，原始字节序列无效，即它没有值（有效=有值）。

被替换的字节（不是真正的“字符”）是那些在假定的源编码中无效的字节。例如，如果您的源编码是 UTF-16 并且您有一个单独的代理，那么这将是“无效”（尽管从技术上讲，任何文本处理器都应该在这种情况下致命中止）。作为一个更好的示例，如果源编码是 ASCII，则任何高于 127 的值都是无效字符。

回复收藏 0 原文

~没有更多了~

关于作者

当梦初醒

暂无简介

文章

28 人气

关注发私信

李珊平

文章 0 评论 0

关注

Quxin

文章 0 评论 0

关注

范无咎

文章 0 评论 0

关注

github_ZOJ2N8YxBm

文章 0 评论 0

关注

若言

文章 0 评论 0

关注

南…巷孤猫

文章 0 评论 0

友情链接

文江博客

PHP htmlspecialchars 函数中的 Unicode 替换字符

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者