PHP iconv_strlen问题

发布于 2024-11-15 01:46:35 字数 66 浏览 1 评论 0原文

我想知道当 icon_strlen 在错误的字符序列上失败时意味着什么,特别是字符序列。谢谢

What does it mean when the icon_strlen fails on bad character sequences specifically character sequences is what I want to know. Thanks

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

深海里的那抹蓝 2024-11-22 01:46:35

字符序列是一系列字节。使用 UTF-8 时,并非所有字节组合都有效。

字节序列 \xc2\xbc 形成 Unicode 字符 U+00BC,当使用 UTF- 8 编码。

字节序列 \xe2\x88\x9c 形成 Unicode 字符 U+221C,它是使用 UTF- 时的FOURTH ROOT 符号 (∜) 8 编码。

UTF-8 编码的错误字符序列是任何不符合 UTF-8 字节流,例如字节序列 \xbc\xbc 是非法的,因为两个字节字符的第一个字节必须是 110xxxxx,但 \xbc10111100 写为位。

A character sequence is a series of bytes. When using UTF-8 not all combinations of bytes are valid.

The byte sequence \xc2\xbc forms the Unicode character U+00BC which is the VULGAR FRACTION ONE QUARTER symbol (¼) when using UTF-8 encoding.

The byte sequence \xe2\x88\x9c forms the Unicode character U+221C which is the FOURTH ROOT symbol (∜) when using UTF-8 encoding.

A bad character sequence for UTF-8 encoding would be any byte combination that doesn't fit into the required schema for UTF-8 byte streams, e.g. the byte sequence \xbc\xbc would be illegal because two byte characters must have 110xxxxx in the first byte but \xbc is 10111100 written as bits.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文