当前位置：文江博客话题详情

在 ICU UnicodeString 中，countChar32() 和 length() 之间有什么区别？

发布于 2024-10-31 09:40:02 字数 405 浏览 8 评论 0原文

来自文档；

长度是 UnicodeString 中 UChar 代码单元的数量。如果您想要代码点的数量，请使用 countChar32()。

并

计算字符串长度 UChar 代码单元中的 Unicode 代码点。

一个代码点可以占用一个或两个 UChar 代码单元。计算代码点涉及读取所有代码单元。

由此我倾向于认为代码点是一个实际的字符，而代码单元只是字符的一个可能的部分。

例如。

假设您有一个像

“foobar”

这样的 unicode 字符串，长度和 countChar32 都是 6。然后假设您有一个由 6 个字符组成的字符串，需要完整的 32 位来编码，长度将为 12，但 countChar32 将为 6。

这是正确的吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

傲世九天 2024-11-07 09:40:02

仅当您使用基本多语言平面 (BMP) 之外的字符时，这两个值才会有所不同。这些字符在 UTF-16 中表示为代理对。两个16位字符组成一个逻辑字符。如果您使用其中任何一个，则每个对都算作一个 32位字符，但有两个长度元素。

回复收藏 0 原文

~没有更多了~

关于作者

情话墙

暂无简介

文章

26 人气

关注发私信

饮湿

文章 0 评论 0

关注

明月

文章 0 评论 0

关注

02

文章 0 评论 0

关注

hs1283

文章 0 评论 0

关注

风向决定发型

文章 0 评论 0

关注

落花浅忆

文章 0 评论 0

友情链接

文江博客

在 ICU UnicodeString 中，countChar32() 和 length() 之间有什么区别？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

饮湿

明月

02

hs1283

风向决定发型

落花浅忆

友情链接

在 ICU UnicodeString 中，countChar32() 和 length() 之间有什么区别？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

饮湿

明月

02

hs1283

风向决定发型

落花浅忆

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。