当前位置：文江博客话题详情

对宽数据使用窄字符串操作函数

发布于 2024-11-11 01:27:10 字数 399 浏览 6 评论 0原文

我正在解析一个 XML 文件，该文件可以包含不同语言的本地化字符串（目前只有英语和西班牙语，但将来可能是任何语言），XML 解析器的 API 通过char*，UTF8 编码。

解析数据后需要对数据进行一些操作（在数据中搜索子字符串、连接字符串、确定子字符串的长度等）。

使用标准函数（例如 strlen、strcat 等）会很方便。由于我从 XML 解析器接收的原始数据是 char*，因此我可以使用这些标准字符串处理函数轻松完成所有操作。

然而，这些当然都假设和要求字符串以 NULL 结尾。因此，我的问题是 - 如果您有表示为 char* 的宽数据，那么 NULL 终止符字符是否可以出现在数据内而不是末尾？

即，如果某种语言中的字符不需要2个字节来表示它，并且用一个字节来表示，那么另一个字节是否可以为NULL？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

撧情箌佬 2024-11-18 01:27:10

UTF-8 并不“宽”。 UTF-8 是多字节编码，其中 Unicode 字符可以占用 1 到 4 个字节。 UTF-8 有效字符内不会有零终止符。确保您不会对解析器为您提供的内容感到困惑。它可以是 UTF-16 或 UCS2 或它们放置在宽字符串中的 4 字节等效项，在这种情况下，您必须将它们视为宽字符串。

回复收藏 0 原文