UTF-8 字符串分隔符

发布于 2024-11-04 17:43:48 字数 171 浏览 0 评论 0原文

我正在解析一个二进制协议，其中 UTF-8 字符串散布在原始字节中。此特定协议在每个 UTF-8 字符串前面添加一个短字符（两个字节），指示后续 UTF-8 字符串的长度。这给出了最大字符串长度 2^16 > 65 000 对于特定应用来说绰绰有余。

我的问题是，这是分隔 UTF-8 字符串的标准方法吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

临风闻羌笛 2024-11-11 17:43:48

我不会称之为定界，更像是“长度前缀”。有些人称它们为 Pascal 字符串，因为早期 Pascal 语言是以这种方式在内存中存储字符串的流行方法之一。

我认为没有专门针对这一点的正式标准，因为它是存储 UTF-8 字符串（或任何与此相关的字节字符串）的相当明显的方式。不过，它被反复定义为许多处理包含字符串的消息的标准的一部分。

回复收藏 0 原文

奢欲 2024-11-11 17:43:48

UTF8 通常不会被限制，您应该能够使用此处提到的规则来发现其中的多字节字符：http://en.wikipedia.org/wiki/UTF-8#Description

回复收藏 0 原文

╰◇生如夏花灿烂 2024-11-11 17:43:48

我会使用以 0x11 开头的分隔符......
但如果您发送原始字节，则必须从处理的数据\消息中排除此分隔符，这意味着如果存在与该分隔符类似的用户输入，则必须将其转换。

如果用户输入任何 utf8 表示的字符，您只需按原样发送即可。

回复收藏 0 原文

~没有更多了~

关于作者

思慕

暂无简介

0 文章

0 评论

23 人气

关注发私信

烙印

文章 0 评论 0

关注

singlesman

文章 0 评论 0

关注

给自己一个微笑

文章 0 评论 0

关注

独孤求败

文章 0 评论 0

关注

晨钟暮鼓

文章 0 评论 0

关注

我是自愿种绣球花的

文章 0 评论 0

友情链接

文江博客

UTF-8 字符串分隔符

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者