为什么用short代替char作为字符串？ char* 和 unsigned char* 之间的区别？

发布于 2025-01-05 16:19:40 字数 471 浏览 6 评论 0原文

正如标题所说，我有两个问题。

编辑：澄清一下，他们实际上并没有使用 char 和 short，他们通过特定的方式确保它们是 8 位和 16 位类型定义。实际类型称为 UInt8 和 UInt16。

1.问题

iTunes SDK 使用无符号短*，其中需要字符串。使用它代替 char*/unsigned char* 有何优点？如何将其转换为 char*，以及使用此类型时有何不同？

2.问题

我只在必须存储字符串时见过 char* 。那么我什么时候应该使用 unsigned char* ，或者它没有任何区别？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

梦里南柯 2025-01-12 16:19:40

无符号短数组可以与宽字符串一起使用 - 例如，如果您有 UTF-16 编码文本 - 尽管我希望在这些情况下看到 wchar_t 。但他们可能有自己的理由，比如 MacOS 和 Windows 之间的兼容。（如果我的消息来源正确，MacOS 的 wchar_t 是 32 位，而 Windows 是 16 位。）

您可以通过调用适当的库函数在两种类型的字符串之间进行转换。哪个功能合适取决于具体情况。 SDK不是自带的吗？

并且使用 char 而不是 unsigned char，好吧，所有字符串历来都是用 char 定义的，因此切换到 unsigned char代码> 会引入不兼容性。
（切换到signed char也会导致不兼容，但不知何故没有那么多......）

编辑现在问题已经编辑了，让我说我没有看到在我输入答案之前进行编辑。但是，是的，由于上述原因，UInt16 是比 wchar_t 更好的 16 位实体表示。

回复收藏 0 原文

挖鼻大婶 2025-01-12 16:19:40

1.问题 - 答案

我认为他们使用 unsigned Short* 因为他们必须对 unicode 字符使用 UTF-16 编码，从而表示 BMP 内和外的字符。您问题的其余部分取决于源和目标的 Unicode 编码类型 (UTF-8,16,32)

2。问题 - 答案

再次取决于编码类型以及您正在谈论的字符串。如果您计划处理扩展 ASCII 表之外的字符串，则切勿使用有符号或无符号字符。（除英语之外的任何其他语言）

回复收藏 0 原文

甜警司 2025-01-12 16:19:40

可能是轻率地尝试使用 UTF-16 字符串。 C 有一个宽字符类型，wchar_t 及其 char（或 wchar_t）可以是 16 位长。虽然我对 SDK 不太熟悉，无法说明为什么他们要走这条路线，但它可能是为了解决编译器问题。在 C99 中，有更合适的 [u]int[least/fast]16_t 类型 - 请参阅。
请注意，C 对数据类型及其底层大小几乎没有保证。有符号或无符号的 Shorts 不保证为 16 位（尽管保证至少有那么多），字符也不限制为 8 或 Widechars 16 或 32。
要在字符和短字符串之间进行转换，您可以使用 SDK 提供的转换函数。如果您确切地知道它们在这些短字符串中存储的内容以及您想要在 char 字符串中存储的内容，您也可以编写自己的库或使用第 3 方库。
这实际上并没有什么区别。如果您想对字符进行（无符号）算术或位操作，通常会转换为 unsigned char。

编辑：在你告诉我们他们使用 UInt16 而不是 unsigned Short 之前，我写了（或者开始写，无论如何）这个答案。在这种情况下，就不会涉及到野兔的大脑了。专有类型可能用于与没有 stdint 类型的旧版（或不兼容）编译器兼容，以存储 UTF-16 数据。这是完全合理的。