使 size_t 和 wchar_t 可移植吗？

发布于 2024-09-26 02:09:14 字数 340 浏览 6 评论 0原文

据我了解， size_t 和 wchar_t 的表示完全是特定于平台/编译器的。例如，我读到 Linux 上的 wchar_t 现在通常是 32 位，但在 Windows 上它是 16 位。有什么方法可以在我自己的代码中将它们标准化为设定的大小（int、long 等），同时仍然保持与两个平台上现有标准 C 库和函数的向后可比性？

我的目标本质上是做一些类似 typedef 的事情，这样它们就有一个固定的大小。在不破坏任何东西的情况下这可能吗？我应该这样做吗？有更好的办法吗？

更新： 我想这样做的原因是为了让我的字符串编码在 Windows 和 Linux 上保持一致，

谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

百合的盛世恋 2024-10-03 02:09:14

听起来您正在寻找 C99 的 & C++0x 的 / 标头。这定义了诸如 uint8_t 和 int64_t 之类的类型。

如果您没有这些标头，您可以使用 Boost 的 cstdint.hpp。

回复收藏 0 原文

单身狗的梦 2024-10-03 02:09:14

您不想重新定义这些类型。相反，您可以使用 int32_t 或 int16_t（带符号的 32 位和 16 位）等类型定义，它们是的一部分C 标准库中的代码>。

如果您使用 C++，C++0x 将添加 char16_t 和 char32_t，它们是用于 UTF-16 和 UTF 的新类型（不仅仅是整型类型的 typedef） -32。

对于 wchar_t，另一种方法是使用像 ICU 这样的库，它在一种独立于平台的方式。然后，您可以只使用 UChar 类型，该类型始终为 UTF-16；您仍然需要注意字节顺序。 ICU 还提供 UChar (UTF-16) 之间的转换器。

回复收藏 0 原文

╰つ倒转 2024-10-03 02:09:14

不。尝试使用 typedef 来“修复”字符类型的根本问题是，您最终得到的结果在某些平台上与内置函数和宽字符文字一致，而在其他平台上则不然。

如果您想要在所有平台上都相同的字符串格式，您只需选择大小和符号即可。您想要无符号 8 位“字符”，还是有符号 64 位“字符”？您可以在任何具有适当大小的整数类型的平台上使用它们（并非所有平台都如此）。但是，就语言而言，它们并不是真正的字符，因此不要期望能够对它们调用 strlen 或 wcslen，或者拥有一个很好的文字语法。字符串文字是（当然，转换为）char*，而不是signed char* 或unsigned char*。宽字符串文字是 wchar_t*，它相当于一些其他整数类型，但不一定是您想要的类型。

因此，您必须选择一种编码，在内部使用它，定义您自己的所需字符串函数版本，实现它们，然后根据需要与采用字符串的非字符串函数进行平台编码之间的转换。 utf-8 是一个不错的选择，因为大多数 C 字符串函数仍然“工作”，从某种意义上说，它们做了一些相当有用的事情，即使它不完全正确。

回复收藏 0 原文

肩上的翅膀 2024-10-03 02:09:14

wchar_t 可能会比 size_t 更具有粘性。人们可以假设 size_t 的最大大小（例如 8 字节），并在写入文件（或套接字）之前将所有变量转换为该大小。另一件需要记住的事情是，如果您尝试写入/读取某种二进制表示形式，您将遇到字节排序问题。无论如何， wchar_t 可以在一个系统上表示 utf-32 编码（我相信 Linux 是这样做的），并且可以在另一系统上表示 UTF-16 编码（Windows 是这样做的）。如果您尝试在平台之间创建标准格式，则必须解决所有这些问题。

回复收藏 0 原文