支持和反对在跨平台库中专门支持 std::wstring 的争论

发布于 2024-09-18 01:09:02 字数 243 浏览 12 评论 0原文

我目前正在开发一个跨平台的 C++ 库，我打算让它能够识别 Unicode。我目前通过 typedef 和宏对 std::string 或 std::wstring 提供编译时支持。这种方法的缺点是它迫使您使用 L("string") 等宏，并大量使用基于字符类型的模板。

支持和反对仅支持 std::wstring 的论据是什么？

使用 std::wstring 是否会专门阻碍 GNU/Linux 用户群（其中首选 UTF-8 编码）？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

耀眼的星火 2024-09-25 01:09:02

很多人希望使用带有 UTF-8 (std::string) 的 unicode，而不是 UCS-2 (std::wstring)。 UTF-8 是许多 Linux 发行版和数据库上的标准编码 - 因此不支持它将是一个巨大的缺点。在 Linux 上，每次以字符串作为参数调用库中的函数时，都需要用户将（本机）UTF-8 字符串转换为 std::wstring。

在 gcc/linux 上，std::wstring 的每个字符将有 4 个字节，而在 Windows 上将有 2 个字节。这可能会在读取或写入文件（以及从不同平台复制文件或将文件复制到不同平台）时导致奇怪的效果。我宁愿推荐 UTF-8/std::string 用于跨平台项目。

回复收藏 0 原文

清引 2024-09-25 01:09:02

支持和反对仅支持 std::wstring 的论点是什么？

支持使用宽字符的论点是，它可以完成窄字符可以做的所有事情，甚至更多。

据我所知，反对它的论点是：

宽字符需要更多的空间（这几乎不相关，原则上，中国人在记忆方面并不比美国人更头痛）
使用宽字符让一些习惯于所有内容的西方人感到头疼他们的字符适合 7 位（并且不愿意学习注意不要将实际字符的字符类型与其他用途混合使用）

至于灵活性：我维护了一个库（几个 kLoC）可以处理窄字符和宽字符。大部分是通过字符类型作为模板参数，我不记得任何宏（除了 UNICODE ）。不过，并非所有内容都是灵活的，其中有一些代码最终需要 char 或 wchar_t 字符串。（使用宽字符使内部键字符串变宽是没有意义的。）
用户可以决定是否只需要窄字符支持（在这种情况下 "string" 就可以）或只需要宽字符支持（这需要他们使用 L"string"）或者他们是否也想同时支持两者（这需要类似 T("string") 的东西）。