如何正确移植仅限 Win 的函数 GetMultiByteString？

发布于 2024-09-11 15:44:03 字数 246 浏览 8 评论 0原文

我正在将最初仅适用于 Windows 的代码移植到跨平台友好的代码；一个特殊的障碍是尝试将对 Windows Unicode 函数“GetMultiByteString”（以及任何相关函数）的调用转换为更可移植的基于 wchar 的函数。我在这方面没有取得什么成功，因为在尝试迭代 Unicode 字符串时使用 wchar 会导致循环过早终止。

使用 wchar 替换 GetMultiByteString 和任何其他相关 Unicode 函数的正确方法是什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

鲸落 2024-09-18 15:44:07

您正在尝试将苹果变成橙子。 MultiByteToWideChar 和 WideCharToMultiByte 在特定编码之间进行转换，UTF-16 <->各种其他编码，包括 ANSI。

3个问题：

char <-> 的编码方式C 标准库中的 wchar_t 函数的操作是由实现定义的。它可以在 UCS-2 和 ASCII、EBDIC 或任意数量的其他代码页之间进行转换。您不能用这些函数替换 Windows 函数，因为您不能假设 wcstombs 和 mbstowcs 实际上正在谈论 UTF-16，或者实际上正在谈论 ASCII。通常他们在 unix 机器上使用的实际编码是 UTF-32。
Unix 机器通常不识别 UTF-16——如果它们支持 unicode，它们都是基于 UTF-8 的。
wchar_t 在 unix 机器上通常为 4 个字节，而不是 2 个字节，因此您必须检查所有代码以确保它的大小从未被假定为 2 个字节。

简而言之，除非您自己编写代码来进行编码，否则没有完全可移植的方法来处理此类事情。

如果你想要可移植，你需要定义一个 typedef 或其他东西，以便你的应用程序在 Windows 上使用 wchar_t，而在其他一切上使用 char。然后，您必须假设 Windows 机器上使用 UTF-16，而 unix 机器上使用 UTF-8。

或者：您必须使用图书馆，例如 ICU。

回复收藏 0 原文

~没有更多了~