如何在 Linux API 中使用 wstring？

发布于 2024-12-02 21:34:36 字数 879 浏览 4 评论 0原文

我想在 Linux 上开发一个应用程序。我想使用 wstring 因为我的应用程序应该支持 unicode 并且我不想使用 UTF-8 字符串。

在Windows操作系统中，使用wstring很容易。因为任何 ANSI API 都有 unicode 形式。例如有两个CreateProcess API，第一个API是CreateProcessA，第二个API是CreateProcessW。

wstring app = L"C:\\test.exe";
CreateProcess
(
  app.c_str(), // EASY!
  ....
);

但在 Linux 中使用 wstring 似乎很复杂！例如，Linux 中有一个名为 parport_open（这只是一个例子）。

我不知道如何将我的 wstring 发送到此 API（或像 parport_open 这样接受字符串参数的 API）。

wstring name = L"myname";
parport_open
(
  0, // or a valid number. It is not important in this question.
  name.c_str(), // Error: because type of this parameter is char* not wchat_t*
  ....
);

我的问题是如何在 Linux API 中使用 wstring？

注意：我不想使用 UTF-8 字符串。

谢谢

原文

I want to develope an application in Linux. I want to use wstring beacuse my application should supports unicode and I don't want to use UTF-8 strings.

In Windows OS, using wstring is easy. beacuse any ANSI API has a unicode form. for example there are two CreateProcess API, first API is CreateProcessA and second API is CreateProcessW.

wstring app = L"C:\\test.exe";
CreateProcess
(
  app.c_str(), // EASY!
  ....
);

But it seems working with wstring in Linux is complicated! for example there is an API in Linux called parport_open (It just an example).

and I don't know how to send my wstring to this API (or APIs like parport_open that accept a string parameter).

wstring name = L"myname";
parport_open
(
  0, // or a valid number. It is not important in this question.
  name.c_str(), // Error: because type of this parameter is char* not wchat_t*
  ....
);

My question is how can I use wstring(s) in Linux APIs?

Note: I don't want to use UTF-8 strings.

Thanks

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

心头的小情儿 2024-12-09 21:34:36

几乎每个发行版上的 Linux API（在最新的内核上并具有正确的区域设置）默认都使用 UTF-8 字符串¹。您也应该在代码中使用它们。抵抗是徒劳的。

Windows 上的 wchar_t（以及 wstring）仅在 Unicode 限制为 65536 个字符时才方便（即 wchar_t 用于 UCS-2），现在 16 位 Windows wchar_t 用于 UTF-16，1 wchar_t=1 Unicode 字符的优势早已不复存在，因此您拥有使用 UTF-8 也有同样的缺点。恕我直言，现在 Linux 方法是最正确的。（我关于 UTF-16 的另一个答案以及为什么 Windows 和 Java 使用它）

顺便说一下，string 和 wstring 都无法识别编码，因此您无法可靠地使用这两个中的任何一个操作 Unicode 代码点。我听说 wxWidgets 工具包中的 wxString 可以很好地处理 UTF-8，但我从未对此进行过广泛的研究。

实际上，正如下面指出的，内核的目标是与编码无关，即将字符串视为（NUL 终止？）字节的不透明序列（这就是为什么使用“较大”字符类型（如 UTF-16）的编码不能被用过的）。另一方面，无论何时进行实际的字符串操作，都会使用当前的区域设置，并且默认情况下，在几乎所有现代 Linux 发行版上，它都设置为 UTF-8（这对我来说是一个合理的默认值）。