char 与 wchar_t

发布于 2024-12-06 05:29:32 字数 579 浏览 7 评论 0原文

我正在尝试打印出 wchar_t* 字符串。代码如下：

#include <stdio.h>
#include <string.h>
#include <wchar.h>

char *ascii_ = "中日友好";  //line-1
wchar_t *wchar_ = L"中日友好";  //line-2

int main()
{
    printf("ascii_: %s\n", ascii_);  //line-3
    wprintf(L"wchar_: %s\n", wchar_);  //line-4
    return 0;
}

//Output
ascii_: 中日友好

问题：

显然我不应该将 CJK 字符分配给第 1 行中的 char* 指针，但我只是这样做了，并且第 3 行的输出是正确的，那么为什么？第 3 行中的 printf() 如何给我非 ASCII 字符？它是否以某种方式知道编码？
我假设第2行和第4行中的代码是正确的，但为什么我没有得到第4行的任何输出？

原文

I'm trying to print out a wchar_t* string.
Code goes below:

#include <stdio.h>
#include <string.h>
#include <wchar.h>

char *ascii_ = "中日友好";  //line-1
wchar_t *wchar_ = L"中日友好";  //line-2

int main()
{
    printf("ascii_: %s\n", ascii_);  //line-3
    wprintf(L"wchar_: %s\n", wchar_);  //line-4
    return 0;
}

//Output
ascii_: 中日友好

Question:

Apparently I should not assign CJK characters to char* pointer in line-1, but I just did it, and the output of line-3 is correct, So why? How could printf() in line-3 give me the non-ascii characters? Does it know the encoding somehow?
I assume the code in line-2 and line-4 are correct, but why I didn't get any output of line-4?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

_蜘蛛 2024-12-13 05:29:32

首先，在源代码中使用非 ASCII 字符通常不是一个好主意。可能发生的情况是中文字符被编码为与 ascii 兼容的 UTF-8。

现在，至于为什么 wprintf() 不起作用。这与流方向有关。每个流只能设置为正常或宽。一旦设定，就无法更改。第一次使用时已设置。（由于printf，这是ascii）。之后，由于方向不正确，wprintf 将无法工作。

换句话说，一旦您使用了 printf()，您就需要继续使用 printf()。同样，如果您从 wprintf() 开始，则需要继续使用 wprintf()。

不能混合使用printf() 和wprintf()。（Windows 上除外）

编辑：

回答有关为什么 wprintf 行甚至无法单独工作的问题。可能是因为代码在编译时将中日友好的UTF-8格式存储到了wchar_中。但是，wchar_t 需要 4 字节 unicode 编码。（Windows 中为 2 字节）

因此，我可以想到两个选项：

不要为 wchar_t 烦恼，而只使用多字节 char。这是最简单的方法，但如果用户的系统未设置为中文语言环境，则可能会失败。
使用 wchar_t，但您需要使用 unicode 转义序列对中文字符进行编码。这显然会使其在源代码中不可读，但它可以在任何可以打印汉字字体的机器上运行，无论语言环境如何。