RichEdit 中的 Unicode RTF 文本

发布于 2024-08-12 07:09:49 字数 518 浏览 10 评论 0原文

我在使用 RichEdit 控件显示 unicode RTF 文本时遇到问题。我的应用程序是 Unicode，因此所有字符串都是 wchar_t 字符串。
如果我将控件创建为“RichEdit20A”，我可以使用例如 SetWindowText，并且文本将以正确的格式显示。如果我将控件创建为“RichEdit20W”，则使用 SetWindowText 会逐字显示文本，即显示所有 RTF 代码。如果我使用 EM_SETTEXTEX 参数，指定代码页 1200（MSDN 告诉我用于指示 unicode），也会发生同样的情况。
我尝试过使用 StreamIn 函数，但这似乎仅在我以 ASCII 文本进行流式传输时才有效。如果我以宽字符进行流式传输，那么我会在控件中看到空文本。我使用 SF_RTF|SF_UNICODE 标志，MSDN 提示可能不允许这种组合。

那么该怎么办呢？有没有什么方法可以将 Widechars 放入 RichEdit 而不丢失 RTF 解释，或者我是否需要对其进行编码？我考虑过尝试 UTF-8，或者也许使用 RTF 中的编码工具，但我不确定最好的选择是什么。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

眉黛浅 2024-08-19 07:09:50

我最近不得不这样做，并注意到你所做的同样的观察。

看起来，尽管 MSDN 几乎是这么建议的，“RTF”解析器只能使用 8 位编码。所以我最终做的是使用 UTF-8，这是一种 8 位编码，但是仍然可以表示全范围的 Unicode 字符。您可以通过 WideCharToMultiByte()：

PWSTR WideString = /* Some string... */;
DWORD WideLength = wcslen(WideString) + 1;
PSTR Utf8;
DWORD Length;
INT ReturnedLength;

// A utf8 representation shouldn't be longer than 4 times the size
// of the utf16 one.
Length = WideLength * 4;
Utf8 = malloc(Length);
if (!Utf8) { /* TODO: handle failure */ }

ReturnedLength = WideCharToMultiByte(CP_UTF8,
                                     0,
                                     WideString,
                                     WideLength-1,
                                     Utf8,
                                     Length-1,
                                     NULL,
                                     NULL);
if (ReturnedLength)
{
   // Need to zero terminate...
   Utf8[ReturnedLength] = 0;
}
else { /* TODO: handle failure */ }

一旦你有了 UTF-8 格式的它，你就可以这样做：

SETTEXTEX TextInfo = {0};

TextInfo.flags = ST_SELECTION;
TextInfo.codepage = CP_UTF8;

SendMessage(hRichText, EM_SETTEXTEX, (WPARAM)&TextInfo, (LPARAM)Utf8);

当然（我最初忽略了这一点，但虽然我很明确......）：

free(Utf8);

I had to do this recently, and noticed the same sorts of observations you're making.

It seems that, despite what MSDN almost suggests, the "RTF" parser will only work with 8-bit encodings. So what I ended up doing was using UTF-8, which is an 8 bit encoding but still can represent the full range of Unicode characters. You can get UTF-8 from a PWSTR via WideCharToMultiByte():

PWSTR WideString = /* Some string... */;
DWORD WideLength = wcslen(WideString) + 1;
PSTR Utf8;
DWORD Length;
INT ReturnedLength;

// A utf8 representation shouldn't be longer than 4 times the size
// of the utf16 one.
Length = WideLength * 4;
Utf8 = malloc(Length);
if (!Utf8) { /* TODO: handle failure */ }

ReturnedLength = WideCharToMultiByte(CP_UTF8,
                                     0,
                                     WideString,
                                     WideLength-1,
                                     Utf8,
                                     Length-1,
                                     NULL,
                                     NULL);
if (ReturnedLength)
{
   // Need to zero terminate...
   Utf8[ReturnedLength] = 0;
}
else { /* TODO: handle failure */ }

Once you have it in UTF-8, you can do:

SETTEXTEX TextInfo = {0};

TextInfo.flags = ST_SELECTION;
TextInfo.codepage = CP_UTF8;

SendMessage(hRichText, EM_SETTEXTEX, (WPARAM)&TextInfo, (LPARAM)Utf8);

And of course (I left this out originally, but while I'm being explicit...):

free(Utf8);

回复收藏 0 原文

本王不退位尔等都是臣 2024-08-19 07:09:50

RTF 是 ASCII，任何 ASCII 之外的字符都将使用转义序列进行编码。
RTF 1.9.1 规范 ( 2008 年 3 月）

回复收藏 0 原文

骑趴 2024-08-19 07:09:50

看一下 rtf 规范中的 \uN 文字，因此您必须将宽字符串转换为 unicode 字符字符串，例如 \u902?\u300?\u888?
http://www.biblioscape.com/rtf15_spec.htm#Heading9
本例中的数字代表字符十进制代码，问号是在 RichEdit 不支持 unicode (RichEdit v1.0) 的情况下将替换 unicode 字符的字符。

例如，对于 unicode 字符串 L"TIME"，rtf 数据将为“\u84?\u73?\u77?\u69?”

回复收藏 0 原文

~没有更多了~