C++ 中 Unicode 不区分大小写的搜索在 Windows 上

发布于 2024-08-09 00:15:58 字数 533 浏览 10 评论 0原文

我昨天问了类似的问题，但认识到我需要以不同的方式重新调整它。

简而言之：在 Windows 上的 C++ 中，当字符串采用 unicode 格式（宽字符、wchar_t）并且我不知道字符串的语言时，如何对字符串（在另一个字符串内）进行不区分大小写的搜索。我只想知道大海捞针是否存在。针的位置与我无关。

背景：我有一个包含很多电子邮件正文的存储库。这些信息采用不同的语言（日语、德语、俄语、芬兰语；应有尽有）。所有数据都是 Unicode 格式，我将其加载到 C++ 应用程序中的宽字符串 (wchar_t)（主体已进行 MIME 解码，因此在我的调试器中我可以看到实际的日语、德语字符）。我不知道消息的语言，因为电子邮件不包含该详细信息，而且单个电子邮件正文可能包含多种语言的字符。

我正在寻找类似 wcssstr 的东西，但能够以不区分大小写的方式进行搜索。我知道，在不知道文本语言的情况下，不可能 100% 正确地从大写字母转换为小写字母。我想要一个在 99% 可能的情况下都有效的解决方案。

我使用带有 C++、STL 和 Boost 的 Visual Studio 2008。

原文

分享到QQ

分享到微博