当前位置：文江博客话题详情

C 中带有重音字符的 isLetter

发布于 2024-10-31 11:26:26 字数 213 浏览 10 评论 0原文

我想创建（或查找）一个 C 函数来检查 char c 是否是一个字母... 当然，我可以轻松地为 az 和 AZ 执行此操作。

但是，如果测试 c == á,ã,ô,ç,ë 等，我会收到错误

可能这些特殊字符存储在比字符更多的位置...

我想知道：这些特殊字符是如何存储的，我的函数需要接收哪些参数，以及如何接收？我还想知道是否有任何标准函数已经做到了这一点。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

毅然前行 2024-11-07 11:26:26

我认为您正在寻找 iswalpha() 例程：

   #include <wctype.h>

   int iswalpha(wint_t wc);

DESCRIPTION
   The iswalpha() function is the wide-character equivalent of
   the isalpha(3) function.  It tests whether wc is a wide
   character belonging to the wide-character class "alpha".

它确实取决于当前 locale(7) 的 LC_CTYPE，因此它在应该同时正确处理多种类型输入的程序中使用可能并不理想。

I think you're looking for the iswalpha() routine:

   #include <wctype.h>

   int iswalpha(wint_t wc);

DESCRIPTION
   The iswalpha() function is the wide-character equivalent of
   the isalpha(3) function.  It tests whether wc is a wide
   character belonging to the wide-character class "alpha".

It does depend upon the LC_CTYPE of the current locale(7), so its use in a program that is supposed to handle multiple types of input correctly simultaneously might not be ideal.

回复收藏 0 原文

苏大泽ㄣ 2024-11-07 11:26:26

如果您正在使用单字节代码集，例如 ISO 8859-1 或 8859-15（或任何其他 8859-x 代码集），则 isalpha() 函数将完成这项工作，如果您还记得在程序中使用 setlocale(LC_ALL, ""); （或其他合适的 setlocale() 调用）。如果没有这个，程序将在 C 语言环境中运行，该语言环境仅对 ASCII 字符（0x00..0x7F 范围内的 8859-x 字符）进行分类。

如果您使用多字节或宽字符代码集（例如 UTF8 或 UTF16），则需要查看和。

回复收藏 0 原文

看春风乍起 2024-11-07 11:26:26

这些字符的存储方式取决于区域设置。在大多数 UNIX 系统上，它们将存储为 UTF8，而 Win32 计算机可能会将它们表示为 UTF16。 UTF8 存储为可变数量的字符，而 UTF16 则使用代理项对存储 - 因此位于 wchar_t （或 unsigned Short）内（不过顺便说一句，Windows 上的 sizeof(wchar_t) 只有 2（而 *nix 上为 4），因此，如果使用代理对编码（在很多情况下都会如此），您通常需要 2 个 wchar_t 类型来存储 1 个字符。

如前所述，iswalpha() 例程将为您执行此操作，并记录在这里。它应该为您处理特定于区域设置的问题。

回复收藏 0 原文