“high ascii”的正确技术术语是什么？人物？

发布于 2024-08-06 00:59:44 字数 198 浏览 19 评论 0原文

引用“高 ASCII”或“扩展 ASCII”字符的技术上正确的方法是什么？我指的不仅仅是128-255的范围，而是0-127范围之外的任何字符。

它们通常被称为变音符号、重音字母，有时被随意称为“国家”或非英语字符，但这些名称要么不精确，要么只涵盖可能字符的子集。

程序员能够立即认出什么正确、精确的术语？与非技术受众交谈时使用的最佳英语术语是什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

初心未许 2024-08-13 00:59:44

“非 ASCII 字符”

回复收藏 0 原文

橘寄 2024-08-13 00:59:44

127 以上的 ASCII 字符代码未定义。许多不同的设备和软件供应商开发了自己的字符集，值为 128-255。有些人选择绘图符号，有些人选择重音字符，有些人选择其他字符。

Unicode 试图建立一套通用的字符代码，其中包括大多数语言中使用的字符。这不仅包括传统的西方字母，还包括西里尔文、阿拉伯文、希腊文，甚至包括中文、日文、韩文以及许多其他现代和古代语言的字符。

Unicode 有多种实现。最流行的编码之一是 UTF-8。受欢迎的一个主要原因是它向后兼容 ASCII，字符代码 0 到 127 对于 ASCII 和 UTF-8 都是相同的。

这意味着最好说 ASCII 是 UTF-8 的子集。字符代码 128 及以上不是 ASCII。它们可以是 UTF-8（或其他 Unicode），也可以是硬件或软件供应商的自定义实现。

回复收藏 0 原文

时光无声 2024-08-13 00:59:44

您可以创造诸如“trans-ASCII”、“supra-ASCII”、“ultra-ASCII”等术语。实际上，“meta-ASCII”会更好，因为它暗示了元位。

回复收藏 0 原文

萌能量女王 2024-08-13 00:59:44

不代表 ASCII 字符的位序列并不一定是 Unicode 字符。

根据您使用的字符编码，它可能是：

无效的位序列
Unicode 字符
ISO-8859-x 字符
Microsoft 1252 字符
其他字符编码中的字符
错误、二进制数据等

一个定义适合所有这些情况的是：

不是 ASCII 字符

说得非常迂腐，即使是“非 ASCII 字符”也不能完全适合所有这些情况，因为有时超出此范围的位序列可能只是一个无效位序列，而不是一个字符。

回复收藏 0 原文

旧人哭 2024-08-13 00:59:44

我使用的术语是“扩展 ASCII”，意思是“超出原始 0-127 的字符”。

Unicode 是一组可能的扩展 ASCII 字符，并且非常非常大。

UTF-8 是表示 Unicode 字符的方式，与原始 ASCII 向后兼容。

回复收藏 0 原文

木森分化 2024-08-13 00:59:44

摘自在线资源（酷网站），因为我发现它有用并且适合写作和回答。

最初只包含大写字母和数字，但在 1967 年添加了小写字母和一些控制字符，形成了所谓的 US-ASCII，即字符 0 到 127。
因此，这套仅有 128 个字符的字符集于 1967 年作为标准发布，包含了用英语书写所需的所有内容。

1981年，IBM开发了8位ASCII码的扩展，称为“代码页437”，在这个版本中替换了一些过时的控制字符为图形字符。此外还添加了 128 个字符，包括新的符号、符号、图形和拉丁字母，以及用其他语言（例如西班牙语）书写文本所需的所有标点符号和字符。
通过这种方式添加了从 128 到 255 的 ASCII 字符。IBM

在其型号 5150（称为“IBM-PC”）的硬件中包含对此代码页的支持，该型号被认为是第一台个人计算机。
这种型号的操作系统“MS-DOS”也使用了这种扩展的ASCII码。

回复收藏 0 原文