计算机体系结构中的字符大小是多少？

发布于 2025-01-10 14:07:15 字数 496 浏览 6 评论 0 原文

这篇关于字长的维基百科文章提供了不同计算机体系结构中字长的表格。它有不同的列，如“整数大小”、“浮点大小”等。我想，整数大小是ALU参数的大小，浮点大小是大小FPU 的参数中，地址解析单位是单个地址表示的位数/位数/位数。字长是处理器使用的数据的自然大小（这仍然有些令人困惑）。

但我想知道表中的 char size 列代表什么？这是理论上可能的最小物体尺寸吗？这是可能的最小对齐吗？对字符大小的数据定义的常见操作是什么？在 x86、x86-64 中，ARM 架构字符大小为 8 位，与最小整数大小相同。但在其他一些架构上，字符大小为 5/6/7 位，这与该架构中的整数大小非常不同。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

我不是你的备胎 2025-01-17 14:07:15

在现代 C 语言中，保证 char 可以独立修改，而不会干扰周围的数据。通常选择最窄的加载/存储指令的宽度。因此，在 Alpha 或字可寻址 CPU 上，char 必须是字大小，否则每个 char 存储都必须编译为包含字的原子 RMW。（而不是在 C11 为该语言引入线程感知内存模型之前，像某些早期编译器实际使用的那样便宜得多的非-原子 RMW。）请参阅现代 x86 硬件不能将单个字节存储到内存中吗？（一般涵盖现代 ISA）和 C++ 内存模型和 char 数组上的竞争条件，以满足 C++11 和 C11 对 char 的要求。

但是历史机器中的维基百科单词和字符大小表显然是<考虑到尺寸，并非如此。（例如，在某些可字寻址的机器上小于一个字，我很确定）。

它是关于软件（和终端等字符 I/O 硬件）如何将机器本机字符编码的多个字符（例如 ASCII、EBCDIC 或更早版本的子集）打包到机器字中。

与这段历史相比，Unicode 和可变长度字符编码（如 UTF-8 和 UTF-16）是最近的发明。 https://en.wikipedia.org/wiki/Character_encoding#History
许多系统使用的每个字符少于 8 位，例如 6 位（64 种独特的编码）对于大写和小写拉丁字母加上一些特殊字符和控制代码就足够了。

这些历史字符集促使编程语言选择使用或不使用某些特殊字符，因为它们是在具有特定字符集的系统上开发的。

历史上的机器确实做过类似将 3 个字符的文本打包成 18 位单词的事情。

您可能想在 https://retrocomputing.stackexchange.com/ 上搜索，甚至在阅读更多内容后在那里提问。