当前位置：文江博客话题详情

unsigned int 与 size_t

发布于 2024-07-05 17:57:16 字数 141 浏览 16 评论 0原文

我注意到现代 C 和 C++ 代码似乎几乎到处都使用 size_t 而不是 int/unsigned int - 从 C 字符串函数的参数到STL。我很好奇这样做的原因以及它带来的好处。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

自由如风 2024-07-12 17:57:17

类型 size_t 必须足够大才能存储任何可能对象的大小。 Unsigned int 不必满足该条件。

例如，在 64 位系统中，int 和 unsigned int 可能是 32 位宽，但 size_t 必须足够大才能存储大于 4G 的数字

回复收藏 0 原文

断念 2024-07-12 17:57:17

glibc 手册 0.02 的摘录在研究该主题时也可能相关：

2.4 版之前的 GCC 的 size_t 类型和版本存在潜在问题。 ANSI C 要求 size_t 始终为无符号类型。为了与现有系统的头文件兼容，GCC 将 stddef.h' 中的 size_t 定义为系统 sys/types.h' 定义的任何类型。大多数在“sys/types.h”中定义 size_t 的 Unix 系统，将其定义为有符号类型。库中的某些代码依赖于 size_t 是无符号类型，如果有符号则无法正常工作。

期望 size_t 为无符号的 GNU C 库代码是正确的。 size_t 作为有符号类型的定义不正确。我们计划在2.4版本中，GCC将始终将size_t定义为无符号类型，并且fixincludes'脚本将修改系统的sys/types.h'以免与此发生冲突。

同时，我们通过在编译 GNU C 库时明确告诉 GCC 对 size_t 使用无符号类型来解决这个问题。 `configure' 将自动检测 GCC 用于 size_t 的类型，并在必要时覆盖它。

回复收藏 0 原文

何以畏孤独 2024-07-12 17:57:17

如果我的编译器设置为 32 位，则 size_t 只不过是 unsigned int 的 typedef。如果我的编译器设置为 64 位，则 size_t 只不过是 unsigned long long 的 typedef。

回复收藏 0 原文

戏舞 2024-07-12 17:57:17

size_t 是指针的大小。

所以在32位或者常见的ILP32（整数、长整型、指针）模型中size_t是32位。
而在64位或常见的LP64（长整型，指针）模型中，size_t是64位（整数仍然是32位）。

还有其他模型，但这些是 g++ 使用的模型（至少默认情况下）

回复收藏 0 原文

ぺ禁宫浮华殁 2024-07-12 17:57:16

size_t 类型是无符号整数类型，是 sizeof 运算符（和 offsetof 运算符）的结果，因此保证是足够大以包含系统可以处理的最大对象的大小（例如，8Gb 的静态数组）。

size_t 类型可能大于、等于或小于 unsigned int，并且您的编译器可能会对其进行假设以进行优化。

您可以在 C99 标准第 7.17 节中找到更准确的信息，该草案可在 Internet 上的 pdf 格式，或 C11 标准第 7.19 节，也可作为 pdf 草案。

回复收藏 0 原文

残月升风 2024-07-12 17:57:16

经典 C（Brian Kernighan 和 Dennis Ritchie 在《C 编程语言》，Prentice-Hall，1978 年描述的 C 的早期方言）不提供 size_t。 C 标准委员会引入了 size_t 来消除可移植性问题

embedded.com 上有详细解释（有一个很好的例子）

回复收藏 0 原文

烟酉 2024-07-12 17:57:16

简而言之，size_t 永远不会是负数，并且它可以最大限度地提高性能，因为它被类型定义为无符号整数类型，该类型足够大（但不是太大）来表示最大可能对象的大小在目标平台上。

大小永远不应该为负数，实际上 size_t 是一个无符号类型。另外，由于 size_t 是无符号的，因此您可以存储大约是相应有符号类型中两倍大的数字，因为我们可以使用符号位来表示大小，就像无符号中的所有其他位一样整数。当我们多获得一位时，我们可以将我们可以表示的数字范围乘以大约两倍。

那么，您可能会问，为什么不直接使用 unsigned int 呢？它可能无法容纳足够多的数字。在 unsigned int 为 32 位的实现中，它可以表示的最大数字是 4294967295。某些处理器（例如 IP16L32）可以复制大于 4294967295 字节的对象。

那么，您可能会问，为什么不使用 unsigned long int 呢？它会在某些平台上造成性能损失。标准 C 要求 long 至少占用 32 位。 IP16L32 平台将每个 32 位长实现为一对 16 位字。这些平台上的几乎所有 32 位运算符都需要两条指令（甚至更多），因为它们在两个 16 位块中处理 32 位。例如，移动 32 位长通常需要两条机器指令——一条指令用于移动每个 16 位块。

使用 size_t 可以避免这种性能损失。根据这篇精彩的文章，“类型 size_t 是一个 typedef，它是某些无符号整数类型的别名，通常是 unsigned int 或 unsigned long，但甚至可能是 unsigned long每个标准 C 实现都应该选择足够大的无符号整数（但不会大于所需的大小）来表示目标平台上最大可能对象的大小。

回复收藏 0 原文

夏の忆 2024-07-12 17:57:16

size_t 类型是 sizeof 运算符返回的类型。它是一个无符号整数，能够表示主机支持的任何内存范围的字节大小。它（通常）与 ptrdiff_t 相关，因为 ptrdiff_t 是有符号整数值，因此 sizeof(ptrdiff_t) 和 sizeof(size_t) 相等。

编写 C 代码时，无论何时处理内存范围，您都应该始终使用 size_t。

另一方面，int 类型基本上定义为主机可以用来最有效地执行整数算术的（有符号）整数值的大小。例如，在许多较旧的 PC 类型计算机上，值 sizeof(size_t) 将为 4（字节），但 sizeof(int) 将为 2（字节）。尽管 CPU 可以处理高达 4 GiB 的（逻辑）内存空间，但 16 位算术比 32 位算术更快。

仅当您关心效率时才使用 int 类型，因为它的实际精度在很大程度上取决于编译器选项和机器体系结构。特别是，C 标准指定了以下不变量： sizeof(char) <= sizeof(short) <= sizeof(int) <= sizeof(long) 对程序员可用的精度的实际表示没有其他限制对于这些原始类型中的每一个。

注意：这与 Java 中的不同（Java 实际上指定了“char”、“byte”、“short”、“int”和“long”每种类型的位精度）。

回复收藏 0 原文

~没有更多了~