printf(“%x”,1) 是否会调用未定义的行为？

发布于 2024-10-11 20:45:33 字数 728 浏览 10 评论 0原文

根据C标准（6.5.2.2第6段）

如果表示被调用函数的表达式的类型不包含原型，对每个参数执行整数提升，并且参数将 float 类型提升为 double 类型。这些称为默认参数促销活动。如果参数的数量不等于参数的数量，则行为未定义。如果函数是用包含原型的类型定义的，并且原型要么以省略号 (, ...) 结尾，要么以后面的参数类型结尾促销与参数的类型不兼容，行为未定义。如果函数定义的类型不包含原型，并且提升后的参数与之后的参数不兼容促销时，行为未定义，但以下情况除外：
一个提升类型是有符号整数类型，另一个提升类型是对应的无符号整数类型，并且该值可以用两种类型表示；
这两种类型都是指向字符类型的限定或非限定版本的指针，或者无效。

因此，一般来说，将 int 传递给需要 unsigned int 的可变参数函数（反之亦然），只要传递的值适合两者类型。然而，printf 的规范如下（7.19.6.1 第 9 段）：

如果转换规范无效，则行为未定义。如果有任何参数是不是相应转换规范的正确类型，行为是未定义。

有符号/无符号不匹配也不例外。

这是否意味着 printf("%x", 1) 会调用未定义的行为？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

故事与诗 2024-10-18 20:45:33

我相信它在技术上是未定义的，因为 %x 的“正确类型”被指定为 unsigned int - 正如您所指出的，有符号/无符号也不例外这里不匹配。

printf 的规则适用于更具体的情况，因此会覆盖一般情况的规则（对于特定覆盖一般情况的另一个示例，通常允许传递 NULL 到需要 const char * 参数的函数，但将 NULL 传递给 strlen() 是未定义的行为。

我说“技术上”，因为我相信考虑到标准中的其他限制，实施需要故意不正常才能导致这种情况出现问题。

回复收藏 0 原文

放我走吧 2024-10-18 20:45:33

不能，因为 %x 格式化的是 unsigned int，而常量表达式 1 的类型是 int，而它的值却可以表示为 unsigned int。该操作不是UB。

回复收藏 0 原文

飞烟轻若梦 2024-10-18 20:45:33

这是未定义的行为，与将整数类型的指针重新解释为相反符号的互补类型的原因相同。不幸的是，这在两个方向上都是不允许的，因为一个方向上的有效表示可能是另一个方向上的陷阱实现。

我看到从有符号到无符号的重新解释可能存在陷阱表示的唯一原因是符号表示的这种变态情况，其中无符号类型只是屏蔽了符号位。不幸的是，从标准 6.2.6.2 开始，这种情况是允许的。
在这样的架构上，有符号类型的所有负值可能是无符号类型的陷阱表示。

在您的示例中，这更加奇怪，因为不允许使用 1 表示无符号类型的陷阱。因此，要使其成为“真实”示例，您必须使用 -1 提出问题。

我认为人们仍然没有为任何架构编写具有这些功能的 C 编译器，因此如果标准的新版本可以废除这种令人讨厌的情况，那么生活肯定会变得更加容易。

回复收藏 0 原文

月亮坠入山谷 2024-10-18 20:45:33

TL;DR 这不是 UB。

作为 n. '代词' m.在此答案中指出，C 标准表示有符号整数类型的所有非负值都具有完全相同的表示形式作为相应的无符号类型，因此只要值在两种类型的范围内，就可以互换使用。

来自 C99 标准 6.2.5 类型 - 第 9 段和脚注 31：

9 有符号整数类型的非负值范围是一个子范围
相应的无符号整数类型，以及表示
每种类型中的相同值是相同的。 31）

31) 相同的表示和对齐要求旨在
暗示作为函数参数的可互换性，返回值
职能和工会成员。

完全相同的文本出现在 C11 标准的 6.2.5 类型 - 第 9 段和脚注 41 中。

回复收藏 0 原文

掩耳倾听 2024-10-18 20:45:33

我相信它是未定义的。具有可变长度参数列表的函数在接受参数时没有隐式转换，因此 1 在传递到 时不会被转换为 unsigned int printf()，导致未定义的行为。

回复收藏 0 原文

°如果伤别离去 2024-10-18 20:45:33

标准的作者通常不会尝试在每个可以想象的极端情况下明确强制行为，特别是当存在 100% 的所有实现共享的明显正确行为，并且没有理由期望任何实现执行其他任何操作时。尽管标准明确要求有符号和无符号类型对于适合两者的值具有匹配的内存表示形式，但从理论上讲，实现可以以不同的方式将它们传递给可变参数函数。该标准并不禁止这种行为，但我没有看到任何证据表明作者有意允许这种行为。最有可能的是，他们根本没有考虑这种可能性，因为从来没有（据我所知）实现过这种方式。

如果代码在有符号值上使用 %x，清理实现可能会发出警告，尽管高质量的清理实现还应该提供一个选项来默默地接受此类代码。如果在诊断/清理模式下使用传递的值，则除了将传递的值处理为无符号或发出警告之外，没有理由执行任何其他操作。虽然标准可能禁止实现将任何在有符号值上使用 %x 的代码视为不可访问，但任何认为实现应该利用这种自由的人都应该被认为是白痴。

专门针对健全的非诊断实现的程序员不必担心在输出“uint8_t”值之类的内容时添加强制转换，但那些代码可能被提供给低级实现的程序员可能希望添加此类强制转换以防止编译器“此类实现可能会带来“优化”。

回复收藏 0 原文

~没有更多了~