常见的算术转换——一套更好的规则？

发布于 2024-07-18 20:00:46 字数 751 浏览 8 评论 0 原文

考虑以下代码：

void f(byte x) {print("byte");}
void f(short x) {print("short");}
void f(int x) {print("int");}

void main() {
    byte b1, b2;
    short s1, s2;

    f(b1 + b2); // byte + byte = int
    f(s1 + s2); // short + short = int
}

在 C++、C#、D 和 Java 中，两个函数调用都解析为“int”重载...我已经意识到这是“规范中的”，但为什么语言是这样的是这样设计的？我正在寻找更深层次的原因。

对我来说，结果是能够表示两个操作数的所有可能值的最小类型，例如：

byte + byte --> byte
sbyte + sbyte --> sbyte
byte + sbyte --> short
short + short --> short
ushort + ushort --> ushort
short + ushort --> int
// etc...

这将消除不方便的代码，例如 short s3 = (short) (s1 + s2)，而且 IMO 更直观、更容易理解。

这是 C 时代遗留下来的遗产，还是有更好的理由导致当前的行为？

原文

Consider the following code:

void f(byte x) {print("byte");}
void f(short x) {print("short");}
void f(int x) {print("int");}

void main() {
    byte b1, b2;
    short s1, s2;

    f(b1 + b2); // byte + byte = int
    f(s1 + s2); // short + short = int
}

In C++, C#, D, and Java, both function calls resolve to the "int" overloads... I already realize this is "in the specs", but why are languages designed this way? I'm looking for a deeper reason.

To me, it makes sense for the result to be the smallest type able to represent all possible values of both operands, for example:

byte + byte --> byte
sbyte + sbyte --> sbyte
byte + sbyte --> short
short + short --> short
ushort + ushort --> ushort
short + ushort --> int
// etc...

This would eliminate inconvenient code such as short s3 = (short)(s1 + s2), as well as IMO being far more intuitive and easier to understand.

Is this a left-over legacy from the days of C, or are there better reasons for the current behavior?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

爱她像谁 2024-07-25 20:00:46

引自这篇 MSDN 博客文章：

字节 b = 32；字节 c = 240；整数 i = b +
C; // 我是什么？

在这个奇幻的世界里，我的价值
就16岁了！为什么？因为两人
+ 运算符的操作数都是
字节，因此总和“b+c”计算为
一个字节，结果是 16，因为
整数溢出。（而且，正如我指出的
早些时候，整数溢出是新的
安全攻击向量。）

同样，

int j = -b;

将导致 j 的值为 224
出于同样的原因，而不是 -32。

这真的是你想要的吗？

...

所以无论你如何分割它，你都是
将不得不插入烦人的
演员表。也可以有语言
在安全方面犯错误（迫使你
在你知道的地方插入演员表
溢出不是问题）而不是
宁可沉默（你
可能不会注意到缺少的演员表，直到
您的薪资部门询问您原因
他们的书最终没有加起来
月）。

另外，值得注意的是，添加这些强制转换仅意味着额外的输入，仅此而已。一旦 JIT（或者可能是静态编译器本身）将算术运算简化为基本处理器指令，就没有什么聪明的事情发生了 - 只是数字是否被视为 int 还是 byte< /代码>。

这是一个很好的问题，但是……根本不是一个显而易见的问题。希望现在您已经清楚原因了。

回复收藏 0 原文

揽月 2024-07-25 20:00:46

恕我直言，如果规定移位运算符只能与恒定移位值一起使用（对可变移位量使用移位函数），则一组更好的规则是任何算术表达式的结果应始终评估，就好像它是用最大可能的有符号或无符号类型，前提是可以静态保证给出正确的结果（在最大有符号类型可能不够的情况下，将应用稍微棘手的规则）。如果移位操作数只允许为常量，则可以在编译时很容易地确定任何操作数的最大有意义值可能是什么，因此我认为编译器没有任何充分的理由不考虑如何使用运算符的结果在决定运营商的实施。