XOR 运算的 4 字节字对齐

发布于 2024-08-15 15:58:28 字数 235 浏览 13 评论 0原文

在字边界上进行按位运算有什么优势吗？这样做有任何 CPU 或内存优化吗？

实际问题：我正在尝试创建两个结构的异或。假设结构 1 和结构 2 的大小相同，均为 10000 字节。我保留前几百个字节，然后开始 1 和 2 的异或。假设我从 302 开始。这将一次占用 4 个字节并进行 XOR。两个结构的302、303、304和305将被异或。这个循环将重复到10000。

现在，如果我从304开始，是否会有任何性能改进？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

水中月 2024-08-22 15:58:28

是的，使用正确的对齐方式至少有两个优点：

便携性。并非所有处理器都支持非对齐数字。为了获得最大的可移植性，您应该只使用完全对齐（即 N 字节整数从 N 的倍数地址开始）的数字
速度。 AFAIK，即使是支持非对齐数字的处理器，使用对齐数字仍然会更快。

回复收藏 0 原文

巾帼英雄 2024-08-22 15:58:28

过早的优化是万恶之源

只需以简单的方式进行，然后在分析器告诉您优化很重要时进行优化。

是的，如果你正确对齐，你会走得更快。如果您使用 SSE2 向量 XOR 指令，您的速度会更快，在正确对齐的情况下，您将一次执行 16 个字节，并且不会污染缓存。而且您不太可能应该花时间来优化它。

回复收藏 0 原文

空气里的味道 2024-08-22 15:58:28

某些处理器仅允许在 32 位字边界上进行 4 字节操作（有些处理器仅允许在半字边界上进行）。

在这些处理器上，非对齐访问会导致处理器异常（具体取决于 CPU、操作系统和设置），这将导致进程崩溃或操作系统的大量工作。

在其他处理器（例如 x86）上，您只会因为每次操作必须执行两次读取和写入（加上一点移位）而受到性能影响。

请参阅链接文本以查看 ARM CPU 的问题

回复收藏 0 原文

~没有更多了~

关于作者

囍笑

暂无简介

0 文章

0 评论

23 人气

关注发私信

隔纱相望

文章 0 评论 0

关注

昵称有卵用

文章 0 评论 0

关注

梨涡

文章 0 评论 0

关注

蓝咒

文章 0 评论 0

关注

白芷

文章 0 评论 0

关注

樱娆

文章 0 评论 0

友情链接

文江博客

XOR 运算的 4 字节字对齐

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

隔纱相望

昵称有卵用

梨涡

蓝咒

白芷

樱娆

友情链接

XOR 运算的 4 字节字对齐

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

隔纱相望

昵称有卵用

梨涡

蓝咒

白芷

樱娆

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。