当前位置：文江博客话题详情

计算单周期数据路径中的前导零

发布于 2024-08-23 17:55:58 字数 178 浏览 4 评论 0原文

大家可能都知道，MIPS 指令集支持 clz（计数前导零），如下所示：

clz $t0,$t1 计数前导零 t0 = t1 中前导零的数量

我正在 verilog 中编写单周期数据路径，只是想知道 ALU 需要支持什么才能做到这一点...有什么想法吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

左岸枫 2024-08-30 17:55:58

这是一种可能的方法（我忽略输入 0 的情况，这可能最好被视为特殊情况）：

32 位数字中前导零的数量是：
- 前 16 位中前导零的数量（如果前 16 位中有任何非零）；或
- 16，如果高 16 位全为零，则加上低 16 位中前导零的数量
则给出 5 位结果的顶部位（忽略输入 0 的特殊情况...）。
现在您需要找到 16 位数字中前导零的数量，因此再次应用相同的原理。
等等。

在 Verilog 中，它可能看起来像这样：

result[4] = (value[31:16] == 16'b0);
val16     = result[4] ? value[15:0] : value[31:16];
result[3] = (val16[15:8] == 8'b0);
val8      = result[3] ? val16[7:0] : val16[15:8];
result[2] = (val8[7:4] == 4'b0);
val4      = result[2] ? val8[3:0] : val8[7:4];
result[1] = (val4[3:2] == 2'b0);
result[0] = result[1] ? ~val4[1] : ~val4[3];

Here's a possible approach (I'm ignoring the case of an input of 0, which is probably best treated as a special case):

The number of leading zeros in a 32-bit number is either:
- the number of leading zeros in the top 16 bits, if any of the top 16 bits are non-zero; or
- 16, plus the number of leading zeros in the bottom 16 bits, if the top 16 bits are all zero
That gives the top bit of the 5-bit result (ignoring the special case of an input of 0...).
Now you need to find the number of leading zeros in a 16-bit number, so apply the same principle again.
etc.

In Verilog, it might look something like this:

result[4] = (value[31:16] == 16'b0);
val16     = result[4] ? value[15:0] : value[31:16];
result[3] = (val16[15:8] == 8'b0);
val8      = result[3] ? val16[7:0] : val16[15:8];
result[2] = (val8[7:4] == 4'b0);
val4      = result[2] ? val8[3:0] : val8[7:4];
result[1] = (val4[3:2] == 2'b0);
result[0] = result[1] ? ~val4[1] : ~val4[3];

回复收藏 0 原文

乱世争霸 2024-08-30 17:55:58

我能想到的最简单的实现（不是很优化）是根据 32 个（如果是 32 位）掩码检查单词，最长的优先，决定哪个最适合并返回其编号。

类似（伪代码）：

if word == 0: return 32
elsif (word & 1) == 0: return 31
elsif (word & 3) == 0: return 30

等。

The simplest implementation I can think of (not very optimized) is checking the word against 32 (in case of 32-bit) masks, longest first, deciding which fits first and returning its number.

Something like (pseudocode):

if word == 0: return 32
elsif (word & 1) == 0: return 31
elsif (word & 3) == 0: return 30

etc.

回复收藏 0 原文

魂牵梦绕锁你心扉 2024-08-30 17:55:58

构建一个 clz16 单元，它查看 16 位，并具有 4 位结果 (0..15) 和“allzero”输出。将其中两个放在一起制作 clz32，您需要一个多路复用器来选择哪 4 个较低位，以及用于较高 2 个输出位的逻辑位。

clz16是由两片clz8以同样的方式组合而成。 clz8由两个clz4组成。
clz4 只是 <= 4 个输入的三个布尔函数，所以你如何做并不重要，合成器会将其归结为几个门。

这种分层方法比 Matthew Slattery 的级联多路复用器解决方案大，但可能没有那么多（它不需要宽门来切换多路复用器），而且我相信它允许较低的道具。延迟。两种方法都可以通过延迟属性很好地扩展到更大的尺寸（例如 64、128 位）。到 log2(n)。

回复收藏 0 原文

~没有更多了~

关于作者

活泼老夫

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

计算单周期数据路径中的前导零

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

计算单周期数据路径中的前导零

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。