如何计算CPU的理论峰值性能

发布于 2024-11-15 00:18:53 字数 975 浏览 2 评论 0原文

这是我的 cat /proc/cpuinfo 输出:

...

processor           : 15
vendor_id           : GenuineIntel
cpu family          : 6
model               : 26
model name          : Intel(R) Xeon(R) CPU           E5520  @ 2.27GHz
stepping            : 5
cpu MHz             : 1600.000
cache size          : 8192 KB
physical id         : 1
siblings            : 8
core id             : 3
cpu cores           : 4
apicid              : 23
fpu                 : yes
fpu_exception       : yes
cpuid level         : 11
wp                  : yes
flags               : fpu vme de pse tsc msr pae mce cx8 apic ...
bogomips            : 4533.56
clflush size        : 64
cache_alignment     : 64
address sizes       : 40 bits physical, 48 bits virtual
power management    :

这台机器有两个 CPU,每个 CPU 有 4 个具有超线程功能的核心,因此处理器总数为 16(2 CPU * 4 核心 * 2 超线程)。这些处理器具有相同的输出,为了保持干净,我只显示最后一个的信息并省略标志行中的部分标志。

那么如何以 GFlops 来计算这台机器的峰值性能呢? 让我知道是否应该提供更多信息。

谢谢。

Here is my cat /proc/cpuinfo output:

...

processor           : 15
vendor_id           : GenuineIntel
cpu family          : 6
model               : 26
model name          : Intel(R) Xeon(R) CPU           E5520  @ 2.27GHz
stepping            : 5
cpu MHz             : 1600.000
cache size          : 8192 KB
physical id         : 1
siblings            : 8
core id             : 3
cpu cores           : 4
apicid              : 23
fpu                 : yes
fpu_exception       : yes
cpuid level         : 11
wp                  : yes
flags               : fpu vme de pse tsc msr pae mce cx8 apic ...
bogomips            : 4533.56
clflush size        : 64
cache_alignment     : 64
address sizes       : 40 bits physical, 48 bits virtual
power management    :

This machine has two CPUs, each with 4 cores with hyperthreading capability, so the total processor number is 16(2 CPU * 4 core * 2 hyperthreading). These processors have same output, to keep clean, I just show the last one's info and omit part of flags in the flags line.

So how do I calculate the peak performance of this machine in terms of GFlops?
Let me know if more info should be supplied.

Thanks.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

疧_╮線 2024-11-22 00:18:53

您可以查看英特尔导出规范
图表中的GFLOP通常被称为单芯片的峰值。
E5520 显示为 36.256 Gflop/s。

该单芯片有 4 个具有 SSE 的物理内核。
所以这个 GFLOP 也可以计算为:
2.26GHz*2(相加)*2(SIMD双精度)*4(物理核心) = 36.2。

您的系统有两个 CPU,因此您的峰值为 36.2*2 = 72.4 GFLOP/S。

You can check the Intel export spec.
The GFLOP in the chart is usually referred as the peak of a single chip.
It shows 36.256 Gflop/s for E5520.

This single chip has 4 physical cores with SSE.
So this GFLOP can also be calculated as:
2.26GHz*2(mul,add)*2(SIMD double precision)*4(physical core) = 36.2.

You system has two CPUs, so your peak is 36.2*2 = 72.4 GFLOP/S.

停顿的约定 2024-11-22 00:18:53

您可以在此网站中找到一个公式:

http://www.novatte.com/our-blog/197-how-to-calculate-peak-theoretical-performance-of-a-cpu-based-hpc-system< /a>

这里的公式:

性能 (GFlops) = (CPU 速度 (GHz) x (CPU 核心数量) x (每个周期的 CPU 指令) x (每个节点的 CPU 数量)。

所以在你的情况下:2.27x4x4x2=72.64 GFLOP/s
请参阅此处了解 CPU 的配置 http://ark.intel.com/products/40200

you can find a formula in this website:

http://www.novatte.com/our-blog/197-how-to-calculate-peak-theoretical-performance-of-a-cpu-based-hpc-system

here the formula:

performance in GFlops = (CPU speed in GHz) x (number of CPU cores) x (CPU instruction per cycle) x (number of CPUs per node).

so in your case: 2.27x4x4x2=72.64 GFLOP/s
see here for the configuration of your CPU http://ark.intel.com/products/40200

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文