如何计算CPU的理论峰值性能
这是我的 cat /proc/cpuinfo
输出:
...
processor : 15
vendor_id : GenuineIntel
cpu family : 6
model : 26
model name : Intel(R) Xeon(R) CPU E5520 @ 2.27GHz
stepping : 5
cpu MHz : 1600.000
cache size : 8192 KB
physical id : 1
siblings : 8
core id : 3
cpu cores : 4
apicid : 23
fpu : yes
fpu_exception : yes
cpuid level : 11
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic ...
bogomips : 4533.56
clflush size : 64
cache_alignment : 64
address sizes : 40 bits physical, 48 bits virtual
power management :
这台机器有两个 CPU,每个 CPU 有 4 个具有超线程功能的核心,因此处理器总数为 16(2 CPU * 4 核心 * 2 超线程)。这些处理器具有相同的输出,为了保持干净,我只显示最后一个的信息并省略标志行中的部分标志。
那么如何以 GFlops 来计算这台机器的峰值性能呢? 让我知道是否应该提供更多信息。
谢谢。
Here is my cat /proc/cpuinfo
output:
...
processor : 15
vendor_id : GenuineIntel
cpu family : 6
model : 26
model name : Intel(R) Xeon(R) CPU E5520 @ 2.27GHz
stepping : 5
cpu MHz : 1600.000
cache size : 8192 KB
physical id : 1
siblings : 8
core id : 3
cpu cores : 4
apicid : 23
fpu : yes
fpu_exception : yes
cpuid level : 11
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic ...
bogomips : 4533.56
clflush size : 64
cache_alignment : 64
address sizes : 40 bits physical, 48 bits virtual
power management :
This machine has two CPUs, each with 4 cores with hyperthreading capability, so the total processor number is 16(2 CPU * 4 core * 2 hyperthreading). These processors have same output, to keep clean, I just show the last one's info and omit part of flags in the flags line.
So how do I calculate the peak performance of this machine in terms of GFlops?
Let me know if more info should be supplied.
Thanks.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您可以查看英特尔导出规范。
图表中的GFLOP通常被称为单芯片的峰值。
E5520 显示为 36.256 Gflop/s。
该单芯片有 4 个具有 SSE 的物理内核。
所以这个 GFLOP 也可以计算为:
2.26GHz*2(相加)*2(SIMD双精度)*4(物理核心) = 36.2。
您的系统有两个 CPU,因此您的峰值为 36.2*2 = 72.4 GFLOP/S。
You can check the Intel export spec.
The GFLOP in the chart is usually referred as the peak of a single chip.
It shows 36.256 Gflop/s for E5520.
This single chip has 4 physical cores with SSE.
So this GFLOP can also be calculated as:
2.26GHz*2(mul,add)*2(SIMD double precision)*4(physical core) = 36.2.
You system has two CPUs, so your peak is 36.2*2 = 72.4 GFLOP/S.
您可以在此网站中找到一个公式:
http://www.novatte.com/our-blog/197-how-to-calculate-peak-theoretical-performance-of-a-cpu-based-hpc-system< /a>
这里的公式:
性能 (GFlops) = (CPU 速度 (GHz) x (CPU 核心数量) x (每个周期的 CPU 指令) x (每个节点的 CPU 数量)。
所以在你的情况下:2.27x4x4x2=72.64 GFLOP/s
请参阅此处了解 CPU 的配置 http://ark.intel.com/products/40200
you can find a formula in this website:
http://www.novatte.com/our-blog/197-how-to-calculate-peak-theoretical-performance-of-a-cpu-based-hpc-system
here the formula:
performance in GFlops = (CPU speed in GHz) x (number of CPU cores) x (CPU instruction per cycle) x (number of CPUs per node).
so in your case: 2.27x4x4x2=72.64 GFLOP/s
see here for the configuration of your CPU http://ark.intel.com/products/40200