За определяне на производителността на клъстера при изчисления с плаваща запетая е използван стандартния тест LINPACK във варианта му за паралелни архитектури с разпределена памет HPL. Същият тест се използва за оценка на производителността на суперкомпютрите от списъка Top500.
Производителността се измерва на базата на два параметъра на изчислителната машина:
- теоретична производителност
Rpeak
— това е производителността, изчислена като произведение на броя на процесорните ядра по тяхната максимална теоретична производителност; - реална производителност
Rmax
— това е същинската производителност, оценена като сумарен брой операции с плаваща запетая (flops), извършвани за единица време от всички ядра на компютъра.
Поради разликата в производителността на процесорите които се използват в системата Physon, изчислителните възли са разделени на няколко групи:
малка подсистема — 24 ядра (6 процесора Xeon E5335)
голяма подсистема — 160 ядра (40 процесора Xeon 5420)
нова подсистема — 24 ядра (4 процесора Xeon E5-2620 )
съвсем нова подсистема — 24 ядра (2 процесора Xeon E5-2650 v4)
графичен възел — 1024 ядра (2 процесора Tesla M2090)
Производителност на Physon в Gflops:
компонент | брой ядра | Rpeak | Rmax | Ns | ефективност |
---|---|---|---|---|---|
интерактивен възел | 8 | 64 | 51.4 | 37504 | 80.3% |
малка подсистема | 24 | 192 | 154.8 | 64768 | 80.6% |
голяма подсистема | 160 | 1600 | 1302 | 192000 | 81.4% |
нова подсистема | 24 | 384 | 381 | 120000 | 99.2 % |
съвсем нова подсистема | 24 | 729.6 | — | — | — |
общо CPU | 240 | 4301.6 | 3221 | — | — |
графичен възел | 1024 | 1332 | 518 | 30000 | 39 % |
За теста са използвани:
- компилатор: Intel C/C++ Compiler (EM64T), v10.0.23
- BLAS: Intel Math Kernel Library (EM64T), v10.0.1.014
- MPI: OpenMPI, v1.2.1
Реалната производителност надвишава 80% от теоретичната, което се съгласува добре със същото съотношение за други клъстерни системи с InfiniBand връзки.