За определяне на производителността на клъстера при изчисления с плаваща запетая е използван стандартния тест LINPACK във варианта му за паралелни архитектури с разпределена памет HPL. Същият тест се използва за оценка на производителността на суперкомпютрите от списъка Top500.

Производителността се измерва на базата на два параметъра на изчислителната машина:

  • теоретична производителност Rpeak — това е производителността, изчислена като произведение на броя на процесорните ядра по тяхната максимална теоретична производителност;
  • реална производителност Rmax — това е същинската производителност, оценена като сумарен брой операции с плаваща запетая (flops), извършвани за единица време от всички ядра на компютъра.

Поради разликата в производителността на процесорите които се използват в системата Physon, изчислителните възли са разделени на няколко групи:

малка подсистема — 24 ядра (6 процесора Xeon E5335)

голяма подсистема — 160 ядра (40 процесора Xeon 5420)

нова подсистема — 24 ядра (4 процесора Xeon E5-2620 )

съвсем нова подсистема — 24 ядра (2 процесора Xeon E5-2650 v4)

графичен възел — 1024 ядра (2 процесора Tesla M2090)

Производителност на Physon в Gflops:

компонент брой ядра Rpeak Rmax Ns ефективност
интерактивен възел 8 64 51.4 37504 80.3%
малка подсистема 24 192 154.8 64768 80.6%
голяма подсистема 160 1600 1302 192000 81.4%
нова подсистема 24 384 381 120000 99.2 %
съвсем нова подсистема 24 729.6
общо CPU 240 4301.6 3221
графичен възел 1024 1332 518 30000 39 %

За теста са използвани:

  • компилатор: Intel C/C++ Compiler (EM64T), v10.0.23
  • BLAS: Intel Math Kernel Library (EM64T), v10.0.1.014
  • MPI: OpenMPI, v1.2.1

Реалната производителност надвишава 80% от теоретичната, което се съгласува добре със същото съотношение за други клъстерни системи с InfiniBand връзки.