Benchmark Center
Im Vorfeld einer HPC-Beschaffung stehen die Verantwortlichen oftmals vor der Fragestellung, welches System für die eigene Applikation optimal ist. Neben der Leistungsfähigkeit sind die Gesamtkosten und der Energiebedarf der gewählten Lösung entscheidend.
Die praktische Leistungsmessung ist ein wichtiger Aspekt bei der Identifikation von Optimierungspotenzialen. Benchmark-Analysen helfen Ihnen bei der Auswahl der geeigneten HPC-Komponenten. Wir arbeiten daher eng mit den Technologieführern der Branche zusammen und bieten die Möglichkeit, Ihre Applikationen auf aktueller und noch nicht am Markt verfügbarer Hardware zu testen.
Das MEGWARE Benchmark Center bringt dank langjähriger Erfahrung die nötige methodische Kompetenz für aussagekräftige Vergleichszahlen mit. Unsere HPC- und KI-Ingenieure beraten Sie gern hinsichtlich der optimalen Konfiguration und geben Ihnen Remote oder bei uns vor Ort Zugriff auf folgende Hard- und Software:
Zur Verfügung stehende Hardware
- HPC-Server von MEGWARE, Intel, Supermicro, Quanta, Gigabyte und ASUS
- Prozessoren: Intel Xeon Scalable (Granite Rapids, Sapphire Rapids, Ice Lake), AMD EPYC (Bergamo, Genoa, Milan), Huawei ARM v8.2 Kunpen 920
- Beschleuniger: NVIDIA Tesla H100, AMD Radeon Instinct (MI210) und Xilinx Alveo U280
- Parallele Filesysteme von Panasas, IBM Spectrum Scale (GPFS), Lustre und BeegFS mit einer Bandbreite von mindestens 1GB/s
- Infiniband Interconnect EDR oder HDR von NVIDIA Networks und OmniPath von Intel
- DDR4 Speicher von Samsung und Micron
Manufacturer | Type | Cores | Clock in GHz | Quantity |
AMD | EPYC "Genoa" 9334 | 32 | 2,7 | 2 |
AMD | EPYC "Genoa" 9534 | 64 | 2,45 | 4 |
AMD | EPYC "Genoa" 9654 | 96 | 2,4 | 4 |
AMD | EPYC "Milan" 7713 | 64 | 2,0 | 8 |
AMD | EPYC "Milan-X" 7773x | 64 | 2,2 | 8 |
Intel | Xeon "Granite Rapids AP" 6980P | 128 | 2,0 | 4 |
Intel | Xeon "Sapphire Rapids" 8470 | 52 | 2,0 | 8 |
Intel | Xeon "Sapphire Rapids" 8480 | 56 | 2,0 | 4 |
Intel | Xeon Max "Sapphire Rapids HBM" 9468 | 48 | 2,1 | 4 |
Intel | Xeon "IceLake" 8362 | 32 | 2,8 | 2 |
Intel | Xeon "IceLake" 8368 | 38 | 2,4 | 2 |
Intel | Xeon "IceLake" 6346 | 16 | 3,1 | 2 |
Intel | Xeon "IceLake" 8360Y | 36 | 2,4 | 8 |
Huawei | Kunpeng 920-4826 | 48 | 2,6 | 8 |
Manufacturer | Type | Quantity |
AMD | Instinct MI300X | 1 |
AMD | Radeon Instinct MI210 | 2 |
Nvidia | H100 | 2 |
Nvidia | A100 | 4 |
Xilinx Alveo | U280 (PCIe Gen4) | 1 |
Manufacturer | Type | Capacity | Interface | Seq. Read | Seq. Write | Quantity |
Intel | Optane DC P4800X | 375GB | U.2 | 2400MB/s | 2000MB/s | 2 |
Micron | 7500 Pro | 15.3TB | U.3 / PCI Gen4 | 7000MB/s | 5900MB/s | 2 |
Micron | 7500 MAX | 12.8TB | U.3 / PCI Gen4 | 7000MB/s | 5900MB/s | 2 |
Micron | 9400 MAX | 6.4TB | U.3 / PCI Gen4 | 7000MB/s | 7000MB/s | 1 |
SOLIDIGM | D5-P5430 | 15.36TB | U.2 / PCI Gen4 | 7000MB/s | 3000MB/s | 1 |
SOLIDIGM | D7-1010 | 3.84TB | U.2 / PCI Gen5 | 14500MB/s | 8200MB/s | 1 |
SOLIDIGM | D7-1030 | 3.2TB | U.2 / PCI Gen5 | 5200MB/s | 900MB/s | 1 |
Western Digital | SN655 | 7.68TB | U.3 / PCI Gen4 | 6800MB/s | 2000MB/s | 1 |
Manufacturer | Type | Bandwidth | Interface | Quantity |
Cornelis Networks | OmniPath | 100GBit | PCIe3 x16 | 12 |
NVIDIA Networks | Connect-X6 HDR InfiniBand | 200GBit | PCIe4 x16 | 4 |
NVIDIA Networks | Connect-X4 EDR InfiniBand | 100GBit | PCIe3 x16 | 4 |
Zur Verfügung stehende Software
- Betriebssysteme: Linux (RedHat, SUSE) und Windows HPC Server
- Compiler: Intel Cluster Studio, PGI, Open 64, GCC
- MPI-Implementationen: Intel MPI, Open MPI, MVAPICH
- Optimierte Softwarebibliotheken wie ACML und Intel MKL
- Cluster-Managementsoftware ClustWare® von MEGWARE
- Intel Parallel Studio Cluster Edition mit Intel® VTune™ Amplifier XE, Intel® Inspector und Intel® Advisor
- Künstliche Intelligenz / Machine Learning Frameworks: caffe2. cntk, digits, mxnet, pytorch, tensorflow tensorrt, theano, torch
Eine Kurzanalyse führen wir für Sie kostenfrei durch. Weiterführende Benchmarks und Optimierungen berechnen wir nach Aufwand.