In diesem Artikel beschreibe ich technische Details zu Performance, Energieverbrauch, Hintergrundspeicher, Gesamtarchitektur und Hauptspeicher von Tianhe-2, dem derzeit schnellsten Supercomputers der Welt aus China.
Rechenleistung
Der derzeit schnellste Supercomputer heißt „Tianhe-2 (MilkyWay-2)“. Er hat eine theoretische Rechenleistung von 54.902,4 Tflop/s. Er ist damit doppelt so schnell wie der bisher schnellste Rechner Titan – Cray XK7 aus Amerika1.
Energieverbrauch
Er hat dabei einen im Vergleich zu denen anderen Supercomputern im Ranking unter http://top500.org einen hohen Energieverbrauch von 17.808,00 kW2. Er übersteigt damit die Supercomputer auf Platz 2 und 3 um mehr als das Doppelte.
Prozessor
Es werden im Cluster 3 Typen von Prozessoren in Kombination eingesetzt.
Vom Hersteller Intel werden 48.000 GPUs der Art Intel Xeon Phi 31S1P3 mit je 57 Kernen (On-Board) mit je 1,1 GHz eingesetzt. Weiterhin kommen 32.000 CPUs der Art Intel Xeon E5-26924 mit 12 Kernen (On-Chip) von je 2,2 GHz zum Einsatz.
Zudem werden noch 4.096 CPUs der Art Galaxy FT-15005 Frontend-Prozessoren mit 16 Kernen, welche von NUDT (National University of Defense Technology) selbst konstruiert wurden6, eingesetzt. Sie basieren auf SPARC v9 und haben damit eine RISC-Architektur7.
Insgesamt hat der Supercomputer 3.120.000 Kerne 8.
Hauptspeichergröße
Die Größe des gesamten Hauptspeichers beträgt 1.375 TiB 9.
Gesamtarchitektur der Verbindungsstrukturen
Die Verbindung erfolgt über TH Express-210, welche das Fat Tree Netztopologie mit 13 Switches nutzt, um innerhalb des Clusters die Prozessoren und anderen Komponenten miteinander zu verbinden11. Es findet daher eine switchbasierte proprietäre Hochgeschwindigkeitsverbindung statt.
Der Supercomputer besteht aus 125 Racks, welche wiederum 4 Frames enthalten, welche wiederum 32 Knoten enthalten. Insgesamt hat der Supercomputer 16.000 Knoten12.
Aufgrund der unterschiedlichen Prozessortypen handelt es sich um eine hybride Architektur13.
Hintergrundspeicher
Die Anbindung an den Hintergrundspeicher, welcher 12,4 PB beträgt, erfolgt über ein Storage System, welches aus 64 Speicherserven und 256 I/O Nodes besteht. Die I/O Nodes enthalten SSDs14.