AMD bringt Instinct MI350-GPUs auf den Markt, um generative KI-Modelle zu beschleunigen

AMDs neue GPUs für KI-Workloads
Während der Veranstaltung Advancing AI 2025 stellte AMD die Grafikprozessoren der Instinct MI350-Serie vor.
Diese neue Generation, die auf der CDNA 4-Architektur und einem 3-Nanometer-Prozessknoten basiert, besteht aus den Modellen MI350X und MI355X.
Beide Modelle verfügen über 288 GB HBM3E-Speicher und eine Bandbreite von 8 TB/s. Dadurch können Modelle mit bis zu 520 Milliarden Parametern auf einer einzigen GPU verarbeitet werden. Der MI355X erreicht bis zu 20 PFLOPs in FP4- und FP6-Präzision bei einem Stromverbrauch von bis zu 1400 W.
Im Vergleich zum Modell MI300X bietet die neue Serie eine bis zu viermal höhere Leistung bei Inferenzaufgaben und eine bis zu 3,5-mal höhere Leistung bei Trainingsmodellen wie Llama 3.1 und DeepSeek R1.
Möglich wird dies durch Verbesserungen der Recheneinheiten, eine erhöhte Speicherbandbreite und neue Datentypen wie FP4, FP6 und FP8.
Auf Effizienz und Skalierbarkeit optimierte Architektur
Die MI350 basieren auf einer Chiplet-Architektur, die aus einem 3-nm-Compute-Die (XCD) und zwei 6-nm-Input/Output-Dies (IOD) besteht, die mittels hybrider 3D-Verpackungstechnologie verbunden sind. Sie integrieren außerdem die vierte Generation von Infinity Fabric und 256 Recheneinheiten.
Das Design unterstützt die GPU-Partitionierung für mehrere Lasten und kann auf Infrastrukturen mit bis zu acht gleichzeitigen Instanzen ausgeführt werden.
eltiempo