AMD hat offiziell den Instinct MI350P veröffentlicht, einen neuen PCIe-Beschleuniger, der für Unternehmensbenutzer entwickelt wurde, die eine lokale KI-Inferenz ohne Überholung ihrer bestehenden Rechenzentrumsinfrastruktur anstreben.mit einer Breite von nicht mehr als 15 mmDiese Grafikkarte ist vollständig kompatibel mit herkömmlichen luftgekühlten Servern.Es markiert auch AMDs erste Veröffentlichung eines Instinct-Chips der aktuellen Generation, der seit fast vier Jahren für Standard-Server-Slots entwickelt wurde..
AMD Instinct MI350P
AMDs PCIe-basierte Instinct-Produktlinie blieb nach der Markteinführung des MI210 Anfang 2022 stagnierend. Alle nachfolgenden Generationen, einschließlich des MI300X, MI325X und des OAM-Formats MI350X, wurden in den letzten zehn Jahren in den USA eingeführt.übernommene OAM-Socket-Module, die auf speziellen universellen Sockelplatten montiert sindDiese Module benötigen maßgeschneiderte Gehäuse mit robuster Stromversorgung und Luftstrom, um bis zu acht Beschleuniger der 1.000-Watt-Klasse in einem einzigen Tray zu unterstützen.Solche Hardware-Architektur eignet sich für Hyper-Cloud-Anbieter, die GPU-Racks in großen Mengen kaufen, aber es ist nicht für normale Unternehmen geeignet, die keine maßgeschneiderten KI-Racks für inferenztechnische Aufgaben vor Ort einsetzen möchten oder können.NVIDIA fehlt in diesem Segment an einem hochwertigen PCIe-Konkurrenten auf Serverniveau, sodass AMD vorübergehend die Marktexklusivität behält.
Hardwarevergleich: MI350P gegen MI350X OAM
Der MI350P ist keine abgeschnittene Variante des MI350X; AMD entwickelte einen unabhängigen Stromlinienchip für dieses neue Modell.Der MI350X integriert zwei I/O-Drives, die mit acht Beschleunigerkomplex-Drives (XCDs) gekoppelt sindDer MI350P enthält dagegen eine E/A-Matrix und vier XCDs, was 128 Rechenanlagen entspricht.2 GHz Spitzenuhrfrequenz als höheres Pendant. Die Speicherkonfiguration folgt der gleichen heruntergestuften Spezifikation: vier HBM3E-Stacks (gegenüber acht), ein 4.096-Bit-Speicherbus (gegenüber 8.192-Bit),neben 144 GB Speicherkapazität und 4 TB/s Bandbreite, verglichen mit den 288 GB und 8 TB/s Durchsatz des MI350X.
AMD Instinct MI350P-Architektur
Der Spitzenrechenleistungssatz wird ebenfalls um die Hälfte reduziert. Der MI350P erreicht 4.600 MXFP4 TFLOPS im Vergleich zum MI350X®s 9.2 PFLOPS, zusammen mit 2.300 FP8 TFLOPS im Vergleich zum Premiummodell®s 4.6 PFLOPS.Leistungsindikatoren für BF16, FP16 und andere Präzisionsstandards folgen dem gleichen verhältnismäßigen Rückgang. AMD hat insbesondere sowohl Spitzen- als auch reale Leistungsdaten zur Transparenz veröffentlicht.299 TFLOPS unter MXFP4, 1.529 TFLOPS unter FP8 und 713 TFLOPS unter BF16. Diese praktischen Zahlen spiegeln die tatsächliche Leistung innerhalb einer Leistung von 600 W wider,bei denen Leistungsbeschränkungen und Einschränkungen der Speicherbandbreite die theoretische Spitzenleistung zwangsläufig senken.
Das Redaktionsteam hat die MI350X-Plattform zuvor über das Jumpstart-Programm von Supermicro® ausgewertet und ihre robusten Inferenz-Workload-Fähigkeiten erkannt.Das Team ist bestrebt, den MI350P zu testen., analysiert, wie sich dieser PCIe-Form-Faktor-Beschleuniger im Standard-Commodity-Server-Chassis entwickelt.
Der MI350P verfügt trotz seiner halbierten Siliziumskala nicht über eine Leistungsreduzierung von 50%. Er verfügt über eine Leistungsbewertung von 600 W TBP, was etwa 60% der 1000 W-Grenze des MI350X entspricht.Diese Spitzenleistung erreicht die obere Grenze der PCIe CEM-SpezifikationEin reduzierter Betriebsmodus von 450 Watt ist für Server mit unzureichender Kühlung verfügbar, begleitet von moderaten Leistungsabschnitten.In derselben Leistungsklammer positioniert, der MI350P steht im direkten Wettbewerb mit NVIDIA's H200 NVL und RTX Pro 6000 Server für die Beschaffung von Unternehmen.
Im Gegensatz zu NVIDIA H200s mit NVL4-Hochgeschwindigkeitsverbindungen deaktiviert der MI350P die Infinity Fabric-Exposition.
Luftgekühlter Einsatz von acht GPUs
Als Standard-FHFL-PCIe-Karte mit zwei Steckplätzen ist der MI350P mit bestehenden Unternehmensservern kompatibel.einschließlich der zuvor überprüften Dell PowerEdge XE7740 und HPE ProLiant DL380a Gen12Diese Plattformen sind für 600W-Beschleuniger optimiert und erfordern keine benutzerdefinierten Racks, Flüssigkeitskühlung oder OAM-Basisplatten.
Eine achtkartige MI350P-Konfiguration liefert 1.152 GB HBM3E und 32 TB/s Gesamtbandbreite, die ausreicht, um Billionen-Parameter-Modelle in MXFP4-Präzision in einem luftgekühlten Chassis zu beherbergen.Es opfert spezielle SchuppenstoffeWährend der MI350X für die schnelle Kommunikation zwischen den Modulen Infinity Fabric nutzt, setzt der MI350P ausschließlich auf PCIe Gen5.Diese Architektur eignet sich für Knoten-lokale Tensor-Parallelismus und Knoten-Datenparallelismus für Inferenz, während der auf OAM basierende MI350X bei bandbreitenintensiven KI-Ausbildungsaufgaben weiterhin überlegen ist.
Präzisionsformate
Der MI350P erbt alle Präzisionsformate vom MI350X ohne Upgrades. OCP-Block-Skalierungstypen wie MXFP4, MXFP6 und MXFP8 sind für die Entwicklung von KI-Modellen Mainstream geworden,eine niedriggenaue Ausbildung mit vernachlässigbarem Qualitätsverlust ermöglicht. MXFP4 liefert mehr als doppelt so hohe Geschwindigkeit wie FP8 und viermal so hohen Durchsatz wie BF16. Echte Fälle wie OpenAI gpt-oss und Kimi K2.6 beweisen den Wert der nativen Low-Bit-Quantifizierung.Da MXFP4- und INT4-Gewichte nur 25% des Speicherplatzes von BF16 einnehmen, können Trillionen-Parameter-Modelle innerhalb eines einzigen Acht-GPU-Servers bereitgestellt werden, wodurch umständliche Multi-Node-Cluster für lokale Unternehmen beseitigt werden.
Schlussfolgerung
Die meisten KI-Unternehmen vor Ort sind eher von Leistung, Kühlung, Dichte und Budget als von Rohreinheiten begrenzt.Da NVIDIA in diesem Segment keine PCIe-Server-GPU besitzt, AMD behält vorerst einen klaren Wettbewerbsvorteil.Weitere Informationen sind auf der offiziellen Instinct-Webseite von AMD verfügbar.
Beibei Qianxing Jietong Technology Co., Ltd.
Sandy Yang, Leiterin der globalen Strategie
WhatsApp / WeChat: +86 13426366826
E-Mail: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com Die Daten werden auf der Website der chinesischen Regierung gespeichert.
Geschäftsfokus:
Vertrieb von IKT-Produkten/Systemintegration und Dienstleistungen/Infrastrukturlösungen
Mit mehr als 20 Jahren Erfahrung im IT-Vertrieb arbeiten wir mit führenden globalen Marken zusammen, um zuverlässige Produkte und professionelle Dienstleistungen zu liefern.
¢Technologie nutzen, um eine intelligente Welt aufzubauen¡Ihr vertrauenswürdiger Dienstleister für IKT-Produkte!
Sandy Yang, Leiterin der globalen Strategie
WhatsApp / WeChat: +86 13426366826
E-Mail: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com Die Daten werden auf der Website der chinesischen Regierung gespeichert.
Geschäftsfokus:
Vertrieb von IKT-Produkten/Systemintegration und Dienstleistungen/Infrastrukturlösungen
Mit mehr als 20 Jahren Erfahrung im IT-Vertrieb arbeiten wir mit führenden globalen Marken zusammen, um zuverlässige Produkte und professionelle Dienstleistungen zu liefern.
¢Technologie nutzen, um eine intelligente Welt aufzubauen¡Ihr vertrauenswürdiger Dienstleister für IKT-Produkte!



