Startseite Rechtssachen

300 GB/s in 2U: Der Dell PowerEdge R7725xd setzt die Erwartungen an die Speicherleistung zurück

Alle Produkte

Gestell-Speicher-Server
(165)

Huawei-Fusions-Server
(31)

Dell Poweredge Server
(59)

H3C-Server
(30)

Datacom-Schalter
(97)

WLAN-Gerät
(21)

Intelligenter drahtloser Router
(10)

Festplattenlaufwerk HDD
(24)

Interne Festplattenlaufwerk SSD
(16)

Grafische Karte Geforce
(27)

INTEL-CPU-Prozessor
(20)

Server-Gedächtnis RAM
(6)

Geüberholter Speicherserver
(6)

SFP-Transceiver-Modul
(4)

Faser-Kanalschalter
(42)

Bescheinigung

China Beijing Qianxing Jietong Technology Co., Ltd. zertifizierungen

Kunden-Berichte

Das Verkaufspersonal von Beijing Qianxing Jietong Technology Co.,Ltd ist sehr Berufs- und geduldig. Sie können Zitate schnell zur Verfügung stellen. Die Qualität und das Verpacken der Produkte ist auch sehr gut. Unsere Zusammenarbeit ist sehr glatt.

—— 》《Festfing DV LLC

Als ich Intel CPU und nach Toshiba SSD dringend suchte, gab Sandy von Beijing Qianxing Jietong Technology Co., Ltd mir viel Hilfe und erhielt mir die Produkte, die ich schnell benötigte. Ich schätze sie wirklich.

—— Kitty Yen

Sandy von Beijing Qianxing Jietong Technology Co.,Ltd ist ein sehr vorsichtiger Verkäufer, der mich an Konfigurationsfehler in der Zeit erinnern kann, als ich einen Server kaufe. Die Ingenieure sind auch sehr Berufs und können den Prüfungsprozeß schnell abschließen.

—— Strelkin Mikhail Vladimirovich

Wir sind sehr zufrieden mit unserer Erfahrung in der Zusammenarbeit mit Beijing Qianxing Jietong. Die Produktqualität ist ausgezeichnet und die Lieferung erfolgt immer pünktlich. Ihr Verkaufsteam ist professionell, geduldig und sehr hilfreich bei all unseren Fragen. Wir schätzen ihre Unterstützung sehr und freuen uns auf eine langfristige Partnerschaft. Sehr empfehlenswert!

—— Ahmad Navid

Qualität: Große Erfahrung mit meinem Lieferanten. Der MikroTik RB3011 war bereits benutzt, aber er war in sehr gutem Zustand und alles funktioniert perfekt.Und alle meine Sorgen wurden schnell gelöst.Ein sehr zuverlässiger Lieferant wird empfohlen.

—— Geran Colesio

Ich bin online Chat Jetzt

300 GB/s in 2U: Der Dell PowerEdge R7725xd setzt die Erwartungen an die Speicherleistung zurück

March 12, 2026

Einige Server verbessern lediglich bestehende Fähigkeiten, während andere völlig neu definieren, was möglich ist und der Dell PowerEdge R7725xd fällt fest in die letztere Kategorie.mit einer Leistung von mehr als 50 W und einer Leistung von mehr als 50 W,, erreichte dieser 2U-Server höhere Rohspeicherleistung als jedes System, das wir jemals ausgewertet haben.und über das Netz, lieferte es 160 GB/s mit Standard-RDMA-Technologie, ohne unnötige Komplexität hinzuzufügen.

Dell PowerEdge R7725xd

Dies ist weit mehr als nur ein schnellerer Speicherserver; es ist ein System, das die Architektur des datenintensiven Computers verändert.Die heutigen KI-Trainings- und Inferenzpipelines sind häufig nicht durch die GPU-Verarbeitungskraft begrenztHochleistungs-GPU-Knoten werden in leeres Betrieb bleiben, wenn Speichersysteme nicht mit ihren Datenanforderungen Schritt halten können.Um diese Einschränkungen zu überwinden, Teams stützen sich oft auf Caches, überfüllte Hardware und komplexe Stufenstrategien, um sicherzustellen, dass Beschleuniger Daten schnell genug erhalten, um ihre Investition zu rechtfertigen.

Der Dell PowerEdge R7725xd löst diesen Engpass an der Wurzel.mit jedem Laufwerk erhalten eine dedizierte PCIe Gen5 x4 Link, der direkt mit dem AMD EPYC CPU-Komplex verbundenEs gibt keine Bandbreite Drosselung von Fan-out-Designs, und kein Midplane-Expander wird verwendet, um die Gleichzeitigkeit zu reduzieren.Die Leistung wird problemlos skaliert, da die Hardware so konstruiert ist, dass der Durchsatz ohne Ressourcenkonflikt aggregiert wirdIn einer typischen 2-Socket-Konfiguration sind die CPUs durch 4 XGMI-Verbindungen für die Kommunikation zwischen den Sockets verbunden.einer dieser Verbindungen wird neu genutzt, um pro CPU 16 zusätzliche PCIe Gen5-Strecken hinzuzufügen, so dass der Server insgesamt 160 PCIe Gen5-Lane ¥96 für die vorderen SSD-Bereiche und 64 für die vier hinteren PCIe-Slots hat. When paired with Micron’s 9550 PRO SSDs—designed for sustained write workloads and high endurance—the system becomes a high-throughput data engine capable of supporting checkpoint-heavy and continuous streaming workloads.

Wir implementierten PEAK:AIO auf dieser Architektur, um parallele Einreichungspfade zu nutzen und die Effizienz zu erhalten, wenn die Gleichzeitigkeit zunimmt.Das Ergebnis war nicht nur eine beeindruckende Spitzenleistung, sondern auch eine gleichbleibende, anhaltende Leistung unter schweren Belastungen. Die Plattform kann als lokaler Ausführungsknoten für die Vorverarbeitung, Ausbildung oder Datentransformation fungieren oder einen Hochbandbreitenspeicher für mehrere GPU-Systeme über das Netzwerk bereitstellen.Für diejenigen, die Grenzen überschreiten wollen, kann es sogar beide Aufgaben gleichzeitig erledigen.

Wichtige Erkenntnisse

Unerhörter Durchsatz in einem einzigen Knoten:Der R7725xd erhielt über 300 GB/s interne Bandbreite und 160 GB/s über NVMe-oF RDMA und konkurrierte damit mit Multi-Node-Speicherclustern innerhalb eines 2U-Chassis.
Wahre Architektur der 5. Generation, ohne Schalter, ohne Fan-Out:Alle 24 Micron 9550 PRO SSDs erhalten dedizierte x4 PCIe Gen5-Lane direkt vom CPU-Komplex, so dass die Line-Rate-Skalierung ohne Streit möglich ist.
Betrieben von AMD EPYC 9005 Serie:Dual AMD EPYC 9575F Prozessoren bieten die Spurenzahl, die Speicherbandbreite und die NUMA-Topologie, die für eine nachhaltige Hochkonkurrenz-E/A erforderlich sind.
Für KI, Analytics und Checkpoint-Heavy Workloads entwickelt:Das System beseitigt die I/O-Flaschenhalse, die moderne GPU-Pipelines behindern, und ermöglicht eine kontinuierliche Datenübertragung mit hoher Bandbreite.
PEAK:AIO entsperrt volle Parallelismus:PEAK: Der Software-Stack von AIO hält die Warteschlange unter Belastung gesättigt und liefert Unternehmensleistung mit einem überzeugenden Dollar-pro-GB-Verhältnis.

Speziell für den NVMe-Durchsatz entwickelt

Unter den Server der neuesten Generation hat sich Dell von der Einbindung von PCIe-Switches in speicherdichte Server-Setups abgewandelt. Modelle wie die PowerEdge R770 und R7725 verfügen über PCIe Gen5 x4 Bays,Unterstützung von Konfigurationen mit bis zu 16 SSDsServer der vorherigen Generation wie der PowerEdge R760 enthalten einen PCIe-Switch in 24-Bay NVMe-Konfigurationen.Um die Erstellung zu optimieren und die Komplexität von PCIe-Switches zu beseitigenIn den letzten Jahren haben die neueren Server einen Ansatz zur Verringerung der Anzahl der PCIe-Strecken in Speicherdichten-Konfigurationen übernommen.

Der Hauptunterschied zwischen dem Standard-R7725 und dem R7725xd liegt darin, wie die Plattformen PCIe-Root-Komplex-Ressourcen zuweisen.und Allzweck-E/A. Die Variante xd verlagert dieses Ressourcenbudget um, um das NVMe-Subsystem zum primären Verbraucher von PCIe-Bandbreite zu machen.mit jeder SSD, die ihren eigenen x4 Endpunkt erhält, anstatt eine gemeinsame Uplink, die über einen PCIe-Switch oder einen Re-Timer-Baum zur Verfügung gestellt wirdDies gewährt jedem Laufwerk unabhängige Warteschlange und unabhängige DMA-Wege, die zum Speichercontroller führen.

Die Backplane- und Riser-Topologie spiegelt diesen Fokus auf NVMe-Performance wider.Also hat jeder Prozessor die direkte Kontrolle über einen Teil des LaufwerksIn der Praxis erzeugt dies zwei symmetrische NVMe-Domänen, jede mit lokalen Latenzmerkmalen und vollständiger Lese-/Schreibkonkurrenz.die Platzierung ihrer Slots ermöglichte es jedem NIC, sich in einer PCIe-Domäne mit der entsprechenden NVMe-Gruppe auszurichtenUnter NVMe-over-RDMA bedeutete dies, dass der Netzwerkverkehr lokal auf dem Socket blieb, das die zugehörigen Laufwerks-E/A-Einträge verwaltet,Vermeidung des Inter-Socket-Infinity Fabric-Hops, der normalerweise eine Latenzzeit erhöht und Bandbreite unter starker Last verbraucht.

Die thermische Leistung unterstützt auch eine nachhaltige Durchsatzleistung.2 bleibt eine herausragende Wahl in dichten Gen5 Konfigurationen, weil es einen definierten Luftstromkanal und vorhersehbare Heatsink Oberfläche für jedes GerätDie hochdruckfähigen Lüftermodule und die Fahrwerkskanäle des R7725xd ̇ halten den Luftstrom in allen 24 Schachten stabil und ermöglichen den kontinuierlichen Betrieb von Volllaufschreibarbeiten ohne Drosselung.Das mechanische Design ergänzt die elektrische ArchitekturJeder Antrieb kann die volle Leistung aufrechterhalten, weil die Plattform so konstruiert ist, dass 24 gleichzeitige Gen5-Geräte unter Last gekühlt werden können.

Diese Kombination aus Wurzel-Komplex-Ausrichtung, konsistenten nicht einheitlichen Speicherzugangs (NUMA) -Lane-Layout, socketbewusster NIC-Platzierung und thermisch stabiler U.2 Verpackung ermöglicht es dem System, die Linienrate der E/A im Maßstab zu erreichenDie Architektur beseitigt Engpässe und maximiert das Leistungspotenzial.

Dell PowerEdge R7725xd iDRAC 10 Übersicht

Wie viele andere Plattformen der 17. Generation, die wir getestet haben, verfügt diese Generation des R7725xd über die neue iDRAC 10-Plattform von Dell, die als zentraler Knotenpunkt für Remote-Management, Gesundheitsüberwachung,und außerhalb der Bandbreite. Die Dashboard-Ansicht bietet einen sofortigen Überblick über den allgemeinen Systemzustand, den Speicherstatus und die jüngste Aktivität.Bestätigung, dass der Server wie erwartet arbeitetDie wichtigsten Systemdetails, einschließlich Modell, Hostname, BIOS-Version, iDRAC-Firmware-Level, IP-Adresse und Lizenzinformationen, werden auf der rechten Seite der Schnittstelle angezeigt.

Das Dashboard enthält auch eine Aufgabenzusammenfassung, die abgeschlossene, ausstehende und laufende Vorgänge zeigt.Ein Protokoll der jüngsten Ereignisse erfasst Chassis-Eindringlingswarnungen und Stromversorgungsmeldungen.Die virtuelle Konsole befindet sich in der unteren rechten Ecke und ermöglicht eine vollständige Fernsteuerung der KVM.

Der Speicherabschnitt von iDRAC 10 bietet einen vollständigen Überblick über alle im R7725xd installierten physischen Festplatten.mit einem visuellen Kreisdiagramm, das die Antriebszustände zeigtIn dieser Konfiguration sind 24 NVMe SSDs aktiv und berichten als bereit, mit zwei zusätzlichen Bootgeräten im System, getrennt von der primären Front-NVMe-Bank.

Da die R7725xd eine direkte NVMe-Architektur ohne herkömmliche RAID-Controller verwendet,Alle Laufwerke werden als nicht-RAID und individuell adressierbar gemeldet und entsprechen dem Design des Systems für große NVMe-Pools und SDS-Plattformen.

Unter der Statussummary wird im Bereich kürzlich protokollierte Speichereignisse die Einfügungsprotokolle für jede PCIe-SSD, organisiert nach Bucht und Slot, aufgeführt.Diese Aufzeichnung bestätigt die ordnungsgemäße Erkennung in allen Antriebsbereichen und hilft, Probleme mit Sitzplätzen zu identifizierenFür große Einsätze sind diese Protokolle nützlich, um die Antriebsbereitstellung zu verfolgen oder zu überprüfen, ob die Kapazität wie erwartet ausgefüllt wurde.

Der letzte Screenshot zeigt die detaillierte NVMe-Geräteansicht innerhalb von iDRAC10. Jedes NVMe-Laufwerk, das im System installiert ist, wird mit seinem Status, seiner Kapazität und seiner Lage aufgelistet.Die Auswahl eines einzelnen Laufwerks eröffnet eine vollständige Aufschlüsselung seiner Eigenschaften.

In diesem Beispiel zeigt die Antriebsinformationsleiste die vollständige Modellfolge, das Geräteprotokoll, den Formfaktor und die ausgehandelten PCIe-Einstellungen an.Die NVMe-Geräte laufen mit 32 GT/s Verbindungsgeschwindigkeit mit einer verhandelten x4 Verbindung, die bestätigt, dass die Laufwerke mit voller Bandbreite auf dem PCIe Gen5-Backplane des Systems betrieben werden.Unterstützung der Administratoren bei der Überwachung der Erwartungen an die Gesundheit und den Lebenszyklus von Fahrzeugen.

Diese granulare Laufwerkberichterstattung ist in NVMe-Konfigurationen mit hoher Dichte wertvoll, bei denen die Linkbreite, die verhandelte Geschwindigkeit und die Mediengesundheit das Verhalten der Arbeitslast und die Speicherleistung direkt beeinflussen.

Insgesamt bietet die iDRAC 10-Schnittstelle eine klare, hardwareorientierte Ansicht der NVMe-Speicherarchitektur von R7725xd, die eine einfache Validierung der Verbindungsgesundheit, des Laufwerksstatus, der Datenübertragung und der Datenübertragung ermöglicht.und Systemintegrität auf einen Blick.

Dell PowerEdge R7725xd Leistung

Vor dem Test wurde unser System mit einer ausgewogenen, aber leistungsstarken Auslastung konfiguriert. Das System ist mit zwei AMD EPYC 9575F-Prozessoren ausgestattet, jeder mit 64 Hochfrequenzkernen,und mit 24 32GB DDR5-DIMMs mit einer Geschwindigkeit von 6400 MT/s verbundenFür die Speicherung ist das Chassis vollständig mit 24 15,36TB Micron 9550 PRO U.2 NVMe SSDs ausgestattet, die jeweils über einen dedizierten PCIe Gen5 x4 Link verbunden sind.und die Micron 9550 PRO-Laufwerke liefern sequentielle Lesegeschwindigkeiten von bis zu 14,000 MB/s und sequentielle Schreibgeschwindigkeiten von bis zu 10.000 MB/s. Das Netzwerk wird durch vier Broadcom BCM57608-Adapter verwaltet, die zusammen acht 200Gb-Ports versorgen,zusammen mit einer BCM57412 OCP NIC mit zwei zusätzlichen 10-Gigabit-Ports.

Prüfsystemspezifikationen

CPU:2x AMD EPYC 9575F 64-Core Hochfrequenzprozessoren
Gedächtnis:24x 32GB DDR5 @ 6400MT/s
Aufbewahrung24x 15,36TB Micron 9550 PRO U.2 Laufwerke (verbundene PCIe Gen5 4x; unterstützt bis zu 128TB Laufwerke heute mit höheren Kapazitäten am Horizont
Netzwerk:4x Broadcom BCM57608 2x200G NICs, 1x BCM57412 2x10Gb OCP NIC
Schalter:Dell PowerSwitch Z9664

FIO-Leistungsbenchmark

Um die Speicherleistung des PowerEdge R7725xd zu messen, haben wir branchenübliche Metriken und das FIO-Tool verwendet.

Zufällige 4K 1M
Sequentielle 4K 1M

FIO ️ Lokal ️ Bandbreite

Beim Testen des lokalen Zugriffs auf die 24 PCIe Gen5 NVMe-Laufwerke im Dell PowerEdge R7725xd,Das System zeigt genau das, was Sie von einer Plattform erwarten, wo jedes Laufwerk mit CPUs verbunden ist, indem eine vollständige x4-Spur PCIe Gen5-Verbindung verwendet wird. Ohne Netzwerkschicht ist dies der reine, interne Durchsatz von Dell's Gen5-Speicherlayout und der PCIe-Bandbreite der AMD EPYC-Plattform, die ohne Einschränkungen funktioniert.

Sequentielle Lesungen beginnen bei 184 GB/s mit 4K-Blöcken und skalieren schnell, wenn die Blockgröße zunimmt.Dies ist ein starker Hinweis darauf, wie gut das System alle 24 × 4 Gen5-Strecken in eine nachhaltige Lesebandbreite ohne Engpässe in der Steuerungsstufe zusammenfassen kann..

Sequentielle Schriften folgen einer anderen Kurve, bleiben aber fest im erwarteten Bereich.Dies entspricht dem Schreibverhalten der Micron 9550 PRO SSDs und dem Überkopf, der mit hochparallelen NVMe-Schriften über so viele unabhängige Geräte verbunden ist.

Das System erreicht Geschwindigkeiten von fast 300 GB/s bei den kleinsten Blockgrößen, sinkt leicht im mittleren Bereich.und erholt sich dann zu oberen 200s und niedrigen 300s bei größeren BlockgrößenBei 1M erreichen die Zufallslesungen ein Maximum von 318 GB/s, was die Fähigkeit der Plattform zeigt, gemischte Operationen gleichmäßig auf alle 24 Laufwerke zu verteilen.

Zufällige Schriften kommen mit einer niedrigeren Geschwindigkeit ein, was für verteilte Metadaten und Schreibzuweisungsaufgaben in einem breiten NVMe-Set typisch ist.Die Ergebnisse bleiben für den größten Teil des Tests im Bereich von 140 bis 160 GB/s und schrumpfen bei 1 M auf knapp 100 GB/s..

FIO Lokal IOPS

Bei der Untersuchung der IOPS-Seite zeigt der R7725xd eine robuste Leistung bei kleinen Blöcken.mit Anforderungsraten, die bis in die Zehntausende von Millionen reichen, bevor größere Blockgrößen die Arbeitsbelastung in Richtung eines bandbreitenbasierten Profils verschieben.

Bei 4K erreichen Lesungen 44,9 Millionen IOPS und Schreibungen 36,3 Millionen.Demonstration der Fähigkeit des Systems, Arbeitslasten mit hoher Warteschlange effizient auf alle Antriebe zu verteilenDiese Werte schrumpfen natürlich ab, wenn die Blockgrößen zunehmen, aber die Progression bleibt durch die 8K-, 16K- und 32K-Bereiche konsistent.

Bei 16K- und 32K-Blöcken liegen die Lesungen bei 17,4 Millionen und 8,35 Millionen IOPS, wobei die zufälligen Lesungen bei 16,5 Millionen und 8,15 Millionen nahe übereinstimmen.Nachverfolgung niedriger, aber stabil über sowohl sequentielle als auch zufällige Zugriffsmuster.

Wenn wir in 64K und höher wechseln, wechseln die Tests von reinen IOPS zu einem Bandbreiten-gebundenen Szenario. IOPS fallen in den niedrigen Millionenbereich und schließlich in die Hunderttausende.Bei einer Blockgröße von 1 M, lesen IOPS Land um 300K, schreibt bei etwa 174K, und zufällige Operationen in der gleichen Nachbarschaft zu beenden.

Insgesamt zeigen die lokalen IOPS-Ergebnisse eindeutig, dass das System sehr hohe Warteschlangendichte in kleinen Blöcken aufrechterhalten kann.Mit vorhersehbarem Skalieren, wenn die Übertragungen wachsen und die Bandbreite zum dominierenden Faktor wird.

PEAK:AIO: Warum der Dell PowerEdge R7725xd dieser Arbeitsbelastung passt

PEAK:AIO ist für Umgebungen konzipiert, die einen extrem schnellen und langfristigen Zugriff auf große Datensätze erfordern, typischerweise für KI-Ausbildungen, Schlussfolgerungspipelines, Finanzmodellierung und Echtzeit-Analysen.Die Plattform nutzt dichten NVMe-Speicher, ausgewogene PCIe-Bandbreite und eine vorhersehbare Latenzzeit in großem Maßstab.Die zugrunde liegende Hardware muss eine anhaltende Durchsatzleistung liefern und gleichzeitig eine gleichbleibende und wiederholbare Leistung unter gleichzeitigen schweren Belastungen aufweisen..

Hier passt sich der Dell PowerEdge R7725xd natürlich an PEAK:AIO an. Die Systemarchitektur ist so konzipiert, dass die Ressourcen von PCIe Gen5 maximiert werden, wodurch die volle Bandbreite der 24 frontmontierten U-Bänder freigegeben wird.2 NVMe-Bäume direkt an die CPUsDieses Layout verleiht PEAK:AIO das Parallelismus- und Latenzprofil, das es von modernen NVMe-basierten Datenpipelines erwartet.Die Systemkonfiguration unterteilte die NVMe-SSDs in zwei RAID0-Gruppen.

Im getesteten Szenario verwendeten wir zwei Client-Systeme, die mit dem R7725xd verbunden waren, jedes mit Broadcom BCM57608 2x 200G NICs ausgestattet.Die R7725xd wird in eine realistische Hochleistungskonfiguration gedrängt, die das Spiegelbild von PEAK zeigt.Diese Netzwerkbandbreite gab uns die Möglichkeit, das NVMe-Subsystem, die PCIe-Topologie,und die CPU ohne Engpässe an der NIC-Schicht miteinander verbunden.

Das Ergebnis ist eine Plattform, die sich effektiv an PEAK:AIO-Workloads anpasst. Der R7725xd bietet dichte NVMe-Kapazität, PCIe Gen5-Durchsatz, zwei AMD EPYC 9005-Prozessoren für Parallelität,und die Netzwerkkapazität, um die Datenzufuhr von mehreren Clients bei Hunderten von Gigabits pro Client zu unterstützenAlle diese Merkmale sind für die Erreichung der Leistungserwartungen von PEAK:AIO wichtig.

PEAK:AIO ️ NVMe-of RDMA ️ Bandbreite

Bei der Untersuchung der NVMe-oF RDMA-Bandbreitenergebnisse auf dem PowerEdge R7725xd mit PEAK:AIO ist der Gesamttrend genau das, was wir von einem System mit so viel PCIe- und Netzwerkbandbreite erwarten.Mit zunehmender Blockgröße, steigt die Durchsatzleistung rasch an, bis sie sich in der Nähe der praktischen Grenze der Plattform ausgleicht.

Bei den kleinen Blockgrößen beginnt die Leistung im mittleren Bereich von 20 GB / s für Lesen und Schreiben, was normal ist, da 4K- und 8K-Transfers den IOPS-Pfad viel härter drücken als den Durchsatzpfad.Sobald wir in die 16K und 32K Blöcke kommen, öffnet sich die Pipeline. Lesen springt auf rund 154 GB/s bei 32K und steigt weiter auf den 160 GB/s Bereich, wo wir eine Dual-Client-Setup über vier 200 Gb/s Links zu Land erwarten würden.

Zufällige Lese-Performance-Spiegel sind nahezu perfekt aufeinander abgestimmt.Also ist die zufällige Lesebandbreite im Wesentlichen eine Folge der sequentiellen Lesebandbreite., bei einer Geschwindigkeit von etwa 159 bis 161 GB/s von 32K bis 1M. Dies deutet darauf hin, dass der Speicherstapel bei gemischten Zugriffsmustern keinen Engpass hat,und die PCIe-Topologie von R7725xd® verteilt die Last gleichmäßig auf die 24 NVMe-Laufwerke der Generation 5.

Die Schreibleistung verfolgt eine ähnliche Kurve, obwohl sie etwas niedriger liegt als die Leseleistung.Abnehmen auf etwa 117 GB/s bei 128K, aber wiederherstellen, wenn die Blockgröße steigt. Zufällige Schreibvorgänge verhalten sich anders und flatten sich näher an 110-117 GB/s, was für Arbeitslasten mit gemischten Warteschlangen normal ist, die zusätzliche Aufwendungen mit sich bringen.

Die wichtigste Erkenntnis aus diesem Abschnitt ist, dass der R7725xd keine Probleme hat, eine extrem hohe Bandbreite über NVMe-oF aufrechtzuerhalten, selbst wenn mehrere Clients das System an seine Grenzen bringen.Sobald die Blockgrößen 32K oder höher erreichen, saturiert der Server seine verfügbare Netzwerk- und Speicherbandbreite konsequent.Diese Ergebnisse sind eine starke Validierung der Skalierbarkeit der Plattform unter realen Bedingungen..

PEAK AIO NVMe-of RDMA IOPS

Auf der IOPS-Seite zeigt der PowerEdge R7725xd eine starke Leistung bei kleinen Blöcken, obwohl wir zunächst niedrigere Zahlen beobachteten als erwartet;Dieses Problem wird voraussichtlich in Zukunft durch eine verbesserte Netzwerktreiberunterstützung behoben.Auch wenn dies in Betracht kommt, erscheint der allgemeine Skalierungstrend genau so, wie sich NVMe-of RDMA typischerweise verhält, wenn die Blockgröße zunimmt.

Bei der kleinsten Blockgröße kann das System mehr als 6 Millionen IOPS über sequentielle und zufällige Arbeitslasten liefern.und zufällig schreiben alle sitzen in ungefähr dem gleichen Bereich bei 4K und 8K, was darauf hindeutet, dass die Front-End-Clients, die PCIe-Infrastruktur und die NVMe-Laufwerke selbst keine Probleme haben, mit der Anforderungsrate Schritt zu halten.

Wenn die Blockgrößen wachsen, beginnt der erwartete Rückgang der IOPS. bei 32K, liest Land um 4,7 Millionen IOPS, während schreibt Spur etwas hinter bei etwa 4,4 Millionen.,Dies entspricht den zusätzlichen Warteschlangen und CPU-Overhead, die durch Mixed-Access-Muster eingeführt werden.

Wenn wir in die großen Blöcke gehen, verringert sich IOPS weiterhin linear, bis wir 256K und 512K Transfers erreichen, wird der Durchsatz zur dominierenden Metrik.und IOPS fällt natürlich in die Mitte der HunderttausendeBei einer Blockgröße von 1 M konvergieren alle Workloads auf 140K-153K IOPS, entsprechend den Bandbreitenzahlen, die wir im vorherigen Abschnitt gesehen haben.

GPUDirect Speicherleistung

Einer der Tests, die wir mit dem R7725xd durchgeführt haben, war der Magnum IO GPUDirect Storage (GDS) Test.GDS ist eine von NVIDIA entwickelte Funktion, mit der GPUs die CPU umgehen können, wenn sie auf Daten zugreifen, die auf NVMe-Laufwerken oder anderen Hochgeschwindigkeitsspeichergeräten gespeichert sind.Anstatt Daten durch die CPU und den Systemspeicher zu leiten, ermöglicht GDS eine direkte Kommunikation zwischen der GPU und dem Speichergerät, wodurch die Latenzzeit erheblich reduziert und der Datendurchsatz verbessert wird.

Wie GPUDirect-Speicher funktioniert

Wenn eine GPU Daten verarbeitet, die auf einem NVMe-Laufwerk gespeichert sind, müssen die Daten traditionell zuerst durch die CPU und den Systemspeicher reisen, bevor sie die GPU erreichen.Da die CPU ein Vermittler wirdGPUDirect Storage beseitigt diese Ineffizienz, indem es der GPU ermöglicht, über den PCIe-Bus direkt auf Daten vom Speichergerät zuzugreifen.Dieser direkte Pfad reduziert die Datenbewegung, was eine schnellere und effizientere Datenübertragung ermöglicht.

KI-Workloads, insbesondere solche, die mit Deep Learning verbunden sind, sind sehr datenintensiv.und jede Verzögerung bei der Datenübertragung kann zu unterbenutzten GPUs und längeren Trainingszeiten führen. GPUDirect Storage löst diese Herausforderung, indem sichergestellt wird, dass Daten so schnell wie möglich an die GPU geliefert werden, die Leerlaufzeit minimiert und die Rechenleistung maximiert wird.

Darüber hinaus ist GDS besonders für Workloads nützlich, bei denen große Datensätze wie Videoverarbeitung, natürliche Sprachenverarbeitung oder Echtzeit-Inferenz gestreamt werden müssen.Durch die Verringerung der Abhängigkeit von der CPU, beschleunigt GDS die Datenbewegung und befreit CPU-Ressourcen für andere Aufgaben, wodurch die Gesamtleistung des Systems weiter verbessert wird.

Neben der Rohbandbreite liefert GPUDirect mit NVMe-oF (TCP/RDMA) auch ultra-niedrige Latenz I/O. Dies stellt sicher, dass die GPUs nie nach Daten hungern, was das System ideal für Echtzeit-KI-Inferenz macht,Analysepipelines, und Videowiederholung.

GDSIO-Lese nachfolgend

Bei der Prüfung von PEAK:AIO mit einem Client, der GDSIO verwendet, zeigt der Leseendurchsatz ein klares Skalierungsmuster, da sowohl die Blockgröße als auch die Threadzahl zunehmen.Dieser einzelne Client war über zwei 400G-Verbindungen verbunden, wodurch die Gesamtleistung auf 90 GB/s begrenzt wird.

Bei kleinsten Blockgrößen und geringen Threadzahlen ist die Leistung bescheiden, mit 4K-Lesungen ab ca. 189 MiB/s bei einem einzelnen Thread.Das System reagiert sofort., drücken 691 MiB/s bei vier Threads und brechen in den Multi-GiB/s Bereich ein, wenn wir in größere Blöcke treten.

Die mittleren Blockgrößen zeigen die stärkste Empfindlichkeit für die Threadzahl. Bei 32K steigt der Durchsatz von 1,3 GiB/s bei einem einzelnen Thread auf fast 20 GiB/s bei 64 Threads.mit nur einem leichten Verjüngung darüber hinausEin ähnliches Muster tritt bei 64K und 128K auf, wobei das System bei geringer Parallelität von niedrigen einstelligen GiB/s auf über 30 GiB/s übergeht, wenn die Arbeitsbelastung wächst.

Sobald wir die größeren Blockgrößen erreicht haben, beginnt sich der Durchsatz zu stabilisieren, wenn sich das System seiner Leistungsgrenze für einen einzelnen Client nähert.Leistungssteigerung von 11 GiB/s bei einem Faden auf etwa 88 GiB/s bei hoher FadenzahlDie 5 MiB- und 10 MiB-Transfers zeigen das gleiche Plateau, das bei 89 ‰ 90 GiB/s liegt, unabhängig davon, ob der Test mit 64, 128 oder 256 Threads ausgeführt wird.

GDSIO schreiben sequenziell

Auf der Schreibseite folgt das Skalierungsverhalten einem ähnlichen Muster wie die Lesungen, jedoch mit etwas niedrigerer Leistung in den meisten Blockgrößen, was bei sequentiellen Schreib-Workloads erwartet wird.Bei den kleinsten BlockgrößenBei vier Threads wächst der Durchsatz auf etwas mehr als 619 MiB/s, bevor er bei acht Threads über 1 GiB/s steigt.

Mittlere Blockgrößen zeigen stärkere Gewinne, wenn die Threadzahl steigt. Bei 32K beginnt der Durchsatz bei knapp 1 GiB/s und wächst bei höheren Threadniveaus auf über 21 GiB/s.Die 64K- und 128K-Bereiche setzen den Trend fort, die sich von niedrigen einstelligen GiB/s auf mittlere 30 GiB/s und 50 GiB/s bewegt, wenn die Arbeitsbelastung paralleler wird.

Größere Übertragungen erfolgen, wenn sich das System in seine natürliche Schreibdurchsatzobergrenze setzt. Bei 1 MiB steigt die Leistung von 13,3 GiB/s bei einem einzelnen Thread auf knapp 90 GiB/s bei hohen Threadzahlen.Die 5 MiB- und 10 MiB-Tests folgen einem ähnlichen Muster, mit Ergebnissen von 90 GiB/s, unabhängig davon, ob das System mit 64, 128 oder 256 Threads läuft.

Neudefinition der Leistung in der Generation 5

Der Dell PowerEdge R7725xd übersteigt die Rolle eines traditionellen Speicherservers; er markiert eine entscheidende Verschiebung in der Art und Weise, wie Bandbreite innerhalb des Rechenzentrums-Racks orchestriert wird.Durch die vollständige Vermeidung von PCIe-Switches und die Bereitstellung jedes NVMe-LaufwerksDell hat eine Plattform entwickelt, auf der der Durchsatz linear skaliert wird, das thermische Verhalten vollständig vorhersehbar ist und hohe Konkurrenz als Leistungsvorteil genutzt wird.,statt eine Design-Herausforderung.

In Kombination mit den Micron®s 9550 PRO SSDs und den parallelen E/A-Fähigkeiten der PEAK:AIO Software entwickelt sich der R7725xd von einem dicht gepackten NVMe-Gehäuse zu einer vollwertigen Datenmaschine.In seinem kompakten 2U-Formfaktor, kann der Server nicht nur sein lokales PCIe-Fabric saturieren, sondern auch GPUs per RDMA mit Linienrate speisen oder sogar gleichzeitig Rechen- und Speicherarbeitslasten ausführen.

Dell PowerEdge R7225xd heroDell PowerEdge R7225xd

In realen Szenarien liefert diese leistungsstarke Konfiguration über 300 GB/s internen Durchsatz und 160 GB/s über das Netzwerk.Diese Leistung steht im Vergleich zu viel komplexeren und teureren Multi-Node-SpeicherklusternDas Projekt ist ein überzeugendes Zeugnis für die Kraft der Architektur-Ausrichtung, bei der jede Schicht, vom Rohsilizium bis zur optimierten Software, in derist so konzipiert, dass Effizienz und nachhaltige hohe Bandbreite Priorität haben.

Der R7725xd stellt einen neuen Standard für die Leistung von Single-Node-Speichern in der Generation 5 her.Hochgeschwindigkeits-Analytikinfrastrukturen, oder Checkpoint-intensive Trainingsumgebungen, bietet es einen Einblick in eine Zukunft, in der Systemengpässe der Vergangenheit angehören und bisher unerreichbares Leistungspotenzial freisetzen.

Beibei Qianxing Jietong Technology Co., Ltd.
Sandy Yang, Leiterin der globalen Strategie
WhatsApp / WeChat: +86 13426366826
E-Mail: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com Die Daten werden auf der Website der chinesischen Regierung gespeichert.

Geschäftsfokus:
Vertrieb von IKT-Produkten/Systemintegration und Dienstleistungen/Infrastrukturlösungen
Mit mehr als 20 Jahren Erfahrung im IT-Vertrieb arbeiten wir mit führenden globalen Marken zusammen, um zuverlässige Produkte und professionelle Dienstleistungen zu liefern.
¢Technologie nutzen, um eine intelligente Welt aufzubauen¡Ihr vertrauenswürdiger Dienstleister für IKT-Produkte!

PREV: Neue Dell Technologies PowerVault MD JBODs Tame Datenexplosion

NEXT: Überprüfung der Broadcom MegaRAID 9670W-16i RAID-Karte

Kontaktdaten

Beijing Qianxing Jietong Technology Co., Ltd.

Ansprechpartner: Ms. Sandy Yang

Telefon: 13426366826

300 GB/s in 2U: Der Dell PowerEdge R7725xd setzt die Erwartungen an die Speicherleistung zurück

Gestell-Speicher-Server

Huawei-Fusions-Server

Dell Poweredge Server

H3C-Server

Datacom-Schalter

WLAN-Gerät

Intelligenter drahtloser Router

Festplattenlaufwerk HDD

Interne Festplattenlaufwerk SSD

Grafische Karte Geforce

INTEL-CPU-Prozessor

Server-Gedächtnis RAM

Geüberholter Speicherserver

SFP-Transceiver-Modul

Faser-Kanalschalter

300 GB/s in 2U: Der Dell PowerEdge R7725xd setzt die Erwartungen an die Speicherleistung zurück

Wichtige Erkenntnisse

Dell PowerEdge R7725xd Leistung

FIO-Leistungsbenchmark

FIO ️ Lokal ️ Bandbreite

FIO Lokal IOPS

PEAK:AIO: Warum der Dell PowerEdge R7725xd dieser Arbeitsbelastung passt

PEAK:AIO ️ NVMe-of RDMA ️ Bandbreite

PEAK AIO NVMe-of RDMA IOPS

GPUDirect Speicherleistung

Wie GPUDirect-Speicher funktioniert

GDSIO-Lese nachfolgend

GDSIO schreiben sequenziell

Neudefinition der Leistung in der Generation 5

Gestell-Speicher-Server

12 Server Lenovo ThinkSystem SR630 der Bucht-1U Rackmount Gestell-Server

Gestell-Speicher-Server-Intels Xeon E-2378G ThinkSystem SR250 V2 4SFF Prozessor

Gestell-Speicher-Server Inspur NF5180M6 1U Intels C621A Gestell-Berg-Server

Huawei-Fusions-Server

Gestell-Server 32 DDR4 DIMMs FusionServer 5288 V6 4U 44 3,5 Zoll-Festplatten

Ultra Netzwerkspeicher-Server mit hoher Dichte 1288H V5 des Huawei-Fusions-Server-1U

Neuer Gestell-Server-hybrider greller Speicher Gen OceanStors 5310 Huawei