DapuStor J5060 – Spezifikationen
| J5060 | |
|---|---|
| Kapazität (TB) | 61,44 |
| Formfaktor | U.2 15mm |
| Schnittstelle | PCIe 4.0 x4, NVMe 1.4a, Dual-Port unterstützt |
| Lese-/Schreibbandbreite (128 KB) MB/s | 7400 / 3000 |
| Random Read/Write (4 KB) K IOPS | 1500 / 30 (16 KB) |
| 4K Random Latency (Typ.) L/S µs | 105 (4 KB) / 33 (16 KB) |
| 4K Sequential Latency (Typ.) L/S µs | 7 (4 KB) / 12 (16 KB) |
| Typischer Stromverbrauch (W) | 23 |
| Leerlaufstromverbrauch (W) | 5 |
| Flash-Typ | 3D Enterprise QLC NAND Flash |
| Ausdauer | 0,5 DWPD |
| MTBF | 2 Millionen Stunden |
| UBER | 1 Sektor pro 10^17 Bits gelesen |
| Garantie | 5 Jahre |
DapuStor J5060 – Leistung
Checkpointing
Um die reale Leistung der Dapustor J5060 SSD in KI-Trainingsumgebungen zu bewerten, haben wir das Data and Learning Input/Output (DLIO) Benchmark-Tool verwendet. DLIO wurde vom Argonne National Laboratory entwickelt und ist speziell für die Prüfung von I/O-Mustern in Deep-Learning-Workloads konzipiert. Es liefert Einblicke, wie Speichersysteme Herausforderungen wie Checkpointing, Datenerfassung und Modelltraining bewältigen. Die folgende Grafik zeigt, wie beide Festplatten den Prozess über 99 Checkpoints hinweg verarbeiten. Beim Training von Machine-Learning-Modellen sind Checkpoints unerlässlich, um den Zustand des Modells periodisch zu speichern und den Fortschritt bei Unterbrechungen oder Stromausfällen zu sichern. Dieser Speicherbedarf erfordert eine robuste Leistung, insbesondere unter anhaltenden oder intensiven Workloads.
Die für diese Arbeit gewählte Plattform war unser Dell PowerEdge R760 mit Ubuntu 22.04.02 LTS. Wir haben DLIO Benchmark Version 2.0 aus der Veröffentlichung vom 13. August 2024 verwendet. Unsere Systemkonfiguration ist unten aufgeführt:
- 2 x Intel Xeon Gold 6430 (32 Kerne, 2,1 GHz)
- 16 x 64 GB DDR5-4400
- 480 GB Dell BOSS SSD
- Serielle Kabel Gen5 JBOF
- 61,44 TB Dapustor J5060
- 61,44 TB Solidigm D5-P5336
Um sicherzustellen, dass unser Benchmarking reale Szenarien widerspiegelt, basierten wir unsere Tests auf der LLAMA 3.1 405B-Modellarchitektur. Wir implementierten Checkpointing mit torch.save(), um Modellparameter, Optimizer-Zustände und Layer-Zustände zu erfassen. Unser Setup simulierte ein 8-GPU-System, das eine hybride Parallelitätsstrategie mit 4-Wege-Tensor-Parallelität und 2-Wege-Pipeline-Parallelverarbeitung über die acht GPUs verteilt implementierte. Diese Konfiguration führte zu Checkpoint-Größen von 1.636 GB, repräsentativ für moderne Anforderungen an das Training großer Sprachmodelle.
Insgesamt zeigte die Dapustor J5060 während der Anfangsphase des Tests eine solide Konsistenz mit Zeiten um 575,66 Sekunden für die ersten 33 Checkpoints. Die 5060J konnte eine höhere Leistung aufrechterhalten, bevor die Festplatte zum ersten Mal gefüllt war. Auf der anderen Seite zeigte die Solidigm P5336, obwohl anfangs langsamer als die J5060, eine konsistente Leistung während des weiteren Tests.
Bei Betrachtung der Gesamtdurchschnitte erzielte die Dapustor J5060 eine Zeit von 769,44 Sekunden, während die Solidigm P5336 in 640,17 Sekunden abschloss. Dies platziert die Solidigm P5336 in Bezug auf das schnellere Speichern von Checkpoints vorne.Insgesamt bewältigt die Dapustor J5060 kürzere Operationen gut, hat aber Schwierigkeiten mit anhaltenden Schreibvorgängen über 30 Minuten hinaus. Die Solidigm P5336 ist die bessere Festplatte für konsistente Leistung bei längeren Aufgaben. Diese schwächere Schreibleistung der Dapustor J5060 zeigt sich, wenn sich ihre Checkpointing-Geschwindigkeit im Laufe des Tests verschlechtert.
GPU Direct Storage
GPU Direct Storage ist eine Technologie, die eine direkte Datenübertragung zwischen Speichergeräten und GPUs ermöglicht und die CPU und den Systemspeicher umgeht. Bei der herkömmlichen Datenübertragung werden Daten vom Speicher in den Speicher der CPU gelesen und dann in den Speicher der GPU kopiert. Dieser Prozess beinhaltet mehrere Datenkopien, was zu erhöhter Latenz und reduzierter Leistung führt. Die CPU fungiert als Engpass, da sie die Datenübertragung zwischen Speicher und GPU handhaben muss. GDS eliminiert diesen Engpass, indem es Speichergeräten direkt ermöglicht, Daten in und aus dem Speicher der GPU zu übertragen.
Wir haben jede Kombination der folgenden Parameter in Lese- und Schreib-Workloads systematisch getestet:
Blockgrößen: 1M, 128K, 16K
- IODepth: 128, 64, 32, 16, 8, 4, 1
- Bei der Überprüfung unserer GDSIO-Ergebnisse untersuchen wir die Lese- und Schreibleistung der 61,44 TB Dapustor J5060 und Solidigm P5336.
GDSIO – Sequenzielle Leseleistung
Die Dapustor J5060 erreicht einen Spitzenlesedurchsatz von 4,2 GiB/s bei einer Blockgröße von 1M mit IO-Tiefen von 64 und 128. Bei der kleinsten Blockgröße (16 KB) reicht die Leistung von 0,1 GiB/s bis 0,8 GiB/s mit zunehmender IO-Tiefe. Dies zeigt eine klare Präferenz für größere Blockgrößen mit hohen IO-Tiefen für optimalen Durchsatz. Die Spitzenleistung wird bei großen Blockgrößen erzielt, was die Effizienz der Festplatte bei der Verarbeitung von Massendatenübertragungen zeigt.
Vergleichsweise erreichte die Solidigm P5336 einen ähnlichen maximalen Durchsatz von 4,3 GiB/s bei der gleichen Blockgröße (1M), erreichte diese Leistung jedoch früher bei einer IO-Tiefe von 32 und hielt sie bei höheren IO-Tiefen konstant. Dies deutet auf eine etwas bessere Effizienz bei der Verarbeitung großer Blockgrößen über einen breiteren Bereich von IO-Tiefen für die Solidigm P5336 hin.
Um eine bessere Vergleichsansicht zu geben, haben wir ein Differenzdiagramm, das beide Festplatten vergleicht. Ein grünerer Farbblock zeigt einen Vorteil der Dapustor SSD, während ein Block, der sich zur roten Seite des Spektrums bewegt, eine Schwäche zeigt. Hier übertrifft die J5060 die P5336 bei der Blockgröße 128 KB, mit Ausnahme der IO-Tiefen 4 bis 8. Bei den Blockgrößen 16 KB und 1M sind jedoch Durchsatzabfälle bei höheren IO-Tiefen zu verzeichnen, was auf eine geringere Effizienz in diesen Szenarien hindeutet.
Im Vergleich der sequenziellen Leselatenz hält die Solidigm P5336 durchweg eine geringere Latenz als die Dapustor J5060 bei fast allen Blockgrößen und IO-Tiefen. Bei einer Blockgröße von 16 KB wird der Abstand mit zunehmender Warteschlangentiefe deutlicher: Die J5060 erreicht Spitzenwerte von 2.329 μs bei einer Tiefe von 128, während die P5336 mit 1.365 μs niedriger bleibt. Bei 128 KB führt Solidigm bei den meisten Tiefen erneut, mit Ausnahme von hohen Lasten (4.080 μs bei der J5060 gegenüber 5539 μs bei der P5336) bei Tiefe 128. Bei der Blockgröße 1M erfahren beide Festplatten erwartungsgemäß Latenzerhöhungen, aber die P5336 bleibt etwas besser kontrolliert, mit 29.138 μs gegenüber 29.512 μs bei der höchsten Warteschlangentiefe.
GDSIO – Sequenzielle Schreibleistung
Die Dapustor J5060 zeigt einen konsistenten Schreibdurchsatz von 2,7 bis 2,8 GiB/s für Blockgrößen von 128 KB und 1M über alle IO-Tiefen (außer 128 KB, 1 IO-Tiefe, die 2,2 GiB/s erreichte). Für Blockgrößen von 16 KB reicht die Leistung von 0,5 GiB/s bis 1,4 GiB/s, abhängig von der IO-Tiefe, mit Spitzenwerten von 1,4 GiB/s bei höheren IO-Tiefen.
Im Vergleich dazu schneidet die Solidigm P5336 bei Blockgrößen von 128 KB und 1M besser ab und erreicht Spitzenwerte von 3,2 GiB/s. Bei kleineren Blockgrößen (16 KB) zeigt die Solidigm P5336 ebenfalls eine höhere Leistung und erreicht Spitzenwerte von 1,4 GiB/s bei IO-Tiefen von 16 bis 64. Dies deutet darauf hin, dass die Solidigm P5336 bei Schreibvorgängen mit kleineren Blockgrößen etwas effizienter ist.
Betrachtet man die Differenzansicht, so zeigt sich eine größere Lücke zwischen der Dapustor J5060 und der Schreibleistung der Solidigm P5336. Unser Durchsatzvergleich zeigt, dass die J5060 in den meisten Bereichen hinter der P5336 zurückbleibt, insbesondere bei großen Blockgrößen (1M) über alle IO-Tiefen hinweg. Die Durchsatzabfälle erreichen -0,5 GiB/s bei den 4 IO-Tiefen. Obwohl es bei höheren IO-Tiefen mit Blockgrößen von 128 KB Leistungssteigerungen gibt, sind diese nicht signifikant genug, um die breitere Unterleistung auszugleichen.
Beim Vergleich der sequenziellen Schreiblatenz zwischen der Dapustor J5060 und der Solidigm P5336 zeigen beide Festplatten ein ähnliches Verhalten bei kleineren Blockgrößen wie 16 KB, wobei Solidigm bei niedrigen IO-Tiefen einen leichten Vorteil hat, während Dapustor die Lücke bei höheren Tiefen (64 und 128) schließt. Bei Blockgrößen von 128 KB führt Solidigm bei flachen Warteschlangentiefen erneut, aber Dapustor liefert durchweg eine geringere Latenz mit zunehmender IO-Tiefe, was eine bessere Skalierung unter Last anzeigt. Bei Blockgrößen von 1M behält Solidigm jedoch über alle IO-Tiefen hinweg einen klaren Latenzvorteil und zeigt deutlich schnellere Reaktionszeiten unter schweren sequenziellen Schreib-Workloads. Insgesamt ist die Leistung von Solidigm konsistenter, während die Stärke von Dapustor bei mittelgroßen Blöcken und tieferen Warteschlangen sichtbarer ist.
FIO Workload-Zusammenfassung
Flexible I/O Tester (FIO) ist ein branchenüblicher Benchmark-Tool, der zur Messung der Leistung von Speichergeräten unter einer Vielzahl von Workload-Szenarien verwendet wird. FIO ist für seine Vielseitigkeit und Zuverlässigkeit bekannt und simuliert reale Bedingungen, um Einblicke in die Fähigkeiten und Leistungsgrenzen einer SSD zu geben. StorageReview nutzt FIO, um umfassende Analysen anzubieten, die Durchsatz, Latenz und IOPS über Workload-Muster, Blockgrößen und Warteschlangentiefen hinweg messen.
Angewendete Workloads:
128 KB sequenzielles Lesen und Schreiben
- 64 KB Random Reads und Writes
- 16 KB Random Reads und Writes
- 4 KB Random Reads und Writes
- Diese Workloads repräsentieren ein breites Spektrum von Enterprise-Anwendungsfällen, einschließlich großer sequenzieller Übertragungen, intensiver zufälliger I/O, typisch für Datenbanken, und zufälliger Zugriffe mit kleinen Blöcken, die häufig in virtualisierten Umgebungen vorkommen.
Dieser Leistungsabschnitt fasst die Leistung der Dapustor J5060 über wichtige synthetische Workloads zusammen, einschließlich sequenzieller und zufälliger Lese-/Schreiboperationen bei verschiedenen Blockgrößen und Warteschlangentiefen. Die Metriken werden direkt aus der geparsten Fio-Ausgabe extrahiert und umfassen Bandbreite (MB/s), IOPS und Latenz-Perzentile bis zu 99,9999 %, was Einblicke sowohl in den Durchsatz als auch in das Verhalten am Ende der Verteilung unter Last bietet.
128 KB – Sequenzielle Lese- und Schreibleistung
Laufwerk
| IO-Tiefe | BW (MB/s) | IOPS | 99,0% | 99,9% | 99,99% | Dapustor J5060 Lesen |
|---|---|---|---|---|---|---|
| 8T/32Q | 7.479 | 57.081 | 1,66 ms | 1,81 ms | 2,83 ms | Solidigm P5336 Lesen |
| 8T/32Q | 7.479 | 57.057 | 1,51 ms | 1,66 ms | 1,81 ms | Dapustor J5060 Schreiben |
| 8T/32Q | 3.364 | 23.063 | 0,69 ms | 0,70 ms | 0,70 ms | Solidigm P5336 Schreiben |
| 8T/32Q | 3.364 | 25.669 | 2,67 ms | 3,48 ms | 4,42 ms | Die Dapustor J5060 liefert eine beeindruckende sequenzielle Leseleistung bei 128 KB und erreicht 7,48 GB/s mit präziser Latenzkontrolle, selbst bei höheren Perzentilen. Im Vergleich zur Solidigm P5336 ist der Durchsatz der J5060 im Wesentlichen gleich (7,48 GB/s vs. 7,47 GB/s). Solidigm behält jedoch einen leichten Vorteil bei der Latenzkonsistenz und zeigt eine geringfügig niedrigere Tail-Latenz. |
Bei 128 KB sequenziellen Schreibvorgängen (QD16) erzielt die J5060 eine solide Leistung von 3.023 MB/s mit sehr geringer Latenz. Die Solidigm P5336 übertrifft dies jedoch um eine moderate Marge und erreicht 3.364 MB/s, wenn auch mit einer deutlich höheren Latenz, insbesondere beim 99,99%-Perzentil (4,42 ms vs. bemerkenswert niedrige 0,70 ms der Dapustor). Dies deutet darauf hin, dass die J5060 ein stärkerer Kandidat für latenzempfindliche sequenzielle Schreibszenarien ist.
64 KB – Random Read- und Schreibleistung
Laufwerk
| IO-Tiefe | BW (MB/s) | IOPS | 99,0% | 99,9% | 99,99% | Dapustor J5060 Lesen |
|---|---|---|---|---|---|---|
| 8T/32Q | 847 | 114.058 | 20,05 ms | 21,89 ms | 22,68 ms | Solidigm P5336 Lesen |
| 8T/32Q | 847 | 114.014 | 21,36 ms | 21,89 ms | 22,68 ms | Dapustor J5060 Schreiben |
| 8T/32Q | 847 | 8.151 | 574,6 ms | 708,8 ms | 742,39 ms | Solidigm P5336 Schreiben |
| 8T/32Q | 847 | 13.070 | 196,1 ms | 208,6 ms | 221,24 ms | Bei 64 KB Random Reads (QD256) glänzt die Dapustor J5060 mit einem Durchsatz von fast 7,4 GB/s und gut kontrollierter Latenz. Die Ergebnisse von Solidigm sind sehr ähnlich (7,47 GB/s) mit einer etwas besseren maximalen Perzentil-Latenz. Beide Festplatten schneiden hier außergewöhnlich gut ab, mit minimalen praktischen Unterschieden. |
Bei der Schreibleistung von 64 KB Random hat die J5060 spürbare Schwierigkeiten, mit einem starken Durchsatzabfall auf 534 MB/s und einer erheblichen Latenzerhöhung (742,39 ms bei 99,99 %). Im Vergleich dazu übertrifft die Solidigm P5336 die J5060 deutlich und liefert 857 MB/s und eine drastisch niedrigere Latenz (221,24 ms beim gleichen Perzentil), was sie für latenzempfindliche Anwendungen und anhaltenden Schreibdurchsatz weitaus besser geeignet macht.
16 KB – Random Read- und Schreibleistung
Laufwerk
| IO-Tiefe | BW (MB/s) | IOPS | 99,0% | 99,9% | 99,99% | Dapustor J5060 Lesen |
|---|---|---|---|---|---|---|
| 8T/32Q | 847 | 453.461 | 5,28 ms | 6,39 ms | 8,16 ms | Solidigm P5336 Lesen |
| 8T/32Q | 847 | 453.527 | 5,01 ms | 5,21 ms | 5,47 ms | Dapustor J5060 Schreiben |
| 8T/32Q | 847 | 32.404 | 143,65 ms | 149,94 ms | 181,40 ms | Solidigm P5336 Schreiben |
| 8T/32Q | 847 | 51.724 | 57,9 ms | 65,8 ms | 71,8 ms | Bei der 16 KB Random Read-Workload (QD256) erzielt die Dapustor hervorragende Ergebnisse mit 453K IOPS und kontrollierter Latenz. Die Solidigm P5336 spiegelt diese Leistung im Wesentlichen wider und übertrifft die Dapustor leicht bei der Latenz (5,47 ms vs. 8,16 ms bei 99,99 %), was auf eine etwas bessere Latenzkonsistenz für Solidigm bei intensiven Random Read-Szenarien hindeutet. |
Die 16 KB Random Write-Leistung der Dapustor SSD fällt deutlich auf 32K IOPS ab, und die Latenz steigt auf 181,4 ms (99,99 %). Auch hier übertrifft Solidigm die Dapustor-Festplatte deutlich und liefert 51,7K IOPS und ein dramatisch verbessertes Latenzprofil (71,8 ms bei 99,99 %), was den Vorteil von Solidigm für latenzempfindliche Random Write-Workloads unterstreicht.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Global Strategy Director
WhatsApp / WeChat: +86 13426366826
E-Mail: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com
Geschäftsschwerpunkte:
ICT-Produktvertrieb/Systemintegration & Services/Infrastrukturlösungen
Mit über 20 Jahren Erfahrung im IT-Vertrieb arbeiten wir mit führenden globalen Marken zusammen, um zuverlässige Produkte und professionelle Dienstleistungen zu liefern.
"Technologie nutzen, um eine intelligente Welt aufzubauen" Ihr vertrauenswürdiger ICT-Produkt-Dienstleister!



