Während der GTC 2026 präsentierte VDURA wichtige Updates für seine Datenplattform, die darauf ausgelegt sind, die GPU-Auslastung und die Speichereffizienz in KI-Umgebungen zu verbessern. Die Ankündigung umfasst drei Hauptpunkte: die allgemeine Verfügbarkeit von Remote Direct Memory Access (RDMA), eine Vorschau auf die innovative Context-Aware Tiering-Technologie und validierte Infrastrukturkonfigurationen rund um AMD EPYC Turin CPUs und NVIDIA ConnectX-7 Netzwerkkomponenten.
Diese Updates sollen Engpässe bei der Datenbewegung zwischen GPU-Clustern und Speichersystemen beseitigen und gleichzeitig die Datenplatzierung über Speicherebenen hinweg optimieren, um große KI-Trainings- und Inferenz-Workloads besser zu unterstützen – und damit kritische Schwachstellen in moderner KI-Infrastruktur adressieren.
RDMA ermöglicht GPU-Direct-Datenpfade
VDURA hat die RDMA-Unterstützung in seine gesamte Datenplattform integriert, sodass GPU-Server direkt über das Netzwerk auf Speicher zugreifen können, ohne dass die CPU beteiligt ist. Dieser Durchbruch ermöglicht es GPU-zu-Speicher-Datentransfers, traditionelle Kernel- und CPU-gesteuerte Pfade zu umgehen, was die Latenz erheblich reduziert und den Durchsatz steigert – und damit den latenzarmen, hochdurchsatzfähigen Datenpfad liefert, den KI-Trainings- und Inferenz-Workloads in großem Maßstab benötigen.
VDURA Global Namespace
Die RDMA-Implementierung ist eng mit VDURA DirectFlow, der proprietären Datenbewegungs-Schicht des Unternehmens, integriert, um sicherzustellen, dass der gesamte GPU-Serververkehr RDMA nutzt. Durch die Eliminierung von CPU-Overhead im Datenpfad bleiben die Rechenressourcen vollständig den Kernaufgaben des Modelltrainings und der Inferenz gewidmet. Dieser Ansatz erhält höhere GPU-Auslastungsraten bei gleichzeitiger Minimierung der Pipeline-Latenz in verteilten KI-Clustern, was eine wichtige Priorität für groß angelegte KI-Implementierungen darstellt.
Context-Aware Tiering zielt auf die Effizienz der Datenplatzierung ab
VDURA stellte auch die erste Phase seiner Context-Aware Tiering-Funktion vor, die später im Jahr 2026 allgemein verfügbar sein wird. Diese Technologie führt eine intelligente, automatisierte Datenplatzierung über Speicherebenen hinweg ein, basierend auf dem Echtzeit-Workload-Verhalten und den Zugriffsmustern – und geht über statische Richtlinien hinaus, um sicherzustellen, dass Daten genau dort liegen, wo sie am dringendsten benötigt werden.
Die erste Phase erweitert den DirectFlow-Puffer auf lokale NVMe-SSDs, sodass häufig aufgerufene „heiße“ Daten näher an den Rechenressourcen liegen. Dies reduziert die Abhängigkeit von gemeinsam genutztem oder netzwerkgebundenem Speicher für aktive Daten, verbessert die Antwortzeiten für kritische Workloads und optimiert die Leistung weiter.
Darüber hinaus führt die Plattform KVCache-Writeback-Steuerungen ein, die nur persistenzkritische Inferenzdaten selektiv auf dauerhaften Speicher schreiben. Dies minimiert unnötige E/A-Aktivitäten und gewährleistet gleichzeitig die für Produktions-KI-Inferenz-Pipelines erforderlichen Persistenzgarantien, wodurch ein Gleichgewicht zwischen Effizienz und Zuverlässigkeit geschaffen wird.
VDURA führt außerdem ein einheitliches Context Cache Tiering-Framework ein, das DRAM und lokale SSDs umfasst. Dieses Framework ermöglicht Hochgeschwindigkeits-Lese- und Schreibzugriffe, die mit der Leistung von LMCache vergleichbar sind, und eignet sich daher gut für Anwendungsfälle wie die Inferenz von LLMs mit langem Kontext und die Retrieval-Augmented Generation (RAG).
VDURA wies darauf hin, dass zukünftige Phasen von Context-Aware Tiering die anwendungsbezogene Datenplatzierung, die verbesserte Cache-Kohärenz über Knoten hinweg und die Unterstützung für aufkommende Infrastrukturkomponenten wie NVIDIA BlueField-4 DPUs umfassen werden – wodurch die Fähigkeiten der Plattform weiter ausgebaut werden, wenn sich KI-Workloads weiterentwickeln.
Ergänzend zu diesen Software-Verbesserungen stellte das Unternehmen optimierte Plattformkonfigurationen vor, die AMD EPYC Turin-Prozessoren mit NVIDIA ConnectX-7-Netzwerkadaptern kombinieren. Diese Konfigurationen sind speziell darauf ausgelegt, RDMA-fähige Datenpfade zu ergänzen und eine hochdurchsatzfähige, latenzarme Kommunikation zwischen GPU-Clustern und Speichersystemen zu unterstützen – und setzen damit einen neuen Maßstab für GPU-native KI-Infrastruktur.
Fokus auf Full-Stack KI-Datenpipeline
VDURA CEO Ken Claffey betonte den Fokus des Unternehmens auf die Bereitstellung einer KI-Speicherplattform, die die gesamte Datenhierarchie von Speicher bis Langzeitspeicher abdeckt, ohne Kompromisse bei der Leistung einzugehen. Er hob hervor, dass die Plattform RDMA für direkten, CPU-freien Datenzugriff und Context-Aware Tiering zur intelligenten Platzierung von Daten über Speicherebenen hinweg nutzt – Innovationen, die Unternehmen dabei helfen, größere KI-Modelle zu unterstützen, mehr Inferenzanfragen zu bearbeiten und die KI-Infrastruktur zu skalieren und gleichzeitig die Zuverlässigkeitsanforderungen für Produktionsumgebungen zu erfüllen.
Dieser kombinierte Ansatz wurde speziell entwickelt, um größere Modellgrößen zu unterstützen, den Inferenzdurchsatz zu erhöhen und die Gesamteffizienz der Infrastruktur zu verbessern – und das alles unter Einhaltung der Zuverlässigkeits- und Compliance-Standards, die für Produktions-KI-Implementierungen unerlässlich sind.
Verfügbarkeit
Die RDMA-Unterstützung ist ab sofort auf den VDURA V5000 und V7000 Plattformen allgemein verfügbar und kann sofort eingesetzt werden. Phase 1 von Context-Aware Tiering soll später im Jahr 2026 allgemein verfügbar sein, wobei derzeit Early-Access-Programme für ausgewählte Kunden laufen, um die Technologie vor der vollständigen Veröffentlichung zu testen und zu optimieren.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Global Strategy Director
WhatsApp / WeChat: +86 13426366826
E-Mail: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com
Geschäftsschwerpunkt:
ICT-Produktvertrieb/Systemintegration & Services/Infrastrukturlösungen
Mit über 20 Jahren Erfahrung im IT-Vertrieb arbeiten wir mit führenden globalen Marken zusammen, um zuverlässige Produkte und professionelle Dienstleistungen zu liefern.
„Technologie nutzen, um eine intelligente Welt zu bauen“ Ihr vertrauenswürdiger ICT-Produkt-Dienstleister!
Sandy Yang/Global Strategy Director
WhatsApp / WeChat: +86 13426366826
E-Mail: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com
Geschäftsschwerpunkt:
ICT-Produktvertrieb/Systemintegration & Services/Infrastrukturlösungen
Mit über 20 Jahren Erfahrung im IT-Vertrieb arbeiten wir mit führenden globalen Marken zusammen, um zuverlässige Produkte und professionelle Dienstleistungen zu liefern.
„Technologie nutzen, um eine intelligente Welt zu bauen“ Ihr vertrauenswürdiger ICT-Produkt-Dienstleister!



