Der Vektordatenbankanbieter Pinecone hat eine optimierte Lösung vorgestellt, um Token-Einschränkungen und Budgetüberschreitungen für KI-Agenten zu bewältigen. Durch die Übernahme vorberechneter Vektordatensätze können KI-Agenten schnellere Betriebsgeschwindigkeiten erreichen, und das Unternehmen stellt diese optimierten Vektorsätze jetzt für Unternehmensbenutzer bereit.
Ash Ashutosh, CEO von Pinecone, und Edo Liberty, Mitbegründer und CTO von Pinecone, stellten in einem offiziellen Blogbeitrag fest: „KI-Agenten haben den Menschen überholt und sind zum Hauptkonsumenten der modernen Wissensinfrastruktur geworden. In dieser agentengesteuerten KI-Ära führen automatisierte Agenten sich wiederholende Aufgaben aus und geraten oft in starre Brute-Force-Berechnungsschleifen.“ Die Verarbeitung roher Vektordaten führt bei diesen intelligenten Agenten zu inhärenten Ineffizienzen und Engpässen.
Solche technischen Nachteile führen zu stagnierenden Aufgabenerledigungsraten zwischen 50 und 60 %, begleitet von unvorhersehbaren Latenzzeiten und übermäßigen Token-Ausgaben. Die Branche benötigt eine Methode zur Vorverarbeitung von Daten, die auf die kontextbezogenen Szenarien der Agenten zugeschnitten ist, sowie einen effizienten Mechanismus, mit dem Agenten kontextbezogene Daten erhalten können. Pinecone hat die Nexus-Plattform entwickelt, um genau dieser Nachfrage gerecht zu werden.
Die Nexus Knowledge Engine besteht aus zwei Kernmodulen: dem Context Compiler und dem Composable Retriever. Der Kontext-Compiler generiert benutzerdefinierte Datenartefakte – aufgabenspezifische kontextbezogene Datensätze, die aus Rohvektordatenbankdatensätzen erstellt werden. An diese Artefakte werden umfassende Metadaten angehängt, darunter RBAC-Zugriffsbereiche, Versionscodes, Datenquellen und PII-Identifikations-Tags. Basierend auf Quellmaterialien und klaren Aufgabenspezifikationen erstellt der Compiler zunächst maßgeschneiderte Artefakte für vier vordefinierte Agententypen: Vertriebs-, Finanz-, Marketing- und Executive-CEO-Agenten.
Diese intelligenten Agenten nutzen eine spezielle deklarative Abfragesprache namens KnowQL, um mit dem Nexus-System zu kommunizieren. Die Sprache umfasst sechs grundlegende Elemente: Absicht, Filter, Herkunft, Ausgabeform, Vertrauen und Budgetbeschränkungen. Anstatt rohe Vektordaten direkt abzurufen, übermitteln Agenten umfassende KnowQL-Anfragen an die Nexus-Plattform.
Der Composable Retriever von Nexus ist für den Empfang von KnowQL-Anfragen von verschiedenen Agententypen verantwortlich. Es gibt genaue Antworten basierend auf vorab generierten Artefakten zurück, die vom Kontext-Compiler verarbeitet werden. Ein offizielles Schema veranschaulicht deutlich den gesamten Betriebsablauf dieses Mechanismus.
Pinecone Nexus-Umgebung und Prozessablauf.
Die Plattform bietet eine zentralisierte Token-Verbrauchsverwaltung für mehrere Benutzer und unterschiedliche Arbeitslasten. Das einheitliche Dashboard zeigt intuitiv die Token-Nutzung, die Kostenausgaben und den Compliance-Status für eine transparente Überwachung an.
Pinecone erklärte, dass Nexus im Voraus spezialisierte Wissensartefakte vorstrukturiert, kontextualisiert und kompiliert und so Daten vollständig vorbereitet, bevor Agenten Berechnungsaufgaben initiieren.
Im Gegensatz zu herkömmlichen Compilern optimiert der iterative Kontext-Compiler kontinuierlich die Datendarstellung. Es führt experimentelle Modellierungen durch, bewertet die Ergebnisse anhand der Aufgabenziele und konvergiert schließlich zu präzisen Wissensrahmen, die perfekt auf die betrieblichen Anforderungen der Agenten abgestimmt sind. Nachfolgend sind praktische Anwendungsfälle aufgeführt:
-
Handelsvertreter: Sammelt integrierten Transaktionskontext, einschließlich Gong-Anrufprotokolle, Vertriebspipeline-Phasen, wichtige Kunden-E-Mail-Gespräche und aus Slack-Datensätzen extrahierte Wettbewerbsinformationen.
-
Finanzagent: Erzeugt umsatzbezogenen Kontext durch Korrelation von Vertragsklauseln mit Abrechnungszyklen, Nutzungsschwellenwerten und Indikatoren für die Geschäftsausweitung.
-
Marketingagent: Sammelt Attributionsdaten und verknüpft Kampagneninteraktionsaufzeichnungen mit Transaktionserfolgs-/-fehlschlagsprotokollen von Gong sowie Produktqualifizierungssignalen, die aus Benutzerverhaltensdaten abgeleitet werden.
-
CEO-Agent: Fasst abteilungsübergreifende Erkenntnisse zusammen und verknüpft ARR-Schwankungen mit Kundengesundheitswerten, Rekrutierungsfortschritten und Produktentwicklungsmeilensteinen.
Laut den beiden Pinecone-Führungskräften können Nexus-Benutzer von höheren Aufgabenerledigungsquoten, kürzeren Ausführungszyklen, zuverlässigen Ground-Outputs und einem bis zu 90 % geringeren Token-Verbrauch profitieren. Dieses technologische Upgrade realisiert eine strukturelle Optimierung: Es verlagert komplexe Argumentationsberechnungen auf eine unabhängige Wissensschicht, anstatt bei jeder Inferenzanforderung wiederholte Berechnungen auszuführen.
Mehrere Branchenunternehmen, darunter Box, Unstructured, Teradata, LlamIndex und ThoughtFocus, haben offizielle Empfehlungen für die Nexus-Plattform abgegeben.
Gemeinsam mit Nexus hat Pinecone einen brandneuen Marktplatz mit produktionsreifen Wissensanwendungen gestartet. Diese vorgefertigten Lösungen können innerhalb weniger Minuten ohne komplizierte Konfiguration der KI-Infrastruktur bereitgestellt werden. Der Marktplatzkatalog enthält über 90 sofort einsatzbereite Lösungen für die Bereiche Umsatz, Versicherung, Immobilien, Rechtskonformität, Personalwesen und Kundenservice.
Während der Startphase bleibt die Nutzung des Marktplatzes völlig kostenlos, kommerzielle Lösungen von Drittanbietern sind für die baldige Veröffentlichung geplant. Benutzer können über den offiziellen Link auf die Plattform zugreifen.
Pinecone hat außerdem die Preise für seine Vektordatenbanken optimiert, indem es eine kostengünstige Builder-Stufe mit einer monatlichen Gebühr von 20 US-Dollar eingeführt hat. Darüber hinaus hat das Unternehmen seine Cloud-Bereitstellungsabdeckung auf die AWS-Region Europa (Frankfurt) mit der Verfügbarkeitszone eu-central-1 ausgeweitet.
Darüber hinaus wurde die native Volltextsuchfunktion in die Kernvektordatenbank von Pinecone eingebettet, die derzeit in der öffentlichen Vorschau verfügbar ist.
Das Early-Access-Programm für Nexus und KnowQL steht jetzt Unternehmenskunden und Partnern offen. Berechtigte Benutzer sind diejenigen, die agentennative Anwendungen in den Branchen Finanzdienstleistungen, Gesundheitswesen, Rechtsdienstleistungen und Unternehmens-SaaS entwickeln – Szenarien, in denen Agenten komplexe proprietäre Wissensdaten verarbeiten müssen.
Peking Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Global Strategy Director
WhatsApp / WeChat: +86 13426366826
E-Mail: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com
Geschäftsschwerpunkt:
IKT-Produktvertrieb/Systemintegration und -dienste/Infrastrukturlösungen
Mit mehr als 20 Jahren Erfahrung im IT-Vertrieb arbeiten wir mit führenden globalen Marken zusammen, um zuverlässige Produkte und professionelle Dienstleistungen zu liefern.
„Mit Technologie eine intelligente Welt aufbauen“ Ihr vertrauenswürdiger IKT-Produktdienstleister!