KI-Entwicklung mit synthetischen Daten: Nvidia kauft Startup Gretel

Nvidia setzt schon länger auf Tools für synthetische Daten, mit denen Entwickler schneller und kostengünstiger LLMs erstellen und trainieren können. Nun komplettiert die Plattform von Gretel das Nvidia-Portfolio. Die Unternehmensbewertung von Gretel soll bei mehr als 320 Mio. US-Dollar liegen.

Reale Daten werden knapp und sind für das Training von LLMs unter Datenschutzgesichtspunkten auch problematisch. Daher investiert Nvidia-CEO Jensen Huang in das Startup Gretel, das auch als Aussteller bei der GTC 2025-Konferenz von Nvidia dabei war

Nvidia hat Medienberichten zufolge das KI-Startup Gretel gekauft, das sich mit synthetischen Daten beschäftigt. Nvidia will mit dieser Akquisition generativen KI-Dienste für Entwickler bereitstellen und ihre Arbeit beschleunigen. Gretel unterhält große Partnerschaften mit Unternehmen wie Amazon Web Services (AWS), Google Cloud und Microsoft geschlossen und gleichzeitig in den letzten fünf Jahren rund 65 Mio US-Dollar aufgebracht.

Laut einem Bericht von Wired hat Nvidia die Übernahme von Gretel mit Sitz in San Diego, Kalifornien, am 19. März abgeschlossen. Finanzielle Details des Deals sind unbekannt. Gretel soll eine Unternehmensbewertung von über 320 Mio. Dollar haben. Das Startup mit einer Plattform für synthetische Daten beschäftigt rund 80 Mitarbeiter und wurde von einer Gruppe von Ingenieuren und Entwicklern gegründet, die für Google, Red Hat, AWS und die Nationale Sicherheitsbehörde der USA (NSA) tätig waren.

Gretel war auch diese Woche mit einem Stand auf der GTC 2025-Konferenz von Nvidia in San Jose vertreten. Nvidia und Gretel haben bis Redaktionsschluss nicht auf eine Stellungnahme reagiert.

Die Plattform von Gretel nutzt fortschrittliche generative Modelle, um künstliche Daten zu erzeugen, die die statistischen Eigenschaften realer Datensätze beibehalten und gleichzeitig den Datenschutz gewährleisten sollen. Die Plattform von Gretel unterstützt verschiedene Datentypen - wie strukturierte Tabellendaten, Zeitreihendaten und unstrukturierte Texte, die es den Kunden ermöglichen, KI-Modelle zu teilen, zu analysieren und zu entwickeln, ohne sensibles oder proprietäres geistiges Eigentum preiszugeben, so das Unternehmen. Das Startup wird Berichten zufolge in Nvidia eingegliedert.

Gretels Cloud-Partnerschaften mit AWS, Google und Microsoft

Gretel unterhält Partnerschaften mit den großen Cloud-Anbietern wie AWS, Google Cloud und Microsoft, um seine gemeinsamen Kunden bei der Erzeugung hochwertiger, sicherer synthetischer Daten für KI-Lösungen in Unternehmen zu unterstützen. Im Oktober 2024 schlossen sich Google Cloud und Gretel zusammen, um die Generierung synthetischer Daten für Dateningenieure und Datenwissenschaftler zu vereinfachen und zu optimieren.

Ende 2023 gab Gretel eine Partnerschaft mit Microsoft Azure bekannt und trat dem Pegasus-Programm von Microsoft für Startups bei. Ebenfalls Ende 2023 unterzeichnete Gretel eine strategische Kooperationsvereinbarung mit AWS, die darauf abzielt, generative KI-Entwicklung zu beschleunigen und sensible und persönliche Daten zu schützen.

KI-Superstar Nvidia kann die Technologie von Gretel nutzen, um Entwicklern Tools für die Generierung realistischer, datenschutzfreundlicher Datensätze anzubieten. Ebenso werden Trainings und zur Feinabstimmung von KI-Modellen für verschiedene Anwendungen offeriert.

Die Übernahme ergänzt auch Nvidias bestehende Technologien für synthetische Daten, die für das Training großer Sprachmodelle (LLMs) entwickelt wurden. Nvidia bietet bereits seit Jahren Entwicklungstools für die Arbeit mit synthetischen Daten an. Vergangenes Jahr brachte Nvidia seine Nemotron-Familie offener KI-Modelle auf den Markt, die synthetische Trainingsdaten für Entwickler generieren, die diese zum Aufbau oder zur Feinabstimmung von LLMs verwenden können.

Wer ist Gretel?

Gretel wurde von Entwicklern für Entwickler entwickelt und soll mit seinen APIs die Erzeugung anonymisierter und sicherer synthetischer Daten vereinfachen, so dass die Privatsphäre der Nutzer gewahrt und Innovationen schneller umgesetzt werden können.

Entwickler verwenden Gretel, um künstliche, datenschutzfreundliche Versionen ihrer sensiblen Daten zu erstellen und um schnell neue beschriftete Stichproben zu generieren, um begrenzte Trainingsdatensätze für maschinelles Lernen zu erweitern - und das alles auf Abruf. Nach Angaben des Unternehmens nutzen über 150.000 Entwickler Gretel.

Gretel bietet auch eine Anwendungsprogrammierschnittstelle (API), die die Integration in bestehende Arbeitsabläufe ermöglicht, so dass Entwickler synthetische Datensätze bei Bedarf erstellen und anpassen können. Laut dem Unternehmen könnten die Benutzer "das Gleichgewicht zwischen Datentreue und Anonymisierung fein abstimmen" und sich dabei von "integrierten Datenschutzkontrollen" leiten lassen.

Synthetische Daten in der KI-Ära

Einige der weltweit größten KI-Anbieter wie AWS, Microsoft, Meta und Anthropic nutzen bereits synthetische Daten, um ihre KI-Modelle zu trainieren, da die Quellen für reale Daten immer knapper werden.

Meta Llama 3 LLM verwendet synthetische Daten, während Amazons KI-Plattform Bedrock es Entwicklern ermöglicht, mit Anthropics Claude synthetische Daten zu erzeugen.

Synthetische Daten umfassen Texte, Videos und Bilder, die mit realen Daten kombiniert werden können, um KI-Modelle effizienter und kostengünstiger zu trainieren.

Der Artikel erschien zuerst bei unserer Schwesterpublikation crn.com

CRN-Newsletter beziehen und Archiv nutzen - kostenlos: Jetzt bei der CRN Community anmelden

Die renommierten CRN Channel Award 2025 für Hersteller, Distributoren, IT-Dienstleister, Managerinnern und Manager: Jetzt bewerben – alle Infos hier