KI-Startup Unstructured sammelt 40 Mio. Dollar von IBM, Nvidia, Databricks und anderen ein

Mit dem Abschluss der B-Finanzierungsrunde liegt die Gesamtfinanzierung von Unstructured nun bei 65 Mio. Dollar. Die Mittel sollen laut CEO Brian Raymond erst einmal reichen, um die Technologie zur Aufnahme und Vorverarbeitung unstrukturierter Daten für die Entwicklung großer Sprachmodelle (LLMs) weiterzuentwickeln.

Brian Raymond, CEO von Unstructured.

Image:
Brian Raymond, CEO von Unstructured.

Generative KI (GenKI bzw. GenAI) hat sich in den letzten 12 Monaten zu einer der beliebtesten Investitionsbereiche für Tech-Unternehmen entwickelt und fast hat es den Eindruck, als würden Startups in diesem Bereich regelrecht mit Geld beworfen. Laut der jüngsten Studie "EY Reimagining Industry Futures Study", die im Februar erschien, investieren aktuell 43 Prozent der dort 1.405 befragten Unternehmen in generative künstliche Intelligenz. Von den Unternehmen, die in diesem Bereich schon etwas länger aktiv sind, arbeiten 80 Prozent an Proof-of-Concept-Anwendungen, während 20 Prozent bereits Pilotprojekte durchführen, berichtet EY in dieser Studie.

Die Firma Unstructured besteht seit 2022 und entwickelt eine Technologie, die unstrukturierte Daten für die Nutzung durch LLMs für GenKI vorverarbeitet und bereitstellt. Zu den unstrukturierten Daten gehören E-Mails, Dokumente, Bilder, Videos und andere, die mit herkömmlichen Tools nur schwer zu erfassen sind. Sie müssen in Formate umgewandelt werden, die für maschinelles Lernen tauglich sind, um die LLMs zu erstellen, auf denen GenKI beruht.

Die Technologie von Unstructured automatisiert die Umwandlung von unstrukturierten Daten in Formate, die man für die Feinabstimmung von Retrieval Augmented Generation (RAG und LLM) benötigt. Das Unternehmen gibt an, dass es für LLM-Modelle Leistungsverbesserungen von über 20 Prozent erzielen könne, ohne dass Anpassungen erforderlich seien. Die Open-Source-Bibliothek von Unstructured sei bereits über 6 Millionen Mal heruntergeladen worden, teilte die Firma mit.

Im Januar veröffentlichte Unstructured seine kommerzielle SaaS-API, die nach eigenen Angaben bereits über 1.000 zahlende Kunden habe. Im Februar stellte der Anbieter seine Unternehmensplattform vor, die kontinuierlich unstrukturierte Rohdaten extrahiert, um die Zeit, die Entwickler und Datenwissenschaftler für die Datenaufbereitung benötigen, eigener Aussage zufolge "erheblich zu verkürzen".

Brian Raymond, CEO und Gründer von Unstructured, der bei der CIA und im Nationalen Sicherheitsrat des Weißen Hauses tätig war, bevor er in der Welt des Investmentbankings und der Startups landete, erklärte gegenüber CRN, dass sein Unternehmen das erste und einzige sei, das alle unstrukturierten Daten für KI-LLMs aufnehmen und in das richtige Format vorverarbeiten könne.

"Für die Verwendung mit Foundation Models müssen Daten im JSON-Format vorliegen", sagte Raymond. "Aber wenn es sich bei den Daten um eine PDF-, eine PowerPoint- oder eine JPEG-Datei handelt, wie bekommt man sie dann in das JSON-Format? Bis jetzt gab es darauf keine Antwort und wurde immer auf individueller Basis gehandhabt. Das ist der Grund, warum wir im letzten Jahr ein so explosives Wachstum verzeichnen konnten."

Mit "explosivem Wachstum" meint Raymond, dass sein Unternehmen bis zum Ende dieses Monats einen Gesamtumsatz von 7 Mio. US-Dollar erzielt haben wird. Das Unternehmen hat inzwischen über 1.000 zahlende Kunden, darunter mehr als ein Drittel der Fortune-500-Unternehmen.

Dass zu seinen Investoren KI-fokussierte Unternehmen wie Databricks, IBM und Nvidia zählen, sei kein Zufall, so Raymond: "Wir haben enge Beziehungen zu diesen Unternehmen", sagte er. "Wir sind eine ergänzende Technologie für das, was sie aufbauen."

Unstructured habe es nicht eilig, weitere Mittel zu beschaffen. "Wir sind jetzt in einer guten Verfassung. Wir hatten in unserer A-Runde vor sechs Monaten 20 Millionen Dollar aufgenommen. Augenblicklich sind wir also sehr gut kapitalisiert", so Raymond.

Nach dem Vertriebsmodell befragt, berichtete er, dass Unstructured zurzeit ein Selbstbedienungsmodell verfolgt. Kunden könnten quasi von der Straße kommen und sich eine API nehmen, ohne mit jemandem zu sprechen. Das Unternehmen habe natürlich auch Kundenbetreuer, die mit den Unternehmenskunden arbeiten. Außerdem arbeite es beim Verkauf seiner Technologie mit Hyperscalern und einigen Datenbankunternehmen zusammen.

"Für Reseller ist ist es noch zu früh", so der CEO. "Für uns ist das ein ganz neues Feld. Aber wir lernen dazu. Und sobald es Sinn macht, sind wir offen für eine Zusammenarbeit mit dem Channel."