95 Prozent der US-Unternehmen erzielen mit Künstlicher Intelligenz keine Erträge. Das berichtet eine Studie des Massachusetts Institute of Technology. Als Gründe für das Scheitern benennen die Forscher funktionale Defizite der Tools. Dennoch entwickelt sich vielerorts eine Schatten-IT.

GenAI-Kluft in Unternehmen: „Der Hype rund um Künstliche Intelligenz verspricht uns, dass sich alles zum Positiven ändert. Bei uns ist das nicht passiert. Wir bearbeiten lediglich einige Verträge schneller als vorher.“ Diese Aussage eines Chief Operating Officers aus einem mittelständigen Fertigungsbetrieb bringt die aktuelle Studie des Massachusetts Institute of Technology (MIT) zu Künstlicher Intelligenz (KI) prägnant auf den Punkt.
„Lediglich 5 Prozent der von uns untersuchten KI-Pilotprojekte bringt einen Mehrwert von mehreren Millionen Dollar“, schreiben die Autoren der MIT-Studie The GenAI Divide: State of AI in Business 2025. „Die überwiegende Mehrheit bleibt ohne messbare Auswirkungen auf die Gewinn- und Verlustrechnung.“ Die Ergebnisse unterscheiden sich sowohl bei den Unternehmen als auch bei den Entwicklern, Anbietern und Beratungsunternehmen so stark, dass die Forscher von einer Kluft rund um generative Künstliche Intelligenz (GenAI) reden. Diese GenAI-Kluft in Unternehmen zeichnet sich durch eine hohe Akzeptanz dieser Technologie aus, aber durch sehr geringe Auswirkungen in Sachen Transformation und Digitalisierung. Laut Studie gibt es in den Unternehmen zwar viele Experimente, allerdings führen die wenigsten zu den erwünschten Veränderungen.
Die Studie basiert auf einem multimethodischen Forschungsdesign, das zwischen Januar und Juni 2025 durchgeführt wurde. Die Forscher führten eine systematische Überprüfung von mehr als 300 öffentlich bekannt gegebenen KI-Initiativen durch, 52 strukturierte Interviews mit Vertretern von Organisationen aus verschiedenen Branchen und sammelten 153 Umfrageantworten von Führungskräften auf vier großen Konferenzen. Unternehmensspezifische Daten und Zitate wurden anonymisiert. Im Projekt NANDA (Networked Agents and Decentralized Architecture) entwickelt das MIT Infrastruktur und Protokolle für interoperable KI-Agenten, die lernen, zusammenarbeiten und messbare Geschäftsergebnisse liefern.
Anzeige | kostenloses Webinar der Trovarit Academy
|
Die Auswahl der richtigen Business-Software kann schnell zur Herausforderung werden: Der Markt ist unübersichtlich, Anbieter schwer vergleichbar, und manuelle Recherchen kosten viel Zeit. Unstrukturierte Anfragen führen oft zu unklaren oder schwer vergleichbaren Antworten – eine fundierte Entscheidung wird so erschwert.
In unserem Webinar erfahren Sie, wie Sie mit dem KI-gestützten Online-Tool smartRFI den Auswahlprozess effizienter gestalten, strukturierte RFIs versenden und schneller zu einer fundierten Vorauswahl kommen.
Anmeldung
|
Nur 5 Prozent aller Tests enden produktiv
Ein deutlicher Beweis für die GenAI-Kluft in Unternehmen ist die geringe Zahl erfolgreicher Projekte. Lediglich 5 Prozent der für Unternehmen individuell entwickelten KI-Werkzeuge erreichen die Produktionsreife. Die Ausfallrate von 95 Prozent begründet das MIT mit dem schwachen kontextuellen Lernen der Tools, fragilen Arbeitsabläufen und einer mangelnden Abstimmung der Initiativen mit dem Tagesgeschäft zurück.
Auch die Skepsis der Nutzer gegenüber den Angeboten der Anbieter spielt eine große Rolle: „Wir haben uns dieses Jahr Dutzende von Demos angesehen“, berichtet ein Befragter. „Allenfalls ein oder zwei davon sind für uns wirklich nützlich.“
Geht es um erfolgreiche Projekte mit Künstlicher Intelligenz, hängt viel von der Unternehmensgröße ab. Während mittelständische Unternehmen etwa 90 Tage von der Pilotphase bis zur vollständigen Implementierung brauchen, dauert dieser Prozess bei große Unternehmen neun Monate oder länger.
Große Unterschiede verzeichnet die MIT-Studie, wenn es um die Art der intelligenten Software geht: Allzweck-Tools testen viele Unternehmen und stellen dann fest, dass deren Auswirkungen begrenzt sind: Über 80 Prozent der Unternehmen haben nach eigener Aussage ChatGPT oder Microsoft Copilot getestet oder in Pilotprojekten eingesetzt, aber nur 40 Prozent haben diese Tools auch implementiert.“ Der Grund dafür: Diese Werkzeuge verbessern zwar die individuelle Produktivität der Mitarbeiter, zeigen aber keinen positiven Effekt auf den Gewinn der Unternehmen. Intelligente Systeme zum Steuern von Unternehmensabläufen haben 60 Prozent der Befragten evaluiert. Allerdings erreichen diese Systeme lediglich in 20 Prozent der Unternehmen die Pilotphase und nur in 5 Prozent die Produktionsreife.
Beim kontextuellen Lernen patzen die Tools
Die hoher Ausfallrate erklärt die Studie mit dem schwache kontextuellen Lernen der Werkzeuge: Die meisten Systeme für generative Künstliche Intelligenz speichern kein Feedback, passen sich nicht an den Kontext an und verbessern sich nicht im Laufe der Zeit. „ChatGPT vergisst den Kontext, lernt nicht und kann sich nicht weiterentwickeln“, bringt ein Anwender das zentrale Problem auf den Punkt.
Dieser Mangel mindert die Akzeptanz in bestimmten Anwendungsfällen: Anwender nutzen Large Language Modelle, die für Verbraucher gedacht sind, zwar häufig für Entwürfe, lehnen sie aber für unternehmenskritische Aufgaben ab, weil es an Speicherkapazität und Persistenz mangelt. „ChatGPT eignet sich hervorragend für das Brainstorming“, erklärt ein Befragter. „Allerdings fragt das System für jede Sitzung umfangreiche Angaben ab und wiederholt dann dieselben Fehler immer wieder. Es vergisst den Kontext und verbessert sich nicht, weil es nicht lernt.“ Für unternehmenskritische Aufgaben erwarten Anwender Systeme, die Wissen speichern und daher ihre Antworten im Lauf der Zeit verbessern.
Trotz aller Mängel kommt Künstliche Intelligenz zunehmend zum Einsatz: Auch wenn die offiziell eingeführten Programme oft auf geringe Akzeptanz stoßen, entwickelt sich in vielen Unternehmen eine Schatten-IT. So geben zwar nur 40 Prozent der Befragten an, ein Large Language Model offiziell abonniert zu haben – gleichzeitig nutzen über 90 Prozent der Mitarbeitenden solche Tools regelmäßig in ihrer täglichen Arbeit. Offenbar greifen viele Beschäftigte eigenständig zu passenden Werkzeugen, selbst wenn unternehmensweite KI-Initiativen ins Stocken geraten. Jürgen Frisch