Die Studienlage: Warum die meisten KI-Initiativen scheitern – und woran man die Ausnahmen erkennt.

Über alle unabhängigen Analysen der Jahre 2024 und 2025 hinweg zeigt sich dasselbe Bild: Geld allein erzeugt keinen KI-Nutzen, Methode schon. Wir tragen die Befunde hier nüchtern zusammen, belegen jede Zahl mit ihrer Primärquelle und benennen offen, wo eine Zahl nur eingeschränkt oder gar nicht belastbar ist.

Studienlage 2024–2025International & DACHMethode statt Werkzeugjede Zahl mit Quelle
Standortbestimmung starten

Die folgende Übersicht ordnet die Befunde in vier Blöcke: zunächst die internationale Studienlage, dann – für Verwaltungen am relevantesten – die Lage in Deutschland und im DACH-Raum, anschließend der entscheidende Unterschied zwischen Eigenbau und prozess-eingebetteter Lösung, und schließlich die Synthese. Zu jeder Zahl finden Sie eine Kurz-Einordnung sowie über den Link „→ Einordnung“ die ausführliche Methodik- und Quellenseite. Wo eine verbreitete Zahl der Primärquelle nicht standhält, weisen wir das ausdrücklich aus, statt sie als belegt darzustellen.

Block 1 · International

Die internationale Studienlage

Unabhängige Untersuchungen aus den USA und international zeichnen ein konsistentes Bild: Die große Mehrheit der formal eingeführten KI-Initiativen erreicht keinen messbaren Beitrag – während einzelne, gut umgesetzte Vorhaben sehr wohl Wert schaffen.

95 %
der unternehmensweit integrierten GenAI-Initiativen erzielen keinen messbaren P&L-Beitrag; nur 5 % schaffen signifikanten Wert.
MIT Project NANDA, „The GenAI Divide: State of AI in Business 2025“ (rund 52 Organisations-Interviews, 153 Führungs­kräfte-Antworten, 300+ öffentliche Deployments) · → Einordnung
Kurz-Einordnung

Die Zahl bezieht sich auf formale, integrierte GenAI-Initiativen ohne messbaren P&L-Effekt binnen rund sechs Monaten – nicht auf „Unternehmen“ pauschal und nicht auf jede KI-Nutzung. „Kein messbarer Beitrag“ heißt nicht „kein Nutzen“: individuelle Produktivitätsgewinne wurden ausdrücklich nicht mitgezählt. Vorläufiger, nicht peer-reviewter Branchenreport mit teils kleiner Interviewbasis.

39 %
der Unternehmen berichten überhaupt einen EBIT-Effekt durch KI auf Unternehmensebene – die meisten davon unter 5 % des EBIT.
McKinsey / QuantumBlack, „The State of AI in 2025“ (1.993 Befragte aus 105 Ländern, Feldzeit Juni–Juli 2025) · → Einordnung
Kurz-Einordnung

Ein EBIT-Effekt auf Unternehmensebene ist eine deutlich strengere Hürde als reine Nutzung (KI ist laut Bericht in rund 88 % der Unternehmen mindestens in einer Funktion im Einsatz). Hinweis zur Ehrlichkeit: Zwei häufig zitierte Zusatzzahlen sind in der Primärquelle anders belegt – die „5,5 %“ bezeichnen den Anteil der „AI-High-Performer“-Unternehmen, keine Rendite; das grundlegende Workflow-Redesign der Erfolgreichen liegt bei rund 3× (nicht 3,6×) häufiger.

≥ 30 %
der GenAI-Projekte werden nach dem Proof of Concept wieder aufgegeben (Prognose bis Ende 2025).
Gartner, Pressemitteilung 29.07.2024 (Analysten-Prognose, kein Ist-Audit; Gründe: Datenqualität, Risiko, Kosten, unklarer Geschäftswert) · → Einordnung
Kurz-Einordnung

Die Primärquelle nennt präzise „mindestens 30 %“ (Untergrenze), nicht „etwa 30 %“, und es handelt sich um eine zukunftsgerichtete Schätzung, nicht um eine gemessene Ist-Quote. Gartner führt drei verschiedene, nicht zu vermischende Prognosen: 30 % PoC-Abbruch, 60 % bei fehlenden KI-fähigen Daten (bis 2026) und über 40 % der „agentic AI“-Projekte (bis Ende 2027).

> 80 %
der KI-Projekte scheitern – nach gängigen Schätzungen etwa doppelt so häufig wie IT-Projekte ohne KI.
RAND Corporation, „The Root Causes of Failure for AI Projects“, August 2024 (65 Experten-Interviews; Wert als Fremdschätzung zitiert) · → Einordnung
Kurz-Einordnung

Den Satz „über 80 % … doppelt so oft“ zitiert RAND ausdrücklich als vorgefundene Schätzung („by some estimates“), nicht als eigene Messung. RANDs belastbarer eigener Befund ist qualitativ: Hauptursachen sind Führung und Kommunikation sowie Datenqualität – nicht das Modell. Die kursierende Aufschlüsselung „33,8 % / 28,4 % / 18,1 %“ stammt nicht aus diesem Bericht und ist nur eine Sekundärlesart.

42 %
der Unternehmen gaben 2025 die meisten ihrer KI-Initiativen auf (2024: 17 %); im Schnitt wurden 46 % der Proof-of-Concepts vor Produktion verworfen.
S&P Global Market Intelligence / 451 Research, „Generative AI shows rapid growth but yields mixed results“ (Voice of the Enterprise, 1.006 Befragte, Nordamerika & Europa) · → Einordnung
Kurz-Einordnung

Starker Anstieg gegenüber dem Vorjahr. Gemessen wird der aktive Abbruch von Vorhaben, nicht ausbleibender Nutzen – das ist eine andere Methodik als bei der MIT-Studie. Die 42 % bezeichnen den Anteil der Unternehmen, die die Mehrheit ihrer Initiativen aufgeben (Unternehmens-, nicht Projektebene).

383 % ROI
erreicht eine erfolgreiche, prozess-eingebettete Implementierung im modellierten Best-Case.
Forrester, „The Total Economic Impact™ Of Celonis“, im Auftrag von Celonis, Juni 2025 (Composite-Modell aus 4 Kundeninterviews) · → Einordnung
Kurz-Einordnung

Bewusst als Gegenseite gezeigt: Der Unterschied liegt in der Umsetzung, nicht in der Technologie. Wichtig zur Einordnung – es ist ein modelliertes Best-Case-Szenario einer Auftragsstudie zu einem konkreten Process-Mining-Produkt, kein Durchschnitt realer Kunden und keine allgemeine KI-Statistik.

Block 2 · Deutschland & DACH

Die Lage in Deutschland und im DACH-Raum

Für Haus- und WEG-Verwaltungen ist die deutsche Datenlage am aussagekräftigsten. Sie bestätigt das internationale Bild – und macht die eigentliche Blockade sichtbar: nicht die Technik, sondern die Lücke zwischen Erkenntnis und Umsetzung sowie fehlendes Know-how und Personal.

90 %
der Unternehmen halten KI für wettbewerbsentscheidend, aber nur knapp jedes fünfte (rund 17 %) setzt sie tatsächlich ein.
Bitkom / Bitkom Research, „Digitalisierung der Wirtschaft 2025“ (n = 603 Unternehmen ab 20 Beschäftigten, Selbstauskunft) · → Einordnung
Kurz-Einordnung

Transparenzhinweis: Die anderswo kursierende Kombination „72 % halten KI für wichtig / 15 % nutzen sie produktiv“ ist in der Primärquelle nicht belegbar – die „72 %“ stehen dort für das Fehlen einer zentralen Digitalstrategie. Belastbar ist die hier gezeigte Form: 90 % halten KI für wettbewerbsentscheidend, aber nur knapp jedes fünfte Unternehmen setzt sie ein. Die Lücke zwischen Erkenntnis und Umsetzung ist real – die exakten Zahlen 72/15 sind es nicht.

53 % / 53 % / 51 %
Größte Hemmnisse: rechtliche Verunsicherung 53 %, fehlendes technisches Know-how 53 %, fehlendes Personal 51 % (Datenschutz 48 %, schlechte Ergebnisqualität 36 %).
Bitkom Research, „Künstliche Intelligenz in Deutschland 2025“ (n = 604 Unternehmen ab 20 Beschäftigten, KW 27–32/2025, Mehrfachnennungen) · → Einordnung
Kurz-Einordnung

Zwei der drei größten Hürden – fehlendes Know-how und fehlendes Personal – sind kompetenzbezogen und damit grundsätzlich durch Qualifizierung adressierbar; die führende Hürde (rechtliche Unsicherheit) ist primär eine Regulierungsfrage. Es handelt sich um genannte Selbsteinschätzungen, nicht um objektiv gemessene Lücken. Werte für alle befragten Unternehmen; Mehrfachnennungen, daher keine Summe von 100 %.

~33 % / 43 %
Nur rund ein Drittel der Mittelständler nutzt KI; bei 43 % fehlen konkrete KI-Pläne, nur 9,5 % haben KI vollständig implementiert.
Deutscher Mittelstands-Bund / Salesforce, „KI-Index Mittelstand 2025“ (526 Unternehmen bis 500 Beschäftigte, Nov./Dez. 2024) · → Einordnung
Kurz-Einordnung

Mittelstandsfokus; verdeutlicht die Strategie- und Umsetzungslücke. „Einsatz“ umfasst auch erste oder punktuelle Nutzung – vollständig implementiert ist nur knapp jedes zehnte Unternehmen (9,5 %). Auftragsbefragung mit Anbieterbeteiligung; methodische Details nicht öffentlich dokumentiert.

91 %
der (überwiegend großen) befragten deutschen Unternehmen stufen generative KI als geschäftskritisch ein (Vorjahr: 55 %).
KPMG, „Generative KI in der deutschen Wirtschaft 2025“ (653 Telefoninterviews, März 2025; Stichprobe großlastig) · → Einordnung
Kurz-Einordnung

Die 91 % weist KPMG für „deutsche Unternehmen“ allgemein aus, ohne Aufschlüsselung nach Größe; da die Stichprobe stark von großen Unternehmen geprägt ist (knapp zwei Drittel über 1.000 Beschäftigte), spiegelt der Wert überwiegend deren Einschätzung. Gemessen wird die strategische Relevanz, nicht der tatsächliche Einsatz. Ein direkter Groß-gegen-Mittelstand-Vergleich lässt sich aus dieser Studie nicht belegen.

0,35 %
des Umsatzes investiert der deutsche Mittelstand in KI – rund 30 % unter dem deutschen Gesamtmarkt-Durchschnitt (0,5 %).
Horváth, Digital-Value-Studie, Januar 2026 (200 mittelständische Unternehmen ab 100 Mio. € Umsatz, Selbstauskunft) · → Einordnung
Kurz-Einordnung

Eine Investitionsquote, kein Ergebnismaß – sie sagt nichts über Nutzungsgrad oder Rendite aus. Transparenzhinweis: Der Vergleichswert ist der deutsche Gesamtmarkt-Durchschnitt (0,5 %), nicht ein globaler Schnitt; der Mittelstand senkte seine Quote 2025 sogar (von 0,41 % in 2024).

Block 3 · Der entscheidende Unterschied

Der entscheidende Unterschied: Einbettung statt Alleingang

Wenn so viele Initiativen scheitern und einzelne dennoch klar Wert schaffen, stellt sich die Frage: Was unterscheidet die erfolgreichen Vorhaben? Die MIT-NANDA-Untersuchung liefert dazu die deutlichste Zahl – und sie betrifft nicht die Modellqualität, sondern den Weg der Einführung.

Prozess-eingebettete bzw. bei spezialisierten Anbietern eingekaufte, lernfähige KI erreicht den Sprung vom Piloten in den produktiven Dauerbetrieb rund doppelt so oft wie intern im Alleingang gebaute Lösungen. Entscheidend ist dabei nicht die Technik selbst, sondern ob sie in echte Arbeitsabläufe eingebettet und über externe Spezialisierung getragen wird.

67 % vs. ~33 %
Prozess-eingebettete bzw. extern eingekaufte KI erreicht rund 67 % Deployment-Erfolg; interne Eigenbauten nur etwa 33 % – also rund doppelt so oft erfolgreich auf dem ersten Weg.
MIT Project NANDA, „The GenAI Divide“ 2025, berichtet u. a. bei Fortune (Wert aus der Interview-Teilstichprobe von 52 Organisationen) · → Einordnung
Kurz-Einordnung

Verglichen werden zwei Beschaffungswege; Bezugsgröße ist „Deployment“ (Pilot → produktiver Dauereinsatz), nicht allgemeiner ROI. Ehrlichkeitshinweis: Der Bericht nennt „rund doppelt so oft“ (67 % gegenüber 33 %); die anderswo verbreitete Lesart „nur ein Drittel so oft“ ist rechnerisch falsch und wird hier bewusst nicht verwendet. Streng genommen geht es um Software-Beschaffung, nicht um Weiterbildung – das übertragbare Prinzip lautet: Wer KI ohne Einbettung und Spezialisierung im Alleingang angeht, scheitert deutlich häufiger.

Synthese

Die rote Linie durch alle Studien

So unterschiedlich die Methoden sind – ausbleibender P&L-Beitrag, Projektabbrüche, Investitionsquoten, genannte Hemmnisse – sie zeigen in dieselbe Richtung. Mehr Budget allein verschiebt die Erfolgsquote nicht; was den Ausschlag gibt, sind Wissen, Strategie und die Einbettung in echte Abläufe.

Die rote Linie durch alle Studien: nicht die Technologie ist die Blockade, sondern Wissen, Strategie und Umsetzung. Eine Methode lässt sich übertragen.

Genau hier setzen wir an – nicht mit einem weiteren Werkzeug, sondern mit einer Methode, die im Team bleibt und an Ihren echten Vorgängen ansetzt. Der ehrlichste erste Schritt ist keine Folie, sondern Ihre eigene Ausgangslage in Zahlen.

Standortbestimmung starten

Hinweis zur Methodik: Die meisten der hier genannten Quellen sind Beratungs-, Verbands- oder Branchenstudien und nicht peer-reviewt; sie beruhen überwiegend auf Selbstauskünften. Wir nennen sie dennoch, weil sie unabhängig voneinander dasselbe Muster zeigen – und wir kennzeichnen offen, wo eine verbreitete Zahl der Primärquelle nicht standhält. Alle Details, Vorbehalte und Quellenlinks finden Sie auf der Methodik- und Einordnungsseite.