Methodik & Quellen: jede Zahl der Studienlage, nachgeprüft.

Diese Seite legt für jede der zwölf Zahlen offen, woher sie stammt, wie groß die Stichprobe ist, was genau gemessen wurde – und wo eine anderswo verbreitete Lesart der Primärquelle nicht standhält. Wir verlinken die Primärquelle, nicht den Aggregator, und übernehmen Abweichungen transparent, statt sie zu glätten.

PrimärquellenStichprobe & MethodeDiskrepanzen offen benannt2024–2025
← Zurück zur Studienlage

Die Reihenfolge entspricht der Übersicht auf der Studienlage: zuerst die internationale Lage, dann Deutschland und der DACH-Raum, schließlich der entscheidende Unterschied zwischen Eigenbau und prozess-eingebetteter Lösung. Jeder Eintrag verweist mit dem Link „↩ Zur Karte“ zurück auf die zugehörige Karte in der Übersicht.

Wichtige Einschränkung vorweg: Die meisten dieser Quellen sind Beratungs-, Verbands- oder Branchenstudien, sie sind nicht peer-reviewt und beruhen überwiegend auf Selbstauskünften. Sie sind als Stimmungs- und Verbreitungsbild belastbar, nicht als kausaler Wirkungsnachweis. Wir nennen sie dennoch, weil sie unabhängig voneinander dasselbe Muster zeigen.

Block 1 · International

Die internationale Studienlage

95 % der integrierten GenAI-Initiativen ohne messbaren Beitrag

Primärquelle: MIT Project NANDA, „The GenAI Divide: State of AI in Business 2025“ (Preliminary Report, Juli 2025). Bericht als PDF (nanda.media.mit.edu) →

Stichprobe: rund 52 strukturierte Organisations-Interviews, 153 Antworten von Führungskräften und über 300 öffentlich dokumentierte GenAI-Deployments.

Was gemessen wurde: der Anteil unternehmensweit integrierter GenAI-Initiativen, die binnen rund sechs Monaten keinen messbaren Beitrag zur Gewinn- und Verlustrechnung (P&L) erzielten. Etwa 95 % erreichten diese Schwelle nicht, nur rund 5 % schufen signifikanten Wert.

Ehrlich eingeordnet: Die Zahl gilt für formale, integrierte Initiativen – nicht für „Unternehmen“ pauschal und nicht für jede KI-Nutzung. „Kein messbarer Beitrag“ heißt ausdrücklich nicht „kein Nutzen“: individuelle Produktivitätsgewinne (etwa durch ChatGPT am Arbeitsplatz) wurden bewusst nicht mitgezählt. Es handelt sich um einen vorläufigen, nicht peer-reviewten Branchenreport mit teils kleiner Interviewbasis; die genaue Bezugsmenge der Prozentzahl ist nicht in jeder Hinsicht offengelegt. Wir zitieren ihn als das, was er ist – ein starkes Indiz, kein experimenteller Nachweis.

↩ Zur Karte in der Übersicht

39 % berichten einen EBIT-Effekt durch KI auf Unternehmensebene

Primärquelle: McKinsey & Company / QuantumBlack, „The State of AI in 2025“ (November 2025). Studienseite (mckinsey.com) →

Stichprobe: 1.993 Befragte aus 105 Ländern, Feldzeit Juni–Juli 2025; Selbstauskunft.

Was gemessen wurde: der Anteil der Unternehmen, die überhaupt einen Effekt auf das EBIT (Ergebnis vor Zinsen und Steuern) durch KI auf Unternehmensebene berichten – die meisten davon unter 5 % des EBIT. Das ist eine deutlich strengere Hürde als reine Nutzung; KI ist laut Bericht in rund 88 % der Unternehmen mindestens in einer Funktion im Einsatz.

Ehrlich eingeordnet (Diskrepanz): Zwei häufig mitzitierte Zusatzzahlen sind in der Primärquelle anders belegt, als sie kursieren. Die „5,5 %“ bezeichnen den Anteil der „AI-High-Performer“-Unternehmen, keine finanzielle Rendite. Und das grundlegende Redesign der Arbeitsabläufe liegt bei den Erfolgreichen rund häufiger vor, nicht „3,6ד. Wo wir die 5,5 % oder 3,6× anderweitig auf der Website verkürzt aufgreifen, ist das eine vereinfachte Lesart und kein Primärbeleg in diesem Sinne.

↩ Zur Karte in der Übersicht

Mindestens 30 % der GenAI-Projekte werden nach dem Proof of Concept aufgegeben

Primärquelle: Gartner, Pressemitteilung vom 29.07.2024 („At least 30% of generative AI projects will be abandoned after proof of concept by the end of 2025“). Pressemitteilung (gartner.com) →

Art der Aussage: Analysten-Prognose, kein Ist-Audit. Genannte Gründe: schlechte Datenqualität, unzureichendes Risikomanagement, eskalierende Kosten und unklarer Geschäftswert.

Ehrlich eingeordnet: Die Quelle nennt präzise „mindestens 30 %“ (Untergrenze), nicht „etwa 30 %“, und es ist eine zukunftsgerichtete Schätzung, keine gemessene Ist-Quote. Wo wir auf der Startseite verkürzt „~30 %“ schreiben, ist das eine Vereinfachung der Untergrenze. Gartner führt zudem drei verschiedene, nicht zu vermischende Prognosen: 30 % PoC-Abbruch (bis Ende 2025), 60 % bei fehlenden KI-fähigen Daten (bis 2026) und über 40 % der „agentic AI“-Projekte (bis Ende 2027).

↩ Zur Karte in der Übersicht

„Über 80 %“ der KI-Projekte scheitern – als Fremdschätzung zitiert

Primärquelle: RAND Corporation, „The Root Causes of Failure for Artificial Intelligence Projects and How They Can Succeed“, August 2024. Bericht (rand.org) →

Stichprobe: 65 qualitative Experten-Interviews mit Data Scientists und Ingenieuren.

Ehrlich eingeordnet: Den Satz „über 80 % … etwa doppelt so oft wie IT-Projekte ohne KI“ zitiert RAND ausdrücklich als vorgefundene Schätzung („by some estimates“), nicht als eigene Messung. RANDs belastbarer eigener Befund ist qualitativ: Hauptursachen sind Führung und Kommunikation (falsch verstandene oder schlecht kommunizierte Anforderungen) sowie Datenqualität – nicht das Modell oder die Technik. Die andernorts kursierende numerische Aufschlüsselung „33,8 % / 28,4 % / 18,1 %“ stammt nicht aus diesem Bericht und ist nur eine Sekundärlesart.

↩ Zur Karte in der Übersicht

42 % gaben 2025 die meisten KI-Initiativen auf; 46 % der PoCs vor Produktion verworfen

Primärquelle: S&P Global Market Intelligence / 451 Research, „Generative AI shows rapid growth but yields mixed results“ (Voice of the Enterprise: AI & Machine Learning, 2025). Research-Seite (spglobal.com) →

Stichprobe: 1.006 Befragte aus Nordamerika und Europa; Selbstauskunft.

Was gemessen wurde: der aktive Abbruch von Vorhaben – nicht ausbleibender Nutzen. 42 % der Unternehmen gaben 2025 die Mehrheit ihrer KI-Initiativen auf (gegenüber 17 % im Vorjahr), und im Schnitt wurden 46 % der Proof-of-Concepts vor dem Produktivbetrieb verworfen.

Ehrlich eingeordnet: Das ist eine andere Methodik als bei MIT (Abbruch vs. ausbleibender P&L-Effekt) – beide Zahlen sind nicht direkt vergleichbar. Die 42 % beziehen sich auf die Unternehmens-, nicht auf die Projektebene; der starke Anstieg gegenüber dem Vorjahr ist der eigentliche Befund.

↩ Zur Karte in der Übersicht

383 % ROI im modellierten Best-Case einer prozess-eingebetteten Lösung

Primärquelle: Forrester Consulting, „The Total Economic Impact™ Of Celonis“, im Auftrag von Celonis, Juni 2025. Studie (celonis.com) →

Methodik: Composite-Modell (zusammengesetztes Referenzunternehmen) auf Basis von vier Kundeninterviews.

Ehrlich eingeordnet: Diese Zahl zeigen wir bewusst als Gegenseite – sie belegt, dass der Unterschied in der Umsetzung liegt, nicht in der Technologie. Sie ist jedoch ausdrücklich ein modelliertes Best-Case-Szenario einer Auftragsstudie zu einem konkreten Process-Mining-Produkt, kein Durchschnitt realer Kunden und keine allgemeine KI-Statistik. Sie taugt als Illustration der Größenordnung, nicht als Erwartungswert.

↩ Zur Karte in der Übersicht

Block 2 · Deutschland & DACH

Die Lage in Deutschland und im DACH-Raum

90 % halten KI für wettbewerbsentscheidend, nur rund 17 % setzen sie ein

Primärquelle: Bitkom e. V. / Bitkom Research, „Digitalisierung der Wirtschaft 2025“. Bitkom-Presse zur KI-Nutzung (bitkom.org) →

Stichprobe: n = 603 Unternehmen ab 20 Beschäftigten; Selbstauskunft.

Ehrlich eingeordnet (Diskrepanz): Die anderswo kursierende Kombination „72 % halten KI für wichtig / 15 % nutzen sie produktiv“ ist in der Primärquelle nicht belegbar – die „72 %“ stehen dort für das Fehlen einer zentralen Digitalstrategie, nicht für die Bedeutung von KI. Belastbar ist die hier gezeigte Form: 90 % halten KI für wettbewerbsentscheidend, aber nur knapp jedes fünfte Unternehmen (rund 17 %) setzt sie tatsächlich ein. Die Lücke zwischen Erkenntnis und Umsetzung ist real – die exakten Zahlen 72/15 sind es in diesem Zusammenhang nicht.

↩ Zur Karte in der Übersicht

Größte Hemmnisse: rechtliche Unsicherheit 53 %, fehlendes Know-how 53 %, fehlendes Personal 51 %

Primärquelle: Bitkom Research, „Künstliche Intelligenz in Deutschland 2025“. Bitkom-Presse (bitkom.org) →

Stichprobe: n = 604 Unternehmen ab 20 Beschäftigten, Befragung KW 27–32/2025; Mehrfachnennungen möglich.

Was gemessen wurde: genannte Hemmnisse beim KI-Einsatz – rechtliche Verunsicherung 53 %, fehlendes technisches Know-how 53 %, fehlendes Personal 51 %, Datenschutzanforderungen 48 %, schlechte Ergebnisqualität 36 %.

Ehrlich eingeordnet: Zwei der drei größten Hürden – fehlendes Know-how und fehlendes Personal – sind kompetenzbezogen und damit grundsätzlich durch Qualifizierung adressierbar; die führende Hürde (rechtliche Unsicherheit) ist primär eine Regulierungsfrage. Es sind genannte Selbsteinschätzungen, keine objektiv gemessenen Lücken; wegen Mehrfachnennungen summieren sich die Werte nicht auf 100 %.

↩ Zur Karte in der Übersicht

Rund ein Drittel der Mittelständler nutzt KI; bei 43 % fehlen konkrete Pläne

Primärquelle: Deutscher Mittelstands-Bund (DMB) / Salesforce, „KI-Index Mittelstand 2025“. DMB-Themenseite (mittelstandsbund.de) →

Stichprobe: 526 Unternehmen bis 500 Beschäftigte, Befragung November/Dezember 2024.

Was gemessen wurde: rund ein Drittel der Mittelständler nutzt KI (Einsatz umfasst auch erste oder punktuelle Nutzung); bei 43 % fehlen konkrete KI-Pläne; nur 9,5 % haben KI vollständig implementiert.

Ehrlich eingeordnet: Mittelstandsfokus, der die Strategie- und Umsetzungslücke verdeutlicht. „Einsatz“ ist weit gefasst – vollständig implementiert ist nur knapp jedes zehnte Unternehmen. Es handelt sich um eine Auftragsbefragung mit Anbieterbeteiligung; die methodischen Details sind nicht vollständig öffentlich dokumentiert.

↩ Zur Karte in der Übersicht

91 % der (überwiegend großen) befragten Unternehmen stufen GenAI als geschäftskritisch ein

Primärquelle: KPMG, „Generative KI in der deutschen Wirtschaft 2025“. Studienseite (kpmg.com) →

Stichprobe: 653 Telefoninterviews, März 2025; Stichprobe stark von großen Unternehmen geprägt (knapp zwei Drittel über 1.000 Beschäftigte).

Was gemessen wurde: die strategische Relevanz – 91 % stufen generative KI als geschäftskritisch ein (Vorjahr: 55 %) –, nicht der tatsächliche Einsatz.

Ehrlich eingeordnet: KPMG weist die 91 % für „deutsche Unternehmen“ allgemein aus, ohne Aufschlüsselung nach Größe; da die Stichprobe großlastig ist, spiegelt der Wert überwiegend die Einschätzung großer Unternehmen. Ein direkter Vergleich „Großunternehmen gegen Mittelstand“ lässt sich aus dieser Studie nicht belegen.

↩ Zur Karte in der Übersicht

0,35 % des Umsatzes investiert der deutsche Mittelstand in KI

Primärquelle: Horváth, Digital-Value-Studie, Januar 2026. Horváth Media-Center / Studien (horvath-partners.com) →

Stichprobe: 200 mittelständische Unternehmen ab 100 Mio. € Umsatz; Selbstauskunft.

Was gemessen wurde: eine Investitionsquote (Anteil des Umsatzes, der in KI fließt) – 0,35 % im Mittelstand, rund 30 % unter dem deutschen Gesamtmarkt-Durchschnitt von 0,5 %.

Ehrlich eingeordnet (Diskrepanz): Es ist ein Input-, kein Ergebnismaß – die Quote sagt nichts über Nutzungsgrad oder Rendite aus. Der Vergleichswert 0,5 % ist der deutsche Gesamtmarkt-Durchschnitt, nicht ein globaler Schnitt. Bemerkenswert: Der Mittelstand senkte seine Quote 2025 sogar (von 0,41 % in 2024).

↩ Zur Karte in der Übersicht

Block 3 · Der entscheidende Unterschied

Einbettung statt Alleingang

67 % vs. ~33 %: prozess-eingebettete bzw. eingekaufte KI erreicht rund doppelt so oft den Produktivbetrieb

Primärquelle: MIT Project NANDA, „The GenAI Divide“ 2025; der Buy-vs-Build-Wert wird u. a. bei Fortune berichtet. MIT-NANDA-Bericht als PDF → · Fortune-Berichterstattung →

Bezugsgröße: „Deployment“ – der Sprung vom Piloten in den produktiven Dauereinsatz –, gemessen an der Interview-Teilstichprobe von rund 52 Organisationen. Verglichen werden zwei Beschaffungswege: extern eingekauft / prozess-eingebettet (rund 67 % Erfolg) gegenüber intern im Alleingang gebaut (etwa 33 %).

Ehrlich eingeordnet (Diskrepanz): Der Bericht nennt „rund doppelt so oft“ (67 % gegenüber 33 %). Die anderswo verbreitete Lesart „nur ein Drittel so oft“ ist rechnerisch falsch und wird hier bewusst nicht verwendet. Streng genommen geht es um Software-Beschaffung, nicht um Weiterbildung; das übertragbare Prinzip lautet: Wer KI ohne Einbettung in echte Abläufe und ohne Spezialisierung im Alleingang angeht, scheitert deutlich häufiger. Die 67 % sind also kein direkter Beleg für den Erfolg von Schulungen, sondern für den Wert der Einbettung.

↩ Zur Karte in der Übersicht

Die rote Linie durch alle Studien: nicht die Technologie ist die Blockade, sondern Wissen, Strategie und Umsetzung. So unterschiedlich die Methoden sind – ausbleibender P&L-Beitrag, Projektabbrüche, Investitionsquoten, genannte Hemmnisse – sie zeigen in dieselbe Richtung. Eine Methode lässt sich übertragen.

Standortbestimmung starten