Post-Agile: Wie 'Human-AI Teaming' Deine Teams nach Scrum neu organisiert

Post-Agile: Wie 'Human-AI Teaming' Deine Teams nach Scrum neu organisiert

Table of Contents

Post-Agile: Wenn das Team kein rein menschliches mehr ist

Seit über zwei Jahrzehnten optimieren agile Frameworks – Scrum, Kanban oder skalierte Modelle wie SAFe – im Kern dasselbe: die Zusammenarbeit von Menschen. Synchronisation im Daily, Kapazitätsschätzung im Planning, Prozessverbesserung in der Retro. Wir waren und sind mittendrin.

Die genannten und bekannten Rituale setzen alle eine stillschweigende Annahme voraus: Das Team besteht aus Menschen, die ungefähr gleich schnell denken, schlafen müssen und sich abstimmen wollen.

Genau diese Annahme bricht gerade – nicht nur bei unseren Kunden, sondern auch bei uns. Der Auslöser ist keine neue Management-Theorie, sondern der Einzug von Agentic AI (dt. „KI-Agenten") in die Wertschöpfung. KI agiert nicht mehr nur als passives Werkzeug wie eine IDE oder ein Taschenrechner, sondern als aktiver Akteur – als Teammitglied, das Aufgaben annimmt, ausführt und zurückliefert.

Die Zahlen dahinter sind kein Hype: McKinsey schätzt, dass generative KI den Anteil der Arbeitstätigkeiten, die sich mit heutiger Technologie automatisieren lassen, von rund 50 % auf 60–70 % der Arbeitszeit anhebt. (1) Wenn ein so großer Teil der operativen Routine – Code schreiben, Tests generieren, Daten aufbereiten, Dokumentation erstellen – an Agenten übergeht, werden zweiwöchige Sprints und stundenlange Abstimmungsmeetings vom Taktgeber zum Bremsklotz.

Dieser Beitrag schaut auf das, was danach kommt: Human-AI Teaming. Also darauf, wie sich Teams organisieren, wenn der Mensch aus der operativen Tretmühle heraustritt und die Rolle des strategischen Orchestrators übernimmt. Wichtig vorweg, weil wir hands-on arbeiten: Es gibt hier noch kein fertiges Framework. Was es gibt, sind belastbare Muster, eine ehrliche Abwägung der Risiken – und konkrete Schritte für Montagmorgen.

Das ist der erste Teil einer kleinen Serie. Hier geht es um die Menschen und ihre Teams; in den nächsten Beiträgen nehmen wir die übrigen Bausteine auseinander – die Technologie, die Organisation und die Abläufe.

1. Vom Tool zum Teammitglied: Die neue Rolle der KI

Im klassischen agilen Setup ist Softwareentwicklung handwerklich geprägt: Menschen schreiben, testen und analysieren. Im Post-Agile-Modell verschiebt sich die Wertschöpfung. KI-Agenten – etwa GitHubs Copilot Coding Agent, der seit September 2025 allgemein verfügbar ist, oder Cognitions Devin, vermarktet als autonomer KI-Softwareentwickler – übernehmen Teile der Ausführung. (2) Der Mensch definiert den Kontext, formuliert die Problemstellung und validiert das Ergebnis.

Die scharfe Trennung in „Entwickler", „Tester" und „Analyst" verschwimmt, weil eine einzelne Fachkraft mit einem KI-Ensemble den Output produzieren kann, für den früher ein ganzes Scrum-Team nötig war. Aber nur innerhalb eines bestimmten Bereichs – und das kann gar nicht genug betont werden.

Die viel zitierte HBS/BCG-Feldstudie zur „Jagged Technological Frontier" zeigt beides: Bei Aufgaben innerhalb der KI-Kompetenzzone lieferten Beratende mit GPT-4 eine um 40 % höhere Qualität, arbeiteten 25 % schneller und erledigten 12 % mehr Aufgaben. Bei Aufgaben außerhalb dieser Zone lagen sie dagegen 19 Prozentpunkte häufiger daneben – weil sie der KI dort vertrauten, wo sie es nicht verdient hatte. (3)

Neuere und teils strengere Studien schärfen dieses Bild. Ein breit angelegtes Feldexperiment mit über 5.000 Kundenservice-Mitarbeitenden zeigt einen ausgeprägten „Skill-Levelling"-Effekt: +15 % Produktivität im Schnitt, aber +34 % bei Neulingen und kaum Wirkung bei den Erfahrenen. (6) Eine kontrollierte Studie von METR (2025) mit erfahrenen Open-Source-Entwicklern auf ihren eigenen Codebasen fand sogar das Gegenteil des erwarteten Schubs: Die KI machte sie 19 % langsamer – während sie selbst überzeugt waren, 20 % schneller gewesen zu sein. (7)

Die Lehre ist nicht „KI bringt nichts", sondern: Der Nutzen hängt massiv von Aufgabe und Erfahrungsgrad ab – und die gefühlte Produktivität ist ein schlechter Ratgeber.

Die Kernkompetenz des Menschen wird damit nicht das Tippen, sondern das Erkennen, auf welcher Seite dieser unsichtbaren Grenze eine Aufgabe gerade liegt.

Die folgenden drei Verschiebungen sind deshalb keine Selbstläufer, sondern eine gezielte Transformation: Wir bauen dort um, wo KI nachweislich trägt – nicht überall, weil sie angeblich alles kann.

2. Asynchronität als Default-Betriebssystem

Agilität ist extrem synchron: Daily, Planning, Review, Retro – alle gleichzeitig im Raum, mit festen Kadenzen. Human-AI Teaming ermöglicht – und belohnt – das Gegenteil: radikale Asynchronität.

Warum? Eine KI hat keine Arbeitszeiten und braucht keine Meetings zur Motivation. Übergaben erfolgen dokumentenbasiert oder direkt im Repository. Konkreter: Du formulierst abends eine komplexe Anforderung, der Agent erarbeitet über Nacht Lösungsansätze, Prototypen oder Architektur-Entwürfe. Am nächsten Morgen wird nicht diskutiert, sondern gesichtet, korrigiert, feinjustiert und orchestriert.

Das ist kein Neuland, das man erfinden müsste: Remote-First-Organisationen wie GitLab haben das Spielbuch für asynchrones Arbeiten – schriftliche Übergaben, Single Source of Truth, Entscheidungen ohne Meeting – seit Jahren dokumentiert. (4) Human-AI Teaming macht aus dieser Option eine echte Notwendigkeit.

Ein Selbstläufer ist das aber nicht: In einem Feldexperiment mit über 7.000 Beschäftigten in 66 Firmen nutzte der Durchschnitt das integrierte KI-Tool nur in rund 41 % der Wochen. (8) Asynchronität und KI-Teaming entstehen nicht von allein – sie müssen aktiv eingeführt und vorgelebt werden.

Der angenehme Nebeneffekt für die Menschen, wenn es gelingt: Meeting-Zeit kollabiert zugunsten von Deep-Work-Phasen. Und als pragmatische Optimisten behaupten wir: Das ist nicht nur Wunschdenken.

Wie dieser asynchrone Takt konkret organisiert wird – Übergaben, Spezifikation, Freigaben –, ist ein Thema für sich. Dazu im Detail mehr im Beitrag zu den Abläufen.

3. Dynamische Ressourcenallokation statt jahrelang fester Teams

Das Paradigma fester Teams, die jahrelang in derselben Besetzung zusammenbleiben, um „Velocity" aufzubauen, gerät unter Druck. Wohlgemerkt: Nicht die kleine Teamgröße ist das Problem, sondern die starre Dauerhaftigkeit. An ihre Stelle wird ein fluideres Modell treten, eher wie in der Filmproduktion: Ein Team formiert sich um ein konkretes Problem und löst sich danach wieder auf. Das ist – ehrlich gesagt – noch eher Beobachtung aus der Praxis als gesicherte Empirie, aber die Richtung zeichnet sich ab.

Weil die KI das „Heavy Lifting" stellt, lassen sich Engpässe dynamisch überbrücken. Fehlt einer Backend-Entwicklerin das Frontend-Know-how für ein Feature, wartet sie nicht wochenlang auf Kapazität im Frontend-Team, sondern nutzt KI als temporären Pair-Programmer – im Rahmen ihrer Kompetenzzone und unter ihrer Verantwortung.

Erst kürzlich haben wir genau das in der Praxis gesehen: Ein Projektleiter hat eine Datenbankmigration mit KI-Unterstützung bis zu den technischen Basics selbst aufgesetzt – ohne auf eine freie Datenbank-Spezialistin warten zu müssen.

Ressourcenallokation wird so dezentraler und schneller. Entscheidend bleibt das unter ihrer Verantwortung: Nur weil die KI gerade praktisch einspringt, verschiebt sich die KI-Kompetenzgrenze aus Kapitel 1 nicht – die Entwicklerin steht für das Ergebnis gerade, nicht der Agent (oder noch besser der Projektleiter).

Die kleine Teamgröße selbst verschwindet dabei übrigens nicht – sie kommt eher zurück. Warum ausgerechnet KI kleine Teams stärkt, statt sie aufzulösen, und wie man sie klug schneidet, ist das Thema des nächsten Beitrags dieser Serie: zur Organisation.

4. Der Mensch als strategischer Orchestrator (und Regisseur)

Die menschliche Arbeit verschiebt sich – etwas zugespitzt – von der Ausführung zur Entscheidung.

Die Kreation verschwindet dabei nicht; sie steigt auf die Ebene von Problem, Architektur und Urteil. Vom Tippen einzelner Zeilen, hin zum Entwerfen von Systemen und zum Urteil darüber, was überhaupt gebaut werden soll.

Hinzu kommt eine neue, anstrengende Pflicht – die Kuration und Validierung dessen, was die KI liefert. Genau hierfür werden im Post-Agile-Modell drei Fähigkeiten überproportional wertvoll:

  • Kritisches Denken & Systemarchitektur: Passt die generierte Lösung in den Gesamtkontext – technisch, fachlich, wirtschaftlich?
  • Validierung: Halluziniert die KI? Sind Sicherheits- und Qualitätsstandards erfüllt? Martin Fowler bringt die nötige Haltung auf den Punkt: Behandle jeden KI-Codeschnipsel wie einen Pull Request von einem „zwielichtigen, aber extrem produktiven Mitarbeiter" – nutzbar, aber niemals ungeprüft. (5)
  • Empathie & strategische Ausrichtung: Was braucht der Endnutzer wirklich? KI kann Probleme lösen, aber schlecht entscheiden, welche Probleme es wert sind, gelöst zu werden.

Um beim Beispiel zu bleiben: Der Mensch wird zum detailverliebten Regisseur der Code- und Konzeptbasis. Ein Regisseur schreibt nicht jeden Dialog und baut nicht jedes Setting selbst – aber er verantwortet das Ganze. Wie dieses Spezifizieren und Validieren als konkreter Ablauf funktioniert – von „Spec vor Code" bis zur Frage, wann ein Agent allein deployen darf –, vertiefen wir im Beitrag zu den Abläufen.

Wo steht Dein Team heute?

Bevor Du jetzt blindlings eine Transformation startest, hilft eine ehrliche Standortbestimmung. Ordne Dein Team in eines dieser vier Level ein:

LevelBeschreibungTypisches Symptom
1. KI-TabuKI ist Schatten-IT oder verboten. Genutzt wird sie heimlich, ohne Standards.„Offiziell machen wir das nicht."
2. Solo-ToolEinzelne nutzen KI als persönlichen Autocomplete. Kein geteiltes Vorgehen, kein Review-Standard.„Jeder promptet so vor sich hin."
3. Geteilte PraxisEs gibt Konventionen: Wo KI eingesetzt wird, wie reviewt wird, was dokumentiert wird.„Bei uns gilt: KI-Output wird wie ein PR behandelt."
4. Orchestriertes TeamAgenten arbeiten asynchron an definierten Aufgaben, Menschen orchestrieren und validieren entlang klarer Schwellen.„Der Agent hat über Nacht den Entwurf gebaut, wir haben heute früh kuratiert."

Dein Ziel ist nicht, morgen auf Level 4 zu springen. Lass Dein Team stabil von Level 1/2 auf Level 3 kommen – dort entsteht der Hebel, ohne dass die Qualität kippt.

Chancen und Risiken – eine ehrliche Abwägung

Chancen

  • Radikale Effizienzsteigerung: Der Weg von der Idee zum validierten Prototyp verkürzt sich von Wochen auf Tage oder Stunden – belegbar dort, wo die Aufgabe innerhalb der KI-Kompetenzzone liegt. (3)
  • Fokus auf echte Wertschöpfung: Befreiung von Boilerplate, Protokollen und Ticket-Pflege. Zeit für Strategie, Architektur und Nutzerbedürfnisse.
  • Demokratisierung von Fähigkeiten: Fachabteilungen können mit KI erste technische Lösungen oder Datenanalysen erstellen, ohne den Umweg über die IT – der belegte „Skill-Levelling"-Effekt zeigt die größten Zuwächse genau am Einstieg. (6)
  • Gesündere Arbeitskultur: Echte Asynchronität reduziert den Meeting-Wahnsinn und erlaubt Arbeit im eigenen Rhythmus.

Risiken

  • Das Junior-Problem (Apprenticeship Crisis): Wenn KI die klassischen Einstiegsaufgaben fehlerfrei in Sekunden erledigt – wie bilden wir dann noch Senioren aus? Meisterschaft entstand historisch über das Üben der Basics. Ein validiertes Ausbildungsmodell dafür fehlt heute.
  • Review Fatigue: Das Validieren von KI-Output ist kognitiv anstrengend. Genau die „mis-calibrated trust" aus der HBS/BCG-Studie ist die Gefahr: Aus Erschöpfung wird durchgewunken („sieht gut aus") – und die Systemqualität erodiert schleichend. (3) Die METR-Studie (2025) hat genau diese Lücke gemessen – 19 % langsamer trotz gefühlter Beschleunigung. (7)
  • Verlust des „Shared Mental Models": Asynchrones Arbeiten mit KI kostet den beiläufigen Flurfunk und das implizite Wissen, das in synchronen Teams nebenbei entsteht.
  • Methoden-Vakuum: Scrum und SAFe mögen an Grenzen stoßen – aber sie boten Sicherheit. Etablierte Post-Agile-Standards existieren noch nicht, was in Transformationsphasen zu strukturellem Chaos führen kann.

Monday Morning Actions: 3 Schritte für morgen früh

Du musst nicht die Organisation umbauen. Starte mit drei Impulsen direkt im nächsten Team-Meeting:

  1. Der „Frontier-Check“ (25 Min.): Sammelt gemeinsam zwei Listen – Aufgaben, bei denen KI bei euch zuverlässig liefert, und solche, bei denen sie schon mal überzeugend daneben lag. Diese Grenze sichtbar zu machen, ist der erste Schritt gegen blindes Vertrauen.
  2. Der „PR-vom-dodgy-Kollegen"-Standard: Verabredet eine einfache Regel: KI-Output wird wie ein Pull Request behandelt – nichts geht ungeprüft in Produktion, egal wie überzeugend es aussieht. Schreibt es als einen Satz in eure Definition of Done.
  3. Das „Async-Experiment": Wählt eine konkrete Aufgabe, formuliert sie abends sauber als schriftlichen Auftrag (für Mensch oder Agent) und prüft am nächsten Morgen das Ergebnis – statt sie im Meeting zu zerreden. Beobachtet, was die schriftliche Klarheit allein schon bewirkt.

Offene Fragen und nächste Schritte

Um Human-AI Teaming von der Idee in gelebte Praxis zu überführen, sind vier Punkte dringend zu klären:

  1. Neue Metriken definieren. Story Points und Velocity werden bedeutungslos, wenn KI den Großteil der Tickets schließt. Wir brauchen Maße für Outcome (Impact) statt Output (geschlossene Tickets). Nächster Schritt: Pilot-Teams aufsetzen, die nach „Time-to-Value" gesteuert werden.
  2. Die Junior-Krise lösen. Wie lernen Nachwuchskräfte Systemarchitektur und Code-Review, ohne jahrelang die Basics manuell zu üben? Ist „AI-Pairing" (Junior + KI lösen gemeinsam komplexere Probleme) die Antwort? Nächster Schritt: Explizite Mentoring-Programme für Prompting und Reviewing etablieren.
  3. Governance für KI-Entscheidungen. Wie viel operative Autonomie bekommt ein Agent? Darf er bei grünen Tests selbstständig deployen? Nächster Schritt: Schwellen für „Human-in-the-Loop" vs. „Human-on-the-Loop" je nach Kritikalität definieren. (Diese Governance-Frage nehmen wir im Beitrag zu den Abläufen im Detail auseinander.)
  4. Leichtgewichtige Frameworks ableiten. Aus den Erfahrungen der Early Adopter müssen neue Organisationsstrukturen entstehen, die das agile Manifest in den Kontext der KI-Ära übersetzen – ohne den nächsten Methoden-Moloch zu bauen.

Fazit: Die Kosten des Abwartens

Post-Agile ist keine Ankündigung vom Tod der Agilität, sondern die nüchterne Feststellung, dass ein Betriebssystem für rein menschliche Teams nicht automatisch für gemischte Teams passt. Die Effizienzgewinne sind real – aber nur dort, wo Menschen die Grenze der KI-Kompetenz kennen und Validierung ernst nehmen. Genau das ist die Führungsaufgabe.

Es bleibt eine kalibrierte Wette, kein Naturgesetz: Niemand baut die Organisation um, weil KI angeblich alles kann, sondern dort, wo sie nachweislich trägt. Abwarten, bis „das fertige Framework" erscheint, ist trotzdem teuer: Während Du wartest, sammeln andere die Erfahrung, die später zum Standard wird. Starte deshalb klein – nicht mit einer Reorganisation, sondern mit einer ehrlich gezogenen Grenze und einem Review-Standard, der hält.

Und eine unbequeme Ahnung zieht sich durch alles hier: Das Werkzeug allein verändert nichts. Ob das stimmt – und was Unternehmen wie Amazon dazu in harten Zahlen liefern –, ist die Leitfrage der kommenden Beiträge. Hier ging es um die Menschen. Als Nächstes: die Organisation und die Abläufe.

Bilder und sonstige Dankeschöns!

Quellen

  • 1 – McKinsey & Company (2023) Quelle: The economic potential of generative AI: The next productivity frontier. Aussage im Text: Generative KI hebt den Anteil der Arbeitstätigkeiten, die sich mit heute verfügbarer Technologie automatisieren lassen, von rund 50 % auf 60–70 % der Arbeitszeit an. Fundort: Abschnitt zu Automatisierungspotenzial und Produktivität (Executive Summary / „The era of generative AI is just beginning"). Link: mckinsey.com
  • 2 – GitHub (2025) / Cognition AI (2024) Quelle: GitHub Changelog: Copilot coding agent (allgemein verfügbar seit September 2025); Cognition AI: Devin (Vorstellung März 2024). Aussage im Text: KI-Agenten übernehmen zunehmend operative Ausführung. Der frühere „Copilot Workspace"-Technical-Preview wurde eingestellt und in den produktiven Copilot Coding Agent überführt; Devin wird als autonomer KI-Softwareentwickler vermarktet. Fundort: GitHub-Changelog-Einträge zum Copilot Coding Agent; Produktankündigung Cognition AI. Link: github.blog/changelog · cognition.ai
  • 3 – Dell’Acqua, F. et al. (2023/2025) Quelle: Navigating the Jagged Technological Frontier: Field Experimental Evidence of the Effects of AI on Knowledge Worker Productivity and Quality. Zunächst HBS Working Paper 24-013; begutachtet (peer-reviewed) erschienen in Organization Science (2025). Feldexperiment mit 758 BCG-Beratenden, GPT-4. Aussage im Text: Innerhalb der KI-Kompetenzzone +40 % Qualität, ca. 25 % schneller, +12 % erledigte Aufgaben. Außerhalb dieser Zone ca. 19 Prozentpunkte schlechtere Ergebnisse durch „mis-calibrated trust" – Beleg für Effizienzgewinn und die Notwendigkeit konsequenter Validierung (Review Fatigue). Fundort: Abstract sowie Ergebnis-Abschnitte „inside/outside the frontier". Link: Organization Science (2025) · hbs.edu · SSRN 4573321
  • 4 – GitLab Quelle: GitLab All-Remote / Guide to Asynchronous Work (GitLab Handbook & Remote Work Report). Aussage im Text: Etablierte Best Practices für radikale Asynchronität – schriftliche Übergaben, Single Source of Truth, Entscheidungen ohne Meeting – als Fundament für Post-Agile-Workflows. Fundort: Handbook-Abschnitte zu „All-Remote" und „Asynchronous Communication". Link: handbook.gitlab.com – All-Remote
  • 5 – Fowler, M. / Thoughtworks Quelle: Exploring Generative AI (laufende Artikelserie auf martinfowler.com) sowie öffentliche Vorträge zur Evolution der Softwarearchitektur im Angesicht KI-generierten Codes. Aussage im Text: KI-Output ist wie ein Pull Request eines „zwielichtigen, aber sehr produktiven" Mitarbeiters zu behandeln – nutzbar, aber konsequent zu reviewen; klare Abgrenzung von „Vibe Coding" zu verantwortetem, agentischem Arbeiten. Fundort: Artikel „Exploring Generative AI" und zugehörige „Memos". Link: martinfowler.com
  • 6 – Brynjolfsson, E.; Li, D.; Raymond, L. (2025) Quelle: Generative AI at Work. The Quarterly Journal of Economics, 140(2), 889–942. Aussage im Text: „Skill-Levelling": +15 % Produktivität im Schnitt, +34 % bei Neulingen/gering Qualifizierten, kaum Effekt bei Erfahrenen (5.179 Kundenservice-Agenten). Fundort: Abstract und Ergebnis-Abschnitte zur Heterogenität nach Erfahrungsgrad. Link: academic.oup.com/qje
  • 7 – METR (2025) Quelle: Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity. arXiv:2507.09089. RCT, 16 erfahrene Entwickler, 246 Tasks auf eigenen Repos (Cursor Pro, Claude 3.5/3.7). Aussage im Text: KI-Tools verlängerten die Bearbeitungszeit um 19 %, obwohl die Entwickler eine Beschleunigung um ~20 % wahrnahmen – belegt die Perzeptionslücke und das Review-Fatigue-Risiko. Einschränkung: kleine Stichprobe, sehr erfahrene Devs auf vertrautem Code. Fundort: Abstract sowie Abschnitte „Results" und „Forecasts vs. realized". Link: arxiv.org/abs/2507.09089
  • 8 – Dillon, E. W.; Jaffe, S. et al. (2025) Quelle: Shifting Work Patterns with Generative AI. arXiv:2504.11436. Feldexperiment mit 7.137 Beschäftigten in 66 Firmen über 6 Monate (Microsoft 365 Copilot). Aussage im Text: Moderate Zeitersparnis bei E-Mail/Dokumenten, aber niedrige nachhaltige Nutzung (~41 % der Studienwochen) – Adoption ist kein Selbstläufer. Fundort: Abschnitte zu Nutzungsraten und Zeiteffekten. Link: arxiv.org/abs/2504.11436
Share

Related Posts

Mehr als nur ein Wiki: Wie intelligentes Wissensmanagement Deine digitale Transformation beschleunigt

Mehr als nur ein Wiki: Wie intelligentes Wissensmanagement Deine digitale Transformation beschleunigt

Schluss mit Kopfmonopolen: Wissensmanagement schützt vor operativem Chaos und steigert die Produktivität messbar – ohne IT-Großprojekt. Erfahre hier, wie.

Read More
Agile Fluency - DAS Model der agilen Entwicklung?

Agile Fluency - DAS Model der agilen Entwicklung?

Organisationen, die ihre agile Reise angetreten sind, versuchen, Agilität zu messen. Aber wie kann man Agilität messen?

Read More
Dual Track Agile und seine Vorteile

Dual Track Agile und seine Vorteile

Wir zeigen, wie Dual Track Agile helfen kann, schneller bessere Produkte zu entwickeln durch echte Zusammenarbeit zwischen UX und Entwicklern ohne Overhead.

Read More