Prithvi Rajasekaran bei Anthropic Engineering hat einen Beitrag über Multi-Agent-Harnesses für langlebige Anwendungsentwicklung veröffentlicht. Er adressiert ein Problem, das ich seit drei Jahrzehnten kenne — nur in einem völlig neuen Kontext.
Der Solo-Agent hat eine Obergrenze
Das Kernargument spricht mich sofort an: Ein einzelner KI-Agent, der allein arbeitet, verliert bei langen Aufgaben die Kohärenz, wird optimistisch bezüglich seiner eigenen Ergebnisse und beginnt, Abkürzungen zu nehmen. Das ist im Grunde jeder Entwickler um 2 Uhr nachts kurz vor der Deadline, nur dass die KI es schneller macht.
Die Lösung? Den Baumeister vom Kritiker trennen. Verschiedene Agenten übernehmen Planung, Implementierung und Bewertung — und der Evaluator testet die laufende Anwendung, nicht nur den Code. Das spiegelt etwas wider, was ich seit Jahrzehnten predige: Man findet die eigenen Fehler nie so gut wie jemand anderes.
Saubere Übergaben schlagen chaotische Fortführungen
Eine Erkenntnis aus dem Artikel, die besonders resoniert hat: Vollständige Context-Resets mit strukturierten Übergaben funktionierten besser als der Versuch, den Kontext zu komprimieren und weiterzumachen, wenn Context Windows volllaufen.
Ich habe genau dieses Muster in menschlichen Teams gesehen. Ob es Schichtwechsel im Ops-Bereich sind, Sprint-Grenzen in Agile oder Context Windows bei KI — das Prinzip ist identisch. Zustand dokumentieren, sauber übergeben, frisch anfangen. Der Overhead der Übergabe zahlt sich durch Klarheit aus. Jedes Mal.
Wissen, wann der Overhead sich lohnt
Der Beitrag macht auch einen differenzierten Punkt zum Evaluierungs-Overhead. Für Aufgaben, die gut im Kompetenzbereich des Modells liegen, ist ein vollständiger Evaluator-Loop Zeremonie. Für Grenzfälle — kreatives Design, komplexe mehrstufige Features — ist er essenziell.
Das lässt sich direkt auf meine Denkweise bei Code Reviews und QA übertragen. Eine triviale Config-Änderung braucht keine drei Review-Runden. Ein Refactoring des Payment-Systems absolut schon. Die Kunst liegt darin zu erkennen, in welcher Situation man sich befindet — und diese Beurteilung verschwindet nicht, nur weil KI den Code schreibt.
Fazit
Die Zukunft KI-gestützter Entwicklung ist nicht ein einzelner brillanter Agent. Es ist ein Team spezialisierter Agenten mit klaren Rollen, ehrlichen Feedback-Loops und sauberen Übergaben. 30 Jahre Aufbau von Software-Teams haben mich das gelehrt — und offenbar lernt die KI-Architektur dieselbe Lektion. Den vollständigen Artikel gibt es bei Anthropic Engineering mit den technischen Details zur Umsetzung.