Dlaczego architektury wieloagentowe to przyszłość poważnego wytwarzania oprogramowania

Prithvi Rajasekaran w Anthropic Engineering opublikował artykuł o wieloagentowych harnessach do tworzenia długo działających aplikacji. Porusza problem, który obserwuję od trzech dekad — tyle że w zupełnie nowym kontekście.

Samotny agent ma swój sufit

Główny argument trafia do mnie natychmiast: pojedynczy agent AI pracujący samodzielnie traci spójność przy długich zadaniach, staje się nadmiernie optymistyczny co do własnych wyników i zaczyna iść na skróty. To w zasadzie każdy programista o 2 w nocy przed deadlinem, tyle że AI robi to szybciej.

Rozwiązanie? Oddziel budowniczego od krytyka. Różni agenci zajmują się planowaniem, implementacją i ewaluacją — a ewaluator faktycznie testuje działającą aplikację, nie tylko kod. To odzwierciedla coś, co głoszę od dekad: nigdy nie łapiesz własnych bugów tak dobrze, jak robi to ktoś inny.

Czyste przekazania biją chaotyczne kontynuacje

Jeden wniosek z artykułu szczególnie do mnie przemówił: pełne resety kontekstu z ustrukturyzowanymi przekazaniami działały lepiej niż próby kompresji i kontynuacji, gdy okna kontekstowe się zapełniają.

Widziałem dokładnie ten sam wzorzec w zespołach ludzkich. Czy to zmiany w ops, granice sprintów w agile, czy okna kontekstowe w AI — zasada jest identyczna. Udokumentuj stan, przekaż go czysto, zacznij od nowa. Narzut przekazania zwraca się w postaci przejrzystości. Za każdym razem.

Wiedz, kiedy narzut się opłaca

Artykuł zawiera też niuansową uwagę o narzucie ewaluacji. Dla zadań dobrze w zasięgu możliwości modelu, pełna pętla ewaluatora to ceremonia. Dla pracy na krawędzi — kreatywny design, złożone wieloetapowe funkcjonalności — jest niezbędna.

To mapuje się bezpośrednio na moje myślenie o code review i QA. Trywialna zmiana konfiguracji nie potrzebuje trzech rund przeglądu. Refaktor systemu płatności absolutnie tak. Sztuką jest wiedzieć, w której sytuacji się znajdujesz, i ta ocena nie znika tylko dlatego, że AI pisze kod.

Podsumowanie

Przyszłość wytwarzania oprogramowania wspomaganego przez AI to nie pojedynczy genialny agent. To zespół wyspecjalizowanych agentów z jasno określonymi rolami, uczciwymi pętlami feedbacku i czystymi przekazaniami. Trzydzieści lat budowania zespołów programistycznych nauczyło mnie tego — i najwyraźniej architektura AI uczy się tej samej lekcji. Przeczytaj pełny artykuł, by poznać szczegóły techniczne implementacji.