Prithvi Rajasekaran w Anthropic Engineering opublikował artykuł o wieloagentowych harnessach do tworzenia długo działających aplikacji. Porusza problem, który obserwuję od trzech dekad — tyle że w zupełnie nowym kontekście.
Samotny agent ma swój sufit
Główny argument trafia do mnie natychmiast: pojedynczy agent AI pracujący samodzielnie traci spójność przy długich zadaniach, staje się nadmiernie optymistyczny co do własnych wyników i zaczyna iść na skróty. To w zasadzie każdy programista o 2 w nocy przed deadlinem, tyle że AI robi to szybciej.
Rozwiązanie? Oddziel budowniczego od krytyka. Różni agenci zajmują się planowaniem, implementacją i ewaluacją — a ewaluator faktycznie testuje działającą aplikację, nie tylko kod. To odzwierciedla coś, co głoszę od dekad: nigdy nie łapiesz własnych bugów tak dobrze, jak robi to ktoś inny.
Czyste przekazania biją chaotyczne kontynuacje
Jeden wniosek z artykułu szczególnie do mnie przemówił: pełne resety kontekstu z ustrukturyzowanymi przekazaniami działały lepiej niż próby kompresji i kontynuacji, gdy okna kontekstowe się zapełniają.
Widziałem dokładnie ten sam wzorzec w zespołach ludzkich. Czy to zmiany w ops, granice sprintów w agile, czy okna kontekstowe w AI — zasada jest identyczna. Udokumentuj stan, przekaż go czysto, zacznij od nowa. Narzut przekazania zwraca się w postaci przejrzystości. Za każdym razem.
Wiedz, kiedy narzut się opłaca
Artykuł zawiera też niuansową uwagę o narzucie ewaluacji. Dla zadań dobrze w zasięgu możliwości modelu, pełna pętla ewaluatora to ceremonia. Dla pracy na krawędzi — kreatywny design, złożone wieloetapowe funkcjonalności — jest niezbędna.
To mapuje się bezpośrednio na moje myślenie o code review i QA. Trywialna zmiana konfiguracji nie potrzebuje trzech rund przeglądu. Refaktor systemu płatności absolutnie tak. Sztuką jest wiedzieć, w której sytuacji się znajdujesz, i ta ocena nie znika tylko dlatego, że AI pisze kod.
Podsumowanie
Przyszłość wytwarzania oprogramowania wspomaganego przez AI to nie pojedynczy genialny agent. To zespół wyspecjalizowanych agentów z jasno określonymi rolami, uczciwymi pętlami feedbacku i czystymi przekazaniami. Trzydzieści lat budowania zespołów programistycznych nauczyło mnie tego — i najwyraźniej architektura AI uczy się tej samej lekcji. Przeczytaj pełny artykuł, by poznać szczegóły techniczne implementacji.