Agenci kodujący współpracują lokalnie. Zapomnij o API i zbędnych bibliotekach

Wyobraź sobie, że opłacasz subskrypcje Claude’a, Codexa i Gemini, ale każda próba ich wzajemnej komunikacji drenuje Twój portfel przez dodatkowe opłaty za API. Juan Pablo AJ znalazł na to genialnie prosty sposób: rozmowę agentów AI bezpośrednio przez wiersz poleceń. Bez zbędnych SDK, płatnych kluczy czy skomplikowanych zależności. To czysty hack, który pozwala odpalić zaawansowane procesy multi-agentowe w kilka minut, korzystając z tego, co już masz na dysku.

TL;DR

Juan Pablo AJ opracował metodę komunikacji agentów AI przez CLI z wykorzystaniem wznowienia sesji
Rozwiązanie eliminuje koszty API, bazując na posiadanych już subskrypcjach modeli
Dwa podejścia: szybki tryb nieinteraktywny (resume) oraz zaawansowany z użyciem tmux
System pozwala na iteracyjną współpracę: np. Claude tworzy draft, a Codex go recenzuje
Metoda idealna do prototypowania, choć wymaga czujności przy ryzyku halucynacji modeli

Dlaczego agenci AI potrzebują takiej sztuczki?

Juan Pablo AJ, programista, który na co dzień kombinuje z kodującymi agentami, miał serdecznie dość ręcznego przeklejania tekstu między oknami Claude’a, Codexa i Gemini. Zamiast przepalać budżet na tokeny w API, opracował proces oparty na subskrypcjach konsumenckich, które większość z nas i tak opłaca. Cała magia polega na rozszerzaniu sesji jednego modelu przez drugi – przykładowo, wysyłasz prośbę do Codexa, by zrobił szybki przegląd kodu wygenerowanego wcześniej przez Claude’a.

Ten patent sprawdza się idealnie, gdy potrzebujesz świeżego spojrzenia od różnych dostawców, nie chcąc jednocześnie zamykać się w ekosystemie jednego producenta. Brak dodatkowych opłat za wywołania API to karta przetargowa, a sama konfiguracja środowiska zajmuje dosłownie chwilę. To urocza ironia losu: dzięki temu rozwiązaniu modele dogadują się ze sobą taniej i sprawniej niż z oficjalnym serwerem producenta.

Podstawowy wzorzec: resume sesji w wierszu poleceń

Kluczem do sukcesu nie jest otwieranie nowej sesji przy każdym zapytaniu, lecz sprytne wznawianie tej poprzedniej (tzw. resume). Agenci są wywoływani prostymi komendami w stylu codex exec resume --last "prompt" lub gemini -r latest -p "prompt". W ten sposób kontekst rozmowy zostaje zachowany, a wymiana informacji między sztucznymi inteligencjami przebiega bez zakłóceń.

Juan Pablo AJ przechowuje instrukcje w specjalnym pliku pamięci Claude’a – nazwanym „external agent conventions” – do którego wgląd mają pozostali agenci. Pozwala to na stworzenie lekkiej pętli: agent A generuje szkic, wzywa agenta B do konstruktywnej krytyki, a nadrzędny proces decyduje o kolejnym kroku.

To proste rozwiązanie, które rewelacyjnie radzi sobie z tworzeniem dokumentacji, specyfikacji technicznych czy przy rutynowym przeglądzie kodu.

W codziennej pracy unikasz dzięki temu żmudnego kopiowania i wklejania, zyskując obiektywną opinię od innego modelu w czasie rzeczywistym. Scenariusz, w którym Claude pisze, a Codex punktuje błędy, aż do uzyskania stabilnej wersji finalnej, staje się standardem, a nie luksusem zarezerwowanym dla posiadaczy grubego portfela na platformach chmurowych.

Zaawansowany wzorzec z tmux dla lepszej widoczności

Kiedy podstawowa prostota przestaje wystarczać, do gry wchodzi tmux – klasyczne narzędzie do zarządzania wieloma oknami w jednym terminalu. Dzięki niemu możesz stworzyć dedykowane gniazda (sockety), sesje i panele dla poszczególnych agentów, używając poleceń typu tmux -S $SOCKET new -d -s "nazwa". To pozwala na znacznie większą kontrolę nad tym, co dzieje się „pod maską” Twojego lokalnego AI.

Agenci w tym układzie symulują wciskanie klawiszy, czekają na odpowiedź i przechwytują wynik za pomocą komend tmux send-keys ... Enter czy tmux capture-pane -p -J -t target. Zastosowanie wzorców z pliku „tmux multi-agent patterns” sprawia, że cały proces staje się przejrzysty. Możesz na żywo obserwować, jak modele wymieniają się argumentami, co drastycznie ułatwia wyłapywanie błędów w logice.

Wykorzystanie tmux umożliwia pracę równoległą, co jest kluczowe przy bardziej złożonych zadaniach. To idealne rozwiązanie dla tych, którzy chcą monitorować interakcje agentów w czasie rzeczywistym lub zarządzać kilkoma procesami AI jednocześnie bez chaosu w konsoli.

Praktyczne przykłady i kiedy to ma sens

Istnieje kilka konkretnych scenariuszy, w których ten hack pokazuje swój pełny potencjał. Juan Pablo AJ przetestował szereg zastosowań, które mogą odmienić Twój workflow. Przede wszystkim warto rozważyć ten model pracy w następujących przypadkach:

Tworzenie szkicu w Claude i natychmiastowa recenzja w Codex przy użyciu funkcji resume.
Uzyskanie alternatywnej opinii od Gemini na temat tego samego fragmentu tekstu lub kodu.
Model współpracy „twórca-recenzent”, gdzie jeden agent buduje, a drugi szuka dziury w całym.
Rola człowieka jako orkiestratora, który jedynie akceptuje lub odrzuca propozycje agentów.

Jak wspominaliśmy przy okazji tekstu o Humans&, firmie która pozyskała 480 mln dolarów na rozwój współpracy grupowej AI, era samotnych chatbotów powoli przemija. Ten prosty trik udowadnia, że zaawansowane środowisko multi-agentowe można zbudować niemal zerowym kosztem.

Wybieraj tryb nieinteraktywny do błyskawicznych testów, gdy nie chcesz martwić się o zależności. Postaw na tmux, gdy potrzebujesz pełnego wglądu w proces i chcesz trzymać rękę na pulsie.

Ograniczenia i czy to naprawdę poprawia wyniki

Niestety, prosty wzorzec oparty na CLI ma swoje wady, a największą z nich jest ograniczona widoczność – śledzenie pełnej historii rozmów bywa uciążliwe. Należy też zachować szczególną ostrożność w kwestii uprawnień (permissions), ponieważ autonomiczne wywołania systemowe mogą narobić bałaganu w plikach, jeśli nie zostaną odpowiednio ograniczone. Choć tmux rozwiązuje problem monitoringu, wymaga on dodatkowej konfiguracji i instalacji.

Sam Juan Pablo AJ stawia też ważne pytanie: czy fakt, że modele generują ładnie brzmiący tekst i osiągają konsensus, faktycznie oznacza wyższą jakość? Czy może to tylko „wypolerowana” halucynacja, w której agenci wzajemnie utwierdzają się w błędzie? Na ten moment to świetne narzędzie do eksperymentów i prototypowania, ale nie magiczna różdżka rozwiązująca wszystkie problemy.

Aspekt	Nieinteraktywny (resume)	Tmux
Konfiguracja	Brak dodatkowych zależności	Wymagana instalacja tmux
Widoczność	Niska (tylko wynik końcowy)	Wysoka (panele w czasie rzeczywistym)
Zastosowanie	Szybkie, proste testy	Monitoring i praca równoległa
Debugowanie	Utrudnione	Łatwe dzięki przechwytywaniu wyjścia
Zależności	Brak	Gniazda (sockety) tmux

Porównanie metod komunikacji agentów AI: prostota vs kontrola

Trzeba pamiętać, że ryzyko wystąpienia halucynacji rośnie wraz z długością łańcucha interakcji między modelami. To swoista ironia systemów multi-agentowych: im więcej „rozmawiają”, tym łatwiej mogą odpłynąć od faktów.

Źródła:

Juan Pablo AJ: https://juanpabloaj.com/2026/04/16/a-lightweight-way-to-make-agents-talk-without-paying-for-api-usage/; dyskusje na X.com o podobnych narzędziach CLI dla agentów

Agenci AI rozmawiają bez API. Juan Pablo AJ pokazuje sprytny trik

TL;DR

Dlaczego agenci AI potrzebują takiej sztuczki?

Podstawowy wzorzec: resume sesji w wierszu poleceń

Zaawansowany wzorzec z tmux dla lepszej widoczności

Praktyczne przykłady i kiedy to ma sens

Ograniczenia i czy to naprawdę poprawia wyniki

Related Articles

Alibaba pokazuje Qwen 3.8 w preview. Model z 2,4 biliona parametrów ma trafić do open-weight

Nolan widzi w AI przezroczystego konia trojańskiego. Co to oznacza dla Hollywood

Netflix wydał 587 mln USD na startup AI Afflecka. Co to oznacza dla Hollywood