Wyobraź sobie, że opłacasz subskrypcje Claude’a, Codexa i Gemini, ale każda próba ich wzajemnej komunikacji drenuje Twój portfel przez dodatkowe opłaty za API. Juan Pablo AJ znalazł na to genialnie prosty sposób: rozmowę agentów AI bezpośrednio przez wiersz poleceń. Bez zbędnych SDK, płatnych kluczy czy skomplikowanych zależności. To czysty hack, który pozwala odpalić zaawansowane procesy multi-agentowe w kilka minut, korzystając z tego, co już masz na dysku.
TL;DR
- Juan Pablo AJ opracował metodę komunikacji agentów AI przez CLI z wykorzystaniem wznowienia sesji
- Rozwiązanie eliminuje koszty API, bazując na posiadanych już subskrypcjach modeli
- Dwa podejścia: szybki tryb nieinteraktywny (resume) oraz zaawansowany z użyciem tmux
- System pozwala na iteracyjną współpracę: np. Claude tworzy draft, a Codex go recenzuje
- Metoda idealna do prototypowania, choć wymaga czujności przy ryzyku halucynacji modeli
Dlaczego agenci AI potrzebują takiej sztuczki?
Juan Pablo AJ, programista, który na co dzień kombinuje z kodującymi agentami, miał serdecznie dość ręcznego przeklejania tekstu między oknami Claude’a, Codexa i Gemini. Zamiast przepalać budżet na tokeny w API, opracował proces oparty na subskrypcjach konsumenckich, które większość z nas i tak opłaca. Cała magia polega na rozszerzaniu sesji jednego modelu przez drugi – przykładowo, wysyłasz prośbę do Codexa, by zrobił szybki przegląd kodu wygenerowanego wcześniej przez Claude’a.
Ten patent sprawdza się idealnie, gdy potrzebujesz świeżego spojrzenia od różnych dostawców, nie chcąc jednocześnie zamykać się w ekosystemie jednego producenta. Brak dodatkowych opłat za wywołania API to karta przetargowa, a sama konfiguracja środowiska zajmuje dosłownie chwilę. To urocza ironia losu: dzięki temu rozwiązaniu modele dogadują się ze sobą taniej i sprawniej niż z oficjalnym serwerem producenta.
Podstawowy wzorzec: resume sesji w wierszu poleceń
Kluczem do sukcesu nie jest otwieranie nowej sesji przy każdym zapytaniu, lecz sprytne wznawianie tej poprzedniej (tzw. resume). Agenci są wywoływani prostymi komendami w stylu codex exec resume --last "prompt" lub gemini -r latest -p "prompt". W ten sposób kontekst rozmowy zostaje zachowany, a wymiana informacji między sztucznymi inteligencjami przebiega bez zakłóceń.
Juan Pablo AJ przechowuje instrukcje w specjalnym pliku pamięci Claude’a – nazwanym „external agent conventions” – do którego wgląd mają pozostali agenci. Pozwala to na stworzenie lekkiej pętli: agent A generuje szkic, wzywa agenta B do konstruktywnej krytyki, a nadrzędny proces decyduje o kolejnym kroku.
To proste rozwiązanie, które rewelacyjnie radzi sobie z tworzeniem dokumentacji, specyfikacji technicznych czy przy rutynowym przeglądzie kodu.
W codziennej pracy unikasz dzięki temu żmudnego kopiowania i wklejania, zyskując obiektywną opinię od innego modelu w czasie rzeczywistym. Scenariusz, w którym Claude pisze, a Codex punktuje błędy, aż do uzyskania stabilnej wersji finalnej, staje się standardem, a nie luksusem zarezerwowanym dla posiadaczy grubego portfela na platformach chmurowych.
Zaawansowany wzorzec z tmux dla lepszej widoczności
Kiedy podstawowa prostota przestaje wystarczać, do gry wchodzi tmux – klasyczne narzędzie do zarządzania wieloma oknami w jednym terminalu. Dzięki niemu możesz stworzyć dedykowane gniazda (sockety), sesje i panele dla poszczególnych agentów, używając poleceń typu tmux -S $SOCKET new -d -s "nazwa". To pozwala na znacznie większą kontrolę nad tym, co dzieje się „pod maską” Twojego lokalnego AI.
Agenci w tym układzie symulują wciskanie klawiszy, czekają na odpowiedź i przechwytują wynik za pomocą komend tmux send-keys ... Enter czy tmux capture-pane -p -J -t target. Zastosowanie wzorców z pliku „tmux multi-agent patterns” sprawia, że cały proces staje się przejrzysty. Możesz na żywo obserwować, jak modele wymieniają się argumentami, co drastycznie ułatwia wyłapywanie błędów w logice.
Wykorzystanie tmux umożliwia pracę równoległą, co jest kluczowe przy bardziej złożonych zadaniach. To idealne rozwiązanie dla tych, którzy chcą monitorować interakcje agentów w czasie rzeczywistym lub zarządzać kilkoma procesami AI jednocześnie bez chaosu w konsoli.
Praktyczne przykłady i kiedy to ma sens
Istnieje kilka konkretnych scenariuszy, w których ten hack pokazuje swój pełny potencjał. Juan Pablo AJ przetestował szereg zastosowań, które mogą odmienić Twój workflow. Przede wszystkim warto rozważyć ten model pracy w następujących przypadkach:
- Tworzenie szkicu w Claude i natychmiastowa recenzja w Codex przy użyciu funkcji resume.
- Uzyskanie alternatywnej opinii od Gemini na temat tego samego fragmentu tekstu lub kodu.
- Model współpracy „twórca-recenzent”, gdzie jeden agent buduje, a drugi szuka dziury w całym.
- Rola człowieka jako orkiestratora, który jedynie akceptuje lub odrzuca propozycje agentów.
Jak wspominaliśmy przy okazji tekstu o Humans&, firmie która pozyskała 480 mln dolarów na rozwój współpracy grupowej AI, era samotnych chatbotów powoli przemija. Ten prosty trik udowadnia, że zaawansowane środowisko multi-agentowe można zbudować niemal zerowym kosztem.
Wybieraj tryb nieinteraktywny do błyskawicznych testów, gdy nie chcesz martwić się o zależności. Postaw na tmux, gdy potrzebujesz pełnego wglądu w proces i chcesz trzymać rękę na pulsie.
Ograniczenia i czy to naprawdę poprawia wyniki
Niestety, prosty wzorzec oparty na CLI ma swoje wady, a największą z nich jest ograniczona widoczność – śledzenie pełnej historii rozmów bywa uciążliwe. Należy też zachować szczególną ostrożność w kwestii uprawnień (permissions), ponieważ autonomiczne wywołania systemowe mogą narobić bałaganu w plikach, jeśli nie zostaną odpowiednio ograniczone. Choć tmux rozwiązuje problem monitoringu, wymaga on dodatkowej konfiguracji i instalacji.
Sam Juan Pablo AJ stawia też ważne pytanie: czy fakt, że modele generują ładnie brzmiący tekst i osiągają konsensus, faktycznie oznacza wyższą jakość? Czy może to tylko „wypolerowana” halucynacja, w której agenci wzajemnie utwierdzają się w błędzie? Na ten moment to świetne narzędzie do eksperymentów i prototypowania, ale nie magiczna różdżka rozwiązująca wszystkie problemy.
| Aspekt | Nieinteraktywny (resume) | Tmux |
|---|---|---|
| Konfiguracja | Brak dodatkowych zależności | Wymagana instalacja tmux |
| Widoczność | Niska (tylko wynik końcowy) | Wysoka (panele w czasie rzeczywistym) |
| Zastosowanie | Szybkie, proste testy | Monitoring i praca równoległa |
| Debugowanie | Utrudnione | Łatwe dzięki przechwytywaniu wyjścia |
| Zależności | Brak | Gniazda (sockety) tmux |
Porównanie metod komunikacji agentów AI: prostota vs kontrola
Trzeba pamiętać, że ryzyko wystąpienia halucynacji rośnie wraz z długością łańcucha interakcji między modelami. To swoista ironia systemów multi-agentowych: im więcej „rozmawiają”, tym łatwiej mogą odpłynąć od faktów.
Źródła:
Juan Pablo AJ: https://juanpabloaj.com/2026/04/16/a-lightweight-way-to-make-agents-talk-without-paying-for-api-usage/; dyskusje na X.com o podobnych narzędziach CLI dla agentów
