Masz już dość botów, które potrafią tylko generować generyczne maile i nudne slajdy? Poznaj Clicky – małego, niebieskiego stworka, który dosłownie siedzi przy twoim kursorze i pokazuje palcem, co masz zrobić w danej aplikacji. Farza Majeed stworzył narzędzie, które stało się hitem sieci, zgarniając miliony wyświetleń na X w zaledwie kilka dni.
TL;DR
- Clicky analizuje obraz na ekranie i fizycznie wskazuje elementy myszką.
- Narzędzie wykorzystuje modele Claude, AssemblyAI oraz ElevenLabs.
- Projekt jest open-source na GitHubie, obecnie dostępny tylko na macOS.
- Idealnie sprawdza się przy nauce montażu w DaVinci Resolve czy CapCut.
- Viralowy post Farzy Majeeda zdobył 15 tys. polubień i prawie 3 mln odsłon.
Clicky patrzy na twój ekran w czasie rzeczywistym
Wyobraź sobie asystenta, który nie zmusza cię do żmudnego opisywania problemu w oknie czatu. Clicky dyskretnie rezyduje w pasku menu na macOS i na bieżąco skanuje to, co widzisz przed oczami. Wystarczy zadać pytanie głosowe – system błyskawicznie transkrybuje mowę przez AssemblyAI, analizuje kontekst za pomocą modelu Claude i odpowiada naturalnym głosem wygenerowanym przez ElevenLabs.
Kiedy sytuacja tego wymaga, ten niebieski ludzik przejmuje inicjatywę: fizycznie przesuwa kursor i wskazuje konkretny przycisk lub ukryte głęboko w menu ustawienie. Aplikacja bez problemu radzi sobie na komputerach z procesorami Apple Silicon oraz starszymi jednostkami Intela. Cały ekran służy tutaj jako kontekst, więc możesz zapomnieć o robieniu zrzutów ekranu i wklejaniu ich do ChatGPT.
Mahnoor Faisal z redakcji XDA porównuje to doświadczenie do obecności cierpliwego nauczyciela, który trzyma cię za rękę podczas pracy. Redaktorka przetestowała narzędzie w bojowych warunkach przy obsłudze CapCut oraz DaVinci Resolve. Werdykt? Koniec z frustracją wywołaną przewijaniem nudnych tutoriali na YouTube w poszukiwaniu jednej funkcji.
Farza Majeed i viralowe demo na platformie X
Farza Majeed, znany wcześniej jako założyciel buildspace, opublikował demo swojego projektu 7 kwietnia 2026 roku. Krótki film prezentuje, jak Clicky uczy użytkownika obsługi Resolve – ludzik precyzyjnie wskazuje oś czasu i bibliotekę efektów. Post błyskawicznie stał się hitem, zbierając 15 tys. lajków i generując zasięg na poziomie niemal 3 milionów wyświetleń.
Zaledwie dzień po premierze wideo, kod źródłowy trafił do repozytorium na GitHubie (farzaa/clicky). Reakcja społeczności była natychmiastowa – programiści już zaczęli tworzyć forki z myślą o systemie Windows. Oficjalne wydanie na pecety ma pojawić się „bardzo wkrótce”, co ucieszy rzeszę użytkowników spoza ekosystemu Apple. Majeed budował to narzędzie samodzielnie, stawiając na filozofię nauki przez działanie.
To nie jest kolejny nudny chatbot ukryty w karcie przeglądarki. Clicky towarzyszy ci w każdym momencie, eliminując potrzebę przełączania się między oknami aplikacji. Faisal z XDA bez ogródek nazywa to najciekawszym i najbardziej użytecznym narzędziem, jakie widziała w ciągu ostatnich miesięcy.
I built this thing called Clicky.
It’s an AI teacher that lives as a buddy next to your cursor.
It can see your screen, talk to you, and even point at stuff, kinda like having a real teacher next to you.
I’ve been using it the past few days to learn Davinci Resolve, 10/10. pic.twitter.com/oiFJwhuS4U
— Farza 🇵🇰🇺🇸 (@FarzaTV) April 7, 2026
Technologia pod maską niebieskiego kumpla
Za warstwę logiczną i rozumienie tego, co dzieje się na ekranie, odpowiada model Claude od Anthropic. AssemblyAI zajmuje się błyskawiczną zamianą mowy na tekst, a ElevenLabs dba o to, by instrukcje brzmiały jak wypowiadane przez człowieka, a nie robota. Aby zachować płynność, aplikacja wykonuje zrzuty ekranu co sekundę, dostarczając sztucznej inteligencji świeżych danych.
Otwarty charakter projektu (open-source) to raj dla majsterkowiczów, którzy mogą dopisywać własnych agentów lub podpinać inne modele językowe. Proces instalacji jest banalnie prosty: pobierasz pliki z GitHuba i wklejasz własne klucze API do poszczególnych usług w pliku konfiguracyjnym. W ten sposób otrzymujesz trzy potężne usługi AI połączone w jeden, spójny proces pracy.
Choć sama aplikacja nie wymaga opłacania subskrypcji, musisz liczyć się z kosztami za zużycie tokenów w zewnętrznych API. Na ten moment narzędzie wykazuje się imponującą precyzją. Mahnoor Faisal w swoich testach nie odnotowała ani jednej pomyłki przy wskazywaniu elementów interfejsu, co w świecie AI wciąż jest rzadkością.
Nauka software bez tabów i pauz
Tradycyjne kursy wideo to często logistyczny koszmar: musisz odpalić YouTube, zatrzymać film, wrócić do programu, spróbować powtórzyć ruch i zazwyczaj po drodze gubisz wątek. Clicky całkowicie eliminuje ten problem. Otwierasz przykładowo CapCut, pytasz o klatki kluczowe, a asystent natychmiast pokazuje ci oś czasu i tłumaczy głosowo, jak z nich korzystać.
Faisal na co dzień korzysta z zaawansowanego zestawu narzędzi, takich jak NotebookLM czy Claude Code, ale przyznaje, że Clicky wygrywa dzięki bezpośredniej interakcji z ekranem. NotebookLM świetnie radzi sobie z analizą dokumentów, ale nie potrafi wskazać ci palcem przycisku w edytorze wideo. Tutaj wchodzisz w interakcję od razu: klikasz, pytasz i błyskawicznie przyswajasz wiedzę.
Najszybciej uczymy się, gdy ktoś poprawia nasze błędy w locie. Clicky pozwala wyjść z martwego punktu w kilka sekund. Nie musisz już czytać ścian tekstu w dokumentacji ani przeszukiwać forów internetowych, by dowiedzieć się, gdzie twórcy ukryli funkcję eksportu.
Ograniczenia i co przed nami?
Obecnie z dobrodziejstw niebieskiego ludzika skorzystają wyłącznie posiadacze komputerów Mac, choć nieoficjalne wersje na Windows już krążą po sieci. Brakuje też wsparcia dla urządzeń mobilnych czy systemów Linux. Warto pamiętać, że intensywne korzystanie z asystenta może dość szybko uszczuplić stan twojego portfela przez opłaty za kredyty API.
Farza Majeed oficjalnie potwierdził, że pracuje nad natywną wersją dla systemu Windows. W międzyczasie społeczność skupiona wokół projektu dodaje nowe funkcjonalności, takie jak obsługa większej liczby modeli czy sterowanie gestami. Wersja na Windows pojawi się wkrótce, co jest obietnicą samego twórcy, na którą czeka wielu użytkowników.
Oczywiście Clicky nie zastąpi wieloletniego doświadczenia eksperta, ale potrafi skrócić czas potrzebny na opanowanie nowego programu o połowę. Mówiąc nieco złośliwie: w końcu doczekaliśmy się sztucznej inteligencji, która zamiast udawać, że czyta w twoich myślach, po prostu patrzy na to samo co ty.
Źródła:
XDA Developers
