Browser-use: gdy Twoja AI staje się osobistym asystentem przeglądarki
Wyobraź sobie: zamiast ręcznie wypełniać formularze, wyszukiwać produkty czy zbierać dane — po prostu mówisz AI, co trzeba zrobić, a ona wykonuje zadanie w przeglądarce sama. Dokładnie to oferuje browser-use — projekt, który zdobył już 66k gwiazdek na GitHubie.
Co to jest i dlaczego tego potrzebujesz
Browser-use to biblioteka Python, która pozwala łączyć agentów AI (np. GPT-4o czy Claude) z prawdziwą przeglądarką. W zasadzie to mostek między modelami językowymi a stronami internetowymi.
Dla kogo to jest:
- Developerzy, którzy mają dość pisania setek linijek kodu Playwright/Selenium
- Marketerzy chcący zautomatyzować powtarzalne zadania
- Badacze potrzebujący zbierać i analizować dane
- Każdy, kto jest sfrustrowany wykonywaniem tych samych czynności w przeglądarce w kółko
Jak to działa
Instalacja jest prosta:
pip install browser-use
playwright install chromium --with-deps --no-shell
Oto przykład kodu, który sprawia, że AI porównuje ceny modeli AI:
from browser_use import Agent
from browser_use.llm import ChatOpenAI
agent = Agent(
task="Compare the price of gpt-4o and DeepSeek-V3",
llm=ChatOpenAI(model="gpt-4o")
)
await agent.run()
Kluczowe funkcje
-
Wsparcie dla wszystkich popularnych LLM-ów
- OpenAI, Anthropic, Google, DeepSeek i inne
- Wystarczy dodać swój klucz API do pliku .env
-
Praktyczne zastosowania
- Zautomatyzowane wyszukiwanie pracy i składanie aplikacji
- Wypełnianie formularzy i składanie dokumentów
- Porównywanie cen i zakupy
-
Integracja z Model Context Protocol (MCP)
- Podłącz dodatkowe usługi jak GitHub czy system plików
- Buduj złożone łańcuchy zadań
Co potrafi w praktyce
Oto kilka przykładów z dokumentacji:
-
Zautomatyzowane zakupy
- AI dodaje produkty do koszyka i finalizuje zamówienie

-
Wyszukiwanie pracy
- Analizuje CV, znajduje pasujące oferty i składa aplikacje
-
Obsługa dokumentów
- Pisze dokumenty w Google Docs i zapisuje je jako PDF
Szczegóły techniczne
Pod maską używa Playwright do kontrolowania przeglądarki i nowoczesnych LLM-ów do podejmowania decyzji. Projekt jest aktywnie rozwijany — w roadmapie znajdziesz ulepszoną pamięć agentów, równoległe wykonywanie zadań i optymalizację tokenów.
Dlaczego warto wypróbować
- Oszczędza godziny powtarzalnej pracy
- Łatwa integracja z istniejącymi projektami
- Aktywna społeczność i wsparcie
- Jest wersja chmurowa dla szybkiego startu
Jeśli chcesz zautomatyzować cokolwiek w przeglądarce — browser-use może stać się Twoim nowym ulubionym narzędziem. A najlepsze jest to, że możesz zacząć dosłownie w 5 minut.
P.S. Autorzy rozdają gadżety aktywnym kontrybutorom — świetny powód, żeby się zaangażować!
Powiązane projekty