>_ DevTrendspl

Język

Strona główna

Języki

Sekcje

Frontend Backend Mobilne DevOps AI / ML GameDev Blockchain Bezpieczeństwo
Python

Browser-use: gdy Twoja AI staje się osobistym asystentem przeglądarki

101 774 gwiazdki

Wyobraź sobie: zamiast ręcznie wypełniać formularze, wyszukiwać produkty czy zbierać dane — po prostu mówisz AI, co trzeba zrobić, a ona wykonuje zadanie w przeglądarce sama. Dokładnie to oferuje browser-use — projekt, który zdobył już 66k gwiazdek na GitHubie.

Co to jest i dlaczego tego potrzebujesz

Browser-use to biblioteka Python, która pozwala łączyć agentów AI (np. GPT-4o czy Claude) z prawdziwą przeglądarką. W zasadzie to mostek między modelami językowymi a stronami internetowymi.

Dla kogo to jest:

  • Developerzy, którzy mają dość pisania setek linijek kodu Playwright/Selenium
  • Marketerzy chcący zautomatyzować powtarzalne zadania
  • Badacze potrzebujący zbierać i analizować dane
  • Każdy, kto jest sfrustrowany wykonywaniem tych samych czynności w przeglądarce w kółko

Jak to działa

Instalacja jest prosta:

pip install browser-use
playwright install chromium --with-deps --no-shell

Oto przykład kodu, który sprawia, że AI porównuje ceny modeli AI:

from browser_use import Agent
from browser_use.llm import ChatOpenAI

agent = Agent(
    task="Compare the price of gpt-4o and DeepSeek-V3",
    llm=ChatOpenAI(model="gpt-4o")
)
await agent.run()

Kluczowe funkcje

  1. Wsparcie dla wszystkich popularnych LLM-ów

    • OpenAI, Anthropic, Google, DeepSeek i inne
    • Wystarczy dodać swój klucz API do pliku .env
  2. Praktyczne zastosowania

    • Zautomatyzowane wyszukiwanie pracy i składanie aplikacji
    • Wypełnianie formularzy i składanie dokumentów
    • Porównywanie cen i zakupy
  3. Integracja z Model Context Protocol (MCP)

    • Podłącz dodatkowe usługi jak GitHub czy system plików
    • Buduj złożone łańcuchy zadań

Co potrafi w praktyce

Oto kilka przykładów z dokumentacji:

  1. Zautomatyzowane zakupy

    • AI dodaje produkty do koszyka i finalizuje zamówienie

    Przykład zautomatyzowanych zakupów

  2. Wyszukiwanie pracy

    • Analizuje CV, znajduje pasujące oferty i składa aplikacje
  3. Obsługa dokumentów

    • Pisze dokumenty w Google Docs i zapisuje je jako PDF

Szczegóły techniczne

Pod maską używa Playwright do kontrolowania przeglądarki i nowoczesnych LLM-ów do podejmowania decyzji. Projekt jest aktywnie rozwijany — w roadmapie znajdziesz ulepszoną pamięć agentów, równoległe wykonywanie zadań i optymalizację tokenów.

Dlaczego warto wypróbować

  • Oszczędza godziny powtarzalnej pracy
  • Łatwa integracja z istniejącymi projektami
  • Aktywna społeczność i wsparcie
  • Jest wersja chmurowa dla szybkiego startu

Jeśli chcesz zautomatyzować cokolwiek w przeglądarce — browser-use może stać się Twoim nowym ulubionym narzędziem. A najlepsze jest to, że możesz zacząć dosłownie w 5 minut.

P.S. Autorzy rozdają gadżety aktywnym kontrybutorom — świetny powód, żeby się zaangażować!

Powiązane projekty