Browser-use: Cuando tu IA se convierte en un asistente personal de navegación
Imagina: en lugar de rellenar formularios manualmente, buscar productos o recopilar datos, simplemente le dices a la IA lo que necesita hacer — y completa la tarea en el navegador por sí sola. Eso es exactamente lo que ofrece browser-use — un proyecto que ya ha recopilado 66k estrellas en GitHub.
Qué es y por qué lo necesitas
Browser-use es una biblioteca Python que te permite conectar agentes de IA (por ejemplo, GPT-4o o Claude) a un navegador real. En esencia, es un puente entre los modelos de lenguaje y las páginas web.
Para quién es:
- Desarrolladores cansados de escribir cientos de líneas de código con Playwright/Selenium
- Profesionales de marketing que buscan automatizar tareas repetitivas
- Investigadores que necesitan recopilar y analizar datos
- Cualquiera frustrado de realizar las mismas acciones en el navegador repetidamente
Cómo funciona
La instalación es sencilla:
pip install browser-use
playwright install chromium --with-deps --no-shell
Aquí tienes un ejemplo de código que hace que la IA compare precios de modelos de IA:
from browser_use import Agent
from browser_use.llm import ChatOpenAI
agent = Agent(
task="Compare the price of gpt-4o and DeepSeek-V3",
llm=ChatOpenAI(model="gpt-4o")
)
await agent.run()
Características principales
-
Soporte para todos los LLMs más populares
- OpenAI, Anthropic, Google, DeepSeek y otros
- Simplemente añade tu clave API al archivo .env
-
Casos de uso reales
- Búsqueda y envío automatizado de solicitudes de empleo
- Relleno de formularios y envío de documentos
- Comparación de precios y compras
-
Integración con Model Context Protocol (MCP)
- Conecta servicios adicionales como GitHub o el sistema de archivos
- Construye cadenas de tareas complejas
Qué puede hacer en la práctica
Aquí tienes algunos ejemplos de la documentación:
-
Compras automatizadas
- La IA añade artículos al carrito y completa el proceso de compra

-
Búsqueda de empleo
- Analiza currículums, encuentra posiciones coincidentes y envía solicitudes
-
Gestión de documentos
- Escribe documentos en Google Docs y los guarda como PDF
Detalles técnicos
En su interior, utiliza Playwright para el control del navegador y LLMs modernos para la toma de decisiones. El proyecto está en desarrollo activo — el roadmap incluye mejora de la memoria de los agentes, ejecución de tareas en paralelo y optimización de tokens.
Por qué deberías probarlo
- Ahorra horas de trabajo repetitivo
- Fácil integración en proyectos existentes
- Comunidad activa y soporte
- Existe una versión en la nube para comenzar rápidamente
Si quieres automatizar cualquier cosa en el navegador — browser-use podría convertirse en tu nueva herramienta favorita. Y lo mejor de todo — puedes empezar en literalmente 5 minutos.
P.D. Los autores regalan merchandising a los contribuidores activos — ¡una gran razón para hacer una contribución!
Proyectos relacionados