Firecrawl
by Mendable
La API de datos web para IA — convierte sitios web completos en markdown o datos estructurados listos para LLMs
browser Node.js Principiante Auto-hospedable Verificado Destacado
⭐ 86.7k stars 📅 Actualizado: hace 1sem
Descripción
Firecrawl es una plataforma integral de datos web que convierte sitios web completos en markdown o datos estructurados listos para LLMs. Su servidor MCP expone potentes capacidades de scraping, crawling, mapeo de sitios, búsqueda y agente de IA directamente a asistentes de código con IA. Incluye extracción JSON estructurada con validación de esquemas, automatización de navegador para páginas con JavaScript pesado, parsing de PDF y DOCX, capturas de pantalla completas y seguimiento de cambios para monitorear actualizaciones de contenido. El agente de extracción con IA puede navegar flujos de trabajo de múltiples pasos para recopilar datos automáticamente. Firecrawl maneja la complejidad de las páginas web modernas — renderizado dinámico, medidas anti-bot y paginación — para que tu IA reciba contenido limpio y estructurado cada vez.
✅ Ideal para
Flujos de trabajo de IA que necesitan datos web limpios y estructurados de cualquier sitio sin lidiar con la complejidad del scraping
⏭️ No recomendado si
Solo necesitas leer páginas estáticas simples — una herramienta de fetch básica sería suficiente
💡 Casos de uso
- Hacer scraping de páginas web y convertirlas en markdown limpio para consumo de IA
- Crawlear sitios web completos para construir bases de conocimiento comprehensivas
- Extraer datos estructurados de páginas web usando esquemas JSON
- Monitorear sitios web para detectar cambios y actualizaciones de contenido
👍 Ventajas
- ✓ Maneja renderizado JavaScript, medidas anti-bot y estructuras de página complejas automáticamente
- ✓ Soporta extracción JSON estructurada con validación de esquemas
- ✓ Modo agente de IA para flujos de trabajo automatizados de recopilación de datos en múltiples pasos
- ✓ Adopción masiva de la comunidad (86k+ stars) con desarrollo activo
👎 Desventajas
- ✗ Requiere API key — el tier gratuito tiene límites de rate, uso en producción necesita plan de pago
- ✗ La licencia AGPL-3.0 puede ser restrictiva para algunos casos de uso comercial
- ✗ Self-hosting de la plataforma completa requiere infraestructura significativa
🔧 Herramientas expuestas (6 herramientas)
| Tool | Categoría | Descripción |
|---|---|---|
| agent | automation | Agente de IA que navega flujos de trabajo de múltiples pasos para recopilar datos automáticamente |
| map | discovery | Generar un mapa del sitio con todas las URLs descubribles de un sitio web |
| search | discovery | Buscar en la web y devolver resultados como contenido markdown |
| scrape | extraction | Hacer scraping de una URL y convertir a markdown o datos estructurados |
| crawl | extraction | Crawlear un sitio web completo siguiendo enlaces hasta una profundidad especificada |
| batch | extraction | Hacer scraping de múltiples URLs en paralelo para extracción masiva eficiente |
⚡ Instalación
Requisitos previos:
- • Node.js v18+
- • Firecrawl API key from firecrawl.dev
- • API key requerida
Consulta la documentación de Claude Code para configurar este MCP server.
💡 Consejos y trucos
Usa la función de extracción estructurada con un esquema JSON para obtener datos con formato preciso de páginas web. La herramienta de crawl con mapeo de sitio es ideal para construir bases de conocimiento de documentación. Empieza con la API hosted para evitar la complejidad del self-hosting.
Info rápida
- Autor
- Mendable
- Licencia
- AGPL-3.0
- Runtime
- Node.js 18+
- Transporte
- stdio
- Categoría
- browser
- Dificultad
- Principiante
- Auto-hospedable
- ✅
- Auth
- —
- Docker
- —
- Versión
- latest
- Actualizado
- 28 feb 2026
Compatibilidad con clientes
- ✅ Claude Code
- ✅ Cursor
- ❓ VS Code Copilot
- ❓ Gemini CLI
- ❓ Windsurf
- ❓ Cline
- ❓ JetBrains AI
- ❓ Warp
Plataformas
🍎 macOS 🐧 Linux 🪟 Windows