Audio MCP Server
by GongRzhe
Grabación de audio, reproducción y texto a voz mediante asistentes de IA
ai-ml Python Intermedio Auto-hospedable Sin API key
⭐ 8 stars 📅 Actualizado: hace 10m
Descripción
Un servidor MCP para grabación de audio, reproducción y capacidades de texto a voz. Proporciona 5 herramientas para listar dispositivos de audio, grabar desde micrófono con parámetros configurables (duración, tasa de muestreo, canales, dispositivo), reproducir grabaciones, reproducir archivos de audio y texto a voz. Útil para flujos de trabajo de IA basados en voz y tareas de procesamiento de audio.
✅ Ideal para
Flujos de trabajo de IA que necesitan capacidades locales de grabación y reproducción de audio
⏭️ No recomendado si
Necesitas speech-to-text en la nube o TTS de nivel producción
💡 Casos de uso
- Grabar audio mediante comandos de asistente de IA
- Reproducir grabaciones y archivos de audio
- Listar y seleccionar dispositivos de entrada/salida de audio
- Captura de notas de voz durante flujos de trabajo asistidos por IA
👍 Ventajas
- ✓ Sin API key — procesamiento de audio completamente local
- ✓ Parámetros de grabación configurables (duración, tasa de muestreo, canales)
- ✓ Enumeración de dispositivos para selección de entrada/salida
- ✓ Soporte multiplataforma
👎 Desventajas
- ✗ Texto a voz planificado pero no completamente implementado aún
- ✗ Requiere hardware de audio (micrófono/altavoces)
- ✗ Las dependencias de bibliotecas de audio pueden necesitar instalación a nivel de sistema
- ✗ Comunidad pequeña (8 stars)
🔧 Herramientas expuestas (5 herramientas)
| Tool | Categoría | Descripción |
|---|---|---|
| list_audio_devices | device-management | Listar todos los dispositivos de entrada y salida de audio disponibles |
| play_latest_recording | playback | Reproducir el audio grabado más recientemente |
| play_audio | playback | Texto a voz con parámetros de voz configurables |
| play_audio_file | playback | Reproducir un archivo de audio a través de los altavoces |
| record_audio | recording | Capturar entrada de micrófono con duración y parámetros configurables |
💡 Consejos y trucos
Usa list_audio_devices primero para identificar dispositivos disponibles, luego especifica el índice del dispositivo en record_audio para la entrada correcta.
Info rápida
- Autor
- GongRzhe
- Licencia
- MIT
- Runtime
- Python 3.10+
- Transporte
- stdio
- Categoría
- ai-ml
- Dificultad
- Intermedio
- Auto-hospedable
- ✅
- Auth
- —
- Docker
- —
- Versión
- 1.0.0
- Actualizado
- 17 may 2025
Compatibilidad con clientes
- ❓ Claude Code
- ❓ Cursor
- ❓ VS Code Copilot
- ❓ Gemini CLI
- ❓ Windsurf
- ❓ Cline
- ❓ JetBrains AI
- ❓ Warp
Enlaces
Plataformas
🍎 macOS 🐧 Linux 🪟 Windows