MCPdir — MCP Server Directory
🇬🇧 🇪🇸

Audio MCP Server

by GongRzhe

Grabación de audio, reproducción y texto a voz mediante asistentes de IA

ai-ml Python Intermedio Auto-hospedable Sin API key
⭐ 8 stars 📅 Actualizado: hace 10m

Descripción

Un servidor MCP para grabación de audio, reproducción y capacidades de texto a voz. Proporciona 5 herramientas para listar dispositivos de audio, grabar desde micrófono con parámetros configurables (duración, tasa de muestreo, canales, dispositivo), reproducir grabaciones, reproducir archivos de audio y texto a voz. Útil para flujos de trabajo de IA basados en voz y tareas de procesamiento de audio.

✅ Ideal para

Flujos de trabajo de IA que necesitan capacidades locales de grabación y reproducción de audio

⏭️ No recomendado si

Necesitas speech-to-text en la nube o TTS de nivel producción

💡 Casos de uso

  • Grabar audio mediante comandos de asistente de IA
  • Reproducir grabaciones y archivos de audio
  • Listar y seleccionar dispositivos de entrada/salida de audio
  • Captura de notas de voz durante flujos de trabajo asistidos por IA

👍 Ventajas

  • Sin API key — procesamiento de audio completamente local
  • Parámetros de grabación configurables (duración, tasa de muestreo, canales)
  • Enumeración de dispositivos para selección de entrada/salida
  • Soporte multiplataforma

👎 Desventajas

  • Texto a voz planificado pero no completamente implementado aún
  • Requiere hardware de audio (micrófono/altavoces)
  • Las dependencias de bibliotecas de audio pueden necesitar instalación a nivel de sistema
  • Comunidad pequeña (8 stars)

🔧 Herramientas expuestas (5 herramientas)

ToolCategoríaDescripción
list_audio_devicesdevice-managementListar todos los dispositivos de entrada y salida de audio disponibles
play_latest_recordingplaybackReproducir el audio grabado más recientemente
play_audioplaybackTexto a voz con parámetros de voz configurables
play_audio_fileplaybackReproducir un archivo de audio a través de los altavoces
record_audiorecordingCapturar entrada de micrófono con duración y parámetros configurables

💡 Consejos y trucos

Usa list_audio_devices primero para identificar dispositivos disponibles, luego especifica el índice del dispositivo en record_audio para la entrada correcta.

Info rápida

Autor
GongRzhe
Licencia
MIT
Runtime
Python 3.10+
Transporte
stdio
Categoría
ai-ml
Dificultad
Intermedio
Auto-hospedable
Auth
Docker
Versión
1.0.0
Actualizado
17 may 2025

Compatibilidad con clientes

  • Claude Code
  • Cursor
  • VS Code Copilot
  • Gemini CLI
  • Windsurf
  • Cline
  • JetBrains AI
  • Warp

Plataformas

🍎 macOS 🐧 Linux 🪟 Windows