Audio MCP Server

Name: Audio MCP Server
Author: GongRzhe

by GongRzhe

Grabación de audio, reproducción y texto a voz mediante asistentes de IA

ai-ml Python Intermedio Auto-hospedable Sin API key

⭐ 8 stars 📅 Actualizado: hace 10m

Ver en GitHub Ver paquete

Descripción

Un servidor MCP para grabación de audio, reproducción y capacidades de texto a voz. Proporciona 5 herramientas para listar dispositivos de audio, grabar desde micrófono con parámetros configurables (duración, tasa de muestreo, canales, dispositivo), reproducir grabaciones, reproducir archivos de audio y texto a voz. Útil para flujos de trabajo de IA basados en voz y tareas de procesamiento de audio.

✅ Ideal para

Flujos de trabajo de IA que necesitan capacidades locales de grabación y reproducción de audio

⏭️ No recomendado si

Necesitas speech-to-text en la nube o TTS de nivel producción

💡 Casos de uso

Grabar audio mediante comandos de asistente de IA
Reproducir grabaciones y archivos de audio
Listar y seleccionar dispositivos de entrada/salida de audio
Captura de notas de voz durante flujos de trabajo asistidos por IA

👍 Ventajas

✓ Sin API key — procesamiento de audio completamente local
✓ Parámetros de grabación configurables (duración, tasa de muestreo, canales)
✓ Enumeración de dispositivos para selección de entrada/salida
✓ Soporte multiplataforma

👎 Desventajas

✗ Texto a voz planificado pero no completamente implementado aún
✗ Requiere hardware de audio (micrófono/altavoces)
✗ Las dependencias de bibliotecas de audio pueden necesitar instalación a nivel de sistema
✗ Comunidad pequeña (8 stars)

🔧 Herramientas expuestas (5 herramientas)

Tool	Categoría	Descripción
list_audio_devices	device-management	Listar todos los dispositivos de entrada y salida de audio disponibles
play_latest_recording	playback	Reproducir el audio grabado más recientemente
play_audio	playback	Texto a voz con parámetros de voz configurables
play_audio_file	playback	Reproducir un archivo de audio a través de los altavoces
record_audio	recording	Capturar entrada de micrófono con duración y parámetros configurables

💡 Consejos y trucos

Usa list_audio_devices primero para identificar dispositivos disponibles, luego especifica el índice del dispositivo en record_audio para la entrada correcta.

Info rápida

Autor: GongRzhe
Licencia: MIT
Runtime: Python 3.10+
Transporte: stdio
Categoría: ai-ml
Dificultad: Intermedio
Auto-hospedable: ✅
Auth: —
Docker: —
Versión: 1.0.0
Actualizado: 17 may 2025

Compatibilidad con clientes

❓ Claude Code
❓ Cursor
❓ VS Code Copilot
❓ Gemini CLI
❓ Windsurf
❓ Cline
❓ JetBrains AI
❓ Warp

Enlaces

Plataformas

🍎 macOS 🐧 Linux 🪟 Windows