Tier 4 · CLIENT CASE ISA

Agente de voz WhatsApp.WhatsApp voice agent.

Agente conversacional por WhatsApp con voz, RAG y activación por palabra clave. Construido originalmente para una clínica médica. CPU-only deployment.WhatsApp conversational agent with voice, RAG and keyword activation. Originally built for a medical clinic. CPU-only deployment.

01 / ProblemaProblem

El problema realThe problem real

Los call centers son caros y los chatbots de texto son fríos. Para servicios de salud, estética o concierge, la voz es el canal natural — pero las APIs de voz (Twilio, ElevenLabs) cobran por minuto y mandan datos a USA. Para una clínica con datos sensibles bajo Habeas Data, eso no funciona.Call centers are expensive and text chatbots feel cold. For health, aesthetics or concierge services, voice is the natural channel — but voice APIs (Twilio, ElevenLabs) charge per minute and send data to USA. For a clinic with sensitive Habeas Data, that doesn't work.

Por qué importaWhy it matters

Agente conversacional por WhatsApp con voz, RAG y activación por palabra clave. Construido originalmente para una clínica médica. CPU-only deployment.WhatsApp conversational agent with voice, RAG and keyword activation. Originally built for a medical clinic. CPU-only deployment.

02 / SoluciónSolution

Cómo lo resolvemos.How we solve it.

Un agente de voz que vive en WhatsApp con audio en lugar de texto. Activación por palabra clave (el paciente la menciona y el bot se activa). XTTS v2 para voz natural en español, Whisper para transcripción, RAG sobre ChromaDB con catálogo de servicios + FAQ + protocolos clínicos. Todo corre en CPU — no requiere GPU. Estado conversacional persistente por usuario.A voice agent living in WhatsApp with audio instead of text. Keyword activation (patient mentions it and bot activates). XTTS v2 for natural Spanish voice, Whisper for transcription, RAG over ChromaDB with service catalog + FAQ + clinical protocols. Everything runs on CPU — no GPU needed. Persistent conversational state per user.

03 / Stack

Tecnologías usadas.Tech used.

Voice
XTTS v2
STT
Whisper
Vector
ChromaDB
Channel
WhatsApp Cloud API
Backend
FastAPI
CPU-only
Sin GPUNo GPU
ES
Voz nativaNative voice
RAG
Catálogo clienteClient catalog
Local
PrivadoPrivate
04 / Próximos pasosNext steps

¿Servicio de atención por voz?Voice support service?

Adaptamos el agente a tu vertical: salud, estética, finanzas, hotelería, concierge. Setup 3-5 semanas, propiedad del cliente.We adapt the agent to your vertical: healthcare, aesthetics, finance, hospitality, concierge. 3-5 week setup, client-owned.

Hablemos del proyectoLet's discuss the project