La voix impose une UX en temps réel. L’utilisateur tolère peu la latence et les erreurs répétées.

Pipeline — ASR stable, LLM outillé, TTS naturel. Buffers courts; barge‑in pour couper la parole du bot.

UX — Tours rapides, confirmations ciblées (pas pour tout), feedbacks sonores visuels discrets. Gérer les bruits et accents.

Sécurité — Consentement explicite, PII minimale, stockage bref; logs audités. Refus polis sur sujets sensibles.

Mesure — p50/p95 tour complet, taux d’interruptions, erreurs ASR/LLM, satisfaction. original: true category: Guide tags: