Сравнение скорости ASR и TTS в телефонии
Задержка ответа — ключевой параметр в голосовых каналах. Чтобы вы могли выбрать самые быстрые сервисы для своего проекта, мы замерили скорость работы ASR и TTS в агентах.
On-premise
Если Agent Platform установлена в контур вашей компании, то на скорость работы также могут влиять:
- расположение серверов;
- настройки VAD (Voice Activity Detection) — они указываются в конфигурации вашей установки.
ASR
Время от начала распознавания до получения первого фрагмента текста:
| Провайдер | Среднее время (мс) |
|---|---|
| Google Cloud | 485 |
| Yandex SpeechKit | 910 |
| T-Bank VoiceKit | 1050 |
| SaluteSpeech (Сбер) | 1640 |
| 3i VoxKit | 1910 |
TTS
Время от начала синтеза до получения аудио:
| Провайдер | Голос | Среднее время (мс) |
|---|---|---|
| Google Cloud | ru-RU-Wavenet-A | 275 |
| Audiogram | borisova | 320 |
| Yandex SpeechKit | alena (neutral) | 355 |
| ElevenLabs | Голоса модели Turbo v2.5 | 370 |
| Azure | ru-RU-SvetlanaNeural | 730 |
| SaluteSpeech (Сбер) | Nec_8000 | 1015 |