Перейти к основному содержимому

Сравнение скорости ASR и TTS в телефонии

Задержка ответа — ключевой параметр в голосовых каналах. Чтобы вы могли выбрать самые быстрые сервисы для своего проекта, мы замерили скорость работы ASR и TTS в агентах.

On-premise

Если Agent Platform установлена в контур вашей компании, то на скорость работы также могут влиять:

  • расположение серверов;
  • настройки VAD (Voice Activity Detection) — они указываются в конфигурации вашей установки.

ASR

Время от начала распознавания до получения первого фрагмента текста:

ПровайдерСреднее время (мс)
Google Cloud485
Yandex SpeechKit910
T-Bank VoiceKit1050
SaluteSpeech (Сбер)1640
3i VoxKit1910

TTS

Время от начала синтеза до получения аудио:

ПровайдерГолосСреднее время (мс)
Google Cloudru-RU-Wavenet-A275
Audiogramborisova320
Yandex SpeechKitalena (neutral)355
ElevenLabsГолоса модели Turbo v2.5370
Azureru-RU-SvetlanaNeural730
SaluteSpeech (Сбер)Nec_80001015