Модель клонирует голос по нескольким секундам аудио, передаёт эмоции и работает почти без задержки — около 190 мс, а это быстрее большинства конкурентов.
Поддерживает 42 языка, включая русский, и имеет кучу настроек: паузы, дыхание и эмоции (их больше 50, от волнения до смеха).
При регистрации дают 30 тысяч кредитов, их хватит примерно на 30 минут генерации.