Microsoft выпустили модель VibeVoice для генерации речи из текста в режиме реального времени
VibeVoice позволяет создавать длинные диалоги сразу с несколькими участниками, виртуальные голоса даже умеют петь. Можно взять любой текст и сгенерировать часовой подкаст.