Microsoft выпустили модель VibeVoice для генерации речи из текста в режиме реального времени (1 фото + 1 видео)
VibeVoice позволяет создавать длинные диалоги сразу с несколькими участниками, виртуальные голоса даже умеют петь. Можно взять любой текст и сгенерировать часовой подкаст.