Под капотом: акустическая модель, LLM. Их уже вовсю используют в субтитрах для VK Видео, VK Клипах, голосовых сообщениях, для рекомендательной системы Discovery и других задач.
В планах — повышать качество и точность, расширить поддержку языков и добавить разделение по спикерам.