AI VK улучшили технологию преобразования речи в текст — теперь она на 20% точнее превращает голос в текст, убирает шум и улавливает контекст
Под капотом: акустическая модель, LLM. Их уже вовсю используют в субтитрах для VK Видео, VK Клипах, голосовых сообщениях, для рекомендательной системы Discovery и других задач.
В планах — повышать качество и точность, расширить поддержку языков и добавить разделение по спикерам.