Ученые из России придумали, как собирать и размечать данные для LLM БЕЗ гигантских затрат
Презентовали фреймворк на конференции в Вене и уже выложили на GitHub под лицензией MIT. Фреймворк ATGen, разработанный ребятами из Т-Технологий, AIRI, ВШЭ, Сбера и Университета “Иннополис”, учит модель самостоятельно выбирать нужные данные на разметку, чем сокращает расходы в три раза