Что это такое?
Фреймворк-песочница для запуска, оценки и обучения ИИ-агентов в разнообразных симулированных средах.
Открытый проект от AI45Lab, который позиционируется как универсальная песочница для AI-агентов. Позволяет оценивать модели, автоматически собирать данные для обучения (SFT/RL) и проводить RL-тренировку в едином конвейере. Поддерживает множество доменов: от...
Для ML-инженеров и исследователей, которые хотят тестировать и обучать LLM-агенты в реалистичных симуляциях без переписывания кода под каждую среду.
Чтобы обучить ИИ-агента действовать в реальном мире, нужны реалистичные симуляции. Обычно для каждой задачи (Android, Minecraft, робототехника) пишут отдельный код, собирают данные вручную, а RL-тренировка — это отдельная головная боль.
Safactory — это единый фреймворк на Python. Вы подключаете свою LLM через OpenAI-совместимый API, выбираете среду из готовых (Android, ОС, игры, QA, роботы) и запускаете агента. Система сама управляет пулом сред, собирает все взаимодействия в SQLite, а данные можно сразу отправлять на RL-тренировку через встроенный Buffer Server и Slime.
Открытый проект от AI45Lab, который позиционируется как универсальная песочница для AI-агентов. Позволяет оценивать модели, автоматически собирать данные для обучения (SFT/RL) и проводить RL-тренировку в едином конвейере. Поддерживает множество доменов: от эмуляции Android и ОС до Minecraft, робототехники и мультимодальных задач.
В одном проекте можно заставить ИИ-агента управлять Android-эмулятором, играть в Minecraft, решать геометрические задачи по картинкам и обучать робота — и всё это с автоматическим логированием каждого действия.
Стоит пробовать, если вы серьёзно занимаетесь обучением агентов на основе LLM. Проект амбициозный, покрывает много сценариев, но требует технической подготовки (настройка эмуляторов, Docker, Ray). Для простого тестирования одной модели может быть избыточным.
Проект активный, с подробной документацией по разным средам, но звёзд пока мало (17), что говорит о ранней стадии или узкой аудитории.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Фреймворк-песочница для запуска, оценки и обучения ИИ-агентов в разнообразных симулированных средах.
Для ML-инженеров и исследователей, которые разрабатывают агентов на основе больших языковых моделей и нуждаются в автоматизированном пайплайне для их тестирования и дообучения.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.