← Все проекты
Проект / Python

AI45Lab/Safactory: Safactory — фабрика для тестирования и обучения AI-агентов

Единая песочница для оценки, сбора данных и RL-тренировки ИИ-агентов в десятках симуляций.

Открытый проект от AI45Lab, который позиционируется как универсальная песочница для AI-агентов. Позволяет оценивать модели, автоматически собирать данные для обучения (SFT/RL) и проводить RL-тренировку в едином конвейере. Поддерживает множество доменов: от...

★ 19 Python Форки 1 Issue 0 Оценка 7/10 Карточка проверена

Для кого это

Для ML-инженеров и исследователей, которые хотят тестировать и обучать LLM-агенты в реалистичных симуляциях без переписывания кода под каждую среду.

Проблема / задача

Чтобы обучить ИИ-агента действовать в реальном мире, нужны реалистичные симуляции. Обычно для каждой задачи (Android, Minecraft, робототехника) пишут отдельный код, собирают данные вручную, а RL-тренировка — это отдельная головная боль.

Как это работает

Safactory — это единый фреймворк на Python. Вы подключаете свою LLM через OpenAI-совместимый API, выбираете среду из готовых (Android, ОС, игры, QA, роботы) и запускаете агента. Система сама управляет пулом сред, собирает все взаимодействия в SQLite, а данные можно сразу отправлять на RL-тренировку через встроенный Buffer Server и Slime.

Что видно по README

Открытый проект от AI45Lab, который позиционируется как универсальная песочница для AI-агентов. Позволяет оценивать модели, автоматически собирать данные для обучения (SFT/RL) и проводить RL-тренировку в едином конвейере. Поддерживает множество доменов: от эмуляции Android и ОС до Minecraft, робототехники и мультимодальных задач.

Ключевые возможности

Единый конвейер: оценка → сбор данных → RL-тренировка10+ готовых сред: Android, OS, Minecraft, Embodied AI, QA, геометрияВысокая параллельность: асинхронные воркеры для быстрых rolloutLLM-агностик: работает с любым OpenAI-совместимым эндпоинтом (vLLM, SGLang)Два режима развёртывания: локальный на одной машине или распределённый на кластере Ray

Технологии

PythonRaySQLiteDockerOpenAI APIRustGo

Интересный факт

В одном проекте можно заставить ИИ-агента управлять Android-эмулятором, играть в Minecraft, решать геометрические задачи по картинкам и обучать робота — и всё это с автоматическим логированием каждого действия.

С чего начать

  • Клонировать репозиторий и установить зависимости
  • Настроить LLM-бэкенд (например, vLLM) и получить API-ключ
  • Выбрать конфиг среды (например, для Android) и запустить launcher.py с указанием параметров

Оценка GitRadar

Удобство
6/10
Свежесть
8/10
Перспектива
9/10
Монетизация
7/10
Общая оценка
7/10

Вердикт GitRadar

Стоит пробовать, если вы серьёзно занимаетесь обучением агентов на основе LLM. Проект амбициозный, покрывает много сценариев, но требует технической подготовки (настройка эмуляторов, Docker, Ray). Для простого тестирования одной модели может быть избыточным.

Наблюдения по обновлениям

Проект активный, с подробной документацией по разным средам, но звёзд пока мало (17), что говорит о ранней стадии или узкой аудитории.

Что мы проверили

Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.

Исходный репозиторий
https://github.com/AI45Lab/Safactory
Создан на GitHub
24 апреля 2026 г.
Последнее обновление репо
24 апреля 2026 г.
Последняя проверка GitRadar
24 апреля 2026 г.
Изученные файлы
env/qagym/README.md, README.md, rl/README.md, env/robotrustbench/README.md, env/geo3k_vl_test/README.md, env/deepeyes/README.md

FAQ

Что это такое?

Фреймворк-песочница для запуска, оценки и обучения ИИ-агентов в разнообразных симулированных средах.

Для кого подходит?

Для ML-инженеров и исследователей, которые разрабатывают агентов на основе больших языковых моделей и нуждаются в автоматизированном пайплайне для их тестирования и дообучения.

Источники

  • GitHub исходный код и активность
  • README описание, ссылки, стартовые материалы

Нужна помощь с AI45Lab/Safactory?

Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.