Что это такое?
Инструмент для статистического сравнения стеков разработки с использованием AI-агентов, языков и фреймворков.
Retort применяет статистический дизайн экспериментов (DoE) для систематической оценки стеков разработки. Он генерирует дробные факторные планы, комбинируя языки, модели ИИ и инструменты, выполняет эксперименты в изолированных средах, оценивает результаты по...
Для инженеров платформ, тимлидов и исследователей, которые хотят принимать решения о выборе инструментов на основе данных, а не мнений.
Современная разработка — это комбинаторный хастл: десятки языков, фреймворков и AI-агентов. Как выбрать оптимальный стек без бесконечных ручных тестов?
Retort — это движок для эволюции платформ, который помогает «выварить» лучшее из комбинаторного хаоса инструментов разработки. Проект использует статистические методы для систематического тестирования различных комбинаций языков программирования, AI-агентов и фреймворков в изолированных средах (playpens). Результаты оцениваются по нескольким метрикам (качество кода, токены, стоимость, время), после чего стеки либо...
Retort — это движок для эволюции платформ, который помогает «выварить» лучшее из комбинаторного хаоса инструментов разработки. Проект использует статистические методы для систематического тестирования различных комбинаций языков программирования, AI-агентов и фреймворков в изолированных средах (playpens). Результаты оцениваются по нескольким метрикам (качество кода, токены, стоимость, время), после чего стеки либо...
В первом эксперименте Go с моделью Sonnet и инструментом Beads показал идеальное качество 1.00, а TypeScript с той же комбинацией — единственный провал, вероятно, из-за переполнения контекста.
Стоит пробовать, если вы занимаетесь инженерией платформ или исследованиями в области AI-ассистированной разработки. Это редкий инструмент, который применяет серьёзную статистику к хаотичному миру выбора инструментов. Пока проект в альфе, но концепция перспективная.
Проект активен, версия 0.1.0, есть devcontainer, код хорошо структурирован, но пока мало звёзд и форков.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Инструмент для статистического сравнения стеков разработки с использованием AI-агентов, языков и фреймворков.
Для инженеров платформ, тимлидов и исследователей, которые хотят оптимизировать выбор инструментов на основе данных.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.