Что это такое?
Инструмент для автономного улучшения AI-агентов через анализ их логов и генерацию улучшений с помощью LLM.
Проект анализирует трейсы (логи работы) агентов, выявляет паттерны ошибок и слабые места, затем автоматически генерирует улучшения через LLM (например, Claude). Система поддерживает цикл «оценить → проанализировать → улучшить → протестировать» с метриками...
Для разработчиков, создающих AI-агентов на Python, которые хотят автоматизировать процесс их улучшения и тестирования.
AI-агенты часто работают неидеально: пропускают edge-кейсы, допускают ошибки, требуют постоянной ручной доработки. Ручное улучшение отнимает много времени и не масштабируется.
Проект анализирует трейсы (логи работы) агентов, выявляет паттерны ошибок и слабые места, затем автоматически генерирует улучшения через LLM (например, Claude). Система поддерживает цикл «оценить → проанализировать → улучшить → протестировать» с метриками успешности и дашбордом для мониторинга прогресса.
Recursive Improve — это фреймворк на Python для рекурсивного самоулучшения AI-агентов. Он берёт логи их работы, оценивает эффективность через встроенные детекторы, генерирует инсайты и предлагает конкретные изменения в коде или промптах. Включает инструменты для сравнения версий, дашборд для визуализации прогресса и поддержку автономного цикла улучшений через конфигурационный файл program.md.
Проект вдохновлён тем, что 90% кода Claude в Anthropic уже пишется самим Claude — авторы хотят дать такую же возможность для кастомных агентов.
Стоит попробовать, если вы разрабатываете AI-агентов и хотите автоматизировать их эволюцию. Проект сыроват (64 звезды, мало форков), но идея перспективная, а код модульный.
Проект активен: есть Discord, Twitter, сайт kayba.ai. Но сообщество пока малое (64 звезды, 0 issues).
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Инструмент для автономного улучшения AI-агентов через анализ их логов и генерацию улучшений с помощью LLM.
Для разработчиков на Python, которые создают AI-агентов и хотят автоматизировать процесс их доработки и тестирования.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.