Что это такое?
Набор данных для тестирования безопасности ИИ-агентов в реалистичных сценариях с инструментами.
Проект предоставляет наборы траекторий — полных историй взаимодействия агента с пользователем и инструментами. Каждая траектория размечена как безопасная или опасная, а для опасных есть детальная диагностика по трём измерениям: источник риска, тип сбоя и...
Для исследователей ИИ-безопасности, разработчиков агентских систем и команд, которые хотят проверить свои модели на реалистичных траекториях поведения.
Сложно объективно оценить безопасность ИИ-агентов в долгосрочных сценариях с использованием инструментов — не хватает реалистичных и разнообразных тестовых данных.
Проект предоставляет наборы траекторий — полных историй взаимодействия агента с пользователем и инструментами. Каждая траектория размечена как безопасная или опасная, а для опасных есть детальная диагностика по трём измерениям: источник риска, тип сбоя и возможный вред.
ATbench — это семейство бенчмарков для оценки безопасности ИИ-агентов на уровне траекторий. Содержит реалистичные сценарии с использованием инструментов, размеченные экспертами. Есть две версии: ATbench (1000 траекторий) и ATbench500 (500 траекторий). Данные доступны на Hugging Face, кодовая база будет расширяться.
В последней версии ATbench агенты в среднем делают около 9 шагов за траекторию и используют почти 2000 разных инструментов — это очень разнообразные и сложные сценарии.
Стоит пробовать, если вы серьёзно занимаетесь безопасностью ИИ-агентов. Это один из немногих публичных бенчмарков такого масштаба и детализации.
Проект активно развивается: в апреле 2026 вышло крупное обновление с 1000 траекторий, обещают выпуск движка для генерации данных.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Набор данных для тестирования безопасности ИИ-агентов в реалистичных сценариях с инструментами.
Для исследователей и разработчиков, которые работают с агентским ИИ и хотят оценить риски.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.