Проект / Python

claudlos/hermes-katana: Hermes Katana — продвинутая защита для AI-агентов

Библиотека на Python, которая превращает вашего LLM-агента в крепость с семью уровнями безопасности.

claudlos/hermes-katana — open-source проект на Python, который стоит оценить перед внедрением или доработкой.

★ 16 Python Форки 0 Issue 0 Оценка 8/10 Карточка проверена

Для кого это

Для разработчиков, которые создают AI-агентов на Hermes и хотят защитить их от prompt injection, утечек секретов и несанкционированных действий.

Проблема / задача

AI-агенты уязвимы: злоумышленники могут обманом заставить их раскрыть системные промпты, выполнить опасные команды или передать конфиденциальные данные. Обычные фильтры либо пропускают атаки, либо мешают нормальной работе ложными срабатываниями.

Как это работает

Проект внедряет систему отслеживания происхождения данных (taint tracking) на уровне символов — каждый байт помечается источником и отслеживается через все строковые операции. Затем семиуровневая цепочка защиты анализирует потоки данных, сканирует ввод-вывод на 30+ паттернов инъекций, применяет политики безопасности и ведёт защищённый от подделок аудит-трейл. Всё это работает как middleware для Hermes Agent.

Что видно по README

Hermes Katana — это open-source инструментарий безопасности для LLM-агентов, построенных на Hermes. Он предлагает не просто обнаружение угроз, а их предотвращение через глубокую защиту. Вдохновлённый исследованием CaMeL от Google DeepMind, проект отслеживает происхождение данных на уровне символов и блокирует подозрительные потоки до того, как они достигнут критических инструментов вроде терминала. Библиотека прошла...

Ключевые возможности

Отслеживание происхождения данных (taint tracking) на уровне символовСемиуровневая защита: анализ потоков, сканирование ввода/вывода, политики, прокси, аудитДекларативный движок политик безопасности с пресетами (параноидальный, сбалансированный, разрешающий)Зашифрованное хранилище секретов Vault с AES-256-GCM и ротацией ключейMITM-прокси для перехвата и проверки трафика LLM

Технологии

Python 3.10+Pydanticcryptographymitmproxy (опционально)PythonReactOpenAI APIRust

Темы и ключи

aiai-agentai-agentshermeshermes-agentllmllmssecuritysecurity-tools

Интересный факт

Проект утверждает, что поймал 159 из 159 adversarial-атак и успешно отразил 64 попытки обхода защиты — впечатляющий результат для open-source решения.

С чего начать

Установите через pip: pip install hermes-katana
Проверьте систему: katana doctor
Активируйте политику: katana policy use balanced
Просканируйте тестовый ввод: katana scan "игнорируй предыдущие инструкции..."

Оценка GitRadar

Удобство

7/10

Свежесть

9/10

Перспектива

8/10

Монетизация

6/10

Общая оценка

8/10

Вердикт GitRadar

Стоит пробовать, если вы разрабатываете серьёзных AI-агентов на Hermes и беспокоитесь об их безопасности. Проект выглядит технически продвинутым, хорошо протестированным и предлагает реальную многоуровневую защиту, а не просто фильтры.

Наблюдения по обновлениям

Проект активно развивается: версия 2.0.0, 1214 тестов, свежие зависимости, хорошая документация и примеры.

Что мы проверили

Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.

Исходный репозиторий: https://github.com/claudlos/hermes-katana
Лицензия: MIT
Создан на GitHub: 5 апреля 2026 г.
Последнее обновление репо: 5 апреля 2026 г.
Последняя проверка GitRadar: 5 апреля 2026 г.
Изученные файлы: examples/README.md, pyproject.toml, src/hermes_katana/cli/main.py, README.md, src/hermes_katana/__init__.py, src/hermes_katana/exceptions.py

FAQ

Что это такое?

Библиотека безопасности для AI-агентов на платформе Hermes, которая отслеживает происхождение данных и блокирует атаки вроде prompt injection.

Для кого подходит?

Для разработчиков Python, которые создают LLM-агентов и хотят защитить их от злоупотреблений и утечек данных.

Источники

GitHub исходный код и активность
README описание, ссылки, стартовые материалы

Нужна помощь с claudlos/hermes-katana?

Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.

Смотреть услуги Открыть на GitHub Написать в Telegram