Проект / Python

Josh-blythe/bordair-multimodal-v1: Bordair Multimodal — набор данных для тестирования мультимодальных инъекций в промпты

Готовый набор из 61 875 промптов для обучения и оценки детекторов инъекций в AI-системы, работающие с текстом, изображениями, документами и аудио.

★ 13 Python Форки 1 Issue 0 Оценка 7/10 Карточка проверена

Открыть на GitHub Помочь с установкой

Для кого это

Для исследователей AI-безопасности, разработчиков защитных систем для LLM и специалистов по red teaming, которые хотят протестировать устойчивость моделей к сложным атакам.

Проблема / задача

Современные AI-системы уязвимы к атакам, где вредоносная инструкция разбита между разными модальностями — например, часть в тексте, часть в метаданных изображения. Существующие датасеты часто покрывают только текстовые атаки, а для мультимодальных сценариев данных не хватает.

Как это работает

Проект генерирует реалистичные атаки на основе академических исследований (OWASP, CrossInject, FigStep) и индустриальных практик. Каждый пример помечен как атака или безопасный промпт, имеет указание источника и структурирован для обучения бинарных классификаторов. Атаки комбинируют несколько модальностей и используют техники вроде разделения payload, переключения контекста и обфускации.

Что видно по README

Это открытый датасет для тестирования и обучения детекторов prompt injection. Содержит две версии: v1 — кросс-модальные атаки (текст + изображение/документ/аудио), v2 — многоходовые атаки с использованием шаблонов jailbreak и adversarial суффиксов. Все примеры имеют метки и ссылки на источники из рецензируемых работ.

Ключевые возможности

61 875 размеченных примеров (38 117 атак + 23 758 безопасных)Покрытие 13 категорий атак: от прямого переопределения до социальной инженерииКросс-модальные комбинации: текст+изображение, текст+документ, текст+аудио, тройные и четверныеПоддержка многоходовых атак и adversarial суффиксов (nanoGCG)Интеграция с PyRIT от Microsoft для генерации jailbreak-шаблонов

Технологии

PythonPyRIT (Microsoft AI Red Team framework)OpenAI APILLaMARust

Интересный факт

В датасете есть атаки, где вредоносная инструкция спрятана в ультразвуковом диапазоне аудио или в скрытых слоях PDF-документа — методы, описанные в исследованиях по безопасности 2025-2026 годов.

С чего начать

Клонируйте репозиторий
Установите зависимости Python
Запустите generate_payloads.py для создания датасета v1 или generate_v2_pyrit.py для v2

Оценка GitRadar

Удобство

7/10

Свежесть

9/10

Перспектива

8/10

Монетизация

6/10

Общая оценка

7/10

Вердикт GitRadar

Стоит попробовать, если вы занимаетесь защитой AI-систем. Это один из немногих публичных датасетов, который систематически покрывает мультимодальные атаки с академической строгостью. Однако проект молодой (11 звёзд, мало активности), поэтому стоит проверять актуальность и возможные ошибки.

Наблюдения по обновлениям

Проект свежий (2025-2026), основан на актуальных исследованиях, но имеет мало звёзд и активности на GitHub. Код и README выглядят структурированно.

Что мы проверили

Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.

Исходный репозиторий: https://github.com/Josh-blythe/bordair-multimodal-v1
Создан на GitHub: 10 апреля 2026 г.
Последнее обновление репо: 10 апреля 2026 г.
Последняя проверка GitRadar: 10 апреля 2026 г.
Изученные файлы: README.md, generate_benign_multimodal.py, generate_benign.py, generate_payloads.py, generate_v2_pyrit.py

FAQ

Что это такое?

Датасет для обучения и тестирования детекторов prompt injection в мультимодальных AI-системах. Содержит примеры атак, где вредоносная инструкция разбита между текстом, изображениями, документами или аудио.

Для кого подходит?

Для исследователей AI-безопасности, разработчиков защитных решений для LLM и специалистов по red teaming, которые хотят оценить устойчивость моделей к сложным сценариям атак.

Источники

GitHub исходный код и активность
README описание, ссылки, стартовые материалы

Нужна помощь с Josh-blythe/bordair-multimodal-v1?

Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.

Смотреть услуги Открыть на GitHub Написать в Telegram