← Все проекты
Проект / TypeScript

PentesterFlow/OffensiveSET: OffensiveSET — генератор реалистичных датасетов для обучения ИИ-пентастеров

Создаёт качественные диалоги для тонкой настройки LLM, чтобы они думали и действовали как профессиональные специалисты по безопасности.

Это инструмент на TypeScript для генерации датасетов в форматах, совместимых с ShareGPT/ChatML, специально оптимизированных под Qwen3.5. Он создаёт не просто наборы вопросов-ответов, а целые сценарии с цепочками рассуждений (thinking blocks), реалистичными...

★ 26 TypeScript ↑ 4 за 24ч Форки 6 Issue 0 Оценка 8/10 Карточка проверена

Для кого это

Для разработчиков, которые хотят обучать ИИ-модели на реалистичных сценариях пентеста, и для исследователей в области AI-безопасности.

Проблема / задача

Нехватка качественных, разнообразных и реалистичных датасетов для обучения ИИ-моделей навыкам кибербезопасности и пентестинга.

Как это работает

Проект работает как MCP-сервер, который генерирует многоходовые диалоги, имитирующие реальный процесс пентеста: от разведки до эксплуатации уязвимостей и написания отчёта. Он использует шаблоны сценариев (45 вариантов), эмулирует вывод реальных инструментов (40+ инструментов) и включает случаи неудачных атак для полноты картины.

Что видно по README

Это инструмент на TypeScript для генерации датасетов в форматах, совместимых с ShareGPT/ChatML, специально оптимизированных под Qwen3.5. Он создаёт не просто наборы вопросов-ответов, а целые сценарии с цепочками рассуждений (thinking blocks), реалистичными выводами инструментов (nmap, sqlmap) и профессиональными отчётами с CVSS-оценками.

Ключевые возможности

Генерация многоходовых диалогов (8-15 шагов) по реалистичным workflow45 готовых сценариев атак (OWASP, Modern, API, Advanced)Эмуляция вывода 40+ инструментов для пентеста без дублированияВключение случаев неудач (блокировки WAF, обнаружение honeypot)Экспорт в 5 форматов (Qwen ChatML, ShareGPT, OpenAI, Alpaca)

Технологии

TypeScriptMCP (Model Context Protocol)KubernetesOpenAI APILLaMARustGraphQL

Интересный факт

Проект генерирует даже «провальные» сценарии атак, что делает датасеты более реалистичными и учит модели искать обходные пути.

С чего начать

  • Клонировать репозиторий и установить зависимости (npm install)
  • Собрать проект (npm run build)
  • Добавить сервер в Claude через MCP (claude mcp add ...) или конфиг-файл

Оценка GitRadar

Удобство
7/10
Свежесть
9/10
Перспектива
8/10
Монетизация
6/10
Общая оценка
8/10

Вердикт GitRadar

Стоит пробовать, если вы работаете с тонкой настройкой LLM для задач безопасности. Проект узкоспециализированный, но очень качественный для своей ниши.

Наблюдения по обновлениям

Проект активно развивается (версия 2.0.0), имеет чёткую структуру и документацию, но пока мало звёзд и форков.

Что мы проверили

Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.

Исходный репозиторий
https://github.com/PentesterFlow/OffensiveSET
Лицензия
MIT
Создан на GitHub
2 апреля 2026 г.
Последнее обновление репо
2 апреля 2026 г.
Последняя проверка GitRadar
2 апреля 2026 г.
Изученные файлы
README.md, src/index.ts, package.json, src/schemas/tools/index.ts, src/templates/scenarios/index.ts, src/generators/v2/index.ts

FAQ

Что это такое?

MCP-сервер для генерации реалистичных диалогов-сценариев пентеста, чтобы обучать ИИ-модели навыкам кибербезопасности.

Для кого подходит?

Для разработчиков и исследователей, которые хотят создавать или дорабатывать датасеты для обучения LLM в области offensive security.

Источники

  • GitHub исходный код и активность
  • README описание, ссылки, стартовые материалы

Нужна помощь с PentesterFlow/OffensiveSET?

Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.