Что это такое?
Открытый датасет и аналитический пайплайн для изучения того, как ИИ-поисковики (ChatGPT, Google AI, Perplexity) решают, когда искать информацию в сети и какие источники цитировать.
Это не просто отчёт, а открытый исследовательский проект с полными данными и скриптами. Авторы провели четырёхуровневый эксперимент, чтобы выяснить, как дизайн запроса, язык и тип задачи влияют на поведение ИИ-поисковиков. Все сырые данные, промпты и код...
Для маркетологов, SEO-специалистов, исследователей ИИ и контент-стратегов, которые хотят понять логику цитирования в нейросетевых поисковиках.
Непонятно, как ИИ-поисковики решают, когда искать информацию, какие источники считать авторитетными и как глубоко поглощать контент — это чёрный ящик, мешающий оптимизировать контент под новые алгоритмы.
Проект — это масштабный эксперимент: 602 промпта разного типа отправлялись в три платформы (ChatGPT, Google AI, Perplexity). Собирались данные о срабатывании поиска, выбранных источниках и глубине их использования. Затем 18 тысяч страниц-источников анализировались по 72 параметрам (авторитетность, структура, семантика) для выявления закономерностей.
Это не просто отчёт, а открытый исследовательский проект с полными данными и скриптами. Авторы провели четырёхуровневый эксперимент, чтобы выяснить, как дизайн запроса, язык и тип задачи влияют на поведение ИИ-поисковиков. Все сырые данные, промпты и код анализа доступны для проверки и дальнейшего изучения.
Оказалось, что ChatGPT цитирует меньше источников, но использует каждый гораздо глубже (влияние в 5 раз выше, чем у Google). А Perplexity — самый «щедрый» на ссылки, но поверхностный.
Стоит изучить, если вы работаете с контентом или SEO в эпоху ИИ-поиска. Это редкое структурированное исследование с открытыми данными, а не просто мнение. Код рабочий, но проект больше исследовательский, чем готовый инструмент.
Проект — законченное исследование с полным датасетом. Активных коммитов после публикации нет, но данные и методология остаются актуальными для анализа поведения ИИ-поиска.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Открытый датасет и аналитический пайплайн для изучения того, как ИИ-поисковики (ChatGPT, Google AI, Perplexity) решают, когда искать информацию в сети и какие источники цитировать.
Для специалистов по цифровому маркетингу, SEO, исследователей ИИ и контент-менеджеров, которые хотят на данных понять логику современных поисковых систем.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.