Что это такое?
Сервис на Python, который предоставляет API для сбора всех комментариев (включая обсуждения) с платформы Zhihu, обходя её защиту.
Это инструмент для обхода ограничений платформы Zhihu и получения полных данных обсуждений. Он решает сложную задачу автоматической генерации подписей запросов и предоставляет готовый API для интеграции в аналитические пайплайны или исследовательские проекты.
Для разработчиков, аналитиков и исследователей, которым нужны данные общественного мнения с Zhihu для анализа, обучения AI-агентов или мониторинга контента.
Zhihu активно защищает свои данные, усложняя автоматический сбор комментариев, особенно вложенных. Вручную собирать полные обсуждения — долго и неэффективно.
Проект представляет собой сервис на FastAPI, который обходит защиту Zhihu. Он автоматически вычисляет необходимые криптографические подписи (x-zse-96) с помощью встроенного JavaScript-рантайма, выполняет запросы к API Zhihu, обрабатывает пагинацию и рекурсивно собирает все дочерние комментарии («ветки» обсуждений). Всё упаковано в Docker-контейнер для простого развёртывания.
Это инструмент для обхода ограничений платформы Zhihu и получения полных данных обсуждений. Он решает сложную задачу автоматической генерации подписей запросов и предоставляет готовый API для интеграции в аналитические пайплайны или исследовательские проекты.
Проект использует хитрый трюк: для вычисления подписи, которую требует Zhihu, он запускает миниатюрный JavaScript-движок (PyExecJS) прямо внутри Python-сервиса, эмулируя поведение браузера.
Стоит попробовать, если вам критически нужны данные с Zhihu для анализа. Это узкоспециализированный, но технически грамотный инструмент, который решает конкретную сложную задачу. Однако будьте готовы к возможным изменениям со стороны платформы и соблюдайте правила использования.
Проект создан в апреле 2024 года, выглядит свежим и адаптированным под текущие механизмы защиты Zhihu. Активность разработки низкая (13 звёзд, 1 issue), что типично для нишевых инструментов.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Сервис на Python, который предоставляет API для сбора всех комментариев (включая обсуждения) с платформы Zhihu, обходя её защиту.
Для разработчиков и исследователей, которым нужны структурированные данные общественного мнения с Zhihu для аналитики, обучения моделей или мониторинга.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.