← Все проекты
Проект / Python

AuthBits/webmcp: WebMCP — сервер для поиска и извлечения данных из интернета для LLM-агентов

Позволяет LLM-агентам искать в интернете и извлекать структурированные данные с веб-страниц, используя локальные языковые модели.

Это MCP-сервер на Python, который позволяет LLM-агентам искать информацию в интернете и извлекать структурированные данные с веб-страниц. Проект интегрируется с локальными LLM через OpenAI-совместимые API и предлагает гибкие методы загрузки контента.

★ 32 Python Форки 3 Issue 0 Оценка 6/10 Карточка проверена

Для кого это

Для разработчиков, создающих исследовательских LLM-агентов, которым нужен доступ к актуальной информации из интернета и её автоматическая обработка.

Проблема / задача

LLM-агенты часто не имеют прямого доступа к свежей информации из интернета, а ручной сбор и структурирование данных с веб-страниц требует времени и усилий.

Как это работает

Сервер предоставляет инструменты для поиска через DuckDuckGo или SearXNG, загрузки веб-страниц с помощью Playwright для JavaScript-сайтов или быстрого HTTP-запроса для статических страниц. Извлечённый контент очищается и отправляется в локальную LLM для структурированного извлечения данных по заданному промпту или схеме.

Что видно по README

Это MCP-сервер на Python, который позволяет LLM-агентам искать информацию в интернете и извлекать структурированные данные с веб-страниц. Проект интегрируется с локальными LLM через OpenAI-совместимые API и предлагает гибкие методы загрузки контента.

Ключевые возможности

Поиск в интернете через DuckDuckGo или SearXNGИзвлечение и очистка контента с веб-страницПоддержка JavaScript-сайтов через PlaywrightСтруктурированное извлечение данных с помощью локальной LLMЛогирование всех вызовов инструментов

Технологии

PythonPlaywrightllama.cppFastMCPOpenAI APILLaMAGo

Интересный факт

Проект использует два разных размера моделей LLM для разных задач: большую модель для исследовательской работы и меньшую — для извлечения данных, что оптимизирует использование ресурсов.

С чего начать

  • Установите зависимости: pip install -r requirements.txt
  • Настройте переменные окружения LLM_URL и LLM_MODEL
  • Запустите сервер: python app.py

Оценка GitRadar

Удобство
6/10
Свежесть
8/10
Перспектива
7/10
Монетизация
4/10
Общая оценка
6/10

Вердикт GitRadar

Стоит пробовать, если вы разрабатываете исследовательских LLM-агентов и хотите дать им доступ к актуальной информации из интернета. Проект сыроват, но предлагает работающий фундамент.

Наблюдения по обновлениям

Проект активно развивается, но имеет открытые задачи по улучшению извлечения контента и обходу антибот-систем.

Что мы проверили

Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.

Исходный репозиторий
https://github.com/AuthBits/webmcp
Лицензия
MIT
Создан на GitHub
10 апреля 2026 г.
Последнее обновление репо
10 апреля 2026 г.
Последняя проверка GitRadar
10 апреля 2026 г.
Изученные файлы
README.md, app.py, requirements.txt

FAQ

Что это такое?

MCP-сервер для поиска в интернете и извлечения структурированных данных с веб-страниц с помощью локальных LLM.

Для кого подходит?

Для разработчиков, создающих исследовательских LLM-агентов, которым нужен доступ к свежей информации из интернета.

Источники

  • GitHub исходный код и активность
  • README описание, ссылки, стартовые материалы

Нужна помощь с AuthBits/webmcp?

Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.