Проект / Python

admins97/ATTFormer: ATTFormer — нейросеть для поиска видео по запросу

Находит нужные видеофрагменты по текстовому описанию с помощью трансформеров.

Проект реализует архитектуру ATTFormer для задачи частично релевантного поиска видео. Поддерживает несколько датасетов (TVR, Act, Cha), включает конвейер обучения с функцией сложных негативных примеров и валидации по метрикам R@1, R@5, R@10, R@100.

★ 18 Python Форки 0 Issue 0 Оценка 7/10 Карточка проверена

Открыть на GitHub Помочь с установкой

Для кого это

Для разработчиков, работающих с компьютерным зрением и поиском по мультимедиа, а также исследователей в области видеоанализа.

Проблема / задача

Когда нужно быстро найти конкретный момент в длинном видео или в большой библиотеке видеоматериалов по текстовому запросу.

Как это работает

Модель обучается сопоставлять текстовые описания с визуальными и временными признаками видео. Использует механизмы внимания (attention) для выделения ключевых кадров и фрагментов. Оценивает релевантность видео запросу и ранжирует результаты.

Что видно по README

Ключевые возможности

Поиск видео по текстовому запросуПоддержка нескольких датасетовВалидация по стандартным метрикам retrieval

Технологии

PyTorchTransformerPython

Интересный факт

Модель умеет работать с "частично релевантными" видео — когда запрос описывает не всё видео целиком, а только некоторый его фрагмент.

С чего начать

Клонировать репозиторий
Установить зависимости из requirements.txt
Запустить обучение или тестирование с указанием датасета

Оценка GitRadar

Удобство

6/10

Свежесть

8/10

Перспектива

7/10

Монетизация

6/10

Общая оценка

7/10

Вердикт GitRadar

Стоит пробовать, если вы исследуете задачи поиска по видео и хотите готовую реализацию на PyTorch. Проект структурирован, но требует глубокого погружения в тему.

Наблюдения по обновлениям

Проект выглядит законченным, но с минимальной активностью (0 форкв, 0 issues). Кодовая база структурирована.

Что мы проверили

Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.

Исходный репозиторий: https://github.com/admins97/ATTFormer
Создан на GitHub: 23 апреля 2026 г.
Последнее обновление репо: 23 апреля 2026 г.
Последняя проверка GitRadar: 23 апреля 2026 г.
Изученные файлы: README.md, src/main.py, requirements.txt, src/Losses/builder.py, src/Validations/builder.py, src/Configs/builder.py

FAQ

Что это такое?

Нейросеть для поиска видео по текстовому описанию, основанная на архитектуре Transformer.

Для кого подходит?

Для разработчиков и исследователей в области компьютерного зрения, видеоанализа и информационного поиска.

Источники

GitHub исходный код и активность
README описание, ссылки, стартовые материалы

Нужна помощь с admins97/ATTFormer?

Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.

Смотреть услуги Открыть на GitHub Написать в Telegram