Проект / Python

princeton-vl/FOSSA: FOSSA — оценка глубины сцены по размытию без обучения

Получайте карты глубины из обычных фотографий, анализируя степень размытия объектов.

FOSSA — исследовательский проект из Princeton Vision & Learning Lab, реализующий метод оценки глубины сцены по степени размытия объектов. Включает код для обучения и оценки модели, а также набор данных ZEDD для тестирования. Проект сопровождается научной...

★ 29 Python Форки 0 Issue 0 Оценка 6/10 Карточка проверена

Открыть на GitHub Помочь с установкой

Для кого это

Для исследователей компьютерного зрения и разработчиков, работающих с 3D-реконструкцией, AR/VR и автономными системами.

Проблема / задача

Традиционные методы оценки глубины требуют стереокамер, лазерных сканеров или специальных датасетов для обучения, что дорого и сложно внедрять.

Как это работает

Модель анализирует естественное оптическое размытие (дефокус) на снимках с малой глубиной резкости. Алгоритм обучается на синтетически сгенерированных данных и применяется к реальным изображениям без дополнительной донастройки (zero-shot подход). Для работы требуется CUDA-совместимый GPU.

Что видно по README

Ключевые возможности

Zero-shot оценка глубины без дообучения на целевых данныхРабота с синтетическими и реальными изображениямиИнтеграция с датасетом ZEDD для бенчмаркингаПоддержка распределённого обучения на нескольких GPU

Технологии

PythonPyTorchCUDA

Интересный факт

Модель использует специально разработанное CUDA-расширение PowerExpPSF для симуляции оптического размытия, что ускоряет обучение в сотни раз.

С чего начать

Создать conda-окружение с Python 3.8
Установить зависимости из requirements.txt
Собрать CUDA-расширение PowerExpPSF
Загрузить датасеты HAMMER и DDFF-12

Оценка GitRadar

Удобство

4/10

Свежесть

9/10

Перспектива

7/10

Монетизация

3/10

Общая оценка

6/10

Вердикт GitRadar

Стоит пробовать исследователям в области компьютерного зрения для экспериментов с оценкой глубины. Для продакшена потребуется значительная доработка.

Наблюдения по обновлениям

Проект свежий (2024), но имеет низкую активность сообщества (29 звёзд, 0 форков и issue). Код выложен полностью, roadmap выполнен.

Что мы проверили

Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.

Исходный репозиторий: https://github.com/princeton-vl/FOSSA
Лицензия: BSD-3-Clause
Создан на GitHub: 30 марта 2026 г.
Последнее обновление репо: 30 марта 2026 г.
Последняя проверка GitRadar: 30 марта 2026 г.
Изученные файлы: README.md, requirements.txt, dist_val.sh, dist_test.sh, dist_train.sh, eval.py

FAQ

Что это такое?

Набор инструментов для оценки глубины сцены по размытию на фотографиях, не требующий обучения на целевых данных.

Для кого подходит?

Для академических исследователей и инженеров, разрабатывающих алгоритмы 3D-реконструкции, AR-приложения или автономные системы.

Источники

GitHub исходный код и активность
README описание, ссылки, стартовые материалы

Нужна помощь с princeton-vl/FOSSA?

Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.

Смотреть услуги Открыть на GitHub Написать в Telegram