← Все проекты
Проект / Python

princeton-vl/FOSSA: FOSSA — оценка глубины сцены по размытию без обучения

Получайте карты глубины из обычных фотографий, анализируя степень размытия объектов.

FOSSA — исследовательский проект из Princeton Vision & Learning Lab, реализующий метод оценки глубины сцены по степени размытия объектов. Включает код для обучения и оценки модели, а также набор данных ZEDD для тестирования. Проект сопровождается научной...

★ 29 Python Форки 0 Issue 0 Оценка 6/10 Карточка проверена

Для кого это

Для исследователей компьютерного зрения и разработчиков, работающих с 3D-реконструкцией, AR/VR и автономными системами.

Проблема / задача

Традиционные методы оценки глубины требуют стереокамер, лазерных сканеров или специальных датасетов для обучения, что дорого и сложно внедрять.

Как это работает

Модель анализирует естественное оптическое размытие (дефокус) на снимках с малой глубиной резкости. Алгоритм обучается на синтетически сгенерированных данных и применяется к реальным изображениям без дополнительной донастройки (zero-shot подход). Для работы требуется CUDA-совместимый GPU.

Что видно по README

FOSSA — исследовательский проект из Princeton Vision & Learning Lab, реализующий метод оценки глубины сцены по степени размытия объектов. Включает код для обучения и оценки модели, а также набор данных ZEDD для тестирования. Проект сопровождается научной статьёй и онлайн-демо.

Ключевые возможности

Zero-shot оценка глубины без дообучения на целевых данныхРабота с синтетическими и реальными изображениямиИнтеграция с датасетом ZEDD для бенчмаркингаПоддержка распределённого обучения на нескольких GPU

Технологии

PythonPyTorchCUDA

Интересный факт

Модель использует специально разработанное CUDA-расширение PowerExpPSF для симуляции оптического размытия, что ускоряет обучение в сотни раз.

С чего начать

  • Создать conda-окружение с Python 3.8
  • Установить зависимости из requirements.txt
  • Собрать CUDA-расширение PowerExpPSF
  • Загрузить датасеты HAMMER и DDFF-12

Оценка GitRadar

Удобство
4/10
Свежесть
9/10
Перспектива
7/10
Монетизация
3/10
Общая оценка
6/10

Вердикт GitRadar

Стоит пробовать исследователям в области компьютерного зрения для экспериментов с оценкой глубины. Для продакшена потребуется значительная доработка.

Наблюдения по обновлениям

Проект свежий (2024), но имеет низкую активность сообщества (29 звёзд, 0 форков и issue). Код выложен полностью, roadmap выполнен.

Что мы проверили

Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.

Исходный репозиторий
https://github.com/princeton-vl/FOSSA
Лицензия
BSD-3-Clause
Создан на GitHub
30 марта 2026 г.
Последнее обновление репо
30 марта 2026 г.
Последняя проверка GitRadar
30 марта 2026 г.
Изученные файлы
README.md, requirements.txt, dist_val.sh, dist_test.sh, dist_train.sh, eval.py

FAQ

Что это такое?

Набор инструментов для оценки глубины сцены по размытию на фотографиях, не требующий обучения на целевых данных.

Для кого подходит?

Для академических исследователей и инженеров, разрабатывающих алгоритмы 3D-реконструкции, AR-приложения или автономные системы.

Источники

  • GitHub исходный код и активность
  • README описание, ссылки, стартовые материалы

Нужна помощь с princeton-vl/FOSSA?

Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.