Что это такое?
Учебный проект с полным ML-пайплайном для прогнозирования качества воздуха на основе открытых данных.
Этот репозиторий представляет собой учебный пример полного цикла ML-проекта: от сбора данных о качестве воздуха в районе Майами-Форт-Лодердейл-Майами-Бич за 2022-2023 годы до развёртывания модели прогнозирования концентрации PM2.5. Включает скрипты для...
Для ML-инженеров и дата-сайентистов, которые хотят изучить пример end-to-end ML-проекта с Airflow, DVC и облачным развёртыванием.
Создание промышленного ML-пайплайна требует интеграции множества инструментов: версионирования данных, оркестрации задач, мониторинга модели и её развёртывания.
Проект собирает данные о качестве воздуха из OpenAQ, обрабатывает их, строит модель прогнозирования PM2.5 с помощью XGBoost и Prophet, управляет пайплайном через Apache Airflow, версионирует данные с помощью DVC и разворачивает модель как облачную функцию в Google Cloud.
Этот репозиторий представляет собой учебный пример полного цикла ML-проекта: от сбора данных о качестве воздуха в районе Майами-Форт-Лодердейл-Майами-Бич за 2022-2023 годы до развёртывания модели прогнозирования концентрации PM2.5. Включает скрипты для предобработки данных, обучения модели, оркестрации пайплайна и облачной интеграции.
Проект включает видео-демонстрации всего процесса: от создания до анализа дрейфа данных и деградации модели, что делает его отличным учебным материалом.
Стоит попробовать как учебный пример построения end-to-end ML-пайплайна, особенно для изучения Airflow и DVC в связке. Однако проект выглядит как индивидуальный учебный проект, а не готовое к продакшену решение.
Проект содержит подробные инструкции и видео, но имеет мало звёзд и форков, что указывает на низкую популярность.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Учебный проект с полным ML-пайплайном для прогнозирования качества воздуха на основе открытых данных.
Для ML-инженеров и дата-сайентистов, изучающих построение промышленных ML-систем с оркестрацией и облачным развёртыванием.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.