Что это такое?
Open-source расширение для DuckDB, которое позволяет выполнять запросы одновременно на локальной машине и удалённых серверах, с прозрачным доступом к данным.
OpenDuck — это open-source реализация архитектурных идей MotherDuck (гибридное выполнение, дифференциальное хранилище), но с открытым протоколом и бэкендом. Проект позволяет приаттачить удалённую базу как локальную, писать JOIN между локальными и облачными...
Для разработчиков и инженеров данных, которые хотят масштабировать аналитические запросы DuckDB за пределы одной машины без переписывания кода.
DuckDB отлично работает локально, но как только данные не помещаются на диск или нужны совместные вычисления, приходится переезжать на тяжёлые облачные хранилища и менять архитектуру.
OpenDuck — это расширение для DuckDB, которое добавляет прозрачный доступ к удалённым таблицам через команду ATTACH. Запрос автоматически разбивается на части: одни операции выполняются локально, другие — на удалённом воркере, а промежуточные данные передаются по сети. Хранилище построено на дифференциальных слоях: данные записываются один раз, а читать их могут множество процессов. Всё работает через открытый...
OpenDuck — это open-source реализация архитектурных идей MotherDuck (гибридное выполнение, дифференциальное хранилище), но с открытым протоколом и бэкендом. Проект позволяет приаттачить удалённую базу как локальную, писать JOIN между локальными и облачными таблицами и масштабировать вычисления без изменения SQL-кода. Написано в основном на Rust, с интеграцией в DuckDB через C++ расширения.
Проект использует FUSE-модуль для Linux, чтобы монтировать дифференциальное хранилище как обычную файловую систему — DuckDB видит просто файл, а под капотом идёт сложная многослойная логика.
Стоит пробовать, если вы уже используете DuckDB и упираетесь в её локальные ограничения. Это ранний, но амбициозный проект с чёткой архитектурой. Пока сыроват для продакшена, но отлично подходит для экспериментов и кастомизации.
Проект активно развивается: есть единый CLI, поддержка DuckLake, метрики OpenTelemetry. Но звёзд пока мало (289), коммиты идут, но это ранняя стадия.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Open-source расширение для DuckDB, которое позволяет выполнять запросы одновременно на локальной машине и удалённых серверах, с прозрачным доступом к данным.
Для разработчиков и дата-инженеров, которые хотят масштабировать аналитику на DuckDB без перехода на тяжёлые облачные DWH.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.