Что это такое?
Инструмент для тонкой настройки моделей Gemma на тексте, изображениях и аудио, работающий на Mac с чипами Apple Silicon.
Инструмент для тонкой настройки моделей Gemma 4 и 3n с поддержкой мультимодальности. Позволяет дообучать модели на тексте, изображениях и аудио прямо на компьютерах Apple с чипами M-серии. Использует современные методы эффективной настройки (LoRA) и может...
Для Python-разработчиков и ML-инженеров, которые хотят адаптировать модели Gemma под свои задачи с мультимодальными данными (текст, изображения, аудио) на оборудовании Apple Silicon.
Тонкая настройка мультимодальных моделей обычно требует мощных GPU NVIDIA, аренды облачных инстансов и скачивания огромных датасетов на локальную машину.
Проект использует метод LoRA (Low-Rank Adaptation) для эффективной дообучения моделей Gemma. Он работает на PyTorch с поддержкой Metal Performance Shaders (MPS) для Apple Silicon. Поддерживает три типа данных: текстовые CSV, изображения с подписями и аудио с транскрипциями. Можно обучаться на данных из Google Cloud Storage или BigQuery без их полной загрузки на диск. Весь процесс происходит локально на Mac.
Инструмент для тонкой настройки моделей Gemma 4 и 3n с поддержкой мультимодальности. Позволяет дообучать модели на тексте, изображениях и аудио прямо на компьютерах Apple с чипами M-серии. Использует современные методы эффективной настройки (LoRA) и может работать с данными из облачных хранилищ. Включает визуализацию процесса обучения в реальном времени через браузер.
Проект позволяет обучать модели на аудио — редкая возможность для инструментов, работающих на Apple Silicon. Можно адаптировать распознавание речи под медицинские термины, юридические документы или специфические акценты.
Стоит пробовать, если у вас есть Mac на Apple Silicon и нужно дообучить Gemma на своих мультимодальных данных. Проект заполняет нишу локальной настройки моделей с поддержкой аудио, что мало где встречается.
Проект активно развивается, есть подробная документация и руководства. Поддерживает свежие версии Gemma 4 и 3n.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
Инструмент для тонкой настройки моделей Gemma на тексте, изображениях и аудио, работающий на Mac с чипами Apple Silicon.
Для разработчиков и ML-инженеров, которые хотят адаптировать языковые модели под свои задачи без аренды дорогого облачного железа.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.