Что это такое?
HNUMedAgent — открытая платформа для предоперационной регистрации медицинских изображений, использующая мультимодальную языковую модель Intern-S1-mini, дообученную на медицинских датасетах.
HNUMedAgent — открытая платформа, созданная в рамках магистерской диссертации. Она объединяет тонкую настройку мультимодальной визуально-языковой модели Intern-S1-mini с модулем регистрации КТ-изображений (на основе команды-победителя MICCAI Learn2Reg). В...
Для исследователей и разработчиков в области медицинской визуализации, а также для инженеров, работающих с системами роботизированной лапароскопической хирургии.
Ручная регистрация медицинских изображений перед операцией — трудоёмкий процесс, требующий специального ПО и экспертных знаний. HNUMedAgent упрощает эту задачу, используя дообученную мультимодальную модель, которая может отвечать на вопросы по снимкам и визуализировать совмещение КТ-срезов.
Проект основан на мультимодальной модели Intern-S1-mini, которая последовательно дообучается на медицинских датасетах SLAKE и MediScope с использованием техники LoRA Plus. После обучения запускается API-сервер LMDeploy с поддержкой KV-кэша и веб-интерфейс на Gradio. Пользователь загружает два КТ-изображения брюшной полости, задаёт текстовый вопрос — модель выводит ответ и показывает результат регистрации.
HNUMedAgent — открытая платформа, созданная в рамках магистерской диссертации. Она объединяет тонкую настройку мультимодальной визуально-языковой модели Intern-S1-mini с модулем регистрации КТ-изображений (на основе команды-победителя MICCAI Learn2Reg). В проекте используются инструменты ms-swift для SFT, LMDeploy для инференса и Gradio для UI. Поддерживается двухэтапное обучение с разными датасетами, что позволяет...
Проект — магистерская работа одного автора, выполненная при поддержке Shanghai AI Lab (A100 GPU). Вдохновлён победным решением команды EOIR на MICCAI Learn2Reg Challenge.
Интересный экспериментальный проект, демонстрирующий применение современных мультимодальных языковых моделей в медицине. Однако он сырой (12 звёзд, 0 форков), требует самостоятельной подготовки датасетов и мощного GPU. Подойдёт для исследовательских целей, но не для промышленного использования.
Проект создан в рамках магистерской работы, активность низкая (12 звёзд, 0 форков, 0 issues). Обновлений после релиза не видно.
Карточка собрана по данным GitHub, README и структуре репозитория. Это не официальная документация проекта.
HNUMedAgent — открытая платформа для предоперационной регистрации медицинских изображений, использующая мультимодальную языковую модель Intern-S1-mini, дообученную на медицинских датасетах.
Для исследователей в области медицинской визуализации и AI, а также для инженеров, разрабатывающих интеллектуальные хирургические системы.
Если проект подходит под ваш сценарий, можем помочь с установкой, интеграцией, доработкой или аккуратным форком под вашу инфраструктуру.