NVIDIA открыла инструмент для генерации 3D медицинских снимков
NVIDIA выпустила NV-Generate-CTMR для синтеза реалистичных 3D снимков КТ и МРТ. На датасете MR-RATE (700 тысяч объёмов от 83 тысяч пациентов) система создаёт ме

NVIDIA представила NV-Generate-CTMR — открытый фреймворк для синтеза реалистичных 3D медицинских изображений. Это решение опирается на новый датасет MR-RATE — крупнейший открытый набор многомодальных МРТ-исследований мозга.
Проблема нехватки данных
Высокое качество данных для AI в радиологии — это узкое место в разработке диагностических систем. Основные проблемы: ограниченность доступных датасетов, соблюдение приватности пациентов и высокая стоимость аннотирования специалистами. Модели, обученные на узких данных, плохо обобщаются и отказываются работать на других типах сканеров и клинических протоколов. В результате разработчики долгие месяцы собирают десятки тысяч изображений, согласовывают доступ с больницами, договариваются с регуляторами. Это замораживает разработку на месяцы.
Как работает NVIDIA NV-Generate
Фреймворк основан на двух вариантах архитектуры MAISI: MAISI-v1 использует латентные диффузионные вероятностные модели для разнообразной генерации. MAISI-v2 применяет Latent Rectified Flow — это дало ускорение вывода в 33 раза и улучшило качество. Специализированная модель NV-Generate-MR-Brain синтезирует МРТ мозга с разными контрастностями: T1, T2, FLAIR и SWI. Выходные объёмы — вплоть до 512 × 512 × 256 пиксель. Система поддерживает как полный мозг, так и изображения без черепа, с контролем анатомических структур через ControlNet модули.
«Это первый фреймворк, который позволяет задавать анатомические
структуры в синтетических изображениях с точным совпадением условий».
Датасет MR-RATE — новый стандарт
Для тренировки использовался MR-RATE — крупнейший открытый набор многомодальных МРТ исследований мозга: 100 тысяч МРТ-исследований 83+ тысячи уникальных пациентов 700 тысяч 3D объёмов Де-идентифицированные радиологические отчёты и клинические данные Такой масштаб позволяет моделям учиться на реальном разнообразии сканеров, протоколов и патологий — от здоровых структур до редких опухолей.
Преимущества для разработчиков
Фреймворк гибкий: одна модель работает с разными разрешениями, размерами объёмов и охватом области. Не требует переучивания под каждый сканер в клинике. Эффективность: дофайнтюнинг требует меньше вычислений, чем обучение с нуля. Скорость MAISI-v2 сопоставима с лучшими моделями видео-генерации. Внешние исследователи уже применили эти модели для обнаружения аномалий, классификации рака лёгких, выявления поражений простаты и синтеза между модальностями.
Что это значит Синтетические медицинские изображения становятся практическим инструментом индустрии.
Клиники и медтех-стартапы теперь могут обучать устойчивые AI-модели без ожидания огромных датасетов и согласований на приватные данные пациентов. В условиях, когда медицина становится всё более персонализированной и многомодальной, масштабируемая генерация данных — это критическое конкурентное преимущество.