Модель с открытыми весами
Модель с открытыми весами — языковая или мультимодальная нейросеть, параметры (веса) которой публично доступны для скачивания, изучения и локального запуска без обязательного обращения к API разработчика.
Модель с открытыми весами — нейронная сеть, чьи обученные параметры распространяются публично, как правило через платформу Hugging Face или официальный репозиторий компании-разработчика. Это принципиально отличает их от закрытых моделей — GPT-4o, Gemini 2.0 Ultra, Claude — доступных исключительно через API без возможности инспекции или локального запуска весов.
Пользователь или организация скачивает файлы весов — обычно в форматах safetensors или GGUF — и запускает модель локально: на потребительском GPU, корпоративном кластере или в облаке без посредника. Доступ к весам открывает дообучение под специализированный домен, квантование для ускорения на ограниченном оборудовании и полный аудит архитектуры модели.
Открытые веса критически важны для независимости от поставщика, соответствия требованиям конфиденциальности данных и академических исследований. Компании в регулируемых отраслях — здравоохранении, финансах, государственном секторе — выигрывают от возможности развернуть модель на собственной инфраструктуре, не передавая данные третьим сторонам.
К 2025–2026 годам экосистема насчитывает тысячи публичных моделей. Meta выпустила Llama 3 (8B, 70B, 405B параметров), Mistral — Mixtral 8x22B, Alibaba — серию Qwen2.5, DeepSeek — модели DeepSeek-V3 и R1, сопоставимые по качеству с ведущими закрытыми системами. Важная оговорка: термин «открытые веса» точнее, чем «open source», поскольку большинство таких лицензий ограничивают коммерческое использование.