Модели

Модель с открытыми весами

Модель с открытыми весами — языковая или мультимодальная нейросеть, параметры (веса) которой публично доступны для скачивания, изучения и локального запуска без обязательного обращения к API разработчика.

Модель с открытыми весами — нейронная сеть, чьи обученные параметры распространяются публично, как правило через платформу Hugging Face или официальный репозиторий компании-разработчика. Это принципиально отличает их от закрытых моделей — GPT-4o, Gemini 2.0 Ultra, Claude — доступных исключительно через API без возможности инспекции или локального запуска весов.

Пользователь или организация скачивает файлы весов — обычно в форматах safetensors или GGUF — и запускает модель локально: на потребительском GPU, корпоративном кластере или в облаке без посредника. Доступ к весам открывает дообучение под специализированный домен, квантование для ускорения на ограниченном оборудовании и полный аудит архитектуры модели.

Открытые веса критически важны для независимости от поставщика, соответствия требованиям конфиденциальности данных и академических исследований. Компании в регулируемых отраслях — здравоохранении, финансах, государственном секторе — выигрывают от возможности развернуть модель на собственной инфраструктуре, не передавая данные третьим сторонам.

К 2025–2026 годам экосистема насчитывает тысячи публичных моделей. Meta выпустила Llama 3 (8B, 70B, 405B параметров), Mistral — Mixtral 8x22B, Alibaba — серию Qwen2.5, DeepSeek — модели DeepSeek-V3 и R1, сопоставимые по качеству с ведущими закрытыми системами. Важная оговорка: термин «открытые веса» точнее, чем «open source», поскольку большинство таких лицензий ограничивают коммерческое использование.

Пример

Компания адаптирует Llama 3 70B к анализу медицинских записей: скачивает веса, дообучает на закрытой базе клинических документов и разворачивает в защищённой инфраструктуре — никакие данные пациентов не покидают периметр.

Связанные термины

← Глоссарий