Бизнес

Открытый ИИ (open source)

Открытый ИИ — ИИ-системы, для которых публично доступны веса модели, код обучения или и то, и другое, что позволяет любому изучать, запускать, модифицировать и распространять их, в отличие от проприетарных моделей, доступных только через закрытое API.

Открытый ИИ охватывает широкий спектр степеней открытости: от полностью открытых проектов, где публикуются архитектура, код, данные и веса (OLMo от Allen Institute, серия Pythia от EleutherAI), до моделей с «открытыми весами» (open-weight), где веса доступны бесплатно, но тренировочные данные и методология не раскрываются (Meta Llama, Mistral, DeepSeek, Qwen от Alibaba). В октябре 2024 года Open Source Initiative выпустила формальное определение «открытого ИИ», требующее в том числе доступности тренировочных данных, — большинство широко используемых «open-source» моделей ему не соответствует.

Экосистема открытого ИИ развивалась несколькими волнами. После выхода LLaMA-1 в феврале 2023 года сообщество в течение нескольких недель адаптировало модель для запуска на потребительском железе, создало инструменты квантизации (llama.cpp, GGML) и платформы для дообучения. Llama 3 (апрель 2024) и Llama 4 (2025) последовательно сократили разрыв с закрытыми моделями в ключевых бенчмарках. DeepSeek-V2 и DeepSeek-R1 (2024–2025) продемонстрировали, что открытые модели китайских лабораторий способны конкурировать с флагманами OpenAI при значительно меньших заявленных затратах на обучение.

Открытый ИИ создаёт как возможности, так и риски. Для разработчиков и исследователей — это возможность локального запуска без оплаты API, тонкой настройки под специализированные задачи, верификации поведения модели и сохранения приватности данных. Для бизнеса — снижение vendor lock-in и полный контроль над инфраструктурой. Критики указывают, что доступность мощных открытых весов упрощает создание инструментов дезинформации, обход встроенных ограничений безопасности и разработку вредоносных приложений.

К 2026 году открытые модели заняли устойчивую нишу: специализированные fine-tuned версии доминируют в задачах программирования, медицины и юриспруденции. AI Act ЕС предусмотрел облегчённый режим для open-source-разработчиков, однако провайдеры наиболее мощных открытых моделей (выше установленных порогов по вычислительным затратам) подпадают под расширенные требования прозрачности.

Пример

Финтех-стартап дообучает Llama 3 на собственных финансовых документах и развёртывает модель на корпоративных серверах: данные клиентов не покидают периметр компании, а стоимость инференса существенно ниже, чем при использовании API закрытой модели.

Связанные термины

Модель с открытыми весами ИИ-лаборатория Файнтюнинг (дообучение)

← Глоссарий