Модели

Генеративный ИИ

Генеративный ИИ — направление искусственного интеллекта, объединяющее модели, способные создавать новый контент: текст, изображения, аудио, видео и программный код. В отличие от классических аналитических систем, такие модели синтезируют оригинальные результаты, а не классифицируют существующие данные.

Генеративный ИИ охватывает модели, обученные на больших корпусах данных и способные генерировать связный, контекстно релевантный контент. К этому классу относятся большие языковые модели — GPT-4, Claude 3, Gemini; диффузионные модели изображений — Stable Diffusion, DALL-E 3, Midjourney; модели синтеза видео — Sora (OpenAI), Veo (Google), Seedance (ByteDance); а также мультимодальные системы, объединяющие несколько типов данных в единой архитектуре.

Архитектурная основа большинства современных систем — трансформер, предложенный в 2017 году в статье «Attention Is All You Need». Языковые модели обучаются предсказывать следующий токен на триллионах символов; диффузионные модели учатся обращать процесс зашумления изображений. Качество вывода формируется на трёх стадиях: предобучение на огромном корпусе, тонкая настройка на размеченных данных и выравнивание с предпочтениями людей методами RLHF или DPO. Вычислительные требования колоссальны: обучение флагманских моделей требует кластеров из тысяч GPU и занимает месяцы.

Генеративный ИИ изменил экономику интеллектуального труда. Инструменты типа GitHub Copilot повышают продуктивность разработчиков на 20–55% по данным контролируемых экспериментов; маркетинговые команды сокращают время создания контента в разы. Прогнозируемый объём рынка генеративного ИИ к 2028 году превышает $300 млрд. Параллельно возникают регуляторные вопросы: авторские права на обучающие данные, распространение дипфейков, влияние на занятость в ряде отраслей.

К 2026 году генеративный ИИ перешёл от демонстраций к промышленному встраиванию: Microsoft интегрировал Copilot в весь пакет Microsoft 365, Google — в Workspace, Adobe — в Creative Cloud. Конкуренция сместилась от размера моделей к эффективности: компактные модели класса 7–70 млрд параметров (Llama 3.1, Mistral, Qwen) при специализированной настройке сопоставимы с флагманскими системами в узких прикладных задачах.

Пример

Юридическая компания использует Claude для первичного составления проектов договоров на основе брифа клиента, а юрист проверяет и корректирует итоговый документ, сокращая время подготовки с нескольких часов до 20–30 минут.

Связанные термины

Фундаментальная модель Большая языковая модель (LLM)Диффузионная модель Мультимодальная модель

Генеративный ИИ

Пример

Связанные термины

Последние новости по теме