Иск издателей к Meta: обучение Llama на нелегальных копиях книг и журналов
Meta подали иск издатели за обучение Llama на нелегальных копиях. Пять ведущих издательств (Macmillan, McGraw Hill, Elsevier, Hachette, Cengage) и писатель Скот

Мета подали иск пять крупных издательств и писатель Скотт Туроу. Обвинение грозное: компания якобы совершила «одно из самых массовых нарушений авторского права в истории» при обучении модели Llama на пиратских копиях книг и научных журналов.
Как обучали
Llama Meta осознанно копировала книги и научные журналы с пиратских сайтов (LibGen, Anna's Archive, Sci-Hub, Sci-Mag и прочих) и использовала этот материал для обучения Llama без разрешения авторов и правообладателей. Издатели утверждают в исковом заявлении, что это было сделано специально, а не случайно. Логика была простой: пиратские сайты предоставляют контент бесплатно, а лицензирование стоит денег. Meta выбрала экономически рациональное решение — обойти легальные каналы закупки контента и скачивать напрямую с нелегальных источников. Это не был единичный инцидент. Речь идёт о систематическом процессе: поиск пиратских сайтов, скачивание, загрузка в тренировочный набор данных. Компания знала, что делает, и делала это целенаправленно.
Кто подал иск
Исковое заявление подали пять крупнейших издателей мира: Macmillan — художественная литература, учебники, научные издания McGraw Hill — профессиональная литература и образовательный контент Elsevier — научные журналы по всему миру Hachette — один из «Большой пятёрки» издателей США * Cengage — образовательный контент и учебники Плюс писатель Скотт Туроу, автор бестселлеров «The Burden of Proof» и «Presumed Innocent». Это важный момент: это не просто корпоративный спор о деньгах. В исковом заявлении есть отдельный голос автора, что даёт претензиям легитимность и эмоциональный вес. Речь идёт не только о прибыли корпораций, но и о правах отдельных творцов.
Почему это важно На поверхности — это судебный спор о деньгах и авторских правах.
На самом деле речь идёт о правилах игры в эпоху AI. Вопрос звучит просто: если Meta может скачивать чужой контент с пиратских сайтов и обучаться на нём без последствий, то почему авторы и издатели должны верить в защиту своих работ? Иск устанавливает прецедент: AI-компании не могут присваивать творческий контент безнаказанно.
«Это один из самых массовых случаев нарушения авторского права в
истории», — говорится в исковом заявлении.
Как будет развиваться Судебное разбирательство может длиться годы.
Meta вероятно будет защищаться, ссылаясь на fair use (добросовестное использование) или на то, что контент с пиратских сайтов уже находится в общественном доступе. Но такие аргументы в этом контексте слабые: компания сознательно выбрала источник нелегального контента, знала об этом и не пыталась переговорить. Даже если судебный процесс будет долгим, уже сейчас это меняет динамику на рынке. Другие AI-компании (OpenAI, Google, Microsoft, Anthropic) вероятно начнут дистанцироваться от использования явно нелегального контента и перейдут на лицензирование. Издатели будут требовать компенсации за использование своих работ в обучении больших моделей.
Что это значит Этот иск — символ конца эпохи молчаливого «free training» на чужом контенте.
Раньше такие вещи происходили в тени, теперь они на виду у публики. Вероятно, произойдёт две вещи одновременно: какие-то компании договорятся с издателями и авторами (и будут платить за данные), а какие-то проиграют в суде (и заплатят ещё больше). В итоге рынок переформатируется под новые правила. AI не будет «бесплатной» технологией, а будет требовать лицензирования и платежей. Это может замедлить развитие AI, но это справедливо для тех, чей труд используется в обучении.