The Verge→ оригинал

Microsoft PCM: редмондский гигант открывает «супермаркет данных» для обучения ИИ

Microsoft запускает Publisher Content Marketplace (PCM) — платформу для лицензирования контента. Теперь разработчики ИИ смогут легально покупать доступ к статья

Microsoft PCM: редмондский гигант открывает «супермаркет данных» для обучения ИИ
Источник: The Verge. Коллаж: Hamidun News.

Помните те славные времена, когда интернет казался бесконечным бесплатным шведским столом для разработчиков нейросетей? Те дни официально сочтены. Microsoft решила возглавить процесс, который многие в индустрии считали неизбежным, и строит Publisher Content Marketplace (PCM). Если говорить просто, это своего рода App Store, но вместо приложений там продаются права на использование текстов, новостей и аналитики. Редмондский гигант больше не хочет смотреть, как его партнеры и конкуренты тонут в бесконечных судебных исках от разгневанных медиахолдингов.

Контекст здесь важнее самой технологии. Последние два года индустрия ИИ жила в режиме «сначала качай, потом извиняйся». OpenAI, Google и сама Microsoft поглощали петабайты данных из открытого веба, не спрашивая разрешения и уж тем более не предлагая денег. Результатом стали громкие иски от The New York Times и других крупных игроков. Microsoft PCM — это попытка легализовать процесс до того, как суды окончательно перекроют краны с данными. В разработке маркетплейса уже участвуют такие тяжеловесы, как Vox Media, Associated Press и Condé Nast. Эти компании устали бороться с ботами-парсерами и решили, что если их контент все равно будут использовать, то за это нужно хотя бы получать чеки.

Что именно изменилось в подходе? Ключевое слово здесь — «grounding» или приземление моделей. Современные LLM часто галлюцинируют, и чтобы они выдавали актуальные факты, им нужен доступ к свежим и достоверным источникам. PCM позволит разработчикам напрямую подключаться к архивам СМИ, получая проверенную информацию в реальном времени. При этом издатели сохраняют контроль: они сами устанавливают условия использования и видят детальную отчетность. Microsoft обещает прозрачность, которой так не хватало в закрытых сделках между OpenAI и отдельными медиа-группами.

Почему это важно для рынка прямо сейчас? Microsoft фактически создает инфраструктуру для новой экономики знаний. Если раньше данные были «новой нефтью», которую каждый мог добывать бесплатно на чужой земле, то теперь Microsoft ставит на этой земле забор и открывает кассу. Это отличная новость для крупных издателей, чьи архивы стоят миллионы, но тревожный сигнал для маленьких ИИ-стартапов. Платить за лицензионный контент смогут только гиганты, что еще сильнее увеличит разрыв между Big Tech и всеми остальными. Мы наблюдаем, как открытый интернет постепенно превращается в закрытый сад, где за вход для ботов нужно платить.

Стоит признать, что Microsoft выбрала идеальный момент. Компании нужно обезопасить свой Copilot от юридических рисков, и PCM решает эту задачу элегантно. Вместо того чтобы договариваться с каждым издателем по отдельности, они создают стандарт. Если PCM станет индустриальным стандартом, Microsoft получит контроль не только над вычислительными мощностями и моделями, но и над самим сырьем, на котором эти модели работают. Это стратегический ход, который закрепляет доминирование компании в пищевой цепочке искусственного интеллекта на годы вперед.

Главное: Microsoft превращает лицензирование данных в масштабируемый бизнес, фактически признавая, что эпоха бесплатного парсинга веба закончена. Готовы ли вы к тому, что обучение нейросетей станет привилегией богатых?

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…