36Kr (36氪)→ оригинал

Данные как топливо: Китай создает легальный рынок для обучения нейросетей

Пока западные компании тонут в судебных исках от правообладателей, Китай решил легализовать торговлю данными на государственном уровне. Национальное бюро данных

Данные как топливо: Китай создает легальный рынок для обучения нейросетей
Источник: 36Kr (36氪). Коллаж: Hamidun News.

Эпоха, когда разработчики искусственного интеллекта просто пылесосили интернет в поисках текстов и картинок, подходит к концу. Все столкнулись с «стеной данных»: качественного контента в открытом доступе всё меньше, а исков от правообладателей — всё больше. В этой ситуации Китай решил не ждать милости от рынка и включил административный ресурс.

Национальное бюро данных совместно с министерством промышленности и другими ведомствами выпустило документ, который фактически создает в стране новую отрасль — легальный рынок торговли информацией. В центре новой стратегии лежат три типа организаций, которые должны превратить сырые байты в ценный актив. Первые — это биржи данных, официальные площадки, где сделки проходят под присмотром регуляторов.

Вторые — сервисные платформы, обеспечивающие техническую сторону вопроса, от хранения до вычислений. И, пожалуй, самые интересные — это «дата-дилеры» или поставщики данных. Это компании, которые будут профессионально заниматься поиском, очисткой и структурированием информации для конкретных нужд заказчиков.

Звучит как профессия из киберпанк-романа, но для Китая это теперь официальная экономическая реальность. Зачем это нужно именно сейчас? Ответ кроется в национальной программе «ИИ плюс».

Пекин понимает, что технологическое лидерство в области LLM и робототехники невозможно без гигантских объемов специфических данных: медицинских, промышленных, логистических. Большинство этих сокровищ сейчас заперто в локальных базах министерств и корпораций. Создание легальных посредников — это способ «расшторить» эти архивы и дать разработчикам моделей легальный доступ к ним, не нарушая (в теории) законов о безопасности.

После прошлогоднего создания Национального бюро данных многие гадали, во что выльется эта инициатива. Теперь ответ ясен: Китай строит инфраструктуру, где данные становятся таким же товаром, как литий или нефть. Если раньше обучение нейросети на закрытых государственных данных было серой зоной, то теперь это становится поощряемым государством бизнесом.

Это дает китайским компаниям колоссальное преимущество — возможность тренировать модели на реальных данных из госсектора и промышленности, к которым условная OpenAI никогда не получит доступа. Конечно, остается вопрос реализации. Рынок данных — субстанция капризная.

Как оценить стоимость базы данных пациентов или логов работы электростанции? Как гарантировать, что данные не утекут на черный рынок? Китайские власти планируют решать это через жесткую сертификацию тех самых «дата-дилеров».

Фактически, государство создает закрытый клуб доверенных поставщиков, которые станут мостом между владельцами информации и создателями ИИ. Это попытка упорядочить хаос и превратить «ИИ-гонку» в планомерное строительство индустрии. Главное: Пекин делает ставку на легализацию и коммерциализацию данных.

Пока остальной мир спорит об этике скрапинга, Китай строит заводы по переработке информации. Сможет ли государственное регулирование создать достаточно гибкий рынок для нужд ИИ — главный вопрос следующего года.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…