Ars Technica→ оригинал

Wikipedia opens content to AI companies through licensing agreements

Wikimedia Enterprise заключила лицензионные соглашения с крупными ИИ-компаниями, включая Microsoft, Meta и Amazon. Теперь они смогут использовать контент Википе

Wikipedia opens content to AI companies through licensing agreements
Источник: Ars Technica. Коллаж: Hamidun News.

Википедия, один из крупнейших в мире источников знаний, открывает свои двери для искусственного интеллекта. Wikimedia Enterprise, коммерческое подразделение фонда Wikimedia, заключило ряд лицензионных соглашений с технологическими гигантами, такими как Microsoft, Meta, Amazon, а также с перспективными стартапами Perplexity AI и Mistral AI. Эти соглашения предоставляют ИИ-компаниям доступ к обширному массиву данных Википедии для обучения и совершенствования их моделей.

Долгое время Википедия оставалась бесплатным и открытым ресурсом, доступным каждому. Однако, с ростом популярности больших языковых моделей (LLM), спрос на качественные данные для их обучения резко возрос. Wikimedia Enterprise увидела в этом возможность монетизировать свой контент, не нарушая при этом принципы открытости и доступности, лежащие в основе Википедии. Платные лицензии предоставляют компаниям структурированный и оптимизированный доступ к данным, а также техническую поддержку, что существенно упрощает процесс обучения ИИ-моделей.

Что же это значит для ИИ-индустрии? Во-первых, это обеспечивает доступ к огромному объему проверенной и структурированной информации, что критически важно для обучения качественных и надежных LLM. Википедия содержит миллионы статей на различных языках, охватывающих широкий спектр тем – от истории и науки до культуры и технологий. Использование этих данных поможет ИИ-моделям лучше понимать мир и генерировать более релевантные и точные ответы. Во-вторых, лицензионные соглашения обеспечивают устойчивый источник финансирования для Wikimedia Foundation, что позволит организации продолжать поддерживать и развивать Википедию как глобальный ресурс знаний.

Однако, у этого шага есть и потенциальные риски. Важно, чтобы использование контента Википедии соответствовало принципам нейтральности и объективности, лежащим в основе энциклопедии. Необходимо предотвратить ситуации, когда ИИ-модели, обученные на данных Википедии, будут распространять дезинформацию или предвзятые мнения. Wikimedia Foundation должна тщательно контролировать использование своего контента и оперативно реагировать на любые нарушения. Кроме того, важно обеспечить прозрачность в отношении того, какие данные Википедии используются для обучения тех или иных ИИ-моделей.

Заключение лицензионных соглашений с ИИ-компаниями – это важный шаг для Википедии и всей индустрии искусственного интеллекта. Это открывает новые возможности для развития ИИ, но требует ответственного подхода и соблюдения принципов открытости и нейтральности. В будущем мы, вероятно, увидим, как другие крупные источники данных последуют примеру Википедии и начнут монетизировать свой контент для обучения ИИ. Это может привести к формированию нового рынка данных для ИИ, что, в свою очередь, окажет существенное влияние на развитие технологий искусственного интеллекта.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…