Microsoft PCM: gigante de Redmond abre "supermercado de dados" para treinamento de IA
Lembra daqueles tempos de ouro em que a internet parecia um buffet infinito e gratuito para desenvolvedores de IA? Aqueles dias acabaram oficialmente…
Processado por IA de The Verge; editado por Hamidun News
Lembra daqueles tempos de ouro em que a internet parecia um buffet infinito e gratuito para desenvolvedores de IA? Aqueles dias acabaram oficialmente. Microsoft decidiu liderar um processo que muitos na indústria consideravam inevitável, e está construindo o Publisher Content Marketplace (PCM). Simplificando, é uma espécie de App Store, mas em vez de aplicativos, vende-se direitos de uso de textos, notícias e análises. O gigante de Redmond não quer mais ver seus parceiros e concorrentes se afogarem em intermináveis ações judiciais de conglomerados de mídia furiosos.
O contexto aqui é mais importante do que a tecnologia em si. Nos últimos dois anos, a indústria de IA operava em modo "baixe primeiro, peça desculpas depois". OpenAI, Google e a própria Microsoft absorviam petabytes de dados da web aberta sem pedir permissão e muito menos oferecer dinheiro.
O resultado foram ações judiciais de alto perfil do The New York Times e outros grandes atores. Microsoft PCM é uma tentativa de legalizar o processo antes que os tribunais fechem permanentemente a torneira de dados. Gigantes como Vox Media, Associated Press e Condé Nast já estão envolvidos no desenvolvimento do marketplace.
Essas empresas cansaram de lutar contra bots de análise e decidiram que, se seu conteúdo será usado mesmo assim, pelo menos deveriam ser pagos por isso.
O que exatamente mudou na abordagem? A palavra-chave aqui é "grounding". LLMs modernos frequentemente alucinam, e para que emitam fatos atuais, precisam de acesso a fontes frescas e confiáveis. O PCM permitirá que desenvolvedores se conectem diretamente aos arquivos de mídia, obtendo informações verificadas em tempo real. Ao mesmo tempo, os editores retêm o controle: definem eles próprios os termos de uso e veem relatórios detalhados. Microsoft promete a transparência que faltava tanto nos acordos fechados entre OpenAI e grupos de mídia individuais.
Por que isso importa para o mercado agora? Microsoft está essencialmente criando infraestrutura para uma nova economia do conhecimento. Se dados costumavam ser o "novo petróleo" que qualquer um podia extrair gratuitamente em terra alheia, agora Microsoft coloca uma cerca naquela terra e abre a caixa. É ótima notícia para grandes editoras cujos arquivos valem milhões, mas um sinal de alerta para pequenas startups de IA. Apenas gigantes conseguirão pagar por conteúdo licenciado, o que só ampliará ainda mais o abismo entre Big Tech e todos os outros. Estamos vendo a internet aberta se transformar gradualmente em um jardim murado, onde bots precisam pagar para entrar.
Deve-se reconhecer que Microsoft escolheu o momento perfeito. A empresa precisa proteger seu Copilot de riscos legais, e o PCM resolve essa tarefa elegantemente. Em vez de negociar com cada editora separadamente, criam um padrão. Se PCM se tornar um padrão da indústria, Microsoft ganhará controle não apenas sobre recursos computacionais e modelos, mas sobre a matéria-prima na qual esses modelos funcionam. Este é um movimento estratégico que consolida o domínio da empresa na cadeia alimentar de IA por anos a vir.
O essencial: Microsoft está transformando o licenciamento de dados em um negócio escalável, reconhecendo efetivamente que a era da análise gratuita da web terminou. Você está pronto para o treinamento de redes neurais se tornar um privilégio dos ricos?
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.