HKUDS Apresenta OpenSpace em Detalhes — Motor de Auto-Evolução de Habilidades para Agentes IA
HKUDS lançou um tutorial detalhado sobre OpenSpace — um motor que permite que agentes IA aprendam com tarefas completadas e reutilizem habilidades. O…
Processado por IA de MarkTechPost; editado por Hamidun News
O HKUDS lançou uma análise detalhada do OpenSpace — um mecanismo de habilidades de código aberto que permite que agentes de IA não comecem cada tarefa do zero, mas acumulem modelos de trabalho e os reutilizem. O material mostra o ciclo completo: desde a configuração de um modelo OpenAI até a comparação de inicializações "frias" e "quentes", onde a reutilização de habilidades reduz o consumo de tokens e melhora a qualidade da resposta.
Do início frio
OpenSpace é implantado a partir de um repositório GitHub e no tutorial é configurado para modelos OpenAI, incluindo gpt-4o-mini. Em seguida, o agente recebe sua primeira tarefa sem nenhuma biblioteca de habilidades pré-construída. O sistema executa como um agente LLM regular, mas em paralelo captura etapas bem-sucedidas, soluções alternativas e instruções funcionais que podem ser reutilizadas posteriormente.
As habilidades não vivem apenas no contexto do diálogo: são salvas como arquivos seguindo a convenção SKILL.md e registradas em um banco de dados SQLite, para que possam ser visualizadas, versionadas e analisadas separadamente da execução real. Depois disso, os autores lançam uma tarefa semelhante novamente e mostram a diferença entre inicialização fria e inicialização quente.
Aqui o OpenSpace não raciocina do zero, mas seleciona habilidades apropriadas por meio de busca híbrida em BM25 e embeddings. Na demonstração, criam manualmente três habilidades básicas: validação de dados, geração de relatórios com cenários de fallback e um mecanismo de recuperação de erros. Isso é necessário para semear padrões úteis antecipadamente e então deixar o mecanismo evolutivo desenvolvê-los em tarefas reais.
Como as habilidades crescem A ideia-chave do
OpenSpace é que uma habilidade aqui é considerada não como um prompt estático, mas como uma entidade viva. Após cada execução, o sistema analisa o que funcionou, onde ocorreram falhas, quais ferramentas se degradaram e o que pode ser melhorado na próxima versão. Portanto, o mecanismo não apenas acumula cenários bem-sucedidos, mas também sabe como corrigi-los, especializá-los para novas tarefas e extrair novas habilidades de execuções bem-sucedidas individuais.
- FIX — corrige uma habilidade quebrada ou desatualizada sem alterar seu papel.
- DERIVED — cria uma versão derivada para um cenário mais restrito ou nova classe de tarefas.
- CAPTURED — extrai um novo padrão reutilizável diretamente da execução bem-sucedida.
- BM25 + embeddings — ajuda a encontrar rapidamente a habilidade mais relevante para uma descrição de tarefa. * open-space.cloud — fornece um catálogo compartilhado onde as habilidades podem ser pesquisadas, baixadas, carregadas e compartilhadas entre equipes. Uma parte importante da arquitetura é a camada coletiva. Por meio de uma comunidade em nuvem, os agentes podem trocar habilidades já evoluídas, visualizar o histórico de versões e construir repositórios compartilhados para equipes. O artigo apresenta isso como uma transição de um assistente único para uma rede de agentes que aprendem não apenas com seus próprios erros. Se um agente encontrar uma solução confiável para geração de PDF, análise de tabelas ou web research, outro pode pegar essa habilidade e não repetir o mesmo ciclo de tentativas e falhas.
Economia de tokens OpenSpace A parte mais forte do material não é a configuração, mas os números.
O repositório OpenSpace fornece um benchmark GDPVal em uma seleção de 50 tarefas profissionais em seis categorias: documentos, formulários de compliance, mídia, engenharia, planilhas e estratégia. Para uma comparação justa, o OpenSpace foi comparado com um agente ClawWork básico no mesmo modelo Qwen 3.5-Plus backbone, portanto a diferença é explicada precisamente pelo acúmulo de habilidades e não pela substituição de modelo.
O resultado — retorno econômico 4,2 vezes maior, qualidade média de 70,8% e 45,9% menos tokens em execuções de tarefas repetidas. O detalhamento por categoria mostra onde a auto-evolução entrega o máximo. Em documentos e correspondência, a execução quente cortou o consumo de tokens em 56%, em tarefas de formulários e compliance — em 51%, em mídia — em 46%, em planilhas — em 37%.
Ao mesmo tempo, os autores enfatizam que das 165 habilidades evoluídas, a maioria não pertence à expertise de domínio estreito, mas à confiabilidade de execução: manipulação de formatos de arquivo, recuperação de erros, geração de documentos e verificação de qualidade. Ou seja, o principal benefício não vem do "conhecimento de domínio", mas do fato de que o agente para de quebrar em pontos técnicos típicos.
O que isso significa
OpenSpace mostra bem para onde os frameworks de agentes estão indo: de prompts únicos para memória de trabalho persistente, onde cada tarefa concluída torna o sistema mais barato e mais robusto. Para equipes de produto, este é um sinal de que a próxima onda de eficiência virá não apenas de novos modelos, mas também da infraestrutura de habilidades reutilizáveis ao seu redor.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.