GitLab expandiu suporte para modelos open-source em redes fechadas
GitLab 19.0 adicionou suporte para quatro modelos open-source em ambientes self-hosted. Mistral Devstral 2, GLM-5.1, Kimi-K2.6 e MiniMax-M2.7 são implantados na
Processado por IA de GitLab Blog; editado por Hamidun News
GitLab 19.0 expandiu o suporte para modelos open-source para a Plataforma Duo Agent self-hosted. Isso é especialmente importante para equipes que trabalham em redes isoladas e não podem enviar código-fonte para a nuvem.
Air-gap agora não é atraso
Equipes operando em redes completamente isoladas sem acesso à internet historicamente são as últimas a receber acesso às novas capacidades de IA. A razão não está na tecnologia, mas na legislação: em indústrias reguladas, os requisitos de compliance proíbem enviar código-fonte para terceiros.
Anteriormente, GitLab oferecia uma seleção limitada de modelos para esses ambientes, o que criava um duplo problema. Por um lado, você precisa de um modelo poderoso para raciocínio complexo — análise de diffs grandes, ferramentas multi-etapas. Por outro lado, tarefas simples como renomear uma variável não requerem poder computacional. Era necessário pagar a mais por overkill ou trabalhar com qualidade fraca em tarefas complexas.
Quatro novos modelos para cenários diferentes
GitLab adicionou suporte para quatro modelos open-source. Todos foram testados em tarefas reais da Plataforma Duo Agent: uso multi-etapas de ferramentas, geração de código, trabalho com diffs grandes e bases de código multi-arquivo.
- Mistral Devstral 2 123B — foco em geração de código, o melhor em escrever código
- GLM-5.1 — modelo multilíngue, adequado para equipes internacionais
- Kimi-K2.6 — se destaca em logging e raciocínio multi-etapas
- MiniMax-M2.7 — a mais leve, adequada se os recursos computacionais são limitados
A seleção não é aleatória. GitLab testou os candidatos justamente nas tarefas que a plataforma resolve. Os engenheiros avaliaram qualidade de geração de código, aderência às instruções e capacidade de trabalhar com grande contexto.
Duas opções de implantação
A opção principal é equipamento próprio com vLLM (plataforma recomendada por GitLab para servir modelos open-source). A computação permanece em seu servidor, os dados não saem da rede local. Isso é ideal para ambientes onde há requisitos de residência de dados.
Para equipes sem grande capital para hardware, há uma alternativa: máquinas virtuais GPU em nuvem privada (AWS, Azure e outras). Você paga apenas pelo que usa, sem despesas com compra e manutenção de hardware. Enquanto isso, as garantias de isolamento de dados permanecem as mesmas — nada sai para a internet pública.
Como escolher seu caminho
A escolha depende dos requisitos da empresa. Se você precisa de isolamento total com air-gap — apenas modelos self-hosted na própria infraestrutura. Se o compliance permite uma abordagem híbrida — você pode usar diferentes modelos por feature: por exemplo, refatorações simples no MiniMax leve, e análise complexa no Kimi.
O que isso significa
Air-gap não é mais sinônimo de atraso em IA. Indústrias reguladas agora podem implantar agentes da mesma qualidade que corporações enviando dados para a nuvem. Compliance e segurança não devem mais ser obstáculos para a produtividade em IA.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.