GLiGuard da Fastino Labs: um modelo de segurança 16x mais rápido que concorrentes maiores
A Fastino Labs lançou o GLiGuard, um modelo aberto para verificações de segurança de LLM. Ele tem apenas 300M de parâmetros, mas é 16x mais rápido e mais precis

A Fastino Labs lançou GLiGuard — um modelo compacto para moderar LLMs que é mais rápido e preciso que concorrentes enormes. Tem apenas 300 milhões de parâmetros, e os resultados correspondem aos de modelos 90 vezes maiores.
Quatro Tarefas em Um Passe
GLiGuard resolve quatro tarefas críticas de segurança:
- Verificação de segurança de prompts — detecta entradas potencialmente perigosas
- Detecção de jailbreak — encontra tentativas de contornar restrições do modelo
- Classificação de tipos de dano — determina que tipo de dano pode ocorrer
- Detecção de recusa — verifica se o modelo recusou corretamente a responder
Todas as quatro análises ocorrem em um único forward pass, fornecendo velocidade fenomenal de processamento.
Codificador em Vez de Decodificador
A maioria dos modelos guardrail atuais usa arquitetura apenas decodificador, como LLMs típicos. A Fastino Labs seguiu um caminho diferente — construiu GLiGuard em uma base de codificador. Isso reduziu a latência em 16,6x e aumentou o throughput 16 vezes, mantendo simultaneamente a precisão em nove benchmarks de segurança diferentes.
"Um codificador é inerentemente melhor adequado para tarefas de classificação do que arquitetura apenas decodificador", demonstra a experiência da
Fastino Labs.
O Que Isso Significa
A eficiência disparou. Anteriormente, você precisava de um modelo grande para verificar confiável a segurança de LLM. Agora você pode implantar GLiGuard localmente, em dispositivos edge, em aplicações móveis. Isso muda a economia da IA: custos computacionais menores, latência reduzida, melhor privacidade do usuário.