GLiGuard de Fastino Labs : un modèle de sécurité 16x plus rapide que des concurrents plus grands
Fastino Labs a lancé GLiGuard, un modèle ouvert pour les vérifications de sécurité des LLM. Il ne compte que 300M de paramètres, mais il est 16x plus rapide et

Fastino Labs a lancé GLiGuard — un modèle compact pour modérer les LLMs qui est plus rapide et précis que d'énormes concurrents. Il ne compte que 300 millions de paramètres, et les résultats correspondent à des modèles 90 fois plus grands.
Quatre Tâches en Un Seul Passage
GLiGuard résout quatre tâches de sécurité critiques :
- Vérification de sécurité des prompts — détecte les entrées potentiellement dangereuses
- Détection de jailbreak — trouve les tentatives de contourner les restrictions du modèle
- Classification des types de préjudice — détermine quel type de préjudice pourrait survenir
- Détection de refus — vérifie que le modèle a correctement refusé de répondre
Les quatre analyses se déroulent en un seul forward pass, offrant une vitesse de traitement phénoménale.
Encodeur au Lieu de Décodeur
La plupart des modèles guardrail actuels utilisent une architecture décodeur uniquement, comme les LLMs typiques. Fastino Labs a pris une route différente — a construit GLiGuard sur une base d'encodeur. Cela a réduit la latence de 16,6x et augmenté le débit 16 fois, tout en maintenant simultanément la précision sur neuf benchmarks de sécurité différents.
«
Un encodeur est intrinsèquement mieux adapté aux tâches de classification qu'une architecture décodeur uniquement », démontre l'expérience de Fastino Labs.
Ce Que Cela Signifie
L'efficacité a littéralement explosé. Auparavant, il fallait un grand modèle pour vérifier de manière fiable la sécurité des LLMs. Maintenant, vous pouvez déployer GLiGuard localement, sur des appareils edge, dans des applications mobiles. Cela change l'économie de l'IA : coûts de calcul plus faibles, latence réduite, meilleure confidentialité des utilisateurs.