Modèles

Modèle open-weights

Un modèle open-weights est un système d'IA dont les poids de paramètres entraînés sont publiquement divulgués, permettant à quiconque de télécharger, exécuter et modifier le modèle sans accéder à l'infrastructure du développeur d'origine.

Les modèles open-weights sont des systèmes d'IA pour lesquels le développeur divulgue publiquement les poids de paramètres entraînés, généralement sous des licences allant des licences permissives (Apache 2.0, MIT) aux licences commerciales restreintes à l'usage. Cela les distingue des modèles fermés accessibles uniquement par API, comme GPT-4o ou Gemini, où les utilisateurs interagissent par une interface gérée et n'ont pas accès aux paramètres sous-jacents. Le terme « open-weights » est souvent préféré à « open-source » car le code d'entraînement, les pipelines de données et la provenance complète du jeu de données peuvent ne pas être divulgués aux côtés des poids.

Les utilisateurs téléchargent les fichiers de poids — généralement aux formats safetensors ou GGUF — et exécutent l'inférence localement en utilisant des frameworks comme PyTorch, Hugging Face Transformers ou llama.cpp. Cela permet le déploiement sur du matériel personnel, une infrastructure cloud privée ou des GPU grand public sans transmettre les données à une API tierce. De nombreux modèles open-weights servent également de points de contrôle de base pour un fine-tuning supplémentaire sur des données propriétaires ou spécifiques à un domaine.

La divulgation open-weights accélère la recherche en permettant la reproductibilité, les audits de sécurité indépendants et la personnalisation à grande échelle. Les organisations ayant des exigences strictes en matière de confidentialité des données — dans le secteur de la santé, du droit et de la finance — peuvent exécuter les modèles entièrement sur site. La pression concurrentielle des alternatives open-weights a également poussé les fournisseurs fermés à réduire les prix des API et à accélérer les améliorations de capacité. Les critiques arguent que la divulgation sans restriction des poids complique la gouvernance de la sécurité, car les mesures d'alignement appliquées après l'entraînement peuvent être supprimées par le fine-tuning ultérieur.

En 2026, les familles open-weights de premier plan incluent LLaMA 3 de Meta (jusqu'à 405 milliards de paramètres), Mistral et Mixtral, Gemma 2 de Google, Qwen 2.5 d'Alibaba, et DeepSeek V3 et R1. DeepSeek R1, lancé au début de 2025, a attiré une attention significative en correspondant aux performances des modèles de pointe fermés sur les benchmarks de raisonnement tout en publiant ses poids librement. Le Hub Hugging Face héberge des centaines de milliers de points de contrôle dérivés construits sur ces bases.

Exemple

Une entreprise de santé télécharge les poids du modèle LLaMA 3 à 70 milliards de paramètres et les affine sur des notes cliniques désidentifiées entièrement dans son propre centre de données, satisfaisant aux exigences de résidence des données sans envoyer les données des patients à une API externe.

Termes liés

Open-Source AI Fine-tuning Foundation Model AI Lab

← Glossaire