Anthropic Blog→ original

Anthropic a mis à jour sa Responsible Scaling Policy — un système flexible de protection pour les modèles d'IA en croissance

Anthropic a publié une mise à jour importante de sa politique de gestion des risques de l'IA (Responsible Scaling Policy). Au lieu d'une approche universelle, l

Traité par IA depuis Anthropic Blog ; édité par Hamidun News
Anthropic a mis à jour sa Responsible Scaling Policy — un système flexible de protection pour les modèles d'IA en croissance
Source : Anthropic Blog. Collage: Hamidun News.
◐ Écouter l'article

Anthropic a publié une mise à jour de sa Responsible Scaling Policy — une politique de gestion des risques lors du développement de systèmes d'IA puissants. Cette mise à jour importante introduit une approche plus flexible et nuancée, en préservant le principe directeur : la compagnie ne formera ni ne déploiera des modèles tant qu'elle ne sera pas certaine que les risques sont à un niveau acceptable.

Pourquoi la politique a-t-elle été mise à jour ?

Il y a un an, Anthropic a publié la première version de la RSP, développée pour gérer les risques des systèmes d'IA en croissance. Mais un an d'application pratique a montré le besoin d'une approche plus flexible. La compagnie ne surveille pas seulement les capacités techniques des modèles, mais aussi leurs risques potentiels et leurs conséquences.

Anthropic surveille plusieurs catégories de menaces simultanément. Il s'agit de problèmes classiques tels que la propagation de la désinformation, l'incitation à la violence et la fraude — tous couverts par la politique d'utilisation de l'entreprise. Mais la RSP est axée sur des scénarios catastrophiques plus ambitieux qui pourraient émerger si les modèles atteignaient un certain niveau d'autonomie et de capacité à la manipulation complexe.

La politique mise à jour tient compte de l'expérience pratique et des approches utilisées dans d'autres secteurs à haut risque — l'aviation, l'énergie nucléaire, la pharmacie. Cela permet de mieux se préparer à l'accélération du développement de l'IA et de construire des systèmes de protection qui se développent avec la technologie.

Comment fonctionnent les niveaux ASL ?

Le fondement du nouveau système repose sur le principe de protection proportionnelle : les mesures de sécurité doivent augmenter en tandem avec les risques. Anthropic a introduit les AI Safety Level Standards (ASL Standards) — des ensembles gradués d'exigences techniques et procédurales, inspirés par les Biosafety Levels internationaux, qui sont utilisés en laboratoire pour travailler avec des matériaux dangereux.

Le système commence avec ASL-1 pour les modèles ayant des capacités basiques (par exemple, des bots spécialisés pour les échecs ou la recherche rapide d'informations) et s'élève à ASL-2, ASL-3 et au-delà à mesure que les capacités et les risques potentiels augmentent.

Chaque niveau supérieur implique des exigences plus strictes :

  • Un suivi et une journalisation renforcés de toutes les opérations effectuées par le modèle
  • Des tests de sécurité préalables plus rigoureux avant le déploiement
  • Des couches supplémentaires de contrôle d'accès, d'isolation et de segmentation
  • Des audits indépendants obligatoires et des vérifications par des experts externes en sécurité
  • Des réévaluations plus fréquentes des risques potentiels à mesure que de nouvelles données émergent

À l'heure actuelle, tous les modèles d'Anthropic fonctionnent selon la norme ASL-2, que la compagnie considère comme reflétant les meilleures pratiques de l'industrie aujourd'hui.

Seuils de capacité — quand la vigilance est nécessaire

Au lieu de critères vagues et subjectifs, Anthropic a défini des seuils spécifiques, ou Capability Thresholds — des capacités spécifiques du modèle qui, une fois atteintes, exigent des mesures de sécurité plus puissantes et un nouveau niveau ASL.

Pour l'instant, deux seuils clés ont été définis. Le premier est Autonomous AI R&D : si le modèle peut mener indépendamment des tâches de recherche complexes dans le domaine de l'IA qui nécessitent normalement l'expertise et l'intuition humaines, cela pourrait potentiellement accélérer considérablement le développement de l'IA dans une direction imprévisible.

Le deuxième seuil est mentionné dans le document original, mais sa description complète n'a pas encore été révélée. La compagnie se laisse la possibilité d'élargir cette liste à mesure qu'elle mieux comprend l'impact réel des nouvelles capacités en pratique.

Ce que cela signifie

Anthropic démontre que la sécurité de l'IA ne devrait être ni un blocus irrationnel ni une absence totale de contrôle. Au lieu de cela, la compagnie construit un système évolutif qui se développe avec la technologie et s'adapte aux risques réels.

Une telle approche est également importante pour les autres développeurs. Si les idées d'Anthropic obtiennent une large reconnaissance dans la communauté, elles pourraient devenir un standard de fait dans l'industrie. C'est particulièrement pertinent pour les régulateurs qui cherchent actuellement un cadre pratique pour superviser les systèmes d'IA.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…