OpenAI a lancé des politiques de prompt de protection des adolescents pour les développeurs de gpt-oss-safeguard
OpenAI a lancé un ensemble de politiques de prompt de protection des adolescents pour les développeurs utilisant gpt-oss-safeguard. Les outils filtrent les…
Traité par IA depuis OpenAI Blog ; édité par Hamidun News
OpenAI a publié un ensemble de politiques de sécurité prêtes à l'emploi basées sur des prompts, conçues pour protéger les adolescents dans les applications construites sur le modèle gpt-oss-safeguard. L'outil permet aux développeurs d'ajouter une modération basée sur l'âge sans avoir besoin d'écrire des filtres complexes à partir de zéro. Les adolescents constituent l'un des publics les plus actifs des applications d'IA.
Les chatbots, tuteurs, compagnons de jeu, outils d'apprentissage—tout cela est utilisé par les enfants et les jeunes de 13 à 17 ans. En même temps, la plupart des modèles de langage sont configurés par défaut pour les utilisateurs adultes : ils ne distinguent pas la question d'un spécialiste de trente ans de celle d'un écolier de quatorze ans. L'écart entre les capacités techniques du modèle et son public réel est depuis longtemps un problème pour les développeurs de produits grand public.
Les régulateurs du monde entier y prêtent attention. Dans l'Union européenne, la Loi sur l'IA exige une protection spéciale des groupes d'utilisateurs vulnérables, y compris les mineurs. Aux États-Unis, les débats se poursuivent sur les règles d'utilisation de l'IA par les élèves.
Les entreprises développant des produits pour un large public se heurtent de plus en plus à l'obligation de prouver que leur système ne peut pas faire de mal à un enfant—et cette exigence devient non seulement éthique, mais aussi juridique.
gpt-oss-safeguard est un modèle de garde ouvert d'OpenAI, conçu pour vérifier les messages entrants et sortants dans les systèmes de chat. Il analyse le contenu pour détecter les violations de politique et peut bloquer ou signaler les demandes problématiques avant qu'elles n'atteignent le modèle principal ou l'utilisateur. Les nouvelles politiques pour les adolescents sont implémentées sous forme de prompts—des instructions textuelles que le développeur transmet au modèle avec la demande.
Cela permet, sans modifier la base de code, de connecter une couche de filtrage supplémentaire spécifique au groupe d'âge. Les politiques couvrent les risques pertinents spécifiquement pour les adolescents : les sujets d'automutilation, le cyberharcèlement, les contenus sexuels provocateurs, et les situations où l'IA pourrait involontairement agir comme un adulte autoritaire et exercer une influence excessive sur la pensée encore non formée.
Le développeur inclut la politique dans le prompt système de son application. Le modèle de garde vérifie chaque interaction—à la fois les demandes entrantes de l'utilisateur et les réponses du système—par rapport aux critères adaptés au groupe d'âge. Si le contenu n'est pas accepté par le filtre, le système peut rejeter la réponse, la reformuler ou transmettre la situation pour une modération manuelle.
L'avantage clé de cette approche est la flexibilité : le développeur ne reçoit pas une boîte noire avec des règles rigides, mais travaille avec des politiques personnalisables. C'est fondamentalement important car le contexte de sécurité pour les adolescents est très différent—une plateforme éducative pour les élèves, un compagnon de chat de jeu et une application de santé mentale pour les jeunes nécessitent des approches de modération différentes.
OpenAI met ces outils à la disposition du public, ce qui fait partie d'une stratégie plus large de l'entreprise. En publiant des solutions de modération prêtes à l'emploi, OpenAI abaisse la barrière d'entrée pour les petites équipes qui manquent de ressources pour développer leurs propres systèmes de sécurité. En même temps, cela établit des normes industrielles : si suffisamment de développeurs adoptent ces politiques, une norme de facto de protection des adolescents dans les applications d'IA émergera—et un moyen de démontrer aux régulateurs et au public une approche responsable du développement.
Les questions de sécurité liée à l'âge passent de la catégorie des discussions éthiques à la catégorie des outils concrets. Les développeurs construisant des produits pour les jeunes peuvent désormais s'appuyer sur des solutions prêtes d'un leader du marché—au lieu d'inventer leurs propres filtres ou d'ignorer le problème. Pour l'industrie, c'est un progrès dans la bonne direction.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.