MarkTechPost→ original

Sakana AI a appris à adapter instantanément les modèles de langage sans fine-tuning

L’entreprise japonaise Sakana AI a présenté deux méthodes de rupture pour adapter les grands modèles de langage : Doc-to-LoRA et Text-to-LoRA. Les deux…

Traité par IA depuis MarkTechPost ; édité par Hamidun News
Sakana AI a appris à adapter instantanément les modèles de langage sans fine-tuning
Source : MarkTechPost. Collage: Hamidun News.
◐ Écouter l'article

L'une des procédures les plus coûteuses et les plus fastidieuses du travail avec les grands modèles de langage est leur adaptation à des tâches spécifiques. Vous voulez que votre modèle comprenne votre documentation interne ? Préparez-vous à un entraînement long et intensif en ressources. Ou chargez des tonnes de texte directement dans la fenêtre de contexte, sacrifiant la vitesse et l'argent à chaque requête. Le laboratoire Sakana AI basé à Tokyo a proposé une troisième voie qui pourrait changer l'économie même du travail avec les LLMs.

Dans deux articles de recherche récents, la société a présenté les méthodes Doc-to-LoRA et Text-to-LoRA — des approches basées sur les appelés hypernets. L'idée est élégante dans sa simplicité : au lieu de réentraîner le modèle à chaque fois ou de surcharger sa fenêtre de contexte, un réseau de neurones générateur spécial crée instantáneously un adaptateur LoRA compact qui « absorbe » les connaissances nécessaires et s'intègre au modèle de base. Le processus prend des fractions de seconde et ne nécessite pas une seule étape de descente de gradient.

Pour comprendre l'ampleur du problème que résout Sakana AI, il vaut la peine de se rappeler l'état actuel des choses. Aujourd'hui, il existe deux façons principales de faire fonctionner un modèle de langage avec de nouvelles informations. Premièrement — In-Context Learning, où les données nécessaires sont simplement insérées dans le prompt.

Ceci est flexible mais extrêmement inefficace : chaque requête coûte plus cher, la fenêtre de contexte est limitée, et le modèle n'« mémorise » pas vraiment l'information — il ne la référence que temporairement. La deuxième voie — Supervised Fine-Tuning ou Context Distillation, où le modèle subit un entraînement complet sur de nouvelles données. Le résultat est plus fiable, mais le processus prend des heures ou des jours, nécessite des clusters GPU et une expertise en ingénierie.

Pour chaque nouvel ensemble de données, il faut recommencer à zéro.

Sakana AI propose un contournement élégant à ce compromis grâce à l'amortissement des coûts. Doc-to-LoRA fonctionne avec des documents : vous fournissez en entrée un texte — documentation technique, contrat juridique, dossier médical — et l'hypernet en une seule passe génère un ensemble d'adaptateurs de bas rang qui « codifient » essentiellement le contenu du document dans les poids du modèle. Après cela, le modèle répond aux questions sur le document comme s'il avait suivi un entraînement complet, mais sans une seule itération d'entraînement.

Text-to-LoRA va encore plus loin : l'adaptateur est généré non pas à partir d'un document, mais à partir d'une instruction en langage naturel. Vous décrivez en mots comment le modèle doit se comporter — et l'hypernet transforme cette description en changements concrets de poids. Essentiellement, il s'agit d'une adaptation zero-shot par le langage naturel.

Techniquement, les deux méthodes reposent sur l'architecture LoRA — Low-Rank Adaptation — qui est devenue la norme de facto pour l'ajustement léger des LLMs. Au lieu de modifier tous les milliards de paramètres du modèle, LoRA ajoute des matrices d'adaptateurs compacts qui corrigent le comportement du modèle avec un coût computationnel minimal. L'innovation de Sakana AI est que ces adaptateurs n'ont plus besoin d'être entraînés — ils sont générés par un réseau de neurones séparé entraîné sur une vaste diversité de tâches d'adaptation. L'hypernet apprend à « comprendre » exactement quels changements de poids correspondent à un ensemble particulier de connaissances ou à un schéma comportemental.

Les conséquences pour l'industrie pourraient être assez graves. Actuellement, la personnalisation des LLMs est le domaine des entreprises ayant des équipes ML sérieuses et des budgets de calcul. Si l'approche de Sakana AI se généralise, l'adaptation des modèles deviendra disponible littéralement par un appel API : téléchargez un document — obtenez un modèle spécialisé.

Cela pourrait radicalement changer le marché des solutions IA d'entreprise, où la barrière principale n'est pas la technologie elle-même mais le coût et la complexité de sa personnalisation pour un client spécifique. De plus, la génération instantanée d'adaptateurs ouvre la voie à la personnalisation dynamique : un modèle peut basculer entre des « expertises » à la volée, s'adaptant à chaque utilisateur ou chaque tâche en temps réel.

Cependant, des questions restent ouvertes. Quelle est la qualité de tels adaptateurs générés instantáneously par rapport aux résultats d'un entraînement complet sur de grands ensembles de données complexes ? Comment la méthode gère-t-elle les informations contradictoires ou bruitées ? Comment évolue-t-elle pour les modèles avec des centaines de milliards de paramètres ? Sakana AI — une entreprise connue pour son approche biologiquement inspirée de l'IA et ses affirmations ambieuses, mais tous ses développements n'ont pas été testés à l'échelle de la production réelle.

Néanmoins, la direction établie par Doc-to-LoRA et Text-to-LoRA semble être une étape logiquement suivante dans l'évolution du travail avec les modèles de langage. L'industrie se détourne graduellement du paradigme « entraîner un modèle pour tout » vers des systèmes flexibles et modulaires où l'adaptation se fait instantáneously et bon marché. Sakana AI semble avoir trouvé l'une des voies les plus prometteuses vers cet avenir.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…