Dépendances d'apprentissage de la machine : composants critique pour succès en LLM
Beaucoup de ceux qui ont tenté d'utiliser de grands modèles de langage (LLMs) pour trier des données, par exemple pour sélectionner le meilleur élément d'une…
Traité par IA depuis Habr AI ; édité par Hamidun News
Beaucoup de ceux qui ont tenté d'utiliser de grands modèles de langage (LLMs) pour trier des données, par exemple pour sélectionner le meilleur élément d'une liste, ont rencontré des résultats décevants. Le problème ne réside pas toujours dans le modèle lui-même, mais dans l'approche du tri. Récemment, j'ai mené une expérience comparant cinq méthodes de tri différentes sur 164 publications de ma chaîne Telegram, et les résultats se sont avérés très révélateurs.
L'approche naïve, où on demande simplement aux LLMs d'évaluer chaque élément de la liste et de les trier selon les notes, s'avère souvent inefficace. Cela est dû au fait que les LLMs sont sujets à des erreurs systématiques et ne sont pas toujours cohérents dans leurs évaluations. De plus, ils peuvent être influencés par l'ordre des éléments de la liste. En d'autres termes, les LLMs ne sont pas conçus pour le tri direct.
L'une des approches alternatives intéressantes que j'ai explorées est l'algorithme TrueSkill, initialement développé pour le système d'appairage des joueurs sur Xbox Live. TrueSkill évalue les compétences des joueurs en fonction des résultats de leurs matchs et utilise ces évaluations pour prédire la probabilité de victoire dans les futurs jeux. Dans le contexte du tri des données, TrueSkill peut être utilisé pour comparer les éléments de la liste entre eux et construire un classement basé sur ces comparaisons.
TrueSkill fonctionne en modélisant la compétence de chaque élément comme une distribution normale. Lorsque deux éléments sont comparés, l'algorithme met à jour les distributions de leurs compétences en fonction du résultat de la comparaison. Ce processus est répété pour toutes les paires d'éléments de la liste jusqu'à ce que les distributions des compétences se stabilisent. Les valeurs moyennes résultantes des distributions sont ensuite utilisées pour classer les éléments.
Dans mon expérience, TrueSkill a montré des résultats significativement meilleurs que les approches naïves. Il a fourni une corrélation plus élevée avec les données réelles et était moins sujet aux erreurs systématiques. Cependant, il est important de noter que TrueSkill nécessite un grand nombre de comparaisons pour atteindre une bonne précision. Cela peut être un problème pour les grands ensembles de données.
Quelles conclusions peut-on tirer de cette expérience ? Premièrement, ne vous fiez pas aux approches naïves pour le tri des données dans les LLMs. Deuxièmement, il existe des algorithmes alternatifs, comme TrueSkill, qui peuvent améliorer considérablement les résultats. Troisièmement, le choix du bon algorithme dépend de la tâche spécifique et de la taille de la liste de données. À l'avenir, des algorithmes encore plus efficaces pour le tri des données dans les LLMs pourraient émerger, spécifiquement conçus à cette fin. Cela ouvrira de nouvelles opportunités pour utiliser les LLMs dans des tâches nécessitant un classement précis et une sélection.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.