Stop au gaspillage : TOON compact au lieu du JSON inefficace dans les pipelines LLM
JSON gaspille des tokens dans les pipelines LLM à cause de la répétition des noms de champs. TOON (Token-Oriented Object Notation) est un format compact qui réd

Les modèles de langage fonctionnent avec des tokens, et chaque token a un coût. Si vous transmettez régulièrement des données structurées dans des pipelines LLM, vous utilisez probablement JSON. Mais JSON peut être inefficace : les noms de champs se répètent dans chaque enregistrement, gaspillant de précieux tokens. TOON est une alternative qui résout ce problème.
Pourquoi JSON Gaspille les Tokens
JSON est un format universel pour les données structurées, mais lorsque vous travaillez avec LLM, ses inconvénients deviennent critiques. Imaginez un array de 100 enregistrements de clients, chacun contenant les champs : id, name, email, status. En JSON, chaque enregistrement répète tous ces noms de champs, bien qu'ils puissent être spécifiés une seule fois. Voici un exemple simple : JSON nécessite de répéter les noms de champs dans chaque objet. TOON le résout différemment — il définit la structure une fois, puis transmet uniquement les valeurs. Cela peut réduire de 30–50% les tokens pour les grands ensembles de données.
Où TOON Est le Plus Utile
TOON est le plus efficace lorsque vous travaillez avec des données homogènes :
- Arrays d'enregistrements — tables CRM, logs, résultats de requêtes de base de données
- Support tickets — tous les tickets ont la même structure (auteur, sujet, statut)
- Catalogues de produits — SKU, prix, description, disponibilité se répètent dans chaque article
- Mémoire d'agent — historiques d'interactions, où chaque enregistrement suit un seul modèle
Stratégie de Mise en Œuvre
Vous n'avez pas besoin de passer entièrement à TOON. L'approche optimale : stockez les données en JSON (familier, évolutif), convertissez en TOON avant d'envoyer à LLM, obtenez la réponse du modèle, sauvegardez au format d'origine. Cela nécessite des changements minimes mais offre des économies de tokens considérables.
Conseil clé : avant de passer à TOON, comparez les performances de votre pipeline.
Comparez le nombre de tokens, la latence, la qualité de la réponse et le coût final. Les économies peuvent être substantielles ou marginales — tout dépend de vos données.
Ce que Cela Signifie
TOON n'est pas une révolution, mais un outil pratique pour optimiser les dépenses de LLM. Si vous travaillez avec de grands volumes de données structurées, passer à un format compact peut réduire vos factures de 20–40%. Commencez par tester sur un seul pipeline, mesurez le résultat réel, puis adaptez l'approche. À l'ère des modèles coûteux, chaque token économisé compte.