Picasso dans la poche : comment Doubao change les règles du jeu dans les musées
Au Musée d'Art Pudong de Shanghai, c'est inhabituellement bruyant ces derniers temps, mais les sons ne proviennent pas de groupes de touristes. Les visiteurs…
Traité par IA depuis 36Kr (36氪) ; édité par Hamidun News
Au Musée d'Art Pudong de Shanghai, c'est inhabituellement bruyant ces derniers temps, mais les sons ne proviennent pas de groupes de touristes. Les visiteurs se sont arrêtés devant les chefs-d'œuvre de Picasso, pointant leurs smartphones vers eux, et engagent un dialogue silencieux. De l'autre côté de la ligne se trouve Doubao, le principal atout en IA de l'empire ByteDance.
Tandis que les grandes entreprises occidentales perfectionnent leurs modèles en laboratoire, le géant technologique chinois a apporté son produit avec une audience de 100 millions d'utilisateurs actifs quotidiens (DAU) directement dans les salles des musées. Le projet est devenu le guide numérique officiel pour deux expositions à grande échelle : la collection du Louvre et la rétrospective de Pablo Picasso. La situation dans l'industrie de l'art avait longtemps besoin d'une secousse.
Le problème a toujours été le même : une pénurie d'interprétations de qualité. Les guides professionnels sont rares, leurs services sont chers, et les audioguides du siècle dernier n'inspirent que l'ennui avec leurs bourdonnements monotones. ByteDance y a vu un créneau idéal pour démontrer la puissance de ses algorithmes.
Désormais, l'IA ne se contente pas de fournir des informations à partir d'une base de données ; elle s'engage dans un « dialogue empathique », aidant le spectateur à relier son expérience personnelle aux coups de pinceau sur la toile. Ceci est une tentative de transformer le savoir élitiste en un produit numérique accessible à tous. Le cœur technique de cette transformation est le modèle Seed1.
8 (Seed1.8). Les développeurs affirment qu'il a atteint l'état de l'art (SOTA) dans la perception et la compréhension des flux vidéo.
Contrairement aux anciens systèmes qui exigeaient de prendre une photo et d'attendre une réponse, Doubao fonctionne en mode interaction en temps réel. Il comprend ce que vous voyez, même si vos mains tremblent et que la lumière dans la salle est atténuée. L'IA reconnaît les distinctions les plus fines entre la céramique iranienne du XVe siècle et la porcelaine chinoise de la dynastie Ming, en s'appuyant sur les nuances visuelles qui échappent souvent à l'œil non entraîné.
Le Vice-Président de ByteDance, Zhu Jun, souligne que l'interaction avec l'IA est, avant tout, une conversation. Au musée, Doubao ne se contente pas de donner une conférence ; il pose des questions suggestives. Par exemple, en regardant le tableau « Lecture » de Picasso, un utilisateur peut se demander comment l'atmosphère de silence est créée.
L'IA ne se limitera pas à la date de sa création, mais analysera les courbes douces et les blocs de couleur, les reliant à la muse de l'artiste Marie-Thérèse Walter. Ceci est un niveau d'analyse qui exigeait auparavant au moins un diplôme en histoire de l'art dans sa poche. Auparavant, Doubao avait déjà été entraîné sur des objets du Musée national de Chine et sur sept autres grands lieux du pays.
Mais le cas du musée Pudong est un passage au niveau international. ByteDance a optimisé les algorithmes spécifiquement pour 300 artefacts du Louvre et 80 œuvres de Picasso, en considérant même l'architecture de l'espace d'exposition. Cela crée un précédent : l'IA cesse d'être simplement une « recherche intelligente » et devient un médiateur à part entière entre la culture complexe et la consommation de masse.
Pour l'industrie, c'est un signal clair. Les modèles de langage multimodaux (LMM) ont enfin dépassé le stade du chatbot et ont commencé à explorer le monde physique. Si auparavant nous demandions à l'IA « que puis-je cuisiner avec ces ingrédients », nous demandons maintenant « pourquoi cet artiste a-t-il choisi cette teinte particulière de bleu ».
ByteDance parie que dans l'avenir, notre contact principal avec la réalité sera médiatisé par une couche d'intelligence artificielle qui expliquera, complètera et interprétera tout ce vers lequel nous pointons l'appareil photo. L'essentiel : ByteDance a transformé avec succès un assistant IA en médiateur culturel, résolvant le problème de la pénurie d'experts vivants. Sera-ce la fin de la profession de guide de musée ou le début d'une nouvelle ère d'illumination ?
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.