Источник

MarkTechPost

139
всего статей
78
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·MarkTechPost

Google a présenté Auto-Diagnose — un système d'IA pour identifier les causes des défaillances des tests d'intégration

Google a présenté Auto-Diagnose — un système basé sur Gemini 2.5 Flash qui analyse automatiquement les journaux des tests d'intégration défa

2026-04-28·3 мин
LLM
LLM·MarkTechPost

OpenAI GPT-OSS : Lancement de Modèles Open-Weight dans Colab avec MXFP4 et Inférence Avancée

Un nouveau guide explique comment lancer openai/gpt-oss-20b dans Google Colab : installer les dépendances pour Transformers, vérifier le GPU

2026-04-27·3 мин
LLM
LLM·MarkTechPost

Anthropic sort Claude Opus 4.7 pour la programmation d'agents, la vision et les tâches autonomes

Anthropic a présenté Claude Opus 4.7 — une mise à jour du modèle phare avec des améliorations notables en codage d'agents, analyse d'images

2026-04-27·3 мин
LLM
LLM·MarkTechPost

PrismML Bonsai : Comment exécuter un modèle 1 bit sur CUDA avec GGUF, JSON et RAG

Dans un nouveau tutoriel PrismML Bonsai, nous avons couvert comment exécuter Bonsai-1.7B sur GPU via CUDA et GGUF, mesurer le débit, configu

2026-04-27·2 мин
LLM
LLM·MarkTechPost

xAI lance des APIs Grok séparées pour la reconnaissance et la synthèse vocale pour les développeurs d'entreprise

xAI a divisé la pile vocale de Grok en APIs autonomes : Speech-to-Text et Text-to-Speech pour les entreprises avec des prix agressifs, un su

2026-04-27·3 мин
LLM
LLM·MarkTechPost

NVIDIA a lancé Ising — la première famille ouverte de modèles d'IA pour les systèmes quantiques-classiques

NVIDIA a présenté Ising — une famille ouverte de modèles d'IA pour l'étalonnage des processeurs quantiques et la correction d'erreurs, pour

2026-04-27·3 мин
LLM
LLM·MarkTechPost

Pourquoi LoRA se casse en production et comment RS-LoRA sauve le fine-tuning des modèles

LoRA excelle avec le style et le format, mais perd le signal lors de l'ajustement avec de nouveaux faits ; RS-LoRA résout le problème en cha

2026-04-27·3 мин
LLM
LLM·MarkTechPost

OpenKB et OpenRouter montrent comment construire une base de connaissances IA locale avec recherche Llama

Un nouveau tutoriel explique comment déployer une base de connaissances locale sur OpenKB, connecter un modèle ouvert via OpenRouter et conf

2026-04-27·2 мин
LLM
LLM·MarkTechPost

OpenAI et Magika ont montré comment construire un pipeline pour la reconnaissance de fichiers et l'analyse des menaces

Le guide démontre un pipeline pratique où Magika détermine le type réel du fichier à partir des octets, et OpenAI aide à interpréter le résu

2026-04-27·2 мин
LLM
LLM·MarkTechPost

Meta a présenté Sapiens2 — un modèle unifié de vision par ordinateur pour la pose, la segmentation et la 3D

Meta Reality Labs a lancé Sapiens2 — une famille de modèles de vision pour l'analyse humaine qui résout la pose, la segmentation, la géométr

2026-04-27·3 мин
LLM
LLM·MarkTechPost

OpenMOSS lance MOSS-Audio — un modèle audio ouvert surpassant les alternatives plus volumineux

OpenMOSS a présenté MOSS-Audio — un modèle ouvert qui comprend la parole, la musique et les sons ambiants dans une seule architecture et sur

2026-04-27·2 мин
LLM
LLM·MarkTechPost

Embeddings OpenAI et RL : Comment Construire un Agent avec Mémoire à Long Terme pour des Réponses Précises

Le tutoriel montre comment entraîner un agent RL pour sélectionner les enregistrements pertinents de la mémoire à long terme, afin qu'un LLM

2026-04-27·2 мин
LLM
LLM·MarkTechPost

Comment Mesurer l'Intelligence Réelle : Les Principaux Benchmarks pour les Agents IA

Les tests classiques ne reflètent plus les capacités réelles des réseaux de neurones. Nous explorons quels benchmarks montrent véritablement

2026-04-26·2 мин
LLM
LLM·MarkTechPost

Mémoire Élastique pour l'IA : Comment kvcached Résout la Pénurie de GPU

La distribution dynamique du cache KV promet de réduire drastiquement le coût d'hébergement des modèles de langage en permettant un partage

2026-04-26·3 мин
LLM
LLM·MarkTechPost

Le Modèle Vocal de xAI Surpasse GPT Realtime dans les Tâches Métier

L'entreprise d'Elon Musk, xAI, a présenté grok-voice-think-fast-1.0. Le nouveau modèle a surpassé les solutions d'OpenAI et Google dans la g

2026-04-26·2 мин
LLM
LLM·MarkTechPost

GitNexus : Comment un nouvel outil a appris aux agents IA à comprendre structurellement le code

Les assistants IA excellent à écrire du code local, mais ne comprennent souvent pas l'architecture globale des projets. Le projet open-sourc

2026-04-26·3 мин
LLM
LLM·MarkTechPost

DeepSeek-V4 : Comment les nouveaux algorithmes de compression ont rendu le contexte d'un million de tokens réalité

DeepSeek a présenté la quatrième génération de ses modèles. Grâce à la compression radicale de l'attention, le traitement de volumes massifs

2026-04-26·3 мин
LLM
LLM·MarkTechPost

L'Architecture Decoupled DiLoCo de DeepMind Résout le Problème de Scalabilité de l'IA

L'entraînement de modèles d'IA avancés a toujours été tenu en otage par les pannes matérielles : la défaillance d'une puce arrêtait tout le

2026-04-26·2 мин
LLM
LLM·MarkTechPost

OpenMythos : reconstruction open-source de l'architecture Claude Mythos en PyTorch avec 770M paramètres

Le développeur Kye Gomez a reconstruit l'architecture présumée Claude Mythos d'Anthropic à partir de zéro — sans fuite, uniquement sur la ba

2026-04-23·2 мин
LLM
LLM·MarkTechPost

OpenAI Déploie GPT-5.4-Cyber pour les Professionnels de la Cybersécurité Vérifiés

OpenAI ouvre un accès large à GPT-5.4-Cyber — une version affinée de GPT-5.4 sans restrictions standard pour des milliers de défenseurs véri

2026-04-23·2 мин
LLM
LLM·MarkTechPost

Moonshot AI lance Kimi K2.6 : un modèle agentique avec un essaim de 300 sous-agents

Le laboratoire chinois Moonshot AI a ouvert le code source de Kimi K2.6, un modèle agentique multimodal capable de coordonner de manière aut

2026-04-23·2 мин
LLM
LLM·MarkTechPost

Phi-4-Mini de Microsoft : implémentation de la quantification, de RAG et de LoRA dans un seul notebook Jupyter

Le tutoriel présente le pipeline complet avec Phi-4-mini-instruct : quantification 4 bits, génération en streaming, raisonnement, appel d'ou

2026-04-23·2 мин
LLM
LLM·MarkTechPost

Qwen 3.6-35B-A3B en pratique : multimodalité, MoE et RAG dans un même pipeline

Une analyse détaillée de l’implémentation de Qwen 3.6-35B-A3B, du chargement du modèle à la mise en place de RAG, du tool calling et de la p

2026-04-22·1 мин
LLM
LLM·MarkTechPost

NVIDIA представила Nemotron 3 Super — открытую модель со 120 млрд параметров

Новая гибридная модель сочетает архитектуры Mamba и Attention с подходом Mixture-of-Experts, обеспечивая пятикратный прирост производительно

2026-03-11·2 мин
LLM
LLM·MarkTechPost

Google представила TensorFlow 2.21 и LiteRT для мобильного ИИ

Google представила TensorFlow 2.21 и LiteRT — новый стандарт для запуска нейросетей на смартфонах с поддержкой NPU и ускорением GPU для моби

2026-03-07·2 мин
LLM
LLM·MarkTechPost

Google запустила Android Bench для оценки ИИ в мобильной разработке

Google открыла доступ к Android Bench — первому специализированному инструменту для проверки навыков больших языковых моделей в разработке п

2026-03-07·2 мин
LLM
LLM·MarkTechPost

OpenAI представила Codex Security для автоматического поиска и исправления уязвимостей в коде

OpenAI запускает Codex Security — интеллектуального агента для анализа безопасности кода, который не только находит ошибки, но и предлагает

2026-03-07·2 мин
LLM
LLM·MarkTechPost

Liquid AI выпустила систему для запуска ИИ-агентов полностью на устройстве

Компания Liquid AI представила модель LFM2-24B-A2B и приложение LocalCowork — связку для выполнения сложных рабочих процессов с ИИ-агентами

2026-03-06·3 мин
LLM
LLM·MarkTechPost

Yuan 3.0 Ultra: триллион параметров при рекордной эффективности

Китайская YuanLab AI представила открытую мультимодальную модель с триллионом параметров, которая активирует лишь 68,8 млрд из них. Сокращен

2026-03-05·3 мин
LLM
LLM·MarkTechPost

Alibaba выпустила OpenSandbox — единую среду для безопасной работы AI-агентов

Alibaba открыла исходный код OpenSandbox — инструмента, который даёт AI-агентам изолированные песочницы для выполнения кода, веб-сёрфинга и

2026-03-03·3 мин