MarkTechPost

El equipo Qwen lanzó FlashQLA: aceleración de atención lineal hasta 3× en NVIDIA Hopper
QwenLM lanzó FlashQLA — una biblioteca de kernels CUDA para Gated Delta Network que proporciona ganancia de rendimiento de hasta 3× en GPU N

OpenAI Privacy Filter: Cómo Construir un Pipeline de Producción para Detección y Enmascaramiento de PII
La guía de OpenAI Privacy Filter desglosa un pipeline completo para detectar y enmascarar datos personales — desde la carga del modelo hasta

DeepSeek, Google y Meta: 10 técnicas de compresión de KV-cache en LLM para reducir memoria en inferencia
KV-cache se ha convertido en un consumidor de memoria GPU en grandes LLMs, y una nueva revisión muestra 10 enfoques — desde H2O y SnapKV has

Poolside lanzó Laguna XS.2 y M.1 — modelos abiertos para programación con agentes
Poolside presentó dos modelos Laguna para codificación con agentes: el XS.2 abierto se ejecuta localmente, mientras que el más potente M.1 e

LlamaIndex ParseBench: cómo probar análisis de documentos a través de Python y Hugging Face
Un análisis práctico muestra cómo construir un pipeline de evaluación de analizadores de documentos usando el dataset LlamaIndex ParseBench:

smol-audio de Deep-unlearning: Una colección de notebooks de Colab para ajuste fino de modelos de audio
Deep-unlearning lanzó smol-audio — una colección de notebooks compatibles con Colab para ajustar Whisper, Parakeet, Voxtral, Granite Speech

Top 10 modelos de IA física que controlan robots reales en 2026
En 18 meses, la brecha entre LLMs y la robótica real se ha reducido drásticamente: los modelos de IA física ya funcionan en fábricas, almace

Hugging Face y Gemma 3 1B: Construyendo un Pipeline de Generación Listo para Producción en Colab
Un análisis de cómo ejecutar Gemma 3 1B Instruct en Colab a través de Hugging Face Transformers: con autorización segura, chat templates y u

Z.ai lanza GLM-5V-Turbo — modelo multimodal nativo para programación visual
El laboratorio chino Z.ai ha lanzado GLM-5V-Turbo — un modelo que reconoce diagramas arquitectónicos y capturas de pantalla e inmediatamente

Google Gemma 4, NVIDIA y OpenClaw: Agentes AI locales sin pago por token
Google y NVIDIA están promoviendo la ejecución local de Gemma 4 en RTX, Jetson y DGX Spark para que agentes AI siempre activos como OpenClaw

Talkie-1930: Investigadores lanzaron un modelo 13B sin conocimiento de internet ni de la Segunda Guerra Mundial
Talkie-1930 es un modelo 13B abierto, entrenado solo en textos en inglés hasta 1931, para estudiar el pensamiento histórico, filtraciones de

MarkTechPost muestra cómo construir un agente VLA ligero con modelo de mundo latente y MPC
En un nuevo tutorial, MarkTechPost explica cómo construir un agente embodied simplificado: opera en fotogramas RGB, aprende un modelo de mun

Arcee AI Lanzó Trinity Large Thinking — Modelo de Razonamiento Abierto para Agentes IA
Arcee AI liberó los pesos de Trinity Large Thinking bajo licencia Apache 2.0 y apuesta por escenarios de agentes largos, razonamiento multie

NVIDIA mostró un pipeline completo de optimización de modelos con FastNAS pruning y fine-tuning
NVIDIA lanzó una guía práctica para Model Optimizer: en un único notebook Colab se demuestran el entrenamiento de ResNet20, FastNAS pruning

TII lanza Falcon Perception — modelo 0,6B para segmentación y búsqueda de objetos por texto
TII presentó Falcon Perception — un modelo vision-language compacto con 0,6 mil millones de parámetros que busca y segmenta objetos a partir

Google DeepMind Permite que LLM Reescriba Algoritmos de Teoría de Juegos y Supere Expertos
Google DeepMind demostró que AlphaEvolve puede reescribir código de algoritmos para juegos con información incompleta y encontrar soluciones

Z.AI mostró cómo construir sistemas agentic production-ready en GLM-5 con tool calling
Z.AI lanzó un tutorial detallado sobre GLM-5: desde la configuración del SDK e API compatible con OpenAI hasta streaming, tool calling, sali

Netflix Abre Void — Modelo para Eliminar Objetos de Videos con Consideración de la Física de la Escena
El equipo de Netflix e INSAIT lanzó en código abierto Void — un sistema que elimina objetos de videos y simultáneamente recalcula caídas, so

Cómo la Inteligencia Artificial Ayuda a las Marcas de Ropa a Diseñar la Moda del Futuro
Los algoritmos ya ayudan a las marcas de moda a crear colecciones más rápidamente, pronosticar tendencias, reducir la sobreproducción y pers

Cómo Construir un Pipeline Netflix Void para la Eliminación de Objetos en Vídeo usando CogVideoX
Un análisis detallado muestra cómo implementar el modelo Netflix Void, descargar los puntos de control necesarios, preparar datos de entrada

Gladstone Institutes presenta MaxToki — un modelo de IA que predice el envejecimiento celular
El modelo MaxToki de Gladstone Institutes aprende a ver no una 'instantánea' de la célula, sino su trayectoria a lo largo del tiempo, evalúa

TinyFish Lanzó Plataforma Web Unificada para Agentes de IA con Search, Fetch, Browser y Agent
TinyFish combinó búsqueda, renderización de páginas, sesiones de navegador y flujos de trabajo web autónomos en una única plataforma para ag

Google agregó Skills en Chrome y transformó prompts de IA en escenarios de un clic
Google lanzó la función Skills en Chrome: los usuarios de Gemini podrán guardar prompts frecuentemente usados como escenarios reutilizables

Google DeepMind Presenta Gemini Robotics-ER 1.6 para Autonomía y Lectura de Instrumentos por Robots
Google DeepMind actualizó Gemini Robotics-ER a la versión 1.6: un modelo para robots que comprende mejor el espacio, maneja múltiples flujos

MarkTechPost desglosó el ciclo completo de entrenamiento de grandes modelos de lenguaje: desde datos hasta despliegue
MarkTechPost publicó un desglose detallado de cómo se construyen los LLMs hoy: desde el preentrenamiento en grandes corpus hasta SFT, RLHF,

Google presentó Gemini 3.1 Flash TTS — modelo de habla con control, diálogos e idiomas 70+
Google lanzó Gemini 3.1 Flash TTS en vista previa: el modelo sintetiza texto en 70+ idiomas, soporta diálogos con dos voces y permite contro

Mem0 y OpenAI: cómo construir una capa universal de memoria a largo plazo para agentes de IA
Un nuevo tutorial desglosa la combinación de Mem0, modelos OpenAI y ChromaDB: extrae hechos de conversaciones ordinarias, los almacena por u

SmolAgents: Cómo Construir un Sistema de IA Multiagente con Código y Orquestación Dinámica
Un análisis de la implementación de SmolAgents muestra cómo los agentes de IA ligeros ejecutan código, invocan herramientas, trabajan con me

NetKet y JAX: cómo construir un modelo Transformer para sistemas de espines frustrados
La guía muestra cómo construir un pipeline de VMC de investigación usando NetKet, JAX y arquitectura Transformer para modelar una cadena de

OpenAI presentó GPT-Rosalind — un modelo de IA para biología, genómica y desarrollo de fármacos
OpenAI lanzó GPT-Rosalind — un modelo especializado para biología y farmacéutica que ayuda a acelerar el desarrollo de fármacos, análisis de