MarkTechPost
Fuente de noticias de IA. Los artículos son seleccionados y adaptados por la redacción de Hamidun News.
Últimas publicaciones

Zyphra lanzó el primer modelo MoE de difusión con una aceleración de 7.7x
Zyphra presentó ZAYA1-8B-Diffusion-Preview, el primer modelo MoE de difusión convertido a partir de un LLM. La inferencia se aceleró 7.7x al trasladar el cálculo de la memoria al procesador GPU.

Cómo construir un sistema de estilo MCP para agentes de AI inteligentes
Guía completa para construir un sistema de agentes de AI que abre por sí solo las herramientas adecuadas, enruta tareas y las ejecuta paso a paso.

BerriAI lanzó LiteLLM Agent Platform para agentes en producción
Ejecutar un agente de IA en un script local es sencillo. Ejecutarlo de forma fiable en producción, sincronizar entre reinicios, proporcionar entornos aislados para diferentes contextos—eso es un…

Repowise para el análisis de repositorios: análisis de grafos y código muerto
Repowise ayuda a los desarrolladores a analizar repositorios de código a nivel de todo el proyecto: construcción de grafos de dependencias, búsqueda de código muerto y contexto para AI.

NVIDIA presenta SANA-WM: un modelo para videos de 60 segundos en 720p en una sola GPU
NVIDIA presentó SANA-WM, un world model abierto que genera videos de 60 segundos en 720p con control preciso de cámara en una sola GPU.

Cómo construir un agente de toma de decisiones en streaming con replanificación online en un entorno dinámico
Un tutorial detallado sobre la creación de un agente de toma de decisiones en streaming que se adapta a obstáculos en movimiento y a objetivos cambiantes en tiempo real.

Outlines y Pydantic: cómo construir pipelines de LLM con seguridad de tipos y esquemas estrictos
Una nueva guía sobre Outlines y Pydantic muestra cómo montar pipelines de LLM con un esquema estricto, tipos de datos, recuperación de JSON y llamadas de función validadas.

Volcengine lanza OpenViking — una base de contexto basada en archivos para agentes de AI como OpenClaw
OpenViking de Volcengine propone almacenar la memoria, los recursos y las habilidades de un agente de AI como un sistema de archivos para simplificar la búsqueda de contexto, reducir el gasto de tokens y hacer observable

Diffrax y JAX: guía práctica sobre ODEs, simulaciones estocásticas y neural ODE
Un nuevo análisis de Diffrax y JAX muestra el recorrido completo, desde la configuración del entorno de cómputo y los solvers adaptativos de ODE hasta las simulaciones estocásticas, el batching con vmap y el entrenamient

BM25 vs. RAG: por qué la búsqueda por palabras clave y la búsqueda semántica dan respuestas diferentes
El análisis muestra cómo BM25 ordena los documentos según la frecuencia y la rareza de las palabras, mientras que RAG con embeddings busca por significado, por eso en producción cada vez se combinan más ambos enfoques.

Meta lanzó Tribe v2 — un modelo que predice la respuesta del cerebro a video, audio y texto
Meta liberó Tribe v2 como código abierto, un modelo que predice la respuesta de fMRI del cerebro a partir de video, audio y texto y da a los neurobiólogos una herramienta para experimentos virtuales sin nuevos escaneos.

Google ADK muestra un pipeline multi-agent para análisis de datos, gráficos e informes en Python
Una nueva guía muestra cómo montar en Google ADK un sistema multi-agent para cargar tablas, ejecutar pruebas estadísticas, generar visualizaciones y autogenerar informes en Python.

Google permite que Gemini API combine Search, Maps y funciones personalizadas en una sola solicitud
Google ha actualizado Gemini API: ahora una sola llamada puede combinar Google Search, Google Maps y funciones personalizadas, lo que permite crear flujos agénticos de varios pasos sin código de integración manual.

OpenClaw: cómo montar un runtime local y seguro para agentes de AI sin usar la nube
La nueva guía de OpenClaw muestra cómo poner en marcha un runtime local-first para un agente de AI: gateway en loopback, acceso al modelo mediante variables de entorno, exec controlado y skills determinísticas.

Microsoft mostró cómo ejecutar VibeVoice para ASR, realtime TTS y speech-to-speech
Microsoft lanzó una guía práctica en Colab sobre VibeVoice: en ella se explica paso a paso speaker-aware ASR, realtime TTS, el procesamiento por lotes de audio y la construcción de un pipeline speech-to-speech.

Hugging Face y Lambda: cómo hacer parsing y fine-tuning de reasoning traces de agentes
MarkTechPost publicó una guía práctica sobre el dataset lambda/hermes-agent-reasoning-traces: cómo hacer parsing de los pensamientos del agente, las llamadas a herramientas, generar gráficos y preparar los datos para fin

Alibaba libera Qwen3.6-35B-A3B — un modelo MoE multimodal centrado en la codificación orientada a agentes
Qwen liberó los pesos de Qwen3.6-35B-A3B: con 35.000 millones de parámetros y 3.000 millones activos, el modelo trabaja con código, imágenes y video, con énfasis en tool use, contexto largo y escenarios con agentes.

Microsoft, NVIDIA e IBM entraron en la lista de las 19 principales herramientas de AI red teaming de 2026
Un nuevo informe sobre AI red teaming reunió 19 herramientas — desde Microsoft PyRIT y NVIDIA Garak hasta IBM AIF360 — para detectar fugas de datos, ataques de jailbreak y sesgo del modelo antes de pasar a producción.

Meta presentó Autodata — un sistema de agentes para crear datos de entrenamiento de alta calidad
Meta presentó Autodata — un framework en el que agentes LLM recopilan, verifican y mejoran datos de entrenamiento por sí mismos para que modelos más capaces aprendan con ejemplos más complejos y precisos.

NeuralSet y deep learning: decodificación de rasgos lingüísticos a partir de señales cerebrales de MEG
En un nuevo análisis de NeuralSet, se muestra cómo convertir señales de MEG sin procesar en un modelo que predice rasgos lingüísticos, incluida la longitud de la palabra, directamente a partir de la actividad cerebral.

Microsoft OpenMementos: cómo trabajar con la compresión de contexto y los datos para entrenar modelos
Un análisis paso a paso del dataset Microsoft OpenMementos muestra cómo hacer streaming de reasoning traces, analizar bloques y mementos, medir la compresión de contexto y preparar datos para fine-tuning.

Stanford presentó OpenJarvis — una stack de agentes de AI locales con memoria y aprendizaje
Stanford presentó OpenJarvis — una plataforma para agentes de AI personales que funcionan directamente en el dispositivo, usan memoria y herramientas y aprenden con datos locales.

Harry Tan lanzó gstack — un sistema de workflow para Claude Code con QA, revisión y release
Harry Tan liberó gstack como open source — un conjunto de modos para Claude Code que separa planificación, revisión, QA y release en comandos distintos y añade un navegador persistente.

Zhipu AI lanza GLM-OCR, un modelo OCR compacto de 0,9 mil millones de parámetros para documentos
Zhipu AI y la Universidad de Tsinghua presentaron GLM-OCR, un modelo OCR multimodal de 0,9 mil millones de parámetros que analiza documentos complejos, tablas y fórmulas sin depender de una escala masiva.

LangChain lanzó Deep Agents para agentes de AI de varios pasos con memoria y aislamiento
LangChain lanzó Deep Agents, una biblioteca para agentes de AI que necesitan planificación, memoria a largo plazo, contexto de archivos y aislamiento de subagentes en tareas largas.

IBM lanzó Granite 4.0 1B Speech — un modelo de voz multilingüe compacto para edge AI
IBM presentó Granite 4.0 1B Speech, un modelo ligero para reconocimiento y traducción de voz, diseñado para un despliegue rápido en entornos empresariales y de edge con recursos limitados.

Moonshot AI presentó Attention Residuals — una alternativa a las conexiones residuales en transformers
Moonshot AI propuso Attention Residuals, un reemplazo de las conexiones residuales estándar en transformers, donde la capa elige por sí misma las señales útiles mediante attention a lo largo de la profundidad de la red.

Mistral lanzó Small 4 — un modelo MoE de 119 mil millones de parámetros para reasoning, código y multimodalidad
El nuevo Mistral Small 4 combina instruct, reasoning, código y manejo de imágenes en un único modelo MoE open-source de 119 mil millones de parámetros con contexto de 256k.

Google lanzó WAXAL, un conjunto de datos abierto de habla para lenguas africanas
Google hizo público WAXAL, un gran corpus de habla para lenguas africanas que debería acelerar el reconocimiento y la síntesis de voz allí donde los datos abiertos llevaban mucho tiempo siendo críticamente escasos.

Nvidia abrió el código de OpenShell, un entorno seguro para agentes autónomos de AI
Nvidia lanzó OpenShell como open source: es un entorno con sandboxes, políticas de acceso y enrutamiento privado para que los agentes autónomos de AI trabajen con código y red de forma más segura.