Editorial · verificada por la redacción

MarkTechPost

Fuente de noticias de IA. Los artículos son seleccionados y adaptados por la redacción de Hamidun News.

221 artículos en Hamidun·Último: 15 de junio· Activo·marktechpost.com ↗

Últimas publicaciones

Zyphra lanzó el primer modelo MoE de difusión con una aceleración de 7.7x
LLMMarkTechPost

Zyphra lanzó el primer modelo MoE de difusión con una aceleración de 7.7x

Zyphra presentó ZAYA1-8B-Diffusion-Preview, el primer modelo MoE de difusión convertido a partir de un LLM. La inferencia se aceleró 7.7x al trasladar el cálculo de la memoria al procesador GPU.

16 may 2026·3 min
Cómo construir un sistema de estilo MCP para agentes de AI inteligentes
LLMMarkTechPost

Cómo construir un sistema de estilo MCP para agentes de AI inteligentes

Guía completa para construir un sistema de agentes de AI que abre por sí solo las herramientas adecuadas, enruta tareas y las ejecuta paso a paso.

16 may 2026·3 min
BerriAI lanzó LiteLLM Agent Platform para agentes en producción
LLMMarkTechPost

BerriAI lanzó LiteLLM Agent Platform para agentes en producción

Ejecutar un agente de IA en un script local es sencillo. Ejecutarlo de forma fiable en producción, sincronizar entre reinicios, proporcionar entornos aislados para diferentes contextos—eso es un…

16 may 2026·3 min
Repowise para el análisis de repositorios: análisis de grafos y código muerto
LLMMarkTechPost

Repowise para el análisis de repositorios: análisis de grafos y código muerto

Repowise ayuda a los desarrolladores a analizar repositorios de código a nivel de todo el proyecto: construcción de grafos de dependencias, búsqueda de código muerto y contexto para AI.

16 may 2026·3 min
NVIDIA presenta SANA-WM: un modelo para videos de 60 segundos en 720p en una sola GPU
LLMMarkTechPost

NVIDIA presenta SANA-WM: un modelo para videos de 60 segundos en 720p en una sola GPU

NVIDIA presentó SANA-WM, un world model abierto que genera videos de 60 segundos en 720p con control preciso de cámara en una sola GPU.

16 may 2026·3 min
Cómo construir un agente de toma de decisiones en streaming con replanificación online en un entorno dinámico
LLMMarkTechPost

Cómo construir un agente de toma de decisiones en streaming con replanificación online en un entorno dinámico

Un tutorial detallado sobre la creación de un agente de toma de decisiones en streaming que se adapta a obstáculos en movimiento y a objetivos cambiantes en tiempo real.

3 may 2026·2 min
Outlines y Pydantic: cómo construir pipelines de LLM con seguridad de tipos y esquemas estrictos
LLMMarkTechPost

Outlines y Pydantic: cómo construir pipelines de LLM con seguridad de tipos y esquemas estrictos

Una nueva guía sobre Outlines y Pydantic muestra cómo montar pipelines de LLM con un esquema estricto, tipos de datos, recuperación de JSON y llamadas de función validadas.

2 may 2026·2 min
Volcengine lanza OpenViking — una base de contexto basada en archivos para agentes de AI como OpenClaw
LLMMarkTechPost

Volcengine lanza OpenViking — una base de contexto basada en archivos para agentes de AI como OpenClaw

OpenViking de Volcengine propone almacenar la memoria, los recursos y las habilidades de un agente de AI como un sistema de archivos para simplificar la búsqueda de contexto, reducir el gasto de tokens y hacer observable

2 may 2026·3 min
Diffrax y JAX: guía práctica sobre ODEs, simulaciones estocásticas y neural ODE
LLMMarkTechPost

Diffrax y JAX: guía práctica sobre ODEs, simulaciones estocásticas y neural ODE

Un nuevo análisis de Diffrax y JAX muestra el recorrido completo, desde la configuración del entorno de cómputo y los solvers adaptativos de ODE hasta las simulaciones estocásticas, el batching con vmap y el entrenamient

2 may 2026·2 min
BM25 vs. RAG: por qué la búsqueda por palabras clave y la búsqueda semántica dan respuestas diferentes
LLMMarkTechPost

BM25 vs. RAG: por qué la búsqueda por palabras clave y la búsqueda semántica dan respuestas diferentes

El análisis muestra cómo BM25 ordena los documentos según la frecuencia y la rareza de las palabras, mientras que RAG con embeddings busca por significado, por eso en producción cada vez se combinan más ambos enfoques.

2 may 2026·3 min
Meta lanzó Tribe v2 — un modelo que predice la respuesta del cerebro a video, audio y texto
LLMMarkTechPost

Meta lanzó Tribe v2 — un modelo que predice la respuesta del cerebro a video, audio y texto

Meta liberó Tribe v2 como código abierto, un modelo que predice la respuesta de fMRI del cerebro a partir de video, audio y texto y da a los neurobiólogos una herramienta para experimentos virtuales sin nuevos escaneos.

2 may 2026·3 min
Google ADK muestra un pipeline multi-agent para análisis de datos, gráficos e informes en Python
LLMMarkTechPost

Google ADK muestra un pipeline multi-agent para análisis de datos, gráficos e informes en Python

Una nueva guía muestra cómo montar en Google ADK un sistema multi-agent para cargar tablas, ejecutar pruebas estadísticas, generar visualizaciones y autogenerar informes en Python.

2 may 2026·3 min
Google permite que Gemini API combine Search, Maps y funciones personalizadas en una sola solicitud
LLMMarkTechPost

Google permite que Gemini API combine Search, Maps y funciones personalizadas en una sola solicitud

Google ha actualizado Gemini API: ahora una sola llamada puede combinar Google Search, Google Maps y funciones personalizadas, lo que permite crear flujos agénticos de varios pasos sin código de integración manual.

2 may 2026·2 min
OpenClaw: cómo montar un runtime local y seguro para agentes de AI sin usar la nube
LLMMarkTechPost

OpenClaw: cómo montar un runtime local y seguro para agentes de AI sin usar la nube

La nueva guía de OpenClaw muestra cómo poner en marcha un runtime local-first para un agente de AI: gateway en loopback, acceso al modelo mediante variables de entorno, exec controlado y skills determinísticas.

2 may 2026·3 min
Microsoft mostró cómo ejecutar VibeVoice para ASR, realtime TTS y speech-to-speech
LLMMarkTechPost

Microsoft mostró cómo ejecutar VibeVoice para ASR, realtime TTS y speech-to-speech

Microsoft lanzó una guía práctica en Colab sobre VibeVoice: en ella se explica paso a paso speaker-aware ASR, realtime TTS, el procesamiento por lotes de audio y la construcción de un pipeline speech-to-speech.

2 may 2026·3 min
Hugging Face y Lambda: cómo hacer parsing y fine-tuning de reasoning traces de agentes
LLMMarkTechPost

Hugging Face y Lambda: cómo hacer parsing y fine-tuning de reasoning traces de agentes

MarkTechPost publicó una guía práctica sobre el dataset lambda/hermes-agent-reasoning-traces: cómo hacer parsing de los pensamientos del agente, las llamadas a herramientas, generar gráficos y preparar los datos para fin

2 may 2026·2 min
Alibaba libera Qwen3.6-35B-A3B — un modelo MoE multimodal centrado en la codificación orientada a agentes
LLMMarkTechPost

Alibaba libera Qwen3.6-35B-A3B — un modelo MoE multimodal centrado en la codificación orientada a agentes

Qwen liberó los pesos de Qwen3.6-35B-A3B: con 35.000 millones de parámetros y 3.000 millones activos, el modelo trabaja con código, imágenes y video, con énfasis en tool use, contexto largo y escenarios con agentes.

2 may 2026·3 min
Microsoft, NVIDIA e IBM entraron en la lista de las 19 principales herramientas de AI red teaming de 2026
LLMMarkTechPost

Microsoft, NVIDIA e IBM entraron en la lista de las 19 principales herramientas de AI red teaming de 2026

Un nuevo informe sobre AI red teaming reunió 19 herramientas — desde Microsoft PyRIT y NVIDIA Garak hasta IBM AIF360 — para detectar fugas de datos, ataques de jailbreak y sesgo del modelo antes de pasar a producción.

2 may 2026·2 min
Meta presentó Autodata — un sistema de agentes para crear datos de entrenamiento de alta calidad
LLMMarkTechPost

Meta presentó Autodata — un sistema de agentes para crear datos de entrenamiento de alta calidad

Meta presentó Autodata — un framework en el que agentes LLM recopilan, verifican y mejoran datos de entrenamiento por sí mismos para que modelos más capaces aprendan con ejemplos más complejos y precisos.

2 may 2026·3 min
NeuralSet y deep learning: decodificación de rasgos lingüísticos a partir de señales cerebrales de MEG
LLMMarkTechPost

NeuralSet y deep learning: decodificación de rasgos lingüísticos a partir de señales cerebrales de MEG

En un nuevo análisis de NeuralSet, se muestra cómo convertir señales de MEG sin procesar en un modelo que predice rasgos lingüísticos, incluida la longitud de la palabra, directamente a partir de la actividad cerebral.

2 may 2026·3 min
Microsoft OpenMementos: cómo trabajar con la compresión de contexto y los datos para entrenar modelos
LLMMarkTechPost

Microsoft OpenMementos: cómo trabajar con la compresión de contexto y los datos para entrenar modelos

Un análisis paso a paso del dataset Microsoft OpenMementos muestra cómo hacer streaming de reasoning traces, analizar bloques y mementos, medir la compresión de contexto y preparar datos para fine-tuning.

1 may 2026·2 min
Stanford presentó OpenJarvis — una stack de agentes de AI locales con memoria y aprendizaje
LLMMarkTechPost

Stanford presentó OpenJarvis — una stack de agentes de AI locales con memoria y aprendizaje

Stanford presentó OpenJarvis — una plataforma para agentes de AI personales que funcionan directamente en el dispositivo, usan memoria y herramientas y aprenden con datos locales.

30 abr 2026·3 min
Harry Tan lanzó gstack — un sistema de workflow para Claude Code con QA, revisión y release
LLMMarkTechPost

Harry Tan lanzó gstack — un sistema de workflow para Claude Code con QA, revisión y release

Harry Tan liberó gstack como open source — un conjunto de modos para Claude Code que separa planificación, revisión, QA y release en comandos distintos y añade un navegador persistente.

30 abr 2026·3 min
Zhipu AI lanza GLM-OCR, un modelo OCR compacto de 0,9 mil millones de parámetros para documentos
LLMMarkTechPost

Zhipu AI lanza GLM-OCR, un modelo OCR compacto de 0,9 mil millones de parámetros para documentos

Zhipu AI y la Universidad de Tsinghua presentaron GLM-OCR, un modelo OCR multimodal de 0,9 mil millones de parámetros que analiza documentos complejos, tablas y fórmulas sin depender de una escala masiva.

30 abr 2026·3 min
LangChain lanzó Deep Agents para agentes de AI de varios pasos con memoria y aislamiento
LLMMarkTechPost

LangChain lanzó Deep Agents para agentes de AI de varios pasos con memoria y aislamiento

LangChain lanzó Deep Agents, una biblioteca para agentes de AI que necesitan planificación, memoria a largo plazo, contexto de archivos y aislamiento de subagentes en tareas largas.

30 abr 2026·3 min
IBM lanzó Granite 4.0 1B Speech — un modelo de voz multilingüe compacto para edge AI
LLMMarkTechPost

IBM lanzó Granite 4.0 1B Speech — un modelo de voz multilingüe compacto para edge AI

IBM presentó Granite 4.0 1B Speech, un modelo ligero para reconocimiento y traducción de voz, diseñado para un despliegue rápido en entornos empresariales y de edge con recursos limitados.

30 abr 2026·3 min
Moonshot AI presentó Attention Residuals — una alternativa a las conexiones residuales en transformers
LLMMarkTechPost

Moonshot AI presentó Attention Residuals — una alternativa a las conexiones residuales en transformers

Moonshot AI propuso Attention Residuals, un reemplazo de las conexiones residuales estándar en transformers, donde la capa elige por sí misma las señales útiles mediante attention a lo largo de la profundidad de la red.

30 abr 2026·3 min
Mistral lanzó Small 4 — un modelo MoE de 119 mil millones de parámetros para reasoning, código y multimodalidad
LLMMarkTechPost

Mistral lanzó Small 4 — un modelo MoE de 119 mil millones de parámetros para reasoning, código y multimodalidad

El nuevo Mistral Small 4 combina instruct, reasoning, código y manejo de imágenes en un único modelo MoE open-source de 119 mil millones de parámetros con contexto de 256k.

30 abr 2026·3 min
Google lanzó WAXAL, un conjunto de datos abierto de habla para lenguas africanas
LLMMarkTechPost

Google lanzó WAXAL, un conjunto de datos abierto de habla para lenguas africanas

Google hizo público WAXAL, un gran corpus de habla para lenguas africanas que debería acelerar el reconocimiento y la síntesis de voz allí donde los datos abiertos llevaban mucho tiempo siendo críticamente escasos.

30 abr 2026·3 min
Nvidia abrió el código de OpenShell, un entorno seguro para agentes autónomos de AI
LLMMarkTechPost

Nvidia abrió el código de OpenShell, un entorno seguro para agentes autónomos de AI

Nvidia lanzó OpenShell como open source: es un entorno con sandboxes, políticas de acceso y enrutamiento privado para que los agentes autónomos de AI trabajen con código y red de forma más segura.

30 abr 2026·3 min