Editorial · verificada por la redacción

MarkTechPost

Fuente de noticias de IA. Los artículos son seleccionados y adaptados por la redacción de Hamidun News.

221 artículos en Hamidun·Último: 15 de junio· Activo·marktechpost.com ↗

Últimas publicaciones

Moonshot AI lanza Kimi K2.7-Code: mejora del 21,8% en Code Bench v2 sobre K2.6
LLMMarkTechPost

Moonshot AI lanza Kimi K2.7-Code: mejora del 21,8% en Code Bench v2 sobre K2.6

Moonshot AI liberó el código fuente de Kimi K2.7-Code — un modelo de codificación agencial con contexto de 256K y consumo 30% menor de tokens de raciocinio en comparación con K2.6.

15 jun 2026·3 min
Comparación de modelos TTS 2026: de comerciales a abiertos
LLMMarkTechPost

Comparación de modelos TTS 2026: de comerciales a abiertos

En 2026, la elección de un modelo TTS depende de tres factores: calidad de audio, latencia de procesamiento y costo. Las soluciones comerciales ganan en naturalidad, las abiertas en control y costo.

31 may 2026·3 min
StepFun presenta Step 3.7 Flash — un modelo Vision-Language de 198 mil millones de parámetros
LLMMarkTechPost

StepFun presenta Step 3.7 Flash — un modelo Vision-Language de 198 mil millones de parámetros

StepFun lanzó Step 3.7 Flash, un nuevo modelo multimodal con 198 mil millones de parámetros, visión integrada, una ventana de contexto de 256 mil tokens y modo Advisor para agentes de código.

31 may 2026·3 min
NVIDIA X-Token: destilación que supera a GOLD por 3,82 puntos
LLMMarkTechPost

NVIDIA X-Token: destilación que supera a GOLD por 3,82 puntos

NVIDIA lanzó X-Token, un método de destilación de conocimiento para modelos pequeños (Llama-3.2-1B) que supera a GOLD por 3,82 puntos y mejora la precisión en matemáticas de 2,56 a 15,54%.

31 may 2026·2 min
AgentTrove: cómo usar el dataset de 1,7 millones de trazas de agentes en Python
LLMMarkTechPost

AgentTrove: cómo usar el dataset de 1,7 millones de trazas de agentes en Python

AgentTrove es el mayor dataset abierto de trazas de interacción entre agentes: 1,7 millones de ejemplos en formato ShareGPT. Un tutorial en Python muestra cómo procesar los datos en streaming, normalizar las acciones de

31 may 2026·2 min
Nous Research lanzó Tool Search para Hermes Agent: la precisión aumentó un 49–74% con Opus 4
LLMMarkTechPost

Nous Research lanzó Tool Search para Hermes Agent: la precisión aumentó un 49–74% con Opus 4

Nous Research resolvió el problema del inflado de contexto en MCP al añadir una búsqueda inteligente de herramientas. El sistema selecciona solo los esquemas relevantes y mejora la precisión en decenas de por ciento al t

31 may 2026·2 min
Genesis AI lanza Genesis World 1.0 — una plataforma para evaluar robots 400 veces más rápido
LLMMarkTechPost

Genesis AI lanza Genesis World 1.0 — una plataforma para evaluar robots 400 veces más rápido

Genesis AI lanzó la plataforma Genesis World 1.0 para la simulación de robots, que reduce el tiempo de evaluación de 200 horas a 30 minutos y reproduce el comportamiento real con un 90% de fidelidad.

31 may 2026·2 min
NVIDIA lanzó Polar — framework para entrenar agentes de código
LLMMarkTechPost

NVIDIA lanzó Polar — framework para entrenar agentes de código

NVIDIA creó Polar, un framework para entrenar agentes de lenguaje mediante reinforcement learning, mejorando el rendimiento en SWE-Bench en 22.6 puntos en el entorno Codex.

29 may 2026·2 min
UC Berkeley creó mKernel: una biblioteca unificada para sincronización de GPU en clústeres
LLMMarkTechPost

UC Berkeley creó mKernel: una biblioteca unificada para sincronización de GPU en clústeres

UC Berkeley lanzó mKernel — una nueva biblioteca CUDA para sincronizar miles de GPUs en centros de datos, combinando comunicación local y remota en un único kernel persistente.

29 may 2026·2 min
Stability AI lanza Stable Audio 3 para generación rápida de música
LLMMarkTechPost

Stability AI lanza Stable Audio 3 para generación rápida de música

Stability AI presentó Stable Audio 3 — modelos para generación de música y efectos de sonido que funcionan en MacBook y GPUs de consumidor con 8GB VRAM.

29 may 2026·2 min
ZeroEntropy presenta Zerank-2 — un reordenador ligero para búsqueda precisa
LLMMarkTechPost

ZeroEntropy presenta Zerank-2 — un reordenador ligero para búsqueda precisa

ZeroEntropy lanzó Zerank-2, un codificador cruzado compacto basado en Qwen3 que mejora significativamente la calidad de la búsqueda en sistemas RAG de dos etapas.

29 may 2026·2 min
Sakana AI presenta DiffusionBlocks: método para entrenar redes neuronales por bloques
LLMMarkTechPost

Sakana AI presenta DiffusionBlocks: método para entrenar redes neuronales por bloques

Sakana AI presentó DiffusionBlocks, un nuevo método que permite entrenar capas de redes neuronales residuales de forma independiente, interpretando las actualizaciones como difusión inversa.

29 may 2026·3 min
Búsqueda vectorial en PostgreSQL: guía completa de pgvector para aplicaciones de IA
LLMMarkTechPost

Búsqueda vectorial en PostgreSQL: guía completa de pgvector para aplicaciones de IA

PostgreSQL se ha convertido en un competidor serio de las bases de datos vectoriales especializadas gracias a la extensión pgvector.

29 may 2026·3 min
Perplexity AI Lanza Tokenizador 5x Más Rápido que el Estándar Hugging Face
LLMMarkTechPost

Perplexity AI Lanza Tokenizador 5x Más Rápido que el Estándar Hugging Face

Perplexity AI lanzó un tokenizador Unigram reescrito que acelera el procesamiento de texto 5x y reduce la carga de CPU en 5-6x en entornos de producción.

29 may 2026·3 min
Científicos crean MEMO — un marco para expandir la memoria de LLM sin reentrenamiento
LLMMarkTechPost

Científicos crean MEMO — un marco para expandir la memoria de LLM sin reentrenamiento

Los científicos propusieron MEMO, un marco que permite a los LLM aprender de nuevos datos sin reentrenar el modelo principal, utilizando un módulo de memoria separado.

29 may 2026·3 min
EAGLE 3.1: Cómo corregir la inestabilidad de la decodificación especulativa en LLM
LLMMarkTechPost

EAGLE 3.1: Cómo corregir la inestabilidad de la decodificación especulativa en LLM

El lanzamiento conjunto del equipo EAGLE, vLLM y TorchSpec corrige un problema crítico de decodificación especulativa: la desviación de atención que ralentizaba la inferencia de grandes modelos de lenguaje en producción.

29 may 2026·2 min
Anthropic Lanzó Claude Opus 4.8 con Workflows Dinámicos y Fast Mode Más Económico
LLMMarkTechPost

Anthropic Lanzó Claude Opus 4.8 con Workflows Dinámicos y Fast Mode Más Económico

Anthropic presentó Claude Opus 4.8 con workflows dinámicos y un fast mode más económico. La actualización está disponible en la vista previa de investigación de Claude Code.

29 may 2026·3 min
Liquid AI lanzó LFM2.5-8B: un modelo MoE compacto con contexto de 128K
LLMMarkTechPost

Liquid AI lanzó LFM2.5-8B: un modelo MoE compacto con contexto de 128K

Liquid AI presentó el nuevo modelo LFM2.5-8B-A1B, un modelo MoE eficiente que activa solo 1.5B de 8.3B parámetros. Funciona en una PC de consumidor con contexto de 128K.

29 may 2026·2 min
Hexo Labs publicó SIA — un agente que se actualiza a sí mismo durante el funcionamiento
LLMMarkTechPost

Hexo Labs publicó SIA — un agente que se actualiza a sí mismo durante el funcionamiento

Hexo Labs lanzó el código abierto de SIA — un sistema que se mejora a sí mismo, actualizando tanto las instrucciones del agente como los pesos de su red neuronal.

29 may 2026·1 min
Microsoft Research lanza Webwright — agente navegador que resuelve tareas web al 60%
LLMMarkTechPost

Microsoft Research lanza Webwright — agente navegador que resuelve tareas web al 60%

Microsoft Research presentó Webwright — un agente navegador que ejecuta tareas web complejas mejor que los grandes modelos de lenguaje: 60% de éxito en el benchmark Odysseys frente al 33,5% del GPT-5.4 base.

25 may 2026·2 min
StepFun lanzó StepAudio 2.5 Realtime, un modelo de voz con soporte para roleplay
LLMMarkTechPost

StepFun lanzó StepAudio 2.5 Realtime, un modelo de voz con soporte para roleplay

El laboratorio chino StepFun lanzó StepAudio 2.5 Realtime, un modelo de voz que supera a los competidores en naturalidad del habla y adapta la voz según el escenario del usuario.

25 may 2026·2 min
Langfuse para Ingenieros de LLM: Pipeline Completo de Trazado y Experimentos
LLMMarkTechPost

Langfuse para Ingenieros de LLM: Pipeline Completo de Trazado y Experimentos

Langfuse es una herramienta para depuración y optimización de aplicaciones LLM. Aprenda cómo configurar un pipeline completo de monitoreo, gestión de prompts y experimentos sin modelos pagos.

25 may 2026·2 min
WorkOS presenta auth.md — protocolo abierto para registro de agentes de IA
LLMMarkTechPost

WorkOS presenta auth.md — protocolo abierto para registro de agentes de IA

WorkOS lanzó auth.md — un estándar abierto que permite a los agentes de IA registrarse en aplicaciones a través de un archivo Markdown sin intervención humana.

25 may 2026·3 min
ByteDance presentó Lance: un modelo para comprensión, generación y edición de video
LLMMarkTechPost

ByteDance presentó Lance: un modelo para comprensión, generación y edición de video

ByteDance lanzó Lance, un modelo abierto que en un único marco trabaja con imágenes y video: comprende, genera y edita contenido utilizando solo 3B de parámetros activos.

25 may 2026·2 min
Cohere lanza Command A+: 218 mil millones de parámetros para agentes en dos GPUs
LLMMarkTechPost

Cohere lanza Command A+: 218 mil millones de parámetros para agentes en dos GPUs

Cohere presentó el modelo abierto Command A+ con 218 mil millones de parámetros y capacidades multimodales, ejecutándose en dos GPUs H100 y compatible con 48 idiomas.

25 may 2026·2 min
Perplexity Abre el Scanner Bumblebee para Proteger Sistemas de Desarrollo
LLMMarkTechPost

Perplexity Abre el Scanner Bumblebee para Proteger Sistemas de Desarrollo

Perplexity ha publicado el código fuente de Bumblebee, una herramienta para escanear vulnerabilidades en las dependencias de sistemas de desarrollo sin ejecutar ningún código.

25 may 2026·2 min
Alibaba presentó Qwen3.7-Max: un agente con contexto de un millón de tokens
LLMMarkTechPost

Alibaba presentó Qwen3.7-Max: un agente con contexto de un millón de tokens

Alibaba presentó Qwen3.7-Max, el modelo agente más avanzado de Qwen con contexto de 1M de tokens y modo de razonamiento para tareas complejas multietapa.

25 may 2026·3 min
CopilotKit redefine la arquitectura para agentes de IA en 2026
LLMMarkTechPost

CopilotKit redefine la arquitectura para agentes de IA en 2026

CopilotKit lanzó un nuevo stack para desarrolladores de IA agentic: protocolo AG-UI, plataforma de pruebas AIMock y servidor Pathfinder — una solución completa para entornos de producción.

25 may 2026·3 min
OpenMythos: construyendo transformers avanzados con MLA y GQA en Colab
LLMMarkTechPost

OpenMythos: construyendo transformers avanzados con MLA y GQA en Colab

OpenMythos permite construir transformers recurrentes en Google Colab comparando arquitecturas MLA y GQA. El tutorial verifica estabilidad mediante análisis de radios espectrales de matrices de inyección.

25 may 2026·2 min
Nous Research presentó CNA: gestión del comportamiento de LLM sin reentrenamiento
LLMMarkTechPost

Nous Research presentó CNA: gestión del comportamiento de LLM sin reentrenamiento

La empresa Nous Research presentó el método Contrastive Neuron Attribution (CNA), que permite gestionar el comportamiento de grandes modelos de lenguaje identificando y desactivando circuitos neuronales individuales sin

25 may 2026·3 min