MarkTechPost
Fuente de noticias de IA. Los artículos son seleccionados y adaptados por la redacción de Hamidun News.
Últimas publicaciones

Moonshot AI lanza Kimi K2.7-Code: mejora del 21,8% en Code Bench v2 sobre K2.6
Moonshot AI liberó el código fuente de Kimi K2.7-Code — un modelo de codificación agencial con contexto de 256K y consumo 30% menor de tokens de raciocinio en comparación con K2.6.

Comparación de modelos TTS 2026: de comerciales a abiertos
En 2026, la elección de un modelo TTS depende de tres factores: calidad de audio, latencia de procesamiento y costo. Las soluciones comerciales ganan en naturalidad, las abiertas en control y costo.

StepFun presenta Step 3.7 Flash — un modelo Vision-Language de 198 mil millones de parámetros
StepFun lanzó Step 3.7 Flash, un nuevo modelo multimodal con 198 mil millones de parámetros, visión integrada, una ventana de contexto de 256 mil tokens y modo Advisor para agentes de código.

NVIDIA X-Token: destilación que supera a GOLD por 3,82 puntos
NVIDIA lanzó X-Token, un método de destilación de conocimiento para modelos pequeños (Llama-3.2-1B) que supera a GOLD por 3,82 puntos y mejora la precisión en matemáticas de 2,56 a 15,54%.

AgentTrove: cómo usar el dataset de 1,7 millones de trazas de agentes en Python
AgentTrove es el mayor dataset abierto de trazas de interacción entre agentes: 1,7 millones de ejemplos en formato ShareGPT. Un tutorial en Python muestra cómo procesar los datos en streaming, normalizar las acciones de

Nous Research lanzó Tool Search para Hermes Agent: la precisión aumentó un 49–74% con Opus 4
Nous Research resolvió el problema del inflado de contexto en MCP al añadir una búsqueda inteligente de herramientas. El sistema selecciona solo los esquemas relevantes y mejora la precisión en decenas de por ciento al t

Genesis AI lanza Genesis World 1.0 — una plataforma para evaluar robots 400 veces más rápido
Genesis AI lanzó la plataforma Genesis World 1.0 para la simulación de robots, que reduce el tiempo de evaluación de 200 horas a 30 minutos y reproduce el comportamiento real con un 90% de fidelidad.

NVIDIA lanzó Polar — framework para entrenar agentes de código
NVIDIA creó Polar, un framework para entrenar agentes de lenguaje mediante reinforcement learning, mejorando el rendimiento en SWE-Bench en 22.6 puntos en el entorno Codex.

UC Berkeley creó mKernel: una biblioteca unificada para sincronización de GPU en clústeres
UC Berkeley lanzó mKernel — una nueva biblioteca CUDA para sincronizar miles de GPUs en centros de datos, combinando comunicación local y remota en un único kernel persistente.

Stability AI lanza Stable Audio 3 para generación rápida de música
Stability AI presentó Stable Audio 3 — modelos para generación de música y efectos de sonido que funcionan en MacBook y GPUs de consumidor con 8GB VRAM.

ZeroEntropy presenta Zerank-2 — un reordenador ligero para búsqueda precisa
ZeroEntropy lanzó Zerank-2, un codificador cruzado compacto basado en Qwen3 que mejora significativamente la calidad de la búsqueda en sistemas RAG de dos etapas.

Sakana AI presenta DiffusionBlocks: método para entrenar redes neuronales por bloques
Sakana AI presentó DiffusionBlocks, un nuevo método que permite entrenar capas de redes neuronales residuales de forma independiente, interpretando las actualizaciones como difusión inversa.

Búsqueda vectorial en PostgreSQL: guía completa de pgvector para aplicaciones de IA
PostgreSQL se ha convertido en un competidor serio de las bases de datos vectoriales especializadas gracias a la extensión pgvector.

Perplexity AI Lanza Tokenizador 5x Más Rápido que el Estándar Hugging Face
Perplexity AI lanzó un tokenizador Unigram reescrito que acelera el procesamiento de texto 5x y reduce la carga de CPU en 5-6x en entornos de producción.

Científicos crean MEMO — un marco para expandir la memoria de LLM sin reentrenamiento
Los científicos propusieron MEMO, un marco que permite a los LLM aprender de nuevos datos sin reentrenar el modelo principal, utilizando un módulo de memoria separado.

EAGLE 3.1: Cómo corregir la inestabilidad de la decodificación especulativa en LLM
El lanzamiento conjunto del equipo EAGLE, vLLM y TorchSpec corrige un problema crítico de decodificación especulativa: la desviación de atención que ralentizaba la inferencia de grandes modelos de lenguaje en producción.

Anthropic Lanzó Claude Opus 4.8 con Workflows Dinámicos y Fast Mode Más Económico
Anthropic presentó Claude Opus 4.8 con workflows dinámicos y un fast mode más económico. La actualización está disponible en la vista previa de investigación de Claude Code.

Liquid AI lanzó LFM2.5-8B: un modelo MoE compacto con contexto de 128K
Liquid AI presentó el nuevo modelo LFM2.5-8B-A1B, un modelo MoE eficiente que activa solo 1.5B de 8.3B parámetros. Funciona en una PC de consumidor con contexto de 128K.

Hexo Labs publicó SIA — un agente que se actualiza a sí mismo durante el funcionamiento
Hexo Labs lanzó el código abierto de SIA — un sistema que se mejora a sí mismo, actualizando tanto las instrucciones del agente como los pesos de su red neuronal.

Microsoft Research lanza Webwright — agente navegador que resuelve tareas web al 60%
Microsoft Research presentó Webwright — un agente navegador que ejecuta tareas web complejas mejor que los grandes modelos de lenguaje: 60% de éxito en el benchmark Odysseys frente al 33,5% del GPT-5.4 base.

StepFun lanzó StepAudio 2.5 Realtime, un modelo de voz con soporte para roleplay
El laboratorio chino StepFun lanzó StepAudio 2.5 Realtime, un modelo de voz que supera a los competidores en naturalidad del habla y adapta la voz según el escenario del usuario.

Langfuse para Ingenieros de LLM: Pipeline Completo de Trazado y Experimentos
Langfuse es una herramienta para depuración y optimización de aplicaciones LLM. Aprenda cómo configurar un pipeline completo de monitoreo, gestión de prompts y experimentos sin modelos pagos.

WorkOS presenta auth.md — protocolo abierto para registro de agentes de IA
WorkOS lanzó auth.md — un estándar abierto que permite a los agentes de IA registrarse en aplicaciones a través de un archivo Markdown sin intervención humana.

ByteDance presentó Lance: un modelo para comprensión, generación y edición de video
ByteDance lanzó Lance, un modelo abierto que en un único marco trabaja con imágenes y video: comprende, genera y edita contenido utilizando solo 3B de parámetros activos.

Cohere lanza Command A+: 218 mil millones de parámetros para agentes en dos GPUs
Cohere presentó el modelo abierto Command A+ con 218 mil millones de parámetros y capacidades multimodales, ejecutándose en dos GPUs H100 y compatible con 48 idiomas.

Perplexity Abre el Scanner Bumblebee para Proteger Sistemas de Desarrollo
Perplexity ha publicado el código fuente de Bumblebee, una herramienta para escanear vulnerabilidades en las dependencias de sistemas de desarrollo sin ejecutar ningún código.

Alibaba presentó Qwen3.7-Max: un agente con contexto de un millón de tokens
Alibaba presentó Qwen3.7-Max, el modelo agente más avanzado de Qwen con contexto de 1M de tokens y modo de razonamiento para tareas complejas multietapa.

CopilotKit redefine la arquitectura para agentes de IA en 2026
CopilotKit lanzó un nuevo stack para desarrolladores de IA agentic: protocolo AG-UI, plataforma de pruebas AIMock y servidor Pathfinder — una solución completa para entornos de producción.

OpenMythos: construyendo transformers avanzados con MLA y GQA en Colab
OpenMythos permite construir transformers recurrentes en Google Colab comparando arquitecturas MLA y GQA. El tutorial verifica estabilidad mediante análisis de radios espectrales de matrices de inyección.

Nous Research presentó CNA: gestión del comportamiento de LLM sin reentrenamiento
La empresa Nous Research presentó el método Contrastive Neuron Attribution (CNA), que permite gestionar el comportamiento de grandes modelos de lenguaje identificando y desactivando circuitos neuronales individuales sin