MarkTechPost
Fuente de noticias de IA. Los artículos son seleccionados y adaptados por la redacción de Hamidun News.
Últimas publicaciones

Ocho mejores plataformas de autenticación para agentes de IA y MCP en 2026
MCP alcanzó 97 millones de descargas de SDK al mes. Los agentes de IA están migrando masivamente de experimentos a entornos de producción, y elegir la plataforma de autenticación correcta se ha…

SuperClaude Framework ayuda a estructurar workflows para Claude API
SuperClaude Framework proporciona a los desarrolladores componentes integrados para crear workflows de IA avanzados: comandos, agentes, modos de ejecución y memoria de sesión — todo en un único sistema.

Tencent lanzó TencentDB Agent Memory, sistema de memoria local para agentes de IA
Tencent abrió el código fuente de TencentDB Agent Memory, un sistema de memoria local para agentes de IA que reduce el consumo de tokens en un 61% y aumenta la precisión en un 28%.

NVIDIA Presenta Gated DeltaNet-2: Atención Lineal con Compuertas de Memoria Separadas
NVIDIA ha creado un nuevo mecanismo de atención lineal, Gated DeltaNet-2, que mejora la gestión de memoria en grandes modelos de lenguaje mediante compuertas separadas de borrado y escritura en lugar de una única compuer

Google presentó Gemini 3.5 Flash: un modelo rápido y económico para codificación y agentes de IA
En I/O 2026, Google presentó Gemini 3.5 Flash, un modelo 75% más económico que la versión insignia, que funciona 4 veces más rápido y se desempeña mejor en codificación y automatización.

Alibaba lanza un traductor con latencia de 2.8 segundos en 60 idiomas
Alibaba presentó un modelo para traducir video y voz en tiempo real de forma simultánea en 60 idiomas, con latencia mínima y preservación de la voz del hablante.

NVIDIA presentó Nemotron-Labs-Diffusion: un modelo con decodificación triple
NVIDIA lanzó el modelo de lenguaje Nemotron-Labs-Diffusion, que combina tres modos de decodificación y procesa tokens 6 veces más rápido que Qwen3-8B.

Generación de grafos de conocimiento a partir de texto: guía práctica con kg-gen y NetworkX
Tutorial sobre la extracción automática de entidades y relaciones a partir de texto con kg-gen, la construcción de grafos de conocimiento interactivos y su análisis con NetworkX.

Turbovec: índice vectorial en Rust con el algoritmo TurboQuant de Google Research
Turbovec utiliza el algoritmo TurboQuant de Google para comprimir vectores 16x sin entrenamiento previo, lo que simplifica el despliegue de aplicaciones RAG.

Las mejores plataformas para AI agéntica en 2026: clasificación de Salesforce, Microsoft y otras
Las empresas pasan de los pilotos a producción. MarkTechPost elaboró una clasificación de las 10 principales plataformas para AI agéntica: Salesforce Agentforce, Microsoft Copilot Studio, ServiceNow y otras. Precios veri

NVIDIA desarrolló un método para entrenar redes neuronales con precisión de 4-bit
NVIDIA presentó NVFP4, una metodología para entrenar modelos grandes con precisión de 4-bit en lugar de la 8-bit estándar, reduciendo el uso de memoria a la mitad sin pérdida de calidad.

OpenAI presenta el protocolo MRC para redes de supercomputadoras con millones de GPUs
OpenAI creó un nuevo protocolo de red abierto, MRC, para grandes clústeres de AI. Distribuye datos por cientos de rutas y se recupera de fallos en microsegundos, lo que permite construir supercomputadoras con más de 100

Meta AI presentó NeuralBench — framework para probar modelos de actividad cerebral
Meta lanzó NeuralBench, un framework abierto para la evaluación estandarizada de modelos de AI basados en EEG, que reúne 36 tareas, 94 conjuntos de datos y 13,603 horas de registros cerebrales en una sola interfaz.

Cómo comprimir un modelo de lenguaje 3x: guía de FP8, GPTQ y SmoothQuant
Los desarrolladores recibieron una guía paso a paso para comprimir grandes modelos de lenguaje con llmcompressor, comparando la eficacia de la cuantización FP8, GPTQ y SmoothQuant para reducir la carga sobre el hardware.

OpenAI lanzó tres modelos de audio: traducción, transcripción y razonamiento en tiempo real
OpenAI amplió la Realtime API con tres nuevos modelos de audio para el procesamiento de voz: agentes de razonamiento, traducción multilingüe y transcripción en streaming.

Anthropic creó una herramienta para traducir los pensamientos de Claude a lenguaje humano
Anthropic desarrolló Natural Language Autoencoders, una tecnología que traduce las activaciones internas de Claude en explicaciones textuales y revela cómo funciona la red neuronal.

NVIDIA empaquetó 3 modelos en un archivo y logró un entrenamiento 360× más eficiente
NVIDIA presentó Star Elastic, un método que empaqueta tres modelos de distintos tamaños en un solo checkpoint y permite un entrenamiento 360× más eficiente.

NVIDIA lanzó cuda-oxide: un compilador de código Rust para GPU
NVIDIA presentó cuda-oxide, una herramienta para compilar funciones Rust directamente a código PTX para GPU. Esto simplificará el desarrollo de aplicaciones CUDA en Rust y hará más accesible la computación paralela.

NadirClaw: ahorro en solicitudes de LLM con enrutamiento inteligente de prompts
NadirClaw es una herramienta de enrutamiento inteligente de prompts que clasifica las solicitudes como simples o complejas y las dirige al modelo adecuado para reducir costos.

Hermes Agent de Nous Research tomó el liderazgo en consumo de tokens en OpenRouter
El agente de AI open-source Hermes Agent, de Nous Research, superó a la plataforma de código cerrado OpenClaw y ocupó el primer lugar en OpenRouter, generando 224 mil millones de tokens al día. Esto ocurrió en solo tres

Comparativa de bases de datos vectoriales en 2026: nueve sistemas por costo, escala y arquitectura
Nueve bases de datos vectoriales líderes son ahora infraestructura clave para RAG y la AI agéntica. Un análisis de arquitectura, costo y escalabilidad ayuda a elegir el sistema adecuado para la tarea.

Vercel Labs presentó Zero — un lenguaje para agentes de AI que escriban, corrijan y publiquen código
Vercel lanzó Zero — un lenguaje de programación en el que el compilador genera JSON en lugar de texto para que los agentes de AI puedan escribir, corregir y desplegar programas nativos por su cuenta

Cómo Memori crea memoria persistente para agentes y LLM de múltiples sesiones
Memori es una infraestructura de memoria para aplicaciones con LLM que permite a los agentes conservar el contexto entre sesiones y trabajar con varios usuarios al mismo tiempo.

SHAP para machine learning: comparación de explainers y guía práctica
Una nueva guía muestra cómo elegir entre cuatro métodos de SHAP para interpretar modelos — del rápido Tree al versátil Kernel.

DeepMind creó un mouse con AI basado en Gemini para que los usuarios no cambien a chats
Google DeepMind presentó un mouse con AI basado en Gemini que analiza el contexto alrededor del cursor y permite dar comandos por voz sin abrir una ventana independiente.

Mira Murati presentó el primer sistema para un diálogo natural con AI en tiempo real
Thinking Machines Lab presentó el modelo TML-Interaction-Small, que escucha y responde al mismo tiempo, procesando voz, video y texto sin demoras — por primera vez, la AI puede conversar como un humano.

Nous Research presentó Lighthouse Attention para acelerar el entrenamiento de LLM
Nous Research publicó un nuevo mecanismo de atención, Lighthouse Attention, que acelera entre 1,4x y 1,7x el entrenamiento de grandes modelos de lenguaje al manejar contextos largos.

GLiGuard de Fastino Labs: un modelo de seguridad 16x más rápido que competidores más grandes
Fastino Labs lanzó el modelo abierto GLiGuard para verificaciones de seguridad de LLM: solo 300M de parámetros, pero más preciso que modelos 90 veces más grandes.

Shadow AI en el 63% de las empresas: cómo las herramientas se adelantaron a las políticas corporativas
La mayoría de las empresas todavía no tiene políticas formales de gobernanza de AI, mientras los empleados ya adoptan activamente herramientas por su cuenta, lo que crea serios riesgos de seguridad.

Nous Research aceleró el preentrenamiento de LLM 2,5 veces sin cambiar la arquitectura
Nous Research desarrolló Token Superposition Training, un método que reduce en 2,5 veces el tiempo de preentrenamiento de modelos de lenguaje sin cambiar la arquitectura ni el comportamiento en inferencia.