MarkTechPost
Fuente de noticias de IA. Los artículos son seleccionados y adaptados por la redacción de Hamidun News.
Últimas publicaciones

Liquid AI desafía la carrera por modelos más grandes: la arquitectura híbrida de LFM2 cambia las reglas
La startup Liquid AI presentó un modelo de 24 mil millones de parámetros que combina el mecanismo de atención con convoluciones. El objetivo es resolver los problemas de escalabilidad a los que se enfrenta toda la indust

Composio libera el código de Agent Orchestrator, una herramienta para sistemas multiagente más allá de ReAct
La startup Composio ha publicado un orquestador de agentes de código abierto que aborda el principal problema de la AI en producción: la fragilidad de los ciclos simples de ReAct. El nuevo enfoque promete flujos de traba

El modo WebSocket de OpenAI cambia las reglas del juego para la AI de voz
OpenAI presentó un modo WebSocket para la Realtime API que elimina al principal enemigo de los agentes de AI de voz: la latencia. Tres etapas separadas del procesamiento de voz ahora se comprimen en un solo flujo.

Taalas desafía a las GPU: lógica cableada en lugar de flexibilidad para 17.000 tokens por segundo
La startup canadiense Taalas apuesta por lo que la industria de chips de AI consideraba una herejía: sustituir las GPU programables por chips especializados de lógica cableada. El resultado: 17.000 tokens por segundo.

TruLens: cómo dejar de confiar ciegamente en los LLMs y empezar a medir la calidad
Los modelos de lenguaje siguen siendo cajas negras para la mayoría de los desarrolladores. TruLens ofrece un conjunto de herramientas que hace que cada paso del funcionamiento de un LLM sea transparente y medible, desde

Google propone pensar con más profundidad, no durante más tiempo — y reduce a la mitad los costos de inferencia
Investigadores de Google y la Universidad de Virginia demostraron que una cadena de razonamiento larga no es necesariamente mejor. La nueva métrica Deep-Thinking Ratio permite aumentar la precisión de los LLM y recortar

Google DeepMind presentó Lyria 3 para crear música a partir de fotos
El nuevo modelo Lyria 3 de Google DeepMind supone un avance en la generación de audio. Ahora, la AI puede crear pistas completas con voz y letra usando solo fotos o descripciones de texto.

Tavus presenta Phoenix-4: avatares de video con emociones realistas y respuesta instantánea
El nuevo modelo Phoenix-4 supera el efecto del «valle inquietante» al añadir inteligencia emocional a los avatares digitales y reducir la latencia de generación a un récord de 600 milisegundos.

Anthropic presenta Claude 4.6 Sonnet con una ventana de contexto de 1 millón de tokens
Anthropic entra en la era de los modelos de razonamiento. Claude 4.6 Sonnet recibió una ventana de contexto de 1 millón de tokens y un innovador sistema de verificación de hechos mediante ejecución de código.

Google DeepMind presentó un framework para la delegación inteligente de tareas entre agentes de AI
Los investigadores desarrollaron un sistema para crear una “agentic web” segura, donde los programas autónomos podrán interactuar de forma eficiente y escalar.

Google presentó WebMCP: un nuevo estándar para la interacción de agentes de AI con la web
Google presentó el protocolo WebMCP, que permitirá a los agentes de AI interactuar con sitios web directamente a través de la estructura del código, evitando el análisis de capturas de pantalla, lento y costoso en recurs

Arquitectura de la memoria: cómo enseñar a los agentes de AI a recordar lo importante y razonar de forma lógica
Un análisis de un nuevo concepto de memoria para redes neuronales: la transición del simple almacenamiento del historial de diálogos a bases de conocimiento estructuradas para un análisis profundo de datos.

Guía para crear un pipeline de datos sintéticos con CTGAN y SDV
Descubre cómo construir un sistema confiable de generación de datos tabulares que garantice una alta precisión y preserve todos los patrones estadísticos para el entrenamiento seguro de redes neuronales.

Cómo entrenar AI con preferencias humanas: guía de DPO y QLoRA
Un nuevo tutorial muestra cómo ajustar modelos de lenguaje a las preferencias humanas de forma eficiente sin usar modelos de recompensa pesados, con una sola GPU.

Google Gemini 3 Deep Think: nuevo récord en pruebas de inteligencia general
Google presentó Gemini 3 Deep Think. El modelo obtuvo un 84,6% en la prueba ARC-AGI-2, acercando a la industria a la creación de AGI mediante mecanismos de razonamiento lógico profundo.

OpenAI presentó GPT-5.3-Codex-Spark: una revolución en la velocidad del desarrollo de software
OpenAI lanzó un modelo ultrarrápido para programación. Gracias a los chips de Cerebras, genera 1.000 tokens por segundo, 15 veces más rápido que las versiones estándar.

Cómo entrenar embeddings Matryoshka para una búsqueda de datos ultrarrápida
Descubre cómo la tecnología Matryoshka Representation Learning permite reducir el tamaño de los vectores a 64 dimensiones sin una pérdida significativa de precisión en la búsqueda.

NVIDIA presentó KVTC: una tecnología de compresión de caché de LLM que acelerará 20 veces el funcionamiento de las redes neuronales
Investigadores de NVIDIA presentaron KVTC, un método innovador de compresión de KV-cache. La tecnología permite reducir el consumo de memoria 20 veces, resolviendo el principal problema de escalado de los modelos de leng

Cómo simplificar el desarrollo de redes neuronales: guía para usar Einops en cálculos con tensores
La biblioteca Einops se está convirtiendo en el estándar para trabajar con tensores en deep learning. Explicamos cómo hacer el código más limpio y evitar errores en arquitecturas de Vision y Attention.

Google presentó NAI: interfaces adaptativas basadas en Gemini para un diseño inclusivo
Google Research propone replantear la accesibilidad del software. El framework NAI utiliza agentes de AI de Gemini para adaptar al instante la interfaz a las capacidades físicas y al contexto del usuario.

Microsoft presentó OrbitalBrain: aprendizaje de IA distribuido directamente en el espacio
# Microsoft Presentó OrbitalBrain: Entrenamiento Distribuido de Inteligencia Artificial Directamente en el Espacio Los satélites terrestres recopilan petabytes de imágenes de alta resolución cada…

OAT: cómo la tokenización de acciones acerca los robots a las capacidades de LLM
La robótica se encuentra en el umbral de una nueva era, en gran medida gracias a los avances en modelos de lenguaje grande (LLM).

MLflow para LLM: versionado de prompts y pruebas de regresión
El desarrollo e implementación de grandes modelos de lenguaje (LLM) es una tarea compleja que requiere no solo recursos computacionales significativos, sino también herramientas eficaces para la…

ByteDance lanzó Protenix-v1: modelo Open-Source para la predicción de estructuras biomoleculares
ByteDance, conocida por sus desarrollos en inteligencia artificial, ha presentado Protenix-v1, un ambicioso proyecto de código abierto dirigido a reproducir las capacidades de AlphaFold3 (AF3) en el…

PaperBanana: Google enseñó a las redes neuronales a crear gráficos que no avergüenzan ante los revisores
¿Alguna vez has visto a un doctorando llorar antes de una fecha límite en Nature o Science? Generalmente sucede a las tres de la mañana, cuando el paquete Matplotlib se niega una vez más a alinear la…

Waymo World Model: los vehículos autónomos de Google ahora se entrenan en su propia «Matriz
La conducción autónoma siempre ha chocado contra la misma pared: la realidad es predecible en el 99% de los casos e inquietantemente caótica en el 1% restante.

Claude Opus 4.6: Anthropic enseña a las redes neuronales a pensar lentamente y trabajar para ti
Mientras la industria se queda paralizada esperando el próximo gran paso de OpenAI, Anthropic continúa capturando metódicamente territorio en el uso profesional de IA. El lanzamiento de Claude Opus 4.

GPT-5.3-Codex: OpenAI convierte la programación en un proceso autónomo (y lo hace más rápido)
¿Recuerdas cuando Copilot parecía ser la cumbre del progreso tecnológico? OpenAI acaba de demostrar que aquello era solo el comienzo.

Voxtral Transcribe 2: Mistral recordó por qué todavía necesitamos redes neuronales europeas
Mientras todos esperaban que Mistral lanzara otra iteración de un gran modelo de lenguaje, los franceses decidieron atacar por el flanco y golpear el mercado del reconocimiento de voz.

Gemini 3 Flash: Google enseña a las redes neuronales a no adivinar, sino a examinar
¿Has notado alguna vez cómo se comportan las redes neurales modernas al analizar imágenes complejas? Es como una persona miope intentando leer el número de un autobús desde lejos: si no puede ver los…