MarkTechPost
Fuente de noticias de IA. Los artículos son seleccionados y adaptados por la redacción de Hamidun News.
Últimas publicaciones

OpenKB y OpenRouter muestran cómo construir una base de conocimiento IA local con búsqueda en Llama
Un nuevo tutorial explica cómo desplegar una base de conocimiento local en OpenKB, conectar un modelo abierto a través de OpenRouter y configurar de forma segura la búsqueda sin codificar claves.

OpenAI y Magika mostraron cómo construir un pipeline para reconocimiento de archivos y análisis de amenazas
La guía demuestra un pipeline práctico donde Magika determina el tipo real del archivo a partir de bytes, y OpenAI ayuda a interpretar el resultado e identificar riesgos potenciales.

Meta presentó Sapiens2 — un modelo unificado de visión por computadora para pose, segmentación y 3D
Meta Reality Labs lanzó Sapiens2 — una familia de modelos de visión para análisis humano que resuelve pose, segmentación, geometría de superficie y mapeo 3D desde una única arquitectura.

OpenMOSS lanza MOSS-Audio — modelo de audio abierto que supera alternativas mayores
OpenMOSS presentó MOSS-Audio — un modelo abierto que comprende voz, música y sonidos ambientes en una única arquitectura y supera a modelos open-source significativamente más grandes en benchmarks de audio comunes.

Embeddings de OpenAI y RL: Cómo Construir un Agente con Memoria a Largo Plazo para Respuestas Precisas
El tutorial muestra cómo entrenar un agente RL para seleccionar registros relevantes de la memoria a largo plazo, de modo que una LLM responda con mayor precisión preguntas sobre hechos almacenados.

Cómo Medir la Inteligencia Real: Los Principales Benchmarks para Agentes de IA
Las pruebas clásicas ya no reflejan las capacidades reales de las redes neuronales. Exploramos qué benchmarks realmente muestran si un agente de IA está listo para aplicaciones empresariales del mundo real.

Memoria Elástica para IA: Cómo kvcached Resuelve la Escasez de GPU
La distribución dinámica de caché KV promete reducir radicalmente el costo de alojamiento de modelos de lenguaje, permitiendo un comparticionamiento eficiente de la memoria de una sola GPU.

El Modelo de Voz de xAI Supera a GPT Realtime en Tareas Empresariales
La empresa de Elon Musk, xAI, presentó grok-voice-think-fast-1.0. El nuevo modelo superó las soluciones de OpenAI y Google en la gestión de flujos de trabajo empresariales complejos.

GitNexus: Cómo una nueva herramienta enseñó a agentes IA a comprender estructuralmente el código
Los asistentes de IA sobresalen en escribir código local, pero a menudo no comprenden la arquitectura global de proyectos. El proyecto open-source GitNexus resuelve este problema usando grafos de conocimiento y el protoc

DeepSeek-V4: Cómo los nuevos algoritmos de compresión hicieron realidad el contexto de un millón de tokens
DeepSeek presentó la cuarta generación de sus modelos. Mediante la compresión radical de atención, el procesamiento de volúmenes masivos de datos se está volviendo accesible no solo para los gigantes tecnológicos.

La Arquitectura Decoupled DiLoCo de DeepMind Resuelve el Problema de Escalabilidad de la IA
El entrenamiento de modelos de IA avanzados siempre ha sido rehén de fallos de hardware: una falla en un chip detenía todo el cluster. Una nueva arquitectura de Google DeepMind cambia las reglas del juego.

OpenMythos: reconstrucción de código abierto de la arquitectura Claude Mythos en PyTorch con 770M parámetros
El desarrollador Kye Gomez reconstruyó la presumida arquitectura Claude Mythos de Anthropic desde cero — sin filtraciones, solo basándose en investigaciones públicas.

OpenAI Amplía GPT-5.4-Cyber para Profesionales Verificados de Ciberseguridad
OpenAI abre acceso amplio a GPT-5.4-Cyber — una versión ajustada de GPT-5.4 sin restricciones estándar para miles de defensores verificados.

Moonshot AI lanza Kimi K2.6: un modelo agéntico con un enjambre de 300 subagentes
El laboratorio chino Moonshot AI ha liberado el código fuente de Kimi K2.6, un modelo agéntico multimodal que coordina de forma autónoma hasta 300 subagentes y 4.000 pasos.

Phi-4-Mini de Microsoft: implementación de cuantización, RAG y LoRA en un único notebook Jupyter
El tutorial muestra el pipeline completo con Phi-4-mini-instruct: cuantización de 4 bits, generación en streaming, razonamiento, llamada de herramientas, RAG y LoRA fine-tuning en un solo notebook.

Qwen 3.6-35B-A3B en la práctica: multimodalidad, MoE y RAG en un solo pipeline
Un análisis detallado de la implementación de Qwen 3.6-35B-A3B, desde la carga del modelo hasta RAG, tool calling y la persistencia de sesiones en flujos de trabajo reales.

NVIDIA presentó Nemotron 3 Super — un modelo abierto con 120 mil millones de parámetros
El nuevo modelo híbrido combina las arquitecturas Mamba y Attention con un enfoque Mixture-of-Experts, ofreciendo un aumento de rendimiento de cinco veces para sistemas multiagente. La brecha entre los modelos propietari

Google presentó TensorFlow 2.21 y LiteRT para AI móvil
Google presentó TensorFlow 2.21 y LiteRT, un nuevo estándar para ejecutar redes neuronales en smartphones con soporte para NPU y aceleración de GPU en plataformas móviles.

Google lanza Android Bench para evaluar la IA en el desarrollo móvil
Google puso a disposición Android Bench, la primera herramienta especializada para evaluar las capacidades de los grandes modelos de lenguaje en el desarrollo de aplicaciones para Android.

OpenAI presenta Codex Security para la detección y corrección automáticas de vulnerabilidades en el código
OpenAI lanza Codex Security, un agente inteligente para el análisis de seguridad del código que no solo encuentra errores, sino que también propone parches listos para corregirlos.

Liquid AI lanzó un sistema para ejecutar agentes de AI totalmente en el dispositivo
Liquid AI presentó el modelo LFM2-24B-A2B y la aplicación LocalCowork, un conjunto para ejecutar flujos de trabajo complejos de agentes de AI sin una sola llamada a la nube. La privacidad pasa a ser un principio arquitec

Yuan 3.0 Ultra: un billón de parámetros con eficiencia récord
La china YuanLab AI presentó un modelo multimodal abierto con un billón de parámetros, pero que activa solo 68,8 mil millones de ellos. Una reducción de un tercio en los parámetros junto con un aumento del 49% en la efic

Alibaba lanza OpenSandbox, un entorno unificado para la operación segura de agentes de AI
Alibaba ha abierto el código de OpenSandbox, una herramienta que ofrece a los agentes de AI sandboxes aisladas para ejecutar código, navegar por la web y entrenar modelos. Es una apuesta por un estándar para toda la infr

Alibaba lanzó Qwen 3.5 Small — modelos compactos para funcionar directamente en dispositivos
La nueva serie de modelos de Alibaba, de 0,8 a 9 mil millones de parámetros, desafía la carrera por el tamaño. La filosofía de «más inteligencia, menos cómputo» podría cambiar las reglas del juego para el AI móvil.

SHAP-IQ: un nuevo estándar de AI explicable llega al uso práctico
La biblioteca SHAP-IQ permite no solo evaluar la importancia de las variables de un modelo, sino también entender cómo interactúan entre sí. Explicamos por qué esto cambia el enfoque de la interpretación del aprendizaje

Google presenta STATIC: búsqueda generativa 948 veces más rápida
Google AI desarrolló un framework basado en matrices dispersas que acelera la decodificación en sistemas de recomendación generativos casi mil veces. Esto podría cambiar el enfoque de las recomendaciones a escala industr

Alibaba presenta CoPaw — una estación de trabajo para escalar agentes de AI
El equipo de Alibaba lanzó el framework open-source CoPaw, que convierte la máquina local del desarrollador en un entorno completo para ejecutar agentes autónomos de AI con memoria y flujos de trabajo multicanal.

Unified Latents: Google DeepMind encuentra una forma de mejorar la generación por AI
El nuevo framework Unified Latents de Google DeepMind resuelve el dilema entre la calidad de la compresión de datos y la precisión de las redes neuronales.

Sakana AI aprendió a adaptar instantáneamente modelos de lenguaje sin fine-tuning
El laboratorio tokiota Sakana AI presentó dos métodos — Doc-to-LoRA y Text-to-LoRA — que permiten adaptar grandes modelos de lenguaje a nuevos datos en fracciones de segundo, sin fine-tuning clásico.

Perplexity lanza pplx-embed: modelos de embeddings que cambian las reglas de la búsqueda
Perplexity presentó la familia multilingüe de modelos de embeddings pplx-embed, basada en Qwen3 con atención bidireccional, y afirma que establece un nuevo estándar de calidad para la búsqueda a escala de internet.