MarkTechPost
Fuente de noticias de IA. Los artículos son seleccionados y adaptados por la redacción de Hamidun News.
Últimas publicaciones

Hugging Face y Gemma 3 1B: Construyendo un Pipeline de Generación Listo para Producción en Colab
Un análisis de cómo ejecutar Gemma 3 1B Instruct en Colab a través de Hugging Face Transformers: con autorización segura, chat templates y un pipeline de inferencia reproducible.

Z.ai lanza GLM-5V-Turbo — modelo multimodal nativo para programación visual
El laboratorio chino Z.ai ha lanzado GLM-5V-Turbo — un modelo que reconoce diagramas arquitectónicos y capturas de pantalla e inmediatamente genera código funcional para sistemas de ingeniería de agentes.

Google Gemma 4, NVIDIA y OpenClaw: Agentes AI locales sin pago por token
Google y NVIDIA están promoviendo la ejecución local de Gemma 4 en RTX, Jetson y DGX Spark para que agentes AI siempre activos como OpenClaw funcionen más rápido, más barato y sin facturación de tokens en la nube.

Talkie-1930: Investigadores lanzaron un modelo 13B sin conocimiento de internet ni de la Segunda Guerra Mundial
Talkie-1930 es un modelo 13B abierto, entrenado solo en textos en inglés hasta 1931, para estudiar el pensamiento histórico, filtraciones de datos y la capacidad de IA para generalizar más allá de su era.

MarkTechPost muestra cómo construir un agente VLA ligero con modelo de mundo latente y MPC
En un nuevo tutorial, MarkTechPost explica cómo construir un agente embodied simplificado: opera en fotogramas RGB, aprende un modelo de mundo latente y planifica acciones mediante MPC.

Arcee AI Lanzó Trinity Large Thinking — Modelo de Razonamiento Abierto para Agentes IA
Arcee AI liberó los pesos de Trinity Large Thinking bajo licencia Apache 2.0 y apuesta por escenarios de agentes largos, razonamiento multietapa y uso seguro de herramientas.

NVIDIA mostró un pipeline completo de optimización de modelos con FastNAS pruning y fine-tuning
NVIDIA lanzó una guía práctica para Model Optimizer: en un único notebook Colab se demuestran el entrenamiento de ResNet20, FastNAS pruning bajo límite de FLOPs y recuperación de calidad mediante fine-tuning.

TII lanza Falcon Perception — modelo 0,6B para segmentación y búsqueda de objetos por texto
TII presentó Falcon Perception — un modelo vision-language compacto con 0,6 mil millones de parámetros que busca y segmenta objetos a partir de consultas de texto simple, superando SAM 3 en solicitudes complejas.

Google DeepMind Permite que LLM Reescriba Algoritmos de Teoría de Juegos y Supere Expertos
Google DeepMind demostró que AlphaEvolve puede reescribir código de algoritmos para juegos con información incompleta y encontrar soluciones que superan versiones manuales de expertos en la mayoría de las pruebas.

Z.AI mostró cómo construir sistemas agentic production-ready en GLM-5 con tool calling
Z.AI lanzó un tutorial detallado sobre GLM-5: desde la configuración del SDK e API compatible con OpenAI hasta streaming, tool calling, salida JSON y agente multi-turn para producción.

Netflix Abre Void — Modelo para Eliminar Objetos de Videos con Consideración de la Física de la Escena
El equipo de Netflix e INSAIT lanzó en código abierto Void — un sistema que elimina objetos de videos y simultáneamente recalcula caídas, soporte de objetos y otras consecuencias físicas.

Cómo la Inteligencia Artificial Ayuda a las Marcas de Ropa a Diseñar la Moda del Futuro
Los algoritmos ya ayudan a las marcas de moda a crear colecciones más rápidamente, pronosticar tendencias, reducir la sobreproducción y personalizar las compras, pero también plantean preguntas sobre autoría y mano de ob

Cómo Construir un Pipeline Netflix Void para la Eliminación de Objetos en Vídeo usando CogVideoX
Un análisis detallado muestra cómo implementar el modelo Netflix Void, descargar los puntos de control necesarios, preparar datos de entrada y ejecutar la eliminación de objetos del video a través de CogVideoX.

Gladstone Institutes presenta MaxToki — un modelo de IA que predice el envejecimiento celular
El modelo MaxToki de Gladstone Institutes aprende a ver no una 'instantánea' de la célula, sino su trayectoria a lo largo del tiempo, evalúa la aceleración del envejecimiento e identifica objetivos para la intervención.

TinyFish Lanzó Plataforma Web Unificada para Agentes de IA con Search, Fetch, Browser y Agent
TinyFish combinó búsqueda, renderización de páginas, sesiones de navegador y flujos de trabajo web autónomos en una única plataforma para agentes de IA con una sola clave API y pool de créditos compartido.

Google agregó Skills en Chrome y transformó prompts de IA en escenarios de un clic
Google lanzó la función Skills en Chrome: los usuarios de Gemini podrán guardar prompts frecuentemente usados como escenarios reutilizables y ejecutarlos en el navegador con un solo clic.

Google DeepMind Presenta Gemini Robotics-ER 1.6 para Autonomía y Lectura de Instrumentos por Robots
Google DeepMind actualizó Gemini Robotics-ER a la versión 1.6: un modelo para robots que comprende mejor el espacio, maneja múltiples flujos de video y puede leer instrumentos industriales complejos.

MarkTechPost desglosó el ciclo completo de entrenamiento de grandes modelos de lenguaje: desde datos hasta despliegue
MarkTechPost publicó un desglose detallado de cómo se construyen los LLMs hoy: desde el preentrenamiento en grandes corpus hasta SFT, RLHF, optimización del razonamiento y despliegue en producción.

Google presentó Gemini 3.1 Flash TTS — modelo de habla con control, diálogos e idiomas 70+
Google lanzó Gemini 3.1 Flash TTS en vista previa: el modelo sintetiza texto en 70+ idiomas, soporta diálogos con dos voces y permite controlar la entrega a través de etiquetas de audio.

Mem0 y OpenAI: cómo construir una capa universal de memoria a largo plazo para agentes de IA
Un nuevo tutorial desglosa la combinación de Mem0, modelos OpenAI y ChromaDB: extrae hechos de conversaciones ordinarias, los almacena por user_id, busca por significado semántico e inyecta en las respuestas del agente.

SmolAgents: Cómo Construir un Sistema de IA Multiagente con Código y Orquestación Dinámica
Un análisis de la implementación de SmolAgents muestra cómo los agentes de IA ligeros ejecutan código, invocan herramientas, trabajan con memoria y coordinan tareas dentro de un único sistema.

NetKet y JAX: cómo construir un modelo Transformer para sistemas de espines frustrados
La guía muestra cómo construir un pipeline de VMC de investigación usando NetKet, JAX y arquitectura Transformer para modelar una cadena de espín frustrada J1-J2.

OpenAI presentó GPT-Rosalind — un modelo de IA para biología, genómica y desarrollo de fármacos
OpenAI lanzó GPT-Rosalind — un modelo especializado para biología y farmacéutica que ayuda a acelerar el desarrollo de fármacos, análisis de datos genómicos y planificación de experimentos.

Google presentó Auto-Diagnose — un sistema de IA para encontrar causas de fallos en pruebas de integración
Google presentó Auto-Diagnose — un sistema basado en Gemini 2.5 Flash que analiza automáticamente logs de pruebas de integración fallidas e identifica la causa raíz del fallo con una precisión del 90,14%.

OpenAI GPT-OSS: Lanzamiento de Modelos Open-Weight en Colab con MXFP4 e Inferencia Avanzada
Una nueva guía explica cómo lanzar openai/gpt-oss-20b en Google Colab: instalar dependencias para Transformers, verificar GPU, habilitar cuantización MXFP4 y construir un pipeline de inferencia funcional.

Anthropic lanza Claude Opus 4.7 para programación de agentes, visión y tareas autónomas
Anthropic presentó Claude Opus 4.7 — una actualización del modelo insignia con mejoras notables en codificación de agentes, análisis de imágenes detalladas y tareas autónomas largas.

PrismML Bonsai: Cómo ejecutar un modelo de 1 bit en CUDA con GGUF, JSON y RAG
En un nuevo tutorial de PrismML Bonsai, cubrimos cómo ejecutar Bonsai-1.7B en GPU a través de CUDA y GGUF, medir velocidad, configurar chat, salida JSON estricta y un escenario RAG básico.

xAI lanza APIs Grok separadas para reconocimiento y síntesis de voz para desarrolladores corporativos
xAI ha dividido la pila de voz de Grok en APIs autónomas: Speech-to-Text y Text-to-Speech para negocios con precios agresivos, soporte multilingüe y enfoque en el mercado de aplicaciones de voz.

NVIDIA lanzó Ising — la primera familia abierta de modelos de IA para sistemas cuántico-clásicos
NVIDIA presentó Ising — una familia abierta de modelos de IA para calibración de procesadores cuánticos y corrección de errores, para acercar sistemas híbridos cuántico-clásicos útiles más a la realidad.

Por qué LoRA falla en producción y cómo RS-LoRA salva el ajuste fino de modelos
LoRA es excelente para estilo y formato, pero pierde señal al ajustar con nuevos hechos; RS-LoRA resuelve el problema cambiando la fórmula de escalado a una más estable.