Hugging Face Blog
Fuente de noticias de IA. Los artículos son seleccionados y adaptados por la redacción de Hamidun News.
Últimas publicaciones

AllenAI Lanza olmo-eval — Una Plataforma para Evaluar LLMs Durante el Entrenamiento
AllenAI lanzó olmo-eval, un kit de herramientas abierto para la evaluación continua de modelos de lenguaje durante todo el ciclo de entrenamiento — punto de control a punto de control.

Cohere presentó North Mini Code — un modelo para desarrolladores y agentes de IA
Cohere lanzó North Mini Code, un modelo de 30 mil millones de parámetros específicamente entrenado en programación e interacción con agentes de IA. El modelo es gratuito y está disponible para todos.

Los agentes de voz no están preparados para clientes bilingües. Investigación ServiceNow-AI
Los agentes de voz tienen un desempeño deficiente con clientes bilingües. Esto fue demostrado por una investigación del equipo ServiceNow-AI, que probó siete sistemas populares de reconocimiento de…

Cómo acelerar modelos PyTorch: guía práctica de torch.profiler
Hugging Face habló sobre torch.profiler, una herramienta integrada en PyTorch para análisis de rendimiento. Ayuda a encontrar cuellos de botella en el entrenamiento e inferencia de modelos.

Hugging Face enseñó a TRL a entregar un billón de parámetros a través de pesos delta
Hugging Face agregó Delta Weight Sync a TRL — una técnica que envía solo cambios de pesos, reduciendo el volumen de datos cientos de veces al entrenar modelos gigantes.

Reachy Mini aprendió a hablar localmente sin la nube
El robot humanoide Reachy Mini ahora puede ejecutar toda la pila de reconocimiento de voz localmente, sin la nube ni API, gracias a los modelos abiertos de Hugging Face.

IBM y Artificial Analysis crean benchmark: agentes de IA fracasan en tareas de TI
Los grandes modelos de lenguaje obtuvieron menos del 50% en el nuevo benchmark ITBench-AA para evaluar la capacidad de los agentes de IA para resolver tareas corporativas de TI. Esto muestra que la automatización complet

NVIDIA Nemotron: los modelos de difusión generan texto 6 veces más rápido
NVIDIA presentó Nemotron-Labs Diffusion, los primeros modelos de lenguaje que generan texto en paralelo en lugar de secuencialmente. En modo de autoespeculación, funcionan 6 veces más rápido que los modelos convencionale

Cómo un pequeño modelo superó a GPT-5 y Claude Opus en OCR de portugués
Un modelo especializado de 3 mil millones de parámetros de Dharma AI superó a todos los modelos frontier comerciales en OCR de portugués. Y fue 52 veces más barato que ellos.

Hugging Face lanzó Open Agent Leaderboard para evaluar agentes de AI
Hugging Face presentó un benchmark abierto para comparar sistemas completos de agentes de AI. Mostró que la arquitectura del agente importa más que el modelo elegido.

PaddleOCR 3.5 recibe soporte para Transformers de Hugging Face
PaddleOCR se actualizó con soporte completo para Hugging Face Transformers como backend de inferencia. Ahora el reconocimiento de texto y análisis de documentos funcionan en un entorno PyTorch.

NVIDIA mostró una forma eficiente de entrenar Cosmos en video robótico a través de LoRA
NVIDIA lanzó una guía para fine-tuning del modelo Cosmos Predict 2.5 a través de LoRA/DoRA — un método de adaptación paramétrica eficiente que permite entrenar en 17 horas con una única GPU.

Ettin Reranker de Hugging Face: 6 modelos para reranking preciso de búsqueda
Hugging Face lanzó 6 rerankers Ettin basados en ModernBERT con precisión y velocidad de última generación gracias a Flash Attention 2 y optimización de secuencias.

OlmoEarth v1.1: Allen AI lanzó modelos satelitales 3 veces más baratos
Allen AI presentó una versión más eficiente de modelos para análisis de imágenes satelitales, reduciendo los costos computacionales 3 veces manteniendo la calidad.

Cómo el modelo de Allen AI aprendió a descubrir por sí solo la especialización de los expertos
Allen AI presentó EMO, un modelo basado en una mezcla de expertos que desarrolla de forma natural una especialización por áreas (salud, política, cine) sin entrenamiento explícito en esas categorías.

CyberSecQwen-4B: cómo un modelo pequeño se convirtió en experto en vulnerabilidades
El modelo especializado de ciberseguridad de 4 mil millones de parámetros supera a competidores de propósito general en el análisis de vulnerabilidades y funciona localmente en hardware personal sin servicios en la nube.

OncoAgent: sistema de AI para la detección temprana del cáncer basado en datos privados de pacientes
Cómo un algoritmo de aprendizaje automático ayuda a los médicos a tomar decisiones sobre el diagnóstico del cáncer sin comprometer la confidencialidad de los pacientes

Hugging Face aceleró la inferencia de LLM un 22% con batching asíncrono
El procesamiento paralelo de CPU y GPU, en lugar del secuencial, eliminó un 24% del tiempo ocioso de la GPU y aceleró la generación de tokens casi un cuarto sin cambiar el modelo.

IBM lanzó Granite Embedding R2 — un modelo multilingüe para búsqueda semántica
IBM presentó Granite Embedding R2, un modelo multilingüe abierto para búsqueda semántica con soporte de contexto de 32K y el mejor rendimiento de su clase entre los modelos sub-100M.

H Company lanzó Holotron-12B — un modelo para agentes con un aumento de velocidad de 2x
H Company publicó Holotron-12B en Hugging Face: el modelo multimodal para agentes de AI ofrece más del doble de throughput en tareas de uso de interfaces con una sola H100.

NVIDIA presentó SPEED-Bench — un benchmark unificado para speculative decoding
NVIDIA publicó SPEED-Bench, un conjunto de datos y un framework de medición que compara speculative decoding en cargas reales, contextos largos y distintos motores de inferencia.

IBM lanzó Mellea 0.4.0 y Granite Libraries para pipelines de AI verificables
IBM Research actualizó el framework de código abierto Mellea a la versión 0.4.0 y lanzó tres Granite Libraries para flujos de trabajo de AI estructurados, verificables y seguros.

NVIDIA mostró cómo hacer fine-tuning de un modelo de embedding para un dominio específico en un día
NVIDIA y Hugging Face publicaron una receta paso a paso que en pocas horas convierte un modelo de embedding base en una búsqueda especializada sobre documentos internos.

ServiceNow presentó EVA — un nuevo framework para evaluar agentes de voz con AI
ServiceNow lanzó EVA — un sistema que evalúa a los agentes de voz con AI no solo por el éxito en la tarea, sino también por la calidad del diálogo, desde la brevedad de las respuestas hasta el tiempo de las intervencione

IBM lanza Granite 4.0 3B Vision para extraer datos de documentos y gráficos
IBM presentó Granite 4.0 3B Vision, un modelo multimodal compacto para extraer tablas, gráficos y campos clave de documentos, que puede integrarse en pipelines empresariales con Docling.

H Company presenta Holo3 — un agente de AI para usar la computadora con una puntuación récord en OSWorld-Verified
H Company lanzó Holo3, un modelo para usar la computadora que obtuvo 78,85% en OSWorld-Verified y fue entrenado con escenarios corporativos sintéticos.

Google lanzó Gemma 4 en Hugging Face: modelos multimodales para ejecución local
Google DeepMind abrió la familia Gemma 4 en Hugging Face: cuatro modelos multimodales con licencia Apache 2.0, contexto de hasta 256K y ejecución desde teléfonos hasta estaciones de trabajo.

Hugging Face añadió gradio.Server: ahora se puede conectar un frontend propio al backend de Gradio
El nuevo gradio.Server de Hugging Face convierte a Gradio en una capa de backend para React, Svelte y HTML/JS puro, manteniendo las colas de solicitudes, ZeroGPU y la compatibilidad con Spaces.

Hugging Face transfiere Safetensors a la PyTorch Foundation para una gobernanza neutral del formato
Hugging Face anunció que Safetensors pasó a ser un proyecto de la PyTorch Foundation: no hay cambios incompatibles para los usuarios, mientras el desarrollo del formato pasa a un modelo de gobernanza neutral.

Overworld lanzó Waypoint-1.5: mundos interactivos en 720p para GPUs de consumo
Overworld lanzó Waypoint-1.5, un world model para ejecución local en GPUs de consumo: hasta 720p y 60 FPS, además de una versión 360p más ligera para una gama más amplia de PCs y portátiles.