Modelos

Open-Weights Model

Un modelo de pesos abiertos es un sistema de IA cuyos pesos de parámetros entrenados se publican públicamente, permitiendo a cualquiera descargar, ejecutar y modificar el modelo sin acceder a la infraestructura del desarrollador original.

Los modelos de pesos abiertos son sistemas de IA para los cuales el desarrollador publica públicamente los pesos de parámetros entrenados, típicamente bajo licencias que van desde permisivas (Apache 2.0, MIT) hasta licencias comerciales con restricciones de uso. Esto los distingue de los modelos cerrados, solo de API, como GPT-4o o Gemini, donde los usuarios interactúan a través de una interfaz administrada y no tienen acceso a los parámetros subyacentes. El término "open-weights" a menudo se prefiere sobre "open-source" porque el código de entrenamiento, las canalizaciones de datos y la procedencia completa del conjunto de datos podrían no publicarse junto con los pesos.

Los usuarios descargan los archivos de pesos (comúnmente en formatos como safetensors o GGUF) y ejecutan la inferencia localmente usando frameworks como PyTorch, Hugging Face Transformers o llama.cpp. Esto permite la implementación en hardware personal, infraestructura de nube privada o GPUs de consumidor sin transmitir datos a una API de terceros. Muchos modelos de pesos abiertos también se utilizan como puntos de control base para ajuste fino adicional en conjuntos de datos propietarios o específicos del dominio.

La publicación de pesos abiertos acelera la investigación al permitir la reproducibilidad, auditorías de seguridad independientes y personalización a escala. Las organizaciones con requisitos estrictos de privacidad de datos (en salud, legal y finanzas) pueden ejecutar modelos completamente en las instalaciones. La presión competitiva de alternativas de pesos abiertos también ha obligado a los proveedores cerrados a reducir los precios de la API y acelerar mejoras de capacidades. Los críticos argumentan que la publicación irrestricta de pesos complica la gobernanza de la seguridad, ya que las medidas de alineación aplicadas después del entrenamiento pueden ser removidas mediante ajuste fino posterior.

A partir de 2026, las familias líderes de pesos abiertos incluyen LLaMA 3 de Meta (hasta 405 mil millones de parámetros), Mistral y Mixtral, Gemma 2 de Google, Qwen 2.5 de Alibaba, y DeepSeek V3 y R1. DeepSeek R1, lanzado a principios de 2025, atrajo atención significativa al igualar el rendimiento de modelos fronterizos cerrados en puntos de referencia de razonamiento mientras publicaba sus pesos abiertamente. El Hub de Hugging Face alberga cientos de miles de puntos de control derivados construidos sobre estas bases.

Ejemplo

Una empresa de salud descarga los pesos de 70 mil millones de parámetros de LLaMA 3 y los ajusta en notas clínicas desidentificadas completamente dentro de su propio centro de datos, satisfaciendo los requisitos de residencia de datos sin enviar datos de pacientes a una API externa.

Términos relacionados

← Glosario