Fine-tuning
Fine-tuning es el proceso de entrenar adicionalmente un modelo de IA pre-entrenado en un conjunto de datos más pequeño específico de la tarea para que tenga un mejor rendimiento en esa tarea. En lugar de construir un modelo desde cero, adaptas uno existente a tu dominio, estilo o formato de salida.
Fine-tuning toma un modelo base que ya entiende el lenguaje y continúa su entrenamiento en un conjunto de datos estrecho (típicamente cientos a decenas de miles de ejemplos de las entradas y salidas que te importan). Los pesos del modelo se desplazan hacia tu tarea: redacción legal, codificación médica, el tono de voz de una marca, o un formato de salida estricto como JSON.
Se utiliza mejor cuando necesitas comportamiento consistente, no conocimiento fresco. Enseñar nuevos hechos a un modelo mediante fine-tuning es caro e inseguro (los hechos cambian y el modelo sigue alucinando). Enseñarle un estilo, un formato o una política de decisión funciona bien, porque esos patrones se repiten en los ejemplos de entrenamiento.
En la práctica, los equipos comparan tres opciones: prompt engineering (más barato, sin entrenamiento), RAG (conocimiento fresco y privado), y fine-tuning (comportamiento estable con costo por solicitud más bajo, ya que las instrucciones largas se mueven desde el prompt a los pesos). Métodos eficientes en parámetros como LoRA hacen que el fine-tuning sea viable incluso en una sola GPU.