Cómo Configurar un Modelo Local en Ollama: Parámetros para Control Total
Ollama es un framework para ejecutar modelos localmente (Llama, Mistral, Phi). A través de parámetros como temperatura y longitud de contexto, puedes cambiar el

Ollama proporciona acceso a modelos de lenguaje potentes que funcionan completamente en local en tu ordenador. Pero simplemente lanzar un modelo es solo la mitad de la tarea. Configurar sus parámetros te permite transformar un modelo en varias herramientas diferentes según tu tarea.
Por qué configurar parámetros Ollama viene con valores por defecto razonables.
Pero si necesitas un modelo para escritura creativa, se comportará diferente que para código. La temperatura afecta la originalidad de las respuestas, el contexto determina cuán atrás mira el modelo en el historial de conversación, y los parámetros de rendimiento deciden si el modelo se ejecutará en CPU o GPU.
Parámetros principales * **temperature** — cuán creativo será el
modelo (0 = predecible, 1 = creativo). Para código establece 0–0.3, para ideas — 0.
7–1.0 * top_p — diversidad en la selección de palabras (filtro de probabilidad). Normalmente 0.
8–0.95 top_k — la cantidad de opciones entre las que el modelo elige la siguiente palabra. 40–50 es un buen compromiso num_ctx — tamaño del contexto en tokens (lo que el modelo recuerda del diálogo).
2048–4096 para la mayoría de tareas, hasta 8192 si tienes memoria num_thread — cuántos núcleos de CPU usar. Más ≠ siempre más rápido; experimenta num_gpu — cuántas capas del modelo enviar a la GPU. Acelera el rendimiento si tienes GPU ## Cuándo cambiar qué configuraciones Para chat (asistente, preguntas) establece temperature = 0.
7, top_p = 0.9 y num_ctx = 4096. El modelo será natural pero no olvidará el contexto de la conversación.
Para codificación — temperature = 0.2, num_ctx = 2048, num_thread = 8. Para contenido creativo (ideas, guiones) — temperature = 0.
9, top_p = 0.95, num_ctx = 3072.
"La mejor manera de encontrar parámetros óptimos es probar y observar los resultados", — consejo de la comunidad Ollama.
Ahora mismo puedes exportar tus configuraciones a un Modelfile y compartirlas con otros. Ollama lee parámetros de este archivo al cargar el modelo.
Qué significa esto Ollama convierte modelos locales en una herramienta, no una caja negra.
Controlas no solo tus datos (permanecen en tu máquina) sino también el comportamiento del modelo. Esto es especialmente importante para empresas preocupadas por la privacidad y para desarrolladores experimentando con LLM sin servicios en la nube.