El creador de LILA presentó una arquitectura compacta de AI y cuestionó el enfoque de Sam Altman
El creador de Sovereign-Lila-Leech publicó el manifiesto LILA y contrapuso la arquitectura a la carrera corporativa por ganar escala. La idea del proyecto es…
Procesado por IA desde Habr AI; editado por Hamidun News
El autor del proyecto Sovereign-Lila-Leech ha publicado el manifiesto LILA y ha afirmado que una arquitectura geométrica basada en la red de Leech puede reducir radicalmente el coste de los modelos de lenguaje. La principal apuesta no se centra en nuevos centros de datos, sino en modelos compactos que pueden ejecutarse sin conexión en los dispositivos de los usuarios.
En qué consiste la idea de LILA
En el centro del proyecto se encuentra el intento de incorporar una geometría fija de la red de Leech —uno de los objetos más conocidos de las matemáticas en 24 dimensiones— en un transformer. Según la descripción del repositorio, las proyecciones entrenables estándar de query y key se sustituyen por un núcleo ortogonal congelado, y una función de pérdida adicional acerca las representaciones ocultas hacia las direcciones seleccionadas de la red. El autor lo presenta como una forma de alejarse del enfoque de fuerza bruta y hacer el comportamiento del modelo más interpretable.
«Las matemáticas no deben calcularse — deben existir».
En el propio artículo, esta idea se enmarca como un manifiesto contra la «IA corporativa»: el autor contrapone unas pocas líneas de código y la prioridad geométrica a los grandes presupuestos de OpenAI y Qualcomm. Pero si se elimina la capa periodística, la tesis es clara: no toda la eficiencia en IA tiene que provenir del escalado de parámetros, cómputos e infraestructura; parte de las ganancias puede buscarse en el nivel de la propia estructura del modelo.
Qué promete el proyecto
El manifiesto afirma efectos de máxima ambición: compresión geométrica de 44,9 veces, cuantización nativa de 2 bits y la capacidad de ejecutar modelos de hasta 4.000 millones de parámetros en dispositivos móviles. El autor también hace hincapié en la autonomía offline completa, los costes cero de inferencia en servidor y la privacidad de los datos del usuario. Es decir, no se trata simplemente de otra idea arquitectónica, sino de una propuesta para una nueva pila tecnológica para edge AI.
A un nivel más práctico, los materiales públicos del proyecto se presentan así:
- el repositorio de GitHub describe un modelo base de 20 millones de parámetros, Leech-Lila;
- el README menciona el entrenamiento en TinyStories y FineWeb-edu en una sola NVIDIA T4 en Google Colab;
- el código y los pesos se publican en código abierto bajo AGPLv3;
- un preprint que describe el enfoque está disponible en Zenodo;
- el proyecto se posiciona como código de investigación adecuado para experimentos con sesgos inductivos geométricos.
El README también especifica puntos de referencia más concretos: un rango estable de la primera capa de 8,55, una capacidad efectiva de unos 440 millones de parámetros y un resultado de 0,129 bits por carácter en TinyStories. El autor interpreta esto como evidencia de que la regularización geométrica puede proporcionar ganancias desproporcionadas incluso en un modelo pequeño. Pero por ahora, estas cifras se refieren a una configuración de investigación compacta, no a un producto masivo.
Dónde surgen las preguntas
El principal matiz es que el manifiesto y la descripción técnica del proyecto hablan con distintos niveles de seguridad. El artículo afirma una compresión de 44,9 veces y un cambio casi revolucionario para la IA móvil, mientras que el README del propio repositorio menciona una compresión de 22 veces, métricas en TinyStories y el estado explícito de Prueba de Concepto / Código de Investigación. Esto no hace que el trabajo carezca de sentido, pero muestra que la validación industrial y las comparaciones reproducibles aún están lejos.
El segundo punto se refiere a la comparación con Qualcomm. El autor hace referencia a un preprint de Qualcomm AI Research del 11 de marzo de 2026 sobre cuantización vectorial en la red de Leech y lo interpreta como un reconocimiento tardío del poder de esta matemática. Pero los dos trabajos tienen objetivos diferentes: Qualcomm escribe sobre la compresión de LLM mediante cuantización vectorial, mientras que LILA propone fijar la geometría dentro del mecanismo de atención. Por ello, es pronto para declarar una victoria clara de un enfoque sobre el otro. El proyecto actualmente no cuenta con benchmarks independientes, revisión por pares ni comparaciones en grandes tareas prácticas.
Qué significa esto
La historia de LILA es interesante no como un «asesino» demostrado de los grandes modelos, sino como una señal de que una carrera experimental en torno a edge AI y la eficiencia arquitectónica está comenzando de nuevo. Si estas ideas se confirman mediante pruebas reproducibles, el mercado obtendrá más modelos locales con menor dependencia de la nube. Si no es así, el manifiesto aún marca un cambio importante: el debate en IA ya no se centra únicamente en el tamaño, sino también en las matemáticas de la estructura interna de los modelos.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.