Google revela su escala: 3,2 cuatrillones de tokens de IA al mes, crecimiento de siete veces
En I/O 2026, Google reveló: procesa 3,2 cuatrillones de tokens de IA al mes, siete veces más que hace un año. La compañía ofrece Gemini 3.5 Flash para…
Procesado por IA desde 3DNews AI; editado por Hamidun News
En la conferencia Google I/O 2026, el CEO de la compañía, Sundar Pichai, reveló la escala del procesamiento de inteligencia artificial. Google procesa mensualmente 3,2 cuatrillones de tokens, siete veces más que hace un año. Se trata del despliegue más grande de infraestructura de IA en la historia de la tecnología.
Crecimiento exponencial de computación
La cifra de 3,2 cuatrillones de tokens al mes refleja el crecimiento explosivo de la demanda de IA. El crecimiento de siete veces en un año muestra que la infraestructura se escala de manera no lineal. No se trata simplemente de agregar nuevos servidores, sino de una reimaginación completa de la arquitectura bajo presión de la demanda.
Google requiere estos volúmenes para:
- El funcionamiento de Gemini en resultados de búsqueda y en YouTube (cientos de millones de usuarios)
- Integración de IA en Gmail, Docs, Maps, Photos y otros servicios de consumidor
- Entrenamiento y ajuste fino de nuevos modelos con datos internos
- Servicio del segmento en la nube (Google Cloud) para clientes
- Experimentación con nuevos formatos de integración de IA en productos cotidianos
Esta escala implica que incluso pequeños aumentos en la eficiencia del modelo generan enormes ahorros en electricidad e infraestructura de servidores. Cada porcentaje de optimización representa decenas de millones de dólares al año.
Gemini 3.5 Flash: optimización para la carga
Por eso Google presentó Gemini 3.5 Flash, una versión más ligera de su modelo insignia. El modelo está diseñado para procesar la mayoría de tareas rutinarias con menor consumo computacional, pero sin pérdidas críticas en la calidad de las respuestas. Flash alivia la carga de los modelos principales, permitiendo a la compañía distribuir los recursos computacionales de manera más eficiente. El costo de procesar un token en Flash es varios veces menor en comparación con las versiones completas. No es un modelo recortado, sino una solución de ingeniería para tareas reales que no requieren potencia máxima.
Carrera por la supremacía de infraestructura
Google está señalando claramente que ha invertido más en escalado que sus competidores. OpenAI no revela estas cifras, pero se sabe que también está aumentando la capacidad para ChatGPT. El lanzamiento de modelos de Anthropic, Meta Llama y otros actores requiere volúmenes computacionales serios. Esta es una carrera armamentista, pero no por la cantidad de parámetros en el modelo, sino por la infraestructura misma. Quien escale más rápido y barato es quien gana la guerra por el mercado.
Lo que significa
La divulgación pública de estas cifras es una señal a los inversores sobre la escala real de las apuestas de Google en IA. La compañía no oculta que esto es costoso. Pero los costos se recuperan: la integración de IA en búsqueda, video y la nube son puntos de monetización poderosos. Para desarrolladores y startups, la conclusión es simple: inviertan en optimización, no solo en escalado.
*Meta ha sido reconocida como una organización extremista y está prohibida en la Federación Rusa.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.