AWS Machine Learning Blog→ original

Google DeepMind Gemma 4 появились на Amazon Bedrock: три модели с MoE и мультимодальностью

На Amazon Bedrock появились три модели Gemma 4 от Google DeepMind: Gemma 4 31B, Gemma 4 26B-A4B (MoE) и Gemma 4 E2B. Все распространяются под Apache 2.0 и…

Procesado por IA desde AWS Machine Learning Blog; editado por Hamidun News
Google DeepMind Gemma 4 появились на Amazon Bedrock: три модели с MoE и мультимодальностью
Fuente: AWS Machine Learning Blog. Collage: Hamidun News.
◐ Escuchar artículo

Amazon Bedrock ha añadido tres modelos de la familia Gemma 4, desarrollada por Google DeepMind, a su catálogo — con pesos abiertos, soporte para entrada multimodal y arquitectura MoE. Los modelos están disponibles a través de AWS API inmediatamente después del anuncio.

Tres opciones para diferentes tareas

Gemma 4 fue construida con énfasis en inteligencia por parámetro — máxima eficiencia con requisitos computacionales mínimos. La familia abarca dos enfoques arquitectónicos: modelos densos y MoE, donde solo una porción de la red neuronal se activa por solicitud. Tres variantes instruction-tuned están disponibles en Amazon Bedrock:

  • Gemma 4 31B — un modelo denso clásico con 31 mil millones de parámetros, predecible en comportamiento y conveniente para fine-tuning
  • Gemma 4 26B-A4B — arquitectura MoE: 26B parámetros en el modelo, pero solo 4B se activan por solicitud
  • Gemma 4 E2B — una variante ligera para entornos edge y con recursos limitados

Los tres se distribuyen bajo la licencia Apache 2.0 — uso comercial sin restricciones de volumen o recuento de solicitudes.

Lo que los modelos pueden hacer de serie

Todas las variantes Gemma 4 soportan entrada multimodal: texto e imágenes pueden ser pasados en una única solicitud. Esto habilita aplicaciones en análisis de documentos, QA visual, procesamiento de capturas de pantalla y pipelines mixtos donde diferentes tipos de datos necesitan ser procesados en una única pasada.

El razonamiento integrado permite que el modelo tome pasos intermedios antes de proporcionar la respuesta final. Esto es especialmente notable en tareas matemáticas, lógicas y de múltiples pasos complejos — la precisión mejora sin ingeniería de prompt adicional.

La llamada de función nativa proporciona integración directa con sistemas de agentes y herramientas externas. Los desarrolladores no necesitan inventar workarounds a través del formato de salida — el modelo llama funciones nativamente.

Por qué MoE importa en la práctica

Mixture-of-Experts es una forma real de reducir costos de inferencia. Por solicitud, solo se activa un conjunto de bloques "especialistas" especializados, no toda la red neuronal. La carga computacional es como un modelo pequeño, la calidad como uno grande. Para Gemma 4 26B-A4B esto significa: a pesar de 26 mil millones de parámetros, la inferencia funciona efectivamente con 4 mil millones. En escenarios de alto throughput donde el costo de cada token importa, esto es una ventaja sustancial sobre modelos densos equivalentes.

"La familia fue diseñada con un enfoque en una amplia gama de escenarios de implementación", —

Google DeepMind al describir la arquitectura Gemma 4.

Qué significa esto

Colocar Gemma 4 en Amazon Bedrock reduce la barrera de entrada para empresas en el ecosistema AWS: en lugar de desplegar automáticamente pesos abiertos — una API lista con infraestructura gestionada. Apache 2.0 tampoco restringe la escalabilidad, lo que hace que la familia sea atractiva para equipos de producto que valoran la previsibilidad en las condiciones de licencia.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Necesitas IA funcionando dentro de tu empresa — no solo en tu feed de noticias?

Construyo IA en producción para empresas — CRM a medida, herramientas internas, agentes autónomos, automatización de procesos. Tuya, adaptada a tu proceso, sin coste por usuario. Creado por Zhemal Khamidun, CPO de AlpinaGPT (plataforma de IA, 6.000+ usuarios).

¿Qué te parece?
Cargando comentarios…