Alibaba Qwen: Nuevo récord en el mundo de modelos de IA abiertos
Alibaba Qwen, un gran modelo de lenguaje (LLM) de código abierto desarrollado por el gigante tecnológico chino Alibaba, acaba de establecer un nuevo récord…
Procesado por IA desde 36Kr (36氪); editado por Hamidun News
Alibaba Qwen, un gran modelo de lenguaje (LLM) de código abierto desarrollado por el gigante tecnológico chino Alibaba, acaba de establecer un nuevo récord mundial. Según los últimos datos publicados el 21 de enero por la comunidad de IA Hugging Face, el número de modelos derivados de Qwen ha superado 200 000, lo que lo convierte en el primer LLM de código abierto del mundo en alcanzar esta meta. Este hito es un testimonio de la creciente influencia de China en el campo de la inteligencia artificial y la creciente popularidad de los modelos de código abierto.
Mientras que los modelos propietarios como GPT-4 de OpenAI han dominado los titulares, los modelos abiertos como Llama de Meta y Qwen de Alibaba están ganando rápidamente impulso, ofreciendo a desarrolladores e investigadores mayor flexibilidad y control. La serie de modelos Qwen también ha demostrado métricas impresionantes de descargas, superando 1 mil millones de descargas, con un promedio de 1,1 millones por día. Esto supera significativamente el desempeño de Llama (un modelo estadounidense), haciendo que Qwen sea el modelo de lenguaje de código abierto más descargado del mundo.
Tal nivel elevado de descargas indica un fuerte interés y una adopción generalizada de Qwen en diversas aplicaciones e investigaciones. Los modelos de código abierto permiten una investigación más transparente, ya que cualquiera puede examinar el código, entender cómo funciona el modelo y cómo fue entrenado. Esto es particularmente importante para abordar problemas de sesgo y equidad en la IA.
El éxito de Qwen puede explicarse por varios factores. Primero, es un modelo potente y eficiente entrenado con una cantidad masiva de datos. Segundo, Alibaba lo lanzó bajo una licencia de código abierto, lo que permitió a desarrolladores e investigadores usar, modificar y distribuir libremente el modelo.
Tercero, Alibaba apoya activamente la comunidad de Qwen, proporcionando documentación, herramientas y soporte. La creciente popularidad de Qwen tiene implicaciones significativas para la industria de la IA. Significa que los modelos de código abierto se están volviendo cada vez más competitivos en comparación con los modelos propietarios, lo que podría conducir a mayor innovación y democratización de la IA.
También podría reducir los costos en el desarrollo e implementación de IA, ya que los desarrolladores pueden aprovechar los modelos de código abierto existentes en lugar de construirlos desde cero. En conclusión, el logro de Qwen de 200 000 modelos derivados y 1 mil millones de descargas es un hito importante para la comunidad de IA abierta. Testimonia el poder y el potencial de los modelos de código abierto y la creciente influencia de China en el campo de la IA.
En los próximos años, podemos esperar ver más innovación y competencia en el campo de la IA, impulsada por el crecimiento de modelos de código abierto como Qwen.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.