Qwen (también llamado Tongyi Qianwen, en chino: 通义千问) es una familia de grandes modelos de lenguaje desarrollados por Alibaba. En julio de 2024, fue clasificado como el mejor modelo de idioma chino en algunos puntos de referencia y el tercero a nivel mundial detrás de los mejores modelos de Anthropic y OpenAI.[1]
Qwen | ||
---|---|---|
![]() | ||
Información general | ||
Tipo de programa | Bot conversacional | |
Desarrollador | Alibaba Cloud | |
Lanzamiento inicial | 1 de abril de 2023 (2 años y 12 días) | |
Licencia | Apache-2.0 | |
Información técnica | ||
Plataformas admitidas | ||
Versiones | ||
Última versión estable | 2.5-Max (28 de enero de 2025 (2 meses y 16 días)) | |
Enlaces | ||
Sitio web oficial
Blog
Repositorio de código
| ||
Alibaba lanzó por primera vez una versión beta de Qwen en abril de 2023 bajo el nombre de Tongyi Qianwen.[2] Se lanzó públicamente en septiembre de 2023 después de recibir la aprobación del gobierno chino.[3] En diciembre de 2023 lanzó sus modelos 72B y 1.8B como código abierto, mientras que Qwen 7B se lanzó como código abierto en agosto.[4][5]
En junio de 2024, Alibaba lanzó Qwen 2 y en septiembre lanzó algunos de sus modelos como código abierto, manteniendo sus modelos más avanzados como propietarios.[6][7] Qwen 2 emplea una mezcla de expertos.[8]
En noviembre de 2024, se lanzó QwQ-32B-Preview, un modelo centrado en el razonamiento similar al OpenAI o1, bajo la licencia Apache 2.0 , aunque solo se publicaron los pesos, no el conjunto de datos ni el método de entrenamiento.[9][10] QwQ tiene una longitud de contexto de 32 000 tokens y funciona mejor que o1 en algunos puntos de referencia.[11]
La serie Qwen-Vl es una línea de modelos de lenguaje visual que combina un transformador de visión con un LLM.[12][13] Alibaba lanzó Qwen-VL2 con variantes de 2 mil millones y 7 mil millones de parámetros.[14][15] Qwen-vl-max es el modelo de visión insignia de Alibaba a partir de 2024 y lo vende Alibaba Cloud a un coste de 0,00041 dólares por cada mil tokens de entrada.[16]
Alibaba ha lanzado varios otros tipos de modelos, como Qwen-Audio y Qwen2-Math.[17] En total, ha lanzado más de 100 modelos como código abierto, y sus modelos han sido descargados más de 40 millones de veces.[7][18] Se han desarrollado versiones optimizadas de Qwen, como "Liberated Qwen", desarrollado por Abacus AI con sede en San Francisco, que es una versión que responde a cualquier solicitud del usuario sin restricciones de contenido.[19]