
Alibaba presenta Qwen3, una nueva generación de modelos de razonamiento 'híbridos' de inteligencia artificial.
La empresa tecnológica china Alibaba ha lanzado Qwen 3, una serie de modelos de inteligencia artificial que, según la compañía, supera el rendimiento de algunos de los más destacados en el mercado.
La compañía tecnológica china Alibaba ha presentado recientemente Qwen3, una serie de modelos de inteligencia artificial que, según afirma, pueden igualar o incluso superar a los modelos más avanzados de Google y OpenAI. La mayoría de estos modelos estarán disponibles para descarga bajo una licencia "abierta" en plataformas como Hugging Face y GitHub, y varían en tamaño desde 0.6 mil millones hasta 235 mil millones de parámetros. Los parámetros, que esencialmente reflejan las habilidades de resolución de problemas de un modelo, indican que aquellos con mayor número tienden a tener un rendimiento superior.
El surgimiento de series de modelos como Qwen ha intensificado la presión sobre laboratorios estadounidenses como OpenAI para desarrollar tecnologías de inteligencia artificial más avanzadas. Esto ha llevado a los responsables de políticas a establecer restricciones con el fin de limitar la capacidad de las empresas chinas de IA para adquirir los chips necesarios para el entrenamiento de modelos.
Los modelos Qwen3 son descritos por Alibaba como "híbridos”. Pueden racionalizar problemas complejos con mayor tiempo o, en contraste, responder a solicitudes más simples de manera rápida. Esta capacidad de razonamiento les permite realizar una auto-verificación efectiva, similar a lo que se observa en modelos como el o3 de OpenAI, aunque con la desventaja de una latencia más alta. El equipo de Qwen comentó que han integrado de manera fluida modos de razonamiento y no razonamiento, lo que ofrece a los usuarios flexibilidad para gestionar el tiempo de procesamiento.
Asimismo, algunos de estos modelos utilizan una arquitectura de mezcla de expertos (MoE), que resulta más eficiente en términos computacionales al responder consultas. Esta metodología descompone tareas en subtareas, que son delegadas a modelos más pequeños y especializados. Los modelos Qwen3 admiten 119 idiomas y fueron entrenados con un conjunto de datos que abarca más de 36 billones de tokens, donde un millón de tokens equivale aproximadamente a 750,000 palabras. La empresa indicó que el entrenamiento de Qwen3 utilizó una mezcla de libros de texto, pares de preguntas y respuestas, fragmentos de código y datos generados por IA, entre otros.
Aunque no todos los modelos Qwen3 superan significativamente a los modelos de gama alta recientes como o3 y o4-mini de OpenAI, muestran un rendimiento competitivo. Por ejemplo, el modelo más grande de Qwen3, el Qwen-3-235B-A22B, logra superar a o3-mini de OpenAI y a Gemini 2.5 Pro de Google en el marco de programación Codeforces, además de destacarse en pruebas matemáticas complejas. Sin embargo, este modelo aún no está disponible públicamente.
El modelo Qwen3-32B, que es el más grande disponible al público, mantiene una competencia sólida con varios modelos de IA tanto propietarios como abiertos, incluyendo el R1 del laboratorio chino DeepSeek. Según Alibaba, el Qwen3 destaca en la capacidad de llamar herramientas, seguir instrucciones y replicar formatos de datos específicos. Además de ser accesibles para descarga, los modelos Qwen3 también están disponibles a través de proveedores en la nube, como Fireworks AI y Hyperbolic.
Tuhin Srivastava, cofundador y CEO de Baseten, un host de nube de IA, comentó que el Qwen3 es un ejemplo de cómo los modelos abiertos están manteniendo el ritmo con los sistemas cerrados como los de OpenAI. Resaltó que a pesar de las restricciones de Estados Unidos en cuanto a la venta y compra de chips con China, modelos como Qwen3, que son de vanguardia y de acceso abierto, se utilizarán sin duda a nivel doméstico, reflejando la realidad de que las empresas no solo están desarrollando sus propias herramientas, sino también adquiriendo soluciones a través de compañías de modelos cerrados.