En la actualidad, muchas grandes tecnológicas están desarrollando sus propios modelos de lenguaje, habilitando herramientas basadas en inteligencia artificial. OpenAI, Google, Meta, Microsoft y Anthropic han lanzado múltiples propuestas en los últimos dos años. Sin embargo, el panorama se vuelve más interesante con la entrada de China y su modelo Qwen2.
Qwen2, un modelo de lenguaje chino, llega en cinco variaciones con diferentes números de parámetros. Su versión más completa promete superar a Llama 3 de Meta. China es un país donde la inteligencia artificial se utiliza ampliamente, incluso en educación, donde los padres confían en tablets con IA para las clases particulares de sus hijos.
Hasta ahora, los modelos de lenguaje chinos no han sido tan avanzados como los de OpenAI. Sin embargo, esto podría cambiar con el desarrollo de un superordenador chino que entrenará estos modelos. Qwen2, con modelos que van desde 0.5B hasta 72B parámetros, destaca por su versión ‘instruct’, que supera a Llama 3 en casi todos los benchmarks.
Según Carlos Santana, experto en IA, Qwen2 cuenta con Licencia Apache 2.0, permitiendo su uso, redistribución y modificación por cualquier usuario. Esto abre muchas posibilidades para herramientas independientes basadas en IA. Qwen2 puede alcanzar ventanas de contexto de hasta 128K tokens, lo que permite procesar más información.
Qwen2 es un avance significativo en los modelos de lenguaje open-source, permitiendo a desarrolladores independientes utilizar herramientas de libre distribución. Las fuentes y herramientas de Qwen2 están disponibles en Github, Hugging Face y Modelscope, facilitando su acceso a la comunidad de desarrolladores.