Qwen

Qwen (también llamado Tongyi Qianwen, en chino: 通义千问) es una familia de grandes modelos de lenguaje desarrollados por Alibaba. En julio de 2024, fue clasificado como el mejor modelo de idioma chino en algunos puntos de referencia y el tercero a nivel mundial detrás de los mejores modelos de Anthropic y OpenAI.[1]

Modelos

Alibaba lanzó por primera vez una versión beta de Qwen en abril de 2023 bajo el nombre de Tongyi Qianwen.[2]​ El modelo se basó en el LLM LLaMA desarrollado por Meta AI, con varias modificaciones.[3]​ Se lanzó públicamente en septiembre de 2023 después de recibir la aprobación del gobierno chino.[4]​ En diciembre de 2023 lanzó sus modelos 72B y 1.8B como código abierto, mientras que Qwen 7B se lanzó como código abierto en agosto.[5][6]

En junio de 2024, Alibaba lanzó Qwen 2 y en septiembre lanzó algunos de sus modelos como código abierto, manteniendo sus modelos más avanzados como propietarios.[7][8]​ Qwen 2 emplea una mezcla de expertos.[9]

En noviembre de 2024, se lanzó QwQ-32B-Preview, un modelo centrado en el razonamiento similar al OpenAI o1, bajo la licencia Apache 2.0 , aunque solo se publicaron los pesos, no el conjunto de datos ni el método de entrenamiento.[10][11]​ QwQ tiene una longitud de contexto de 32 000 tokens y funciona mejor que o1 en algunos puntos de referencia.[12]

La serie Qwen-Vl es una línea de modelos de lenguaje visual que combina un transformador de visión con un LLM.[3][13]​ Alibaba lanzó Qwen-VL2 con variantes de 2 mil millones y 7 mil millones de parámetros.[14][15]​ Qwen-vl-max es el modelo de visión insignia de Alibaba a partir de 2024 y lo vende Alibaba Cloud a un coste de 0,00041 dólares por cada mil tokens de entrada.[16]

Alibaba ha lanzado varios otros tipos de modelos, como Qwen-Audio y Qwen2-Math.[17]​ En total, ha lanzado más de 100 modelos como código abierto, y sus modelos han sido descargados más de 40 millones de veces.[8][18]​ Se han desarrollado versiones optimizadas de Qwen, como "Liberated Qwen", desarrollado por Abacus AI con sede en San Francisco, que es una versión que responde a cualquier solicitud del usuario sin restricciones de contenido.[19]

Referencias

  1. Jiang, Ben (11 July 2024). «Alibaba's open-source AI model tops Chinese rivals, ranks 3rd globally». South China Morning Post (en inglés). 
  2. Chiang, Sheila (11 April 2023). «Alibaba to roll out its rival to ChatGPT across all its products». CNBC (en inglés). 
  3. a b Bai, Jinze et ál. (28 Sep 2023). «Qwen Technical Report». arXiv:2309.16609  [cs.CL]. 
  4. Jiang, Ben (13 September 2023). «Alibaba opens Tongyi Qianwen model to public as new CEO embraces AI». South China Morning Post (en inglés). 
  5. Fan, Feifei (1 de diciembre de 2023). «Alibaba unveils new Tongyi Qianwen AI language model». global.chinadaily.com.cn. 
  6. Ye, Josh (August 3, 2023). «Alibaba rolls out open-sourced AI model to take on Meta's Llama 2». reuters. 
  7. Jiang, Ben (7 June 2024). «Alibaba says new AI model Qwen2 bests Meta's Llama 3 in tasks like maths and coding». South China Morning Post (en inglés). 
  8. a b Kharpal, Arjun (19 September 2024). «China's Alibaba launches over 100 new open-source AI models, releases text-to-video generation tool». CNBC (en inglés). 
  9. Yang, An et ál. (10 Sep 2024). «Qwen2 Technical Report». arXiv:2407.10671  [cs.CL]. 
  10. Dickson, Ben (29 November 2024). «Alibaba releases Qwen with Questions, an open reasoning model that beats o1-preview». VentureBeat. 
  11. 故渊 (28 de noviembre de 2024). «阿里通义千问 QwQ 登场:开源 AI 推理新王,MATH 测试超 OpenAI o1 模型 - IT之家». www.ithome.com. 
  12. Wiggers, Kyle (27 November 2024). «Alibaba releases an 'open' challenger to OpenAI's o1 reasoning model». TechCrunch. 
  13. Browne, Ryan (31 December 2024). «Alibaba slashes prices on large language models by up to 85% as China AI rivalry heats up». CNBC (en inglés). 
  14. 沛霖 (30 de agosto de 2024). «阿里通义千问推出 Qwen2-VL:开源 2B / 7B 参数 AI 大模型,处理任意分辨率图像无需分割成块». ithome.com. 
  15. Wang, Peng; Bai, Shuai; Tan, Sinan; Wang, Shijie; Fan, Zhihao; Bai, Jinze; Chen, Keqin; Liu, Xuejing; Wang, Jialin; Ge, Wenbin; Fan, Yang; Dang, Kai; Du, Mengfei; Ren, Xuancheng; Men, Rui; Liu, Dayiheng; Zhou, Chang; Zhou, Jingren; Lin, Junyang (September 18, 2024). «Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution». Cs.CV. arXiv:2409.12191. 
  16. Jiang, Ben (31 December 2024). «Alibaba Cloud cuts AI visual model price by 85% on last day of the year». South China Morning Post (en inglés). 
  17. Franzen, Carl (8 August 2024). «Alibaba claims no. 1 spot in AI math models with Qwen2-Math». VentureBeat. 
  18. «Alibaba accelerates AI push by releasing new open-source models, text-to-video». Reuters. September 19, 2024. 
  19. Mims, Christopher (April 19, 2024). «Here Come the Anti-Woke AIs». WSJ. 

Enlaces externos

 

Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia