Alibaba dégaine une IA qui remet tout en question, une fois de plus

L’année 2025 marque un tournant dans le domaine de l’intelligence artificielle (IA), avec des annonces majeures provenant des géants technologiques et des innovations qui redéfinissent les capacités des modèles d’IA. Et les innovations les plus importantes viennent de l’Asie. Après ChatGPT, Claude ou Perplexity, ce sont les IA de DeepSeek et d’Alibaba qui font l’actualité en ce début d’année. Alibaba a dévoilé Qwen2.5-Max, un modèle d’IA avancé qui, selon l’entreprise chinoise, surpasse ses concurrents comme GPT-4 (OpenAI) et Claude-3.5 Sonnet d’Anthropic. Entraîné sur plus de 20 000 milliards de tokens, ce modèle combine apprentissage supervisé (SFT) et apprentissage par renforcement avec retour humain (RLHF), souligne Alibaba. Ainsi, Qwen2.5-Max a remporté plusieurs benchmarks, notamment Arena-Hard, LiveBench et MMLU-Pro, démontrant sa supériorité dans des domaines comme la programmation, les préférences humaines et les connaissances académiques. Le modèle est disponible via le cloud d’Alibaba et son agent conversationnel Qwen Chat, facilitant son intégration pour les entreprises. Cette annonce intervient alors que la start-up chinoise DeepSeek a récemment surpris le secteur avec son modèle R1, remettant en question la domination américaine dans l’IA. Bien que le chemin pour aboutir à cette IA super performante soit contesté, DeepSeek R1 attire l’attention des géants du secteur pour sa méthode innovante et « frugale ».

Voulez-vous en savoir plus ? (Version IA beta)