- Meta a présenté ce week-end deux nouveaux modèles d’IA open source, Llama 4 Scout et Maverick. Ils alimentent déjà Meta AI sur WhatsApp, Messenger, Instagram et sur le web.
- Le modèle Llama 4 Scout est conçu pour tenir sur un seul GPU Nvidia H100, avec une fenêtre de contexte de 10 millions de tokens. Il surpasse selon Meta les modèles Gemma 3, Gemini 2.0 Flash-Lite et Mistral 3.1 sur de nombreux benchmarks.
- Le modèle Llama 4 Maverick, de taille supérieure, est comparé par Meta à GPT-4o et Gemini 2.0 Flash. Ses performances en codage et raisonnement seraient similaires à DeepSeek, avec moins de la moitié des paramètres actifs.
- Scout et Maverick ont été créés par distillation d’un troisième modèle, Llama 4 Behemoth, doté de 2 000 milliards de paramètres. Encore en phase d’entraînement, Behemoth bat déjà GPT-4.5 et Claude Sonnet 3.7 sur plusieurs benchmarks scientifiques, assure Meta.
- Tous les modèles Llama 4 disposent dans le réseau neuronal des couches de Mixture of Experts (MoE), pour activer uniquement les neurones nécessaires à chaque tâche et donc réduire les coûts d’utilisation.
- À SURVEILLER : LlamaCon. Meta prévoit de détailler sa stratégie IA le 29 avril, dans un contexte de concurrence croissante. Avec les géants chinois – outre Deepseek, Tencent, Alibaba et Baidu proposent tous des modèles open source – mais aussi américains : Behemoth devra se mesurer à GPT-5 et Claude 4.
Une nouvelle manade de Llamas atteint la Californie

Ce week-end, Meta a présenté les premiers modèles de la série Llama 4. De quoi faire face à DeepSeek, qui lui avait volé la vedette des modèles open source en début d’année.