Un Flash éblouissant chez Google

17 décembre 24

Google a présenté Gemini 2.0 Flash, premier modèle de la série Gemini 2.0. Il devient pleinement multimodal et se veut le modèle de référence pour les agents d’IA qui commencent à apparaître. Avec de bonnes chances de réussite.

Google a présenté Gemini 2.0 Flash, un nouveau modèle d’IA multimodal, capable de générer du texte, des images et de l’audio, et d’accepter des vidéos en input. Il est à la fois plus puissant et plus rapide que Gemini 1.5 Pro 002, le plus fort des Gemini jusqu’à présent, avec un score de 76,4 % sur MMLU-Pro, 92,9% sur Natural2Code et 89,7 % sur Math, pour citer les tests les plus courants.
Après les déboires de Gemini, épinglé en février pour avoir notamment représenté des soldats nazis noirs (lire Qant du 23 février), Google a commencé à tester ses modèles sur la “factualité”, le respect des faits, où le nouveau modèle obtient un score raisonnable de 83,6 %.
Google Deepmind déclare que son objectif à long terme est de créer des agents d'intelligence artificielle utiles dans tous les domaines.
Par exemple, Jules, un agent de code expérimental alimenté par Gemini 2.0, s'intègre directement dans un flux de travail GitHub. Il peut s'attaquer à un problème, développer un plan et l'exécuter, le tout sous la direction et la supervision d'un développeur. Gemini 2.0 peut non seulement écrire du code, mais l’exécuter.
Astra, qui avait fait sensation au printemps lors de Google I/O, utilise Gemini 2.0 pour offrir une assistance visuelle, permettant d’identifier des objets, de donner des indications et d’aider à localiser des objets personnels.
Mariner propose une navigation web automatisée via une extension Chrome, avec des applications dans l’exécution de tâches complexes sur le navigateur.
Avec l’éditeur de jeux vidéos Supercell, Google développe des agents pour conseiller les joueurs. Ces agents se basent exclusivement sur l’écran du joueur, ses instructions orales et la recherche sur Internet.

Gemini 2.0 renforcera l'intégration de l’IA dans les principaux outils de Google : la recherche sur Internet (“Search”) et la suite bureautique Workspace. Les abonnés payants à Gemini Advanced, par exemple, peuvent avoir accès à des fonctions de “recherche profonde” : Deep Research agit comme un assistant de recherche personnel, qui crée un plan de recherche en plusieurs étapes basé sur la requête de l'utilisateur, l’exécute sur le web, trouve des informations pertinentes et lance de nouvelles recherches en fonction de ses résultats. Il répète ce processus plusieurs fois, en affinant continuellement son analyse, puis compile un rapport complet des principaux résultats, avec des liens vers les sources originales.
Les nouveaux modèles font montre également de capacités en informatique spatiale, calculant aisément les positions d’objets dans les images (vidéo ci-dessous). Un signe de plus que Large World Models, comme ceux développés par Niantic ou Fei Fei Li, représentent un avenir potentiel de l’IA après l’IA générative.
À SURVEILLER : Des agents plutôt que des performances. Comme prévu, les performances Gemini 2.0 ne constituent pas une rupture mais une amélioration progressive. Tous les grands modèles semblent se heurter à ce plafond, qui déplace la lutte vers le terrain des applications : chain-of-thought pour o1 d’OpenAI, agents d’IA pour Google. Seul Orion/GPT-5 pourrait changer la donne si, comme certains le pensent, le présente comme bouquet final de son “calendrier de l’Avent”, la semaine prochaine.

Plus sur IA

L’IA pourrait éroder la valeur du travail et augmenter les inégalités
IA
L’IA pourrait éroder la valeur du travail et augmenter les inégalités

Alors que les premières études sur l'IA suggéraient qu'elle pourrait combler les écarts de compétences professionnelles et jouer un rôle d'égalisation, des données plus récentes indiquent que les personnes les plus performantes obtiendront de nouveaux “superpouvoirs” qui leur permettront de réaliser une croissance des revenus beaucoup plus importante que les autres. Les entreprises et les travailleurs devront se préparer en conséquence.

Par Azeem Azhar et Chantal Smith (Exponential View)
L'IA cherche, mais cite mal : les limites des moteurs de recherche génératifs
IA
L'IA cherche, mais cite mal : les limites des moteurs de recherche génératifs

Une étude de l’université Columbia révèle que les moteurs de recherche basés sur l'IA peinent à citer correctement leurs sources, présentant souvent des réponses erronées avec une confiance trompeuse. Grok et Gemini remportent le bonnet d’âne.
Alibaba dévoile une IA capable de lire les émotions
IA
Alibaba dévoile une IA capable de lire les émotions

Le groupe chinois Alibaba a lancé R1-Omni, un modèle d'intelligence artificielle capable d'analyser les expressions du visage humain, à partir de vidéos.
Des idées pour un Plan d’Action pour l’IA
IA
Des idées pour un Plan d’Action pour l’IA

Google et OpenAI ont soumis leurs propositions pour le futur AI Action Plan de Donald Trump.

L’essentiel

IA
Une IA pour les gamers

14 mars 25
Dès avril, les testeurs Xbox Insiders pourront essayer Copilot for Gaming, un assistant IA intégré à l’application mobile Xbox. Cet outil proposera des suggestions tactiques en jeu. Copilot pourra observer l’écran du joueur et fournir des indications en temps réel. Microsoft prévoit d’élargir ses fonctionnalités progressivement, mais le premier test servira à affiner l’outil avant un déploiement sur d’autres supports. En savoir plus…
IA
L’Espagne serre la vis sur l’IA

14 mars 25
Le Conseil des ministres espagnol a approuvé un projet de loi imposant des amendes allant de 7,5 millions à 35 millions d'euros (ou jusqu’à 7 % du chiffre d’affaires mondial) aux entreprises d’IA qui ne signalent pas clairement les contenus générés artificiellement, notamment pour limiter les deepfakes. Inspirée de l’AI Act européen, la loi interdit aussi l’usage de techniques subliminales qui manipulent les décisions des utilisateurs et l’exploitation de données biométriques à des fins discriminatoires. Elle doit encore être validée par le parlement espagnol. En savoir plus…
IA
L’Europe découvre Operator

14 mars 25
L'agent Operator d'OpenAI, lancé fin janvier et capable d'exécuter des tâches sur le web comme réserver un restaurant ou effectuer des achats en ligne, est désormais accessible aux utilisateurs de l'abonnement ChatGPT Pro dans l'Union européenne, la Suisse, la Norvège, le Liechtenstein et l'Islande. En savoir plus…
IA
Salesforce mise sur Singapour

13 mars 25
Salesforce va investir 1 milliard de dollars à Singapour sur cinq ans pour accélérer l’adoption de l’IA. Cet investissement vise à soutenir le déploiement d’Agentforce, l'outil d’IA de Salesforce destiné aux entreprises. Salesforce, qui opère à Singapour depuis 25 ans, développe également des technologies avancées dans son centre de recherche local. En savoir plus…
IA
Anthropic perce le plafond de verre

13 mars 25
Anthropic a atteint un chiffre d’affaires annualisé de 1,4 milliard de dollars début mars, en hausse de 40 % par rapport à fin 2024, selon The Information. À ce rythme, l’entreprise pourrait générer entre 2 et 4 milliards de dollars en 2025. La start-up, valorisée 61,5 milliards de dollars, a récemment levé 3,5 milliards lors d’un tour de financement en mars. Google détient 14% de ses actions, mais sans droit de vote ni présence au conseil. En savoir plus…

L’essentiel

Une IA pour les gamers

L’Espagne serre la vis sur l’IA

L’Europe découvre Operator

Salesforce mise sur Singapour

Anthropic perce le plafond de verre