Gemini partout

Capture d'écran 2024-04-11 191509

À l’occasion de sa convention annuelle, Google Cloud a présenté une batterie de nouveaux outils et fonctionnalités IA, dont le modèle Gemini 1.5 Pro.


L'événement Google Cloud Next 2024, en début de semaine à Las Vegas, a été l'occasion pour le groupe de présenter une foule de nouveaux services d’IA. Même dans son cœur de métier, la principale annonce de Google Cloud concerne l’IA : la plateforme Blackwell de Nvidia sera disponible sur Google Cloud début 2025, avec des serveurs GB200 pour l'entraînement de LLM toujours plus puissants.

Le modèle a des oreilles

En matière de LLM, Google continue d’exciter la curiosité sur Gemini 1.5 Pro, décrit comme le “modèle d'IA générative le plus capable” de Google. Il est désormais proposé en “prévisualisation” sur Vertex AI. Sa fenêtre d’attention peut comprendre jusqu'à 1 million de tokens, contre quelques dizaines de milliers pour ses rivaux (lire Qant du 16 février). On peut donc lui proposer, en guise de prompt, une heure de vidéo ou onze heures de fichiers audio, aussi bien que des images et du texte. Gemini Code Assist, nouveau nom de son assistant de code Codey, bénéficie déjà de cette fenêtre contextuelle d'un million de tokens.

La suite bureautique Google Workspace intègre Google Vids, une IA de création vidéo qui permet aux utilisateurs de réaliser des vidéos à partir du traitement de texte Docs et et du tableur Sheets, afin de faciliter la collaboration. De nombreuses autres mises à jour incluent des alertes personnalisables sur Sheets et la prise en charge des onglets dans Docs.

Monétisation

Google a aussi révélé des plans pour monétiser de nouvelles fonctionnalités d'IA pour Google Workspace, proposant des suppléments (“add-on packages”) à 10 dollars par mois et par utilisateur – un tiers du prix de son concurrent chez Microsoft, Copilot. Ces fonctionnalités comprennent une aide IA aux réunions et à la messagerie, ainsi qu'un package de sécurité IA.

Par ailleurs, Google a annoncé la disponibilité générale d’Imagen 2, son outil de génération d'images intégré à Gemini annoncé en décembre dernier (lire Qant du 22 décembre 2023). Depuis, la génération d’images par Google a fait débat : fin février, des hallucinations de Gemini générant des portraits anormaux au nom de la diversité avaient entraîné une suspension temporaire de la série de modèles (lire Qant du 23 février).

L’essentiel