Google crée à tout va

18 décembre 24

Google lance Veo 2, la dernière version de son modèle de génération de vidéo, ainsi que Whisk, un modèle image-to-image basé sur Imagen 3. Les performances éclipsent Sora et tous les modèles du marché.

Après Gemini 2.0, Google DeepMind vient de présenter Veo 2, la version améliorée de son modèle de génération vidéo. Capable de produire des vidéos 4K d’une durée de deux minutes, il surpasse largement Sora d’OpenAI: 4 fois la résolution et 6 fois la durée.
DeepMind affirme également que Veo 2 propose une meilleure gestion des dynamiques physiques, de la lumière et des mouvements complexes mais surtout de la cohérence et de la continuité. Comparé à ses principaux concurrents – outre Sora, on peut citer parmi les plus avancés : Runway, Luma, Pika, Hunyuan et Hailuo – Veo 2 semble être le seul modèle qui suit réellement la scène au fur et à mesure qu'elle se déroule.
Le modèle ne sera déployé que progressivement. Il n’est disponible pour l’heure que dans l’outil expérimental VideoFX, actuellement limité à des vidéos de 720p et huit secondes. Une intégration à Vertex AI est prévue l’an prochain.
Google a également lancé Whisk, un outil permettant de générer des images à partir d’autres images en guise de prompts. Basé sur la dernière version du modèle Imagen 3, Whisk se veut un outil d’exploration visuelle rapide, non destiné à des retouches précises.
À SURVEILLER : La contre-attaque de l’empire et le retour du jedi. Depuis 2023, Google et OpenAI se livrent à une guerre de communication sur l’IA. Les succès de ChatGPT et les déboires de Bard ont jusqu’à présent toujours fait triompher David sur Goliath. Mais Veo 2 est clairement supérieur à Sora, qui de plus a fait tomber ChatGPT après son annonce (lire Qant du 13 décembre). Pour éviter un échec sans précédent, OpenAI devra relever le gant vendredi soir, au dernier jour de son “calendrier de l’Avent”.

Plus sur IA

La lente genèse de la vidéo générative
IA
La lente genèse de la vidéo générative

Une multitude de modèles récents permettent de générer des vidéos à partir de simples descriptions textuelles : tous les géants de la tech, américains et chinois, prennent position face à une nuée de start-up. Alors que les capacités techniques, la qualité des rendus et les usages varient sensiblement d’un outil à l’autre, deux start-up seulement semblent à même de résister.
Jamais un coup de dés n'abolira le hasard
IA
Jamais un coup de dés n'abolira le hasard

S’inspirant de Mallarmé pour son titre, une étude française met en lumière les limites structurelles des modèles génératifs appliqués à la finance. Elle recherche une architecture adaptée à la génération de données synthétiques pour la gestion de portefeuille.
OpenAI aimerait briquer les Chrome de ChatGPT
IA
OpenAI aimerait briquer les Chrome de ChatGPT

Le procès antitrust contre Google jette une lumière inattendue sur les projets grand public d’OpenAI.
Claude, le gendre idéal
IA
Claude, le gendre idéal

Anthropic a analysé plus de 300 000 conversations entre des utilisateurs et son assistant Claude pour cartographier les valeurs que le modèle exprime dans ses réponses. L’étude dessine les contours d’une morale algorithmique, pragmatique et contextuelle.

L’essentiel

IA
Perplexity se joint à la curée contre Google

25 avril 25
Lors du procès antitrust intenté par le département américain de la Justice contre Google, un dirigeant de Perplexity AI a affirmé que les contrats de Google avec Motorola empêchent l’entreprise d’installer son assistant IA par défaut sur les nouveaux appareils. L’application de Perplexity est bien préinstallée, mais non visible sur l’écran d’accueil, en raison des obligations contractuelles de Motorola envers Google. La start-up, qui cherche à étendre sa distribution, dénonce la domination de Google dans la recherche et l’IA sur Android, et affirme que ses négociations avec les fabricants n’ont été possibles que sous la pression du procès en cours. En savoir plus…
IA
Les AI Doomers, alliés d’Elon Musk contre OpenAI

25 avril 25
Un groupe de plus de 30 experts en intelligence artificielle, dont neuf anciens employés d’OpenAI, a publié une lettre ouverte pour s’opposer à la restructuration de l’entreprise qui viserait à lui faire perdre son statut de contrôle par une organisation à but non lucratif. Les signataires incluent Geoffrey Hinton, pionnier de l’apprentissage profond et prix Turing, Margaret Mitchell, responsable éthique chez Hugging Face, et Stuart Russell, professeur d’informatique à l’université de Berkeley, tous engagés sur les risques sociétaux de l’AGI. Elon Musk a notamment lancé un procès dans le même but, après avoir signé la première déclaration appelant à une "pause" face aux progrès trop rapides du secteur en 2023 (lire Qant du 29 mars 2023). En savoir plus…
IA
Une API pour les images de ChatGPT

25 avril 25
OpenAI a ouvert aux développeurs l’accès via API à son nouveau générateur d’images, basé sur le modèle multimodal gpt-image-1, intégré à ChatGPT depuis fin mars. Capable de produire des images réalistes dans divers styles, ce modèle permet de personnaliser le rendu, la qualité et la modération des contenus générés, tout en incluant un filigrane numérique C2PA pour signaler l’origine IA. Le tarif varie selon la qualité, de 2 à 19 centimes par image. Des entreprises comme Adobe, Canva, Wix ou Instacart expérimentent déjà son intégration dans leurs services. En savoir plus…
IA
Apprendre l’IA, mais pas à Harvard

25 avril 25
Donald Trump vient de signer une batterie de décrets pour réformer l’enseignement supérieur et mettre au pas les meilleures universités des États-Unis. Dans le lot, un groupe de travail (task force) sur l’éducation à l’IA est créé à la Maison Blanche, pour coordonner des partenariats public-privé, soutenir la formation des enseignants à l’IA et élargir les programmes de certification en IA. En savoir plus…
IA
Le Washington Post caresse ChatGPT

24 avril 25
OpenAI a conclu un partenariat avec le Washington Post, qui permet à ChatGPT de résumer et de renvoyer vers les articles du journal dans ses réponses. Cet accord s’inscrit dans une série de collaborations avec plus de 20 éditeurs, comme Le Monde, et même investi dans Axios. Les conditions financières de l’accord n’ont pas été divulguées. En savoir plus…

L’essentiel

Perplexity se joint à la curée contre Google

Les AI Doomers, alliés d’Elon Musk contre OpenAI

Une API pour les images de ChatGPT

Apprendre l’IA, mais pas à Harvard

Le Washington Post caresse ChatGPT