OpenAI a conclu ce jeudi un accord avec le groupe de médias News Corp, permettant l'accès aux archives et articles actuels de nombreuses publications, notamment le Wall Street Journal, le New York Post, le Times de Londres et le Daily Telegraph. Cet accord pluriannuel, estimé à plus de 250 millions de dollars sur cinq ans, donne à OpenAI l'accès aux articles des titres de News Corp ainsi qu'à leurs archives, pour entraîner ses modèles IA et répondre aux questions de leurs utilisateurs. Le groupe News Corp rejoint ainsi la liste de plus en plus longue des médias ou conglomérats ayant signé de tels accords avec OpenAI.
En fin d’année dernière, OpenAI avait ainsi conclu un accord similaire avec le groupe Axel Springer, notamment propriétaire des titres Bild Zeitung, Die Welt, Business Insider ou encore Politico (lire Qant du 14 décembre 2023). En mars dernier, c'est le quotidien français Le Monde qui avait ouvert la porte de la presse française à OpenAI, en permettant à l'entreprise de "s'appuyer sur le corpus du journal pour établir et fiabiliser les réponses de ChatGPT" (lire Qant du 14 mars). Le même jour, OpenAI avait annoncé un accord semblable avec l'espagnol Grupo Prisa, propriétaire de El Pais.
Hors médias traditionnels, c'est Reddit qui a donné il y a une semaine les clés de son API de données à OpenAI, pour lui permettre d'entraîner ses modèles sur les posts de ses utilisateurs (lire Qant du 21 mai).
Le NYT contre le reste du monde
Ces accords, et tous les autres (Financial Times, Associated Press : lire Qant du 30 avril) viennent chacun affaiblir un peu plus la position du New York Times, qui a intenté en fin d'année dernière un procès en droit d'auteur à OpenAI (lire Qant du 8 janvier). Le quotidien américain accuse OpenAI et Microsoft de violer les droits d'auteur en entraînant leurs modèles d'IA avec le travail de ses journalistes, et de donner accès à des articles protégés par le paywall du site.
Les déboires d’OpenAI avec le droit d’auteur, justement, ont été remis sur le devant de la scène ces derniers jours avec l’affaire opposant l’entreprise à la star américaine Scarlett Johansson. Il y a quelques jours, l'actrice a en effet accusé OpenAI d'avoir utilisé ses enregistrements publics pour créer Sky, une des voix du nouveau ChatGPT (lire Qant du 22 mai), alors qu'elle avait décliné la proposition de Sam Altman. OpenAI avait alors nié toute intention de copier sa voix et a suspendu l'utilisation de Sky pour éclaircir la situation.
Un droit d’auteur de la voix ?
Hier, le Washington Post a ajouté une nouvelle pierre à la polémique, en affirmant qu'OpenAI avait "casté" l'actrice dont la voix a été utilisée pour Sky plusieurs mois avant que Sam Altman ne contacte Scarlett Johansson. De plus, l'entreprise n'aurait pas cherché spécifiquement une actrice ayant une voix ressemblant à celle de l'actrice. La ressemblance entre les deux voix serait donc le fruit du hasard. La voix de Johansson avait notamment été utilisée dans Her, un film sorti en 2013 dans lequel un homme tombe amoureux d'une intelligence artificielle. La présentation de GPT-4o la semaine dernière y faisait explicitement référence (lire Qant du 14 mai).
Au-delà de la polémique, l'enjeu de l'affaire Johansson-OpenAI est celui du contour des droits d'auteurs et de leur respect. "La voix n'est pas protégée par le droit d'auteur", explique l'avocat Gilles Rouvier, président de l'association Cyberlex : "Il semble clair que le problème de la licéité du jeu d'entraînement s'est ouvert désormais au-delà des œuvres de l'esprit, vers le droit à l'image et les attributs de la personnalité. Il faudra peut-être aller vers la création d'un droit nouveau, spécifique aux IA." En attendant, OpenAI continue de profiter du flou, et fait fi des polémiques, et des procès.
Pour en savoir plus :