L’art, l’IA et la nature

L’IA, artiste incompris • Qant, M. de R. avec Midjourney

Des poèmes plus émouvants, des visages jugés plus réels que nature, et même des blagues jugées plus drôles : les productions d’intelligence artificielle bousculent les critères d’authenticité et interrogent notre capacité à distinguer l’humain de la machine.

Une étude récente teste la capacité des lecteurs à différencier des poèmes écrits par une IA de ceux de poètes classiques (lire Qant du 18 novembre). Les participants, exposés à dix poèmes, ont souvent préféré les créations des IA, qu'ils jugeaient plus créatives, immersives et émotionnelles. Dans le cadre de leur recherche, les auteurs de l’étude ont analysé la capacité des lecteurs à distinguer des poèmes écrits par des auteurs classiques, comme Emily Dickinson ou William Shakespeare, de ceux produits par un modèle d’intelligence artificielle. Sur 1 634 participants, moins de la moitié (46,6 %) ont correctement identifié les œuvres générées par IA. Ce taux, inférieur au hasard statistique, illustre la difficulté à différencier les créations humaines des productions artificielles.

Fait notable, les participants ont jugé certains poèmes générés par l’IA comme étant plus « humains » que les œuvres réelles. Des critères comme le rythme, l’esthétique ou l’émotion perçue ont souvent obtenu de meilleurs scores pour les poèmes produits par la machine que pour ceux d’auteurs établis.

Biais d’origine

Les préférences des lecteurs pour les poèmes générés par IA s’expliquent par leur style souvent plus accessible et explicite. Contrairement à certaines œuvres humaines, parfois jugées complexes ou énigmatiques, les créations de l’IA tendent à privilégier des thèmes clairs et des structures rythmiques régulières. Ces caractéristiques séduisent particulièrement les lecteurs non spécialisés.

Cependant, lorsque les participants savaient qu’un poème avait été écrit par une IA, leurs évaluations devenaient plus sévères. Ce résultat met en évidence un biais de perception persistant : les œuvres artificielles sont jugées différemment en fonction de leur origine présumée. On peut dès lors débattre de la nécessité de signaler l’usage de l’IA dans la création d’œuvres, notamment pour préserver la transparence et éviter les perceptions biaisées.

Double aveugle

Pour parvenir à ces conclusions, les chercheurs ont mené deux expériences distinctes. La première consistait à présenter des poèmes, alternant entre créations humaines et d’autres générées par IA, et à demander aux participants d’identifier leur origine. La seconde visait à évaluer les œuvres sur des critères qualitatifs, tels que l’esthétique, la profondeur émotionnelle et la structure. Les résultats montrent que les poèmes complexes étaient souvent perçus comme artificiels en raison de leur difficulté d’interprétation. À l’inverse, les poèmes d'IA, caractérisés par une simplicité thématique et un style direct, étaient fréquemment considérés comme humains.

Les auteurs de l’étude soulignent que les progrès de l’IA remettent en cause la notion d’authenticité artistique, brouillant la distinction entre créativité humaine et production algorithmique. Alors que les modèles de langage deviennent de plus en plus sophistiqués, leur utilisation dans des contextes artistiques pourrait transformer les attentes des lecteurs et des spectateurs.

Heuristique insuffisante

Une autre étude datant de l’an dernier, menée par des chercheurs de Cornell et Stanford, révèle que les humains peinent à distinguer les textes générés par intelligence artificielle de ceux écrits par des humains. Dans six expériences impliquant 4 600 participants, les autoportraits verbaux – utilisés dans des contextes comme les rencontres en ligne, les candidatures professionnelles et les annonces – étaient correctement identifiés comme générés par IA seulement 50 % à 52 % du temps, un score équivalent au hasard. Les participants utilisaient des heuristiques intuitives, comme l’usage des pronoms personnels ou un ton chaleureux, pour juger de l’authenticité, mais ces indices s’avèrent facilement manipulables par les modèles d’IA.

Les chercheurs soulignent que ces biais cognitifs ouvrent la porte à des risques de manipulation et de désinformation, les modèles d’IA optimisés pouvant produire des textes perçus comme « plus humains que les humains ». Ils recommandent des solutions comme l’intégration « d’accents IA » dans les contenus générés pour les rendre immédiatement reconnaissables, ou une meilleure éducation du public aux limites de ses propres heuristiques inconscientes. Toutefois, ils notent eux-mêmes que l’efficacité de ces mesures pourrait être limitée face à l’évolution rapide des capacités des modèles d’IA.

Visages trompeurs

Au-delà du texte, la question se pose aussi sur les images générées par IA. Une étude menée par des chercheurs de l’université nationale australienne met en lumière un phénomène contre-intuitif : les visages générés par l'IA sont perçus comme plus « réels » que les visages humains eux-mêmes.

Un visage hyperréaliste • Qant, M. de R. avec Midjourney

Ce phénomène, baptisé « hyperréalisme IA », a été démontré à travers plusieurs expériences où les participants ont systématiquement jugé les visages IA, particulièrement les visages blancs, comme plus humains que les visages réels. L’étude attribue ce biais à l’entraînement des modèles génératifs sur des ensembles de données majoritairement composés de visages blancs, favorisant des caractéristiques moyennes qui amplifient leur réalisme perçu.

L’enquête a également révélé que les personnes les moins aptes à identifier les visages générés par IA étaient souvent les plus confiantes dans leur jugement. Parmi les attributs expliquant cette illusion, les visages IA se distinguent par leur symétrie, leur familiarité et leurs proportions idéales, mais sont perçus comme moins mémorables que les visages humains.

Rire jaune

De plus beaux poèmes, des visages plus humains et … un meilleur humour. En juillet dernier, une étude de l'université de Californie révélait que les blagues générées par IA sont jugées plus drôles que celles créées par des humains (lire Qant du 12 juillet).

Comparaison entre ChatGPT et des humains sur différents types d’humour (Source : D. Gorenz et al)

Les chercheurs de l'USC ont notamment observé que les modèles de langages utilisent principalement la reconnaissance de "patterns" pour produire de l'humour, alors que les comédiens s'appuient beaucoup sur la communication non verbale.

Si même l'humour est touché…

Pour en savoir plus :

L’essentiel