Générateurs d'images et archéologie

Mis à jour le 3 mars 2024 à 15:10

Utilisées pour illustrer un cours, faire des affiches à destination du public ou élaborer des hypothèses de reconstitution de sites et d'environnements, les IA permettant de générer des illustrations à partir d'un prompt ou d'autres images sont de plus en plus utilisées en archéologie.

Dans le domaine de la recherche, l'art génératif est notamment employé pour imaginer ce qu'a pu être l'environnement d'un site. Effectivement, lorsque les données environnementales dont l'archéologue dispose sont suffisantes, ce dernier peut alors rédiger un prompt apportant les informations nécessaires à l'IA pour qu'elle puisse élaborer un environnement probable. Par exemple, ces données peuvent correspondre à la densité arboricole, aux essences d'arbres documentées et de manière générale à la végétation supposée, aux cours d'eau passant près du site, aux ressources naturelles présentes, etc. Des IA génératives comme Bing Image Creator (Microsoft) ou DALL-E (OpenAI) peuvent permettre d'aboutir à certains résultats. L'obtention d'une image représentant un environnement probable n'est jamais obtenue au premier essai. Le prompt doit être réélaboré plusieurs fois, en prenant en considération les hallucinations de l'IA, ses imprécisions ou encore en insistant davantage sur certains détails.

Les images ci-dessous ont été élaborées à partir du prompt suivant sur Bing Image Creator : "Environnement d'un temple romain à midi. Un cours d'eau passe à côté. Il y a plusieurs espèces d'arbres. Des Romains sont présents autour." Ce prompt ne se base sur aucune donnée archéologique, mais donne déjà une première idée de ce qui peut être fait à l'aide d'une Intelligence Artificielle générative. Nous pouvons observer qu'en l'absence d'informations plus précises sur le temple, ce dernier peut être représenté en ruines et est archéologiquement faux. De plus, l'IA semble avoir majoritairement ignoré la dernière directive, à savoir la présence de Romains autour du temple, si ce n'est sur la deuxième figuration. Quant à la végétation, puisqu'elle n'avait pas plus de précisions, celle représentée ne se base pas sur la réalité, mais est composée de plusieurs essences d'arbres, comme cela lui a été demandé. D'autres essais, avec un prompt plus précis, incluant des données archéologiques, seraient nécessaires pour obtenir des résultats probants pour la recherche.

Différentes hypothèses d'environnement d'un temple romain élaborées à partir d'un prompt très simple

Des IA génératives multimodales, comme le logiciel libre Stable Diffusion, peuvent être plus pertinentes pour la recherche. Effectivement, Stable Diffusion prend également en données d'entrée des images desquelles il va pouvoir s'inspirer pour créer une représentation de l'environnement souhaité. Par exemple, apporter à l'IA la photographie de l'environnement actuel d'un site et des structures archéologiques qui s'y trouvent encore peut être un bon début.

A ce propos, Stable Diffusion peut être employé pour des reconstitutions hypothétiques de bâtiments, en lui fournissant notamment des plans, des photographies de l'état actuel de la structure, des hypothèses de reconstitution graphiques déjà élaborées, des exemples d'autres bâtiments du même type, etc. De même, le premier essai ne sera certainement pas concluant, mais multiplier les tentatives pourra permettre d'aboutir à des résultats plus probants. Ce logiciel permet également d'obtenir de courtes vidéos entièrement élaborées par l'Intelligence Artificielle, par exemple un survol au-dessus d'un paysage reconstitué.

D'autres logiciels permettent de générer de courtes vidéos à partir d'un prompt, telles que Pika et Google Research Lumiere.

Le risque de ce type d'IA est d'être tenté de voir dans ces images produites des instantanés de l'époque et d'oublier que nous sommes face à des reconstitutions hypothétiques présentant leur lot d'imprécisions, d'erreurs et de subjectivité. Nous pourrions y rattacher le concept d'hyperréalité élaboré, entre autres, par le philosophe français Jean Baudrillard. Ce concept désigne le remplacement de la réalité par l'imaginaire ou la confusion des deux par notre conscience, lorsque ce dernier lui paraît plus beau, plus confortable, plus réel que le réel. Jean Baudrillard le désigne plus précisément comme "la simulation de quelque chose qui n'a jamais existé". Dans le sujet qui nous intéresse, ceci reviendrait à considérer les images produites par l'Intelligence Artificielle comme la réalité. Or, nous devons prendre les résultats obtenus pour ce qu'ils sont : des hypothèses qui auront pour beaucoup peu de chances de dépasser ce stade.