Don : soutien financier
Flux RSS RSS (flux d'abonnement)

Fin de la réalité

jeudi 4 septembre 2025

2 septembre 2025

L’appareil photo ProRes Zoom du smartphone Google Pixel 10 permet de grossir "100× grâce à l’IA". Mais comment zoomer plus loin que le pixel de base de la résolution de l’image ? Les appareils photo-numériques ont un zoom optique, composé par les lentilles et les capacités physiques du matériel, et peuvent imprimer sur le capteur ce que l’appareil peut de plus fin. Ensuite, ils ont un zoom numérique qui peut aller au-delà, mais ne fait en réalité que grossir sur l’image la plus fine, et donc produit une image mal définie, floue. Ce qui revient à prendre une image et à la découper, cadrer ce qu’on veut, et on obtient une image plus petite, qu’on peut agrandir, mais ce qu’il y a dessus est définitif et maximal, c’est cadrer soi-même et a posteriori l’image nette à l’aide un logiciel comme celui de la galerie d’images par défaut. Jusqu’à 100×, c’est-à-dire 10000% de grossissement, on arrive habituellement, pour l’image ci-dessus, par exemple, à ceci :

Qui bien sûr est dans un contexte local (zoom 200×) qui permet de comprendre de quoi il s’agit :

Pour le Pixel 10, il faut cependant créer ici des détails, à l’intérieur des pixels, si l’on veut. C’est-à-dire que la fameuse IA va les prédire, par le mécanisme désormais bien connu de la réponse la plus probable ou la plus attendue par l’utilisateurice. Si la tache floue de quelques pixels de résolution, sans information lisible, ressemble à un chat, l’appareil zoomera sur un chat fabriqué. Quel chat ? Était-ce un chiot ? Si cela ressemble à une voiture au loin, quelle marque va inventer le Pixel 10 ? Et pour notre photo ici : quelle plante ? Les feuilles sont-elles constituées de plusieurs pétioles, ou alors ce sont plusieurs feuilles simples ? Sont-elles ovales, obovales, rhomboïdales ou lancéolées ? Est-ce une plante toxique ? A-t-elle pu servir à tuer le Docteur Lenoir ? Madame Rose, vous avez suivi des études de botanique quand vous habitiez au Brésil, n’est-ce pas ?

On voit encore mieux les limites avec un texte, des formes de lettres sont des formes géométriques quelconque, et deviner le texte le plus probable nécessite de savoir que c’est un texte, et ce qui est écrit non pas en fonction du contexte de l’image alentour, mais en fonction des formes elles-mêmes, c’est très difficile pour les générateurs d’images de faire ça, à moins de leur implanter un système spécifique, comme ça a été le cas sur certains outils, mais uniquement pour mieux traité le texte demandé au prompt, c’est-à-dire mieux écrire ce qui est demandé ("génère moi un salon de coiffure qui s’appelle Rat Tiboise"). Non, là il s’agit de lire ce qui est écrit, or c’est illisible, flou, donc même si on imagine une couche d’écriture en plus, l’IA cherchera le texte le plus probable. Donc inventera quelque chose. Voir ce blog qui fait précisément ce test.

Photo de boîte de jeux vidéos, comparatif de 3 images : zoom 100x par IA (détails déformés, lettres qui n’existent pas, ou formes recomposées qui ne sont pas du tout du texte, visages inexistants, dessin illisble), 100x sans IA (c’est juste flou), et gros-plan du présentoir (on peut lire les titres des jeux et reconnaître Mario sur un Kart)

Ce n’est donc pas la réalité qui est représentée. Ce que ça fait, c’est que ça retire la possibilité pour ses utilisateurices de photographier cette réalité. Les téléphones mobiles ont été, depuis qu’ils ont des caméras et appareils photo, les sources documentaires d’événements politiques importants et sans lesquels la vérité aurait été méconnue, voire pas connue du tout. Aux États-Unis, les émeutes racistes de Charlottesville, l’attaque du Capitol sur ordre de Trump, ou en France les images d’Alexandre Benalla qui était venu directement de l’Élysée pour tabasser des manifestants, et combien d’autres "bavures" policières (on pense à Nahel Merzouk). Ces nouvelles images ne pourront servir de témoignage.

Partager cet article

Un message, un commentaire ?

modération a priori

Ce forum est modéré a priori : votre contribution n’apparaîtra qu’après avoir été validée par les responsables.

Qui êtes-vous ?
Votre message

Pour créer des paragraphes, laissez simplement des lignes vides.

Je crée du contenu sur le web depuis 2001. Ici, il n'y a pas de vidéo, mais comme tout créateur de contenu, j'accepte le soutien mensuel, ou ponctuel.

Rien à voir, mais vous pouvez faire trembler la page.