Deep Dream est une technique de vision par ordinateur popularisée par Google en 2015, bien que développée antérieurement par Alexander Mordvintsev. Elle permet de générer des images hallucinatoires en amplifiant les motifs que les réseaux neuronaux ont appris à reconnaître. L'article présente un tutoriel pratique utilisant TensorFlow et le modèle InceptionV3 pré-entraîné sur ImageNet, avec une implémentation détaillée dans Google Colab.
La méthode consiste à extraire les activations de couches intermédiaires spécifiques du réseau neuronal, notamment mixed3 (détectant les formes simples comme les lignes et textures) et mixed5 (reconnaissant des motifs complexes comme les yeux ou les pattes). En calculant le gradient de la perte par rapport à l'image d'entrée et en appliquant une descente de gradient, on amplifie progressivement les caractéristiques détectées par ces couches, transformant ainsi une image normale en une vision onirique.
L'article détaille chaque étape technique : importation des bibliothèques, chargement du modèle, prétraitement de l'image, calcul des activations, implémentation de la fonction de perte et optimisation par gradient. Le code fourni permet d'exécuter le processus sur 8000 époques avec un taux d'apprentissage de 0,0001, produisant des transformations visuelles progressives où les motifs reconnus par le réseau s'intensifient à chaque itération.
Cette démonstration illustre comment les réseaux neuronaux peuvent révéler leur 'imagination interne' en projetant leurs représentations apprises sur des images d'entrée, créant ainsi des œuvres artistiques algorithmiques uniques qui défient la frontière entre perception artificielle et créativité computationnelle.