« Inceptionisme », le Neuron-Art selon Google

Les réseaux de neurones artificiels reviennent en force sur la scène de l’intelligence artificielle grâce à Google !

Par Thierry Berthier et Éloïse Berthier1

google logo in building credits Robert Scoble  (CC BY 2.0)
google logo in building credits Robert Scoble (CC BY 2.0)

 

Développés dans les années 1940 puis délaissés durant de nombreuses années, les réseaux de neurones artificiels (RNA)2 reviennent en force sur la scène de l’intelligence artificielle depuis les années 1990. Ils sont aujourd’hui à l’origine de progrès spectaculaires réalisés dans les domaines de la classification automatique, de la reconnaissance d’image et de la reconnaissance vocale. Google les utilise massivement dans ses processus d’apprentissage automatisés (machine learning) et parvient aujourd’hui à construire des outils capables de reconnaître quasiment sans erreur le type de sport pratiqué à partir d’une simple vidéo.

Les RNA parviennent à reproduire certaines capacités de l’intelligence humaine à partir de neurones formels dont le fonctionnement est calqué sur celui des neurones biologiques. Il s’agit avant tout d’une tentative de modélisation des mécanismes élémentaires du cerveau humain dans ses capacités d’apprentissage, de mémorisation et de traitement de l’information.

Le principe de fonctionnement du réseau de neurones artificiels

Le neurone artificiel est constitué d’un vecteur poids w, d’un biais b et d’une fonction d’activation f.
Il prend en entrée un vecteur p et renvoie en sortie la quantité f ( ∑ pi wi – b ). La fonction d’activation f imite en général la réponse électrique (potentiel d’action) d’un neurone biologique (Fig 2).

berthier 1
Fig 1 – Modèle de neurone artificiel

 

berthier 2
Fig 2 – Exemples de fonctions d’activation f utilisables

Les neurones sont ensuite associés pour former une couche qui accepte en entrée le vecteur p et donne en sortie le vecteur a (Fig 3).

berthier3
Fig 3 – Modèle d’une couche de neurones artificiels

Enfin, les couches de neurones sont connectées entre elles pour former le réseau final.
La force du réseau de neurones réside dans sa capacité d’apprentissage à partir d’exemples pour lesquels l’entrée et la sortie souhaitée sont connus. Cette phase s’apparente à un entraînement durant lequel le réseau ajuste ses paramètres pour corriger ses erreurs et devenir plus performant sur les futures données d’entrée.

Que sait faire un réseau de neurones ?

Dans les faits, le réseau de neurones est capable de classer de manière automatique des éléments d’un ensemble en différentes catégories. Il est par exemple capable de reconnaître des caractères manuscrits et est couramment utilisé par la poste pour lire les codes postaux des enveloppes.

Il permet également de construire des prévisions s’appuyant sur un jeu de donnée de départ. Enfin, il s’avère particulièrement performant pour la reconnaissance automatique de formes, d’images et de sons. C’est précisément dans ce domaine que Google l’utilise actuellement.

Quand Google « retourne » et questionne son réseau de neurones…

Une équipe d’ingénieurs de la firme américaine vient de publier une étude passionnante3 sur la capacité d’apprentissage et d’interprétation de formes à partir d’une image d’entrée. Au cours de plusieurs expériences, un réseau de neurones comportant une quarantaine de couches est entraîné sur des millions d’images puis est utilisé à l’envers pour chercher à partir d’une réponse connue quelle image d’entrée convient le mieux pour obtenir cette sortie. Les ingénieurs observent ensuite l’interprétation d’une image d’entrée faite par les couches intérieures du réseau en amplifiant les réponses de certaines couches4. Des détails infinitésimaux de l’image initiale sont amplifiés et réinterprétés de manière itérative pour fournir des images de sortie souvent totalement inattendues. Dans les faits, le réseau interprète et perçoit des motifs invisibles pour l’humain dans l’image initiale. Cela ressemble aux jeux d’enfants consistant à observer un nuage et à imaginer les formes animales qu’il contient. L’interprétation résulte d’une alchimie subtile naissant dans les couches internes du réseau et de son corpus de connaissances issues de son entraînement initial. Comme pour un jeune enfant qui aurait été élevé au milieu d’animaux, le réseau développe certains tropismes en fonction de sa base de connaissance. Il tend à interpréter les formes comme des animaux5. Les données stockées le sont à un haut niveau d’abstraction ce qui lui permet de percevoir des formes « chimériques » complexes.

Un aperçu de la galerie d’interprétation du réseau 

Au-delà de l’interprétation algorithmique, le réseau fait preuve d’une « imagination » qui se situe entre le rêve, le mirage et l’hallucination psychédélique. On peut y voir aussi une forme de créativité artistique (le neuron-art) qui émerge de l’inconscient du réseau… Une fois de plus, Google met en lumière une composante en devenir de l’intelligence artificielle. Les spécialistes des systèmes complexes ne manqueront pas d’associer les interprétations du réseau à un phénomène relevant de l’émergence systémique. Ceux des sciences cognitives évoqueront l’effet des biais cognitifs acquis durant la phase d’entraînement à l’image de ce qui se produit durant la phase d’apprentissage de la petite enfance chez l’humain. Cette étude remarquable vient illustrer une fois de plus la réalité et la puissance de la convergence NBIC dans la fusion du I (Informatique) et du C (sciences cognitives).

berthier4

berthier5

berthier6

berthier7

Berthier8

  1. Éloïse Berthier a travaillé cette année sur les réseaux de neurones.
  2. La page wikipédia sur les réseaux de neurones artificiels.
  3. L’article grand public du groupe d’ingénieurs de Google
  4. Les articles de recherche publiés sur le sujet :
    http://arxiv.org/pdf/1412.1897v4.pdf
    http://arxiv.org/pdf/1412.0035v1.pdf
    http://arxiv.org/pdf/1506.02753.pdf
    http://arxiv.org/pdf/1312.6034v2.pdf
  5. La galerie d’images réinterprétées par le réseau de neurones.