Résumé:
Le travail effectué dans ce mémoire contribue à l'analyse perceptuelle pour la
reconnaissance d'une scène. Notre proposition prend en compte la segmentation (étiquetage
de chaque pixel) des images. À cette fin, nous avons proposé une architecture basée sur une
autre architecture déjà existante (AlexNet) permettant l’analyse et la reconnaissance de
scènes à partir d’une image importée. Les résultats sont préliminaires et sont étroitement liés
aux facteurs suivants:
1. Modifiez le téléchargement d'une base de données CIFAR-10 afin de minimiser la
grande quantité de données trouvées, réduisant ainsi le temps d'exécution du test.
2. Utilisation du logiciel de calcul mathématique matlab R2017a 4ème génération.
3. L'architecture utilisée pour la reconnaissance perceptuelle d'une scène et les
différents paramètres modifiés.
Ces trois éléments ont une influence directe sur les résultats obtenus par nos
recherches. Profitant du fait que ce domaine d’étude est encore en développement, nous
envisageons d’étendre cette étude en utilisant d’autres architectures de reconnaissance de
scène efficaces à partir d’une image importée, notamment l’utilisation de SeNet.
Après avoir beaucoup parlé d'architectures, nous pensons que le cœur de
l'apprentissage en profondeur réside dans: Comment construisons-nous ces réseaux?
Répondre à cette question nous aidera à développer la fiabilité de l'analyse perceptuelle pour
la reconnaissance de scène.