Résumé:
Les données de haute dimension ont été regroupées dans des zones que nous voulons découvrir, et chaque jour, la perception du cerveau de l'être humain est confrontée au problème de la réduction de la dimensionnalité pour trouver des structures significatives de basse dimension, cachées dans leurs observations de haute dimension. Le cerveau humain réduit la dimensionnalité des problèmes en fractions de seconde (reconnaissance des visages, textures, lettres, mots, scènes, etc ...). L'objectif pour le scientifique est donc similaire : réduire (projeter) des problèmes de haute dimensionnalité dans une basse dimensionnalité en gardant le maximum de modes de variabilité dans les données, afin de les traiter en un temps raisonnable avec ces dimensions réduites. Cependant, de nombreux ensembles de données contiennent des structures non linéaires qui sont invisibles pour les techniques classiques telles que l'analyse en composantes principales (ACP) et l'échelonnement multidimensionnel (MDS), ces deux méthodes ne parvenant pas à détecter les véritables degrés de liberté de l'ensemble des données. La structure sous-jacente des données, compte tenu des observations de haute dimension (difficiles à stocker, à traiter, à analyser et à visualiser sur le plan informatique), doit être réduite. Dans cette situation, le problème de la DR, connu sous le nom de Manifold learning, devient encore plus difficile, surtout lorsque la dimension d'entrée est très élevée.
Ce travail étudie une approche pour modéliser le problème de l'assemblage d'images afin de combiner plusieurs ensembles d'images des scènes naturelles, où chaque ensemble contient des images appartenant à la même représentation de la scène par des techniques de réduction de la dimensionnalité non linéaire. Notre objectif est d'identifier la suite d’images voisines parmi tous les ensembles d'images.
L'approche proposée s'appuie sur les progrès récents de l'apprentissage par les variétés qui permettent de découvrir des tendances non linéaires dans les données, mais notre cas est différent des approches NLDR utilisées, qui supposent que la correspondance est connue avant de calculer la distance du plus court chemin. Nous avons besoin d'un moyen de trouver la correspondance d'abord, avant de calculer la distance du chemin le plus court et la correspondance du collecteur. Pour ce faire, il est crucial d'employer une représentation d'ensemble d'images adéquatement flexible pour traiter la non-linéarité. {Vous parlez peut-être d'expériences}