Résumé:
Afin de surmonter les problèmes liés à reconnaissance de l’écriture arabe manuscrite à savoir la segmentation, temps de calcul et la classification. Nous proposons dans cette thèse deux contributions de reconnaissance globale des mots arabes manuscrits dans un vocabulaire limité :
Dans la première contribution, nous avons développé une étude comparative entre deux systèmes le premier basé sur les modèles de Markov cachés discrets (DHMMs) avec le développement d’un nouveau algorithme de quantification vectorielle wk-means utilisé pour la première fois dans le domaine de la reconnaissance de l’écriture, le deuxième système est basé sur les modèles de Markov cachés continus (CHMMs). Pour les deux systèmes après une série de prétraitements, l'image du mot à reconnaître sera segmentée de droite à gauche en une suite de trames de taille fixes ou variables en utilisant la technique de la fenêtre glissante afin de générer une séquence de vecteurs de paramètres statistiques et structurelles laquelle sera soumise à deux classifieurs de type HMM (DHMMs, CHMMs) pour identifier le mot. Deux types d’apprentissage sont utilisés l’apprentissage global et embarqué. La discrimination du mot est effectuée sur la base d’un critère du maximum de vraisemblance en utilisant une version modifiée de l’algorithme de Viterbi.
Dans la deuxième contribution, nous présentons des systèmes de reconnaissance globale des mots arabes manuscrits. Nous nous concentrons sur les deux phases d'extraction des caractéristiques et de la classification. Nous avons utilisé une combinaison de trois types de caractéristiques pour mieux représenter le mot à savoir : statistiques, structurelles et les moments de Hu et Zernike. Ces caractéristiques qui représentent les mots, sont extraites pour être utiliser comme entrée, de manière individuelle ou combinée des quatre classifieurs utilisés dans notre contribution : les modèles de Markov cachés continus (CHMMS), les Machines à Vecteurs de Support (SVM), algorithme du K plus proche de voisin flou (FKNN) et réseaux de neurones à fonction de base radiale utilisant l’algorithme d’orthogonalisation des moindres carrés (OLS) (RBFNNs-OLS). Les résultats des classifieurs sont combinés en utilisant les règles de combinaison suivantes : le simple vote, règle du comportement d’espace des connaissances (BKS), règle de Dempster, règle minimum, règle maximum, règle somme, règle moyenne, règle produit, théorie de Bayes.
Pour illustrer l'efficacité des systèmes proposés, nous avons réalisé des expériences significatives sur la base de données de référence IFN/ENIT.