Résumé:
Devant l'augmentation énorme du volume de documents arabe sur Internet, e-mail, l'intranet
des entreprises et les bibliothèques numériques, l'accès aux données d'une façon précise et
rapide devient très difficile. La catégorisation manuelle des textes dans ce cas est très difficile
même s'il est possible elle infect l'efficacité, la rapidité et le coût. Pour cela il est donc
nécessaire de développer des programmes de catégorisation automatique.
Cet article propose une méthode de catégorisation des textes arabes en utilisant les Support
Vector Machine (SVM) qui est basée sur l'apprentissage automatique. Un prétraitement
linguistique et statistique est effectué afin d'adapter les techniques SVM aux texte arabe,
ensuite un model de catégorisation est générer à partir d'un processus d’apprentissage
automatique avec SVM .