Résumé:
Ce travail est basé sur la détection et la catégorisation du contenu offensif et abusif dans les
commentaires arabes dialectal (dialect algérien en particulier). On se base sur Facebook, qui est
la plateforme des réseaux sociaux la plus utilisée en Algérie. De ce fait, nous avons utilisé une
base de données de plus 8,4k textes annotés en trois catégories telle qu’offensif, abusif et
normal. Cependant, nous avons utilisé plusieurs algorithmes d’apprentissage automatique
comme le SVM, le NB et le SGD. Cependant, nous avons obtenus des résultats remarquables
qui peuvent être plus amélioré par des recherches supplémentaires.