Résumé:
Le cross-site scripting (ou XSS en abrégé) est l’une des attaques les plus anciennes et
les plus dangereuses menaçant la confidentialité des données et la navigation en ligne
des applications Web de confiance. Depuis sa révélation, vers la fin de l’année 1999 par
des ingénieurs en sécurité de Microsoft, plusieurs approches, techniques et outils ont
été développés dans le but de sécuriser la navigation web et de protéger les applications
web contre ce type d'attaques. Le problème s’est aggravé avec l’émergence rapide des
technologies Web avancées et des nouveaux styles de programmation. Dans ce projet,
nous contribuons en explorant la capacité des modèles d’apprentissage automatique
pour la détection des attaques XSS. Nous recueillons un ensemble de données de taille
raisonnable, composé de scripts bénins et de vecteurs d’attaques XSS. Nous accordons
une grande importance à l’ingénierie des caractéristiques et aux modèles supervisés
traditionnels pour leur simplicité et leur interprétabilité. L’étude menée a montré que
KNN surpasse tous les modèles existants et atteint plus de 99% en termes de mesure
F1