Résumé:
Les modèles quantitatifs de QSAR présentent une solution statistique du problème de la
difficulté du calcul direct des propriétés physiques et biologiques à partir de la structure.
L’intérêt d’un modèle de QSAR est de tirer des informations à partir de l’ensemble des
descripteurs numériques caractérisant la structure moléculaire et prédire ainsi les activités
biologiques de nouvelles structures.
Cette thèse décrit, en deux parties, la méthodologie employée pour obtenir des relations
quantitatives, structure-activité, et pour le développement des modèles QSAR à partir de
différents ensembles de molécules.
La première partie est divisée en trois chapitres : le premier chapitre rapporte des généralités
sur les composés naturels ( xanthones, flavanoides, curcuminoides), le second chapitre décrit
la méthodologie de QSAR et le troisième chapitre rapporte une introduction générale sur les
descripteurs moléculaires calculés à partir du serveur E-DRAGON1.
La seconde partie est consacrée pour l’application de la méthodologie de QSAR, pour
modéliser l’activité inhibitrice de l’α-glucosidase, exprimée par la grandeur IC50, à partir d’un
ensemble de 57 molécules, dérivés des xanthones et curcuminoides en utilisant la méthode de
régression linéaire multiple et les algorithmes génétiques sont utilisés dans le développement
des modèles en tant que méthode d’apprentissage et de sélection respectivement.
Deux modèles de QSAR sont développés, le premier modèle est obtenu par l’utilisation de la
totalité des descripteurs issus de E-DRAGON1, alors que le deuxième modèle est obtenu en
utilisant seulement les descripteurs de la famille 3D-MoRSE.
Les résultats obtenus de la validation et l’analyse des valeurs résiduelles normalisées prouvent
la validité, la stabilité et la robustesse des deux modèles obtenus. Ils peuvent expliquer la
variance des valeurs de l'activité biologique observées avec des pourcentages de 85,7% et
80,5 % respectivement.
Résumé 2009
Page | vi
Une deuxième étude de QSAR est réalisée sur un ensemble de 24 composés dérivés de
flavonoïdes afin de modéliser leur activité inhibitrice contre le VIH1 (exprimée par la
grandeur pIC50).Une étude comparative a été réalisée entre les deux méthodes de sélection :
les algorithmes génétiques (GA) et l’algorithme ascendant pas à pas (Forward Stepwise).
Le modèle obtenu par GA a donné les meilleurs paramètres statistiques, pour modéliser
l’activité pIC50, par rapport à l’algorithme ascendant. Le modèle proposé a prouvé sa
robustesse, sa bonne précision ainsi qu’une bonne stabilité après vérification par la validation
interne et externe. Il peut expliquer plus de 88% de la variance des valeurs de l'activité
biologique observées.