Résumé:
Cette étude vise à développer des modèles fondés sur une approche quantitative de la relation structure-propriétés (QSPR) afin de prédire certains paramètres physico-chimiques, à savoir la température normale d'ébullition (Tb) et les propriétés critiques : température critique (Tc), pression critique (Pc) et volume critique (Vc) des composés organiques. Les modèles utilisent un algorithme d'apprentissage automatique, plus précisément le réseau de neurones artificiels multilayer (MLP-ANN), pour la modélisation non linéaire, en utilisant des descripteurs moléculaires pertinents comme variables d'entrée. Une comparaison avec la régression par vecteurs de support (SVR) a été effectuée afin d'évaluer les performances des modèles PMC-ANN pour des ensembles de données comprenant respectivement 417, 412, 411 et 418 composés organiques pour Tb, Tc, Pc et Vc. Pour chaque modèle, la base de données a été divisée de manière aléatoire en deux sous-ensembles : 80 % pour l'entraînement et 20 % pour les tests. Les configurations optimales pour les modèles PMC-ANN étaient (25-17-1) pour Tb, (25-14 1) pour Tc, (24-17-1) pour Pc et (18-10-1) pour Vc. Les résultats ont été les suivants : pour le modèle PMC-ANN Tb, les résultats comprenaient R² = 0,9974, IOA = 0,9992, MAE = 3,6331 k, MAPE = 1,0165 % et RMSE = 4,9321 k. Pour le modèle Tc, les résultats étaient R² = 0,9935, IOA = 0,9982, MAE = 7,0545 k, MAPE = 1,0436 % et RMSE = 9,5482 k. Pour le modèle Pc, les résultats étaient les suivants : R² = 0,9907, IOA = 0,9992, MAE = 87,5193 mPa, MAPE = 2,4352 % et RMSE = 122,5629 mPa. Pour le modèle Vc, les résultats étaient R² = 0,9982, IOA = 0,9998, MAE = 6,8173 cm³/mol , MAPE = 2,3525 % et RMSE = 9,4734 cm³/mol . Les modèles PMC-ANN ont systématiquement surpassé les modèles SVR, démontrant une précision, une stabilité et une capacité de généralisation supérieures. La méthode d'analyse de sensibilité (méthode des poids) a été utilisée pour évaluer individuellement la contribution de chaque descripteur d'entrée dans les modèles QSPR-ANN. Les résultats ont montré que la plupart des descripteurs avaient un niveau d'influence élevé ou moyen. De plus, l'analyse du domaine d'applicabilité (AD) a confirmé la fiabilité et la généralisation des modèles, la plupart des points de données se situant dans une fourchette acceptable. Enfin, la comparaison avec les modèles précédents a démontré que les modèles PMC-ANN proposés surpassaient les modèles existants en termes de précision et de robustesse, confirmant leur fort potentiel pour fournir des prévisions précises.