Résumé:
ملخـــــص باللغة العربية:
تهدف هذه الدراسة إلى توضيح آليات وتقنيات معالجة اللغة العربية آليًا؛ وتم التركيز على معالجة النظام الصرفي للغة العربية آليا ؛ مع دراسة مقارنة لنماذج من تطبيقات المعالجة الآلية لصرف اللغة العربية؛ وهي المحللات الصرفية (Morphological Analyzer) الخاصة باللغة العربية؛ محلل باكولتر (Buckwalter) التابع لجامعة بنسيلفينيا الأمريكية ومحلل الخليل التابع لإدارة العلوم والبحث العلمي التابع للمنظمة العربية للتربية والثقافة والعلوم، بالتعاون مع جامعة محمد الأول بوجدة بالمملكة المغربية، ومعهد بحوث الحاسب بمدينة الملك عبد العزيز للعلوم والتقنية بالمملكة العربية السعودية ومحلل ماداميرا Madamira التابع لجامعة كولومبيا الأمريكية؛ ثم دراسة تطبيقية لنتائج التحليل الصرفي لمحلِلَيْ الخليل وماداميرا.
توصَّلَت نتيجةُ البحث ونتيجة المقارنة بين محلِلَيْ الخليل وماداميرا إلى مجموعة من الأخطاء والالتباسات التي تقع فيها المحللات الصرفية، وبناءً على هذه النقائص فقد قمتُ بوضعِ نموذجٍ مقترحٍ يستجيب لمتطلبات حوسبة النظام الصرفي للغة العربية.
جاءت الأطروحة في أربعة فصول؛ الفصل الأول فصلٌ تأسيسيٌ يحدّدُ مفاهيم هذا العلم البيني ويبين المجالات البينية التي تُكوّنُه؛ وأهمها اللسانيات التي يستمدّ منها مصادره ونظرياته اللغوية التي تساعد الباحثين في مجال معالجة اللغات في فهم طبيعة اللغة المراد معالجتها؛ أما المجال الثاني فهو علوم الحاسوب وبالتحديد الذكاء الاصطناعي الذي يمدّنا بالوسائل التقنية وطرق المعالجة.
خُصّص الفصل الثاني لخطوات تهيِئة اللغة العربية لأغراض المعالجة الآلية لها؛ انطلاقا من نمذجتها آليا وبناء الذخائر اللغوية ثم التعرف على النظام الصرفي للغة العربية من خلال تحديد مفهوم النظام الصرفي للغة الذي يرتكز على خاصيتي التصريف والاشتقاق. وتحديد النظريات الصرفية التراثية والغربية التي تكفلت بدراسة هذا النظام. في الفصل الثالث الذي خُصِّص لتطبيقات المعالجة الآلية للنظام الصرفي؛ وضّحتُ طرق التحليل الصرفي الآلي المتمثلة في عددٍ من المراحل وهي: تقسيم وحدات النص Tokenazation ثم إزالة اللواصق عن طريق التجذيع Stemming أو التفريع Lemmatization الذي يهدف للوصول إلى المدخل المعجمي Lemma، ثم تحديد أقسام الكلام pos Tagging؛ ثم حدّدت معايير تصنيف المحللات الصرفية؛ وقد شكَّلَت طرق التحليل الصرفي الآلي ومعايير تصنيف المحللات الصرفية أُسُسَ المقارنة بين محلٍلَي الخليل وماداميرا في الفصل الرابع من البحث.
ولدراسة النموذجين (الخليل وماداميرا) دراسةً مقارنةً؛ فقد اعتمدتُ على مدونةِ اختبارٍ؛ أُخِذَت من ذخيرة لغوية للغة العربية الفصحى الحديثة (MSA)، من جريدة الخليج الكويتية؛ اشتملت على ثلاثة نصوصٍ، نصٌ إخباريٌ ونصٌ في مجال الاقتصاد، ونصٌ في مجال الرياضة بمجموع كلماتٍ وصل إلى 1568 كلمةٍ مختلفةٍ بين أفعال وأسماء وحروف وتمت المقارنة بين مخرجات التحليل الصرفي للخليل وماداميرا؛ بداية بتقسيم وحدات النص والالتباس الناتج عن غياب حركات التشكيل ثم التجذيع والتفريع عن طريق إزالة اللواصق من الأفعال والأسماء للوصول إلى الجذر أو الجذع أو المدخل المعجمي ثم تحديد أقسام الكلام وإضافة السِمات الصرفية و النحوية لكل كلمة