رئيس مجلس الإدارة : د. خالد بن ثاني آل ثاني

Al-sharq

رئيس التحرير: جابر سالم الحرمي

الشرق

مساحة إعلانية

مساحة إعلانية

مساحة إعلانية

ثقافة وفنون

1584

تجميع علمي لموارد اللغة التركية بجامعة كارنيجي ميلون

06 أغسطس 2019 , 07:00ص
alsharq
الدوحة - الشرق

البحوث المعالجة تطلق مسارات تكنولوجية جديدة               

 

 

علم "معالجة اللغات الطبيعية" هو العلم الذي يمكّن أجهزة الحاسوب من فهم اللغة البشرية، واستخراج المعنى مما نقوله أو نكتبه.

وهو العلم الذي قضى كمال أوفلازر، مساعد العميد لشؤون البحث العلمي وأستاذ علوم الحاسوب بجامعة كارنيجي ميلون في قطر، حياته المهنية في الخوض بالأسئلة الكبيرة والفروق الدقيقة فيه.

وقد لا يكون الكثيرون على دراية بمصطلح "معالجة اللغات الطبيعية"، إلا أن الناطقين باللغة الإنجليزية يواجهون هذا العلم المتفرع من علوم الذكاء الاصطناعي في كل مرة يرسلون فيها رسالة نصية، أو يطلبون مساعدة سيري أو أليكسا، أو حتى يطرحون استفساراً في محرك البحث.

ويقول أوفلازر: "يتمحور هذا المجال على كيفية جعل الحاسوب يساعد عملية التواصل بين البشر والآلة، بهدف تيسير هذا التواصل وجعله أكثر فاعلية".

وقد ظهرت العديد من التطورات اللافتة في مجال معالجة اللغات الطبيعية باللغة الإنجليزية، حيث تم التوصل إلى تقنيات غالباً من أمكن تطبيقها بسهولة على اللغات الأخرى ، بقيت بعض اللغات تمثل تحدياً كبيراً في لغة البرمجة هذه.

تحدي اللغة التركية

ولد أوفلازر وترعرع في تركيا، حيث حصل على درجة البكالوريوس والماجستير من جامعة الشرق الأوسط التقنية في أنقرة. ثم تابع دراسته للحصول على درجة الدكتوراه في علوم الحاسوب من جامعة كارنيجي ميلون، حيث درس ثم عمل في الولايات المتحدة طيلة عقد كامل.

عندما عاد إلى تركيا للتدريس في جامعة بيلكنت، اكتشف أن هذه التجربة منحته منظوراً جديداً للأمور، إذ يقول: "نادراً ما تحصل على فرصة لرؤية شكل لغتك الأولى من وجهة نظر خارجية ، فحصل أن كتبت وثيقة باللغة التركية، حينها أدركت أنه لا يوجد مدقق إملائي تركي"

كان ذلك في بداية التسعينيات، وأثارت هذه الملاحظة أسئلة من شأنها توجيه اهتمامات أوفلازر البحثية على مدار الأعوام الخمسة والعشرين القادمة. فقد أدرك وجود العديد من التحديات الكامنة في "معالجة اللغات الطبيعية" الخاصة باللغة التركية.

فعلى سبيل المثال، اللغة التركية هي "لغة تكتل"، ما يعني أن ملحقات الكلمات ترتبط بجذر الكلمة بشكل متصل. ويمكن لكلمة تركية واحدة تضم ملحقات معقدة يمكن أن تعبر عن المعنى نفسه الذي تمنحه جملة كاملة باللغة الإنجليزية.

ويشرح أوفلازر ذلك بالقول: "في اللغة الإنجليزية، يمكن للكمبيوتر التحقق من التهجئة من ضمن قائمة محدودة من الكلمات. أما في اللغة التركية، يمكن أن يؤدي جذر الفعل المطلوب إلى ظهور حوالي 1.5 مليون كلمة مختلفة .

نشر أوفلازر ورقته البحثية الأولى حول التدقيق الإملائي باللغة التركية في عام 1993 ، وفي النهاية طور هو وزملاؤه خوارزميات تصحيح هجاء فعالة، قادرة على تشفير عدد لا حصر له من الكلمات ، وقد قدمت هذه الورقة أيضاً طرقًا أخرى للبحث في معالجة اللغات الطبيعية التركية، مثل نمذجة اللغة الإحصائية ومعالجة الكلام والترجمة الآلية.

ويقول: "في بداية التسعينيات، لم يكن هناك أي عمل يجري في مجال معالجة اللغة التركية الطبيعية. لقد قطعنا شوطًا طويلاً منذ ذلك الحين".

ربع قرن من البحوث

ويتحدث التركية أكثر من 70 مليون شخص في تركيا والشرق الأوسط ودول أوروبا الغربية، بينما يستخدم حوالي 165 مليون شخص حول العالم مشتقات من اللغة التركية الأم.

ويعتقد أوفلازر أن باحثي اللغات الأخرى الأقل دراسة قد يتعلمون من الأساليب والمقاربات المختلفة التي طورها الباحثون باللغة التركية، مشدداً على أن الكتاب البحثي الذي قدّمه لا يمثل أبداً نهاية البحوث في معالجة اللغة الطبيعية التركية. ويقول: "ما قمنا بإنجازه لا يقارب حتى نسبة الـ10% من العمل المطلوب. إذ يعالج الباحثون الآن مجموعة جديدة من الأسئلة التي تشمل التعرف على الكلام، والتطبيقات الخاصة بالأشخاص الذين يعانون من ضعف النظر لاسترجاع المعلومات باللغة التركية. ولكني أعرف أنه، بعد عشرين عاماً من اليوم، سيكون لدينا العديد من التطبيقات الإضافية. فهذا الكتاب هو نقطة الانطلاق لا أكثر".

ويواصل  أبحاثه في مجال معالجة اللغات الطبيعية من خلال مشروعين يدعمهما الصندوق القطري لرعاية البحث العلمي، هما "تطبيقات وموارد اللهجات العربية المتعددة"، و"اختبار فهم اللغة الإنجليزية من خلال تحليل النص المتعمق وطرح الأسئلة".           

مساحة إعلانية