منتدى رحاب الكلمة
مرحبا بكم في منتدى رحاب الكلمة.أنت غير مشترك معنا سجل الآن
مجانا
المواضيع الأخيرة
بحـث
 
 

نتائج البحث
 


Rechercher بحث متقدم

سحابة الكلمات الدلالية

المتواجدون الآن ؟
ككل هناك 3 عُضو متصل حالياً :: 0 عضو مُسجل, 0 عُضو مُختفي و 3 زائر

لا أحد

أكبر عدد للأعضاء المتواجدين في هذا المنتدى في نفس الوقت كان 39 بتاريخ الإثنين 08 أكتوبر 2012, 19:44
احصائيات
هذا المنتدى يتوفر على 1296 عُضو.
آخر عُضو مُسجل هو hamadaeklides2020 فمرحباً به.

أعضاؤنا قدموا 3413 مساهمة في هذا المنتدى في 1520 موضوع

3. العلاقة بين تكنولوجيا المعلومات واللغة العربية

استعرض الموضوع السابق استعرض الموضوع التالي اذهب الى الأسفل

3. العلاقة بين تكنولوجيا المعلومات واللغة العربية

مُساهمة من طرف ونشريس في الأربعاء 30 يناير 2013, 17:08



بسبب الأساس الإنجليزي لتوجهات تكنولوجيا المعلومات، فإن المواجهة بينها وبين اللغة العربية، غير متكافئة. ومظاهر هذا التوجه نجدها في:

(1) تصميم أكثر لغات البرمجة بالإنجليزية.

(2) استخدام شفرات لتبادل البيانات مصممة أصلاً مع الأبجدية الإنجليزية.

(3) تصميم أساليب نظم تخزين المعلومات واسترجاعها هو على أساس أن اللغة الإنجليزية هي الهدف.

(4) القسم الأكبر من مكتبة البرامج الجاهزة هو في الإنجليزية.

(5) معظم الكتب والمراجع والبحوث ذات العلاقة مكتوبة بالإنجليزية.

هذا، إضافة إلى أزمة لغتنا الحادة كما تظهر في قصور التنظير بها، وقصور المعاجم العربية، وقصور أساليب تعليم اللغة، وثنائية الفصحى والعامية. وهي عوائق حقيقية أمام جهود معالجة اللغة العربية آلياً. () ولقد شهد العالم (الغربي بخاصة) على مدى النصف الثاني من القرن العشرين ثورة حقيقية في مجال اللسانيات، أدت إلى ظهور عدد من النماذج اللغوية، وضع بعضها لغويون، ووضع بعضها حاسوبيون. ذكر منها د. نبيل علي اثني عشر نموذجاً.

الوضع الحالي لتعريب المعلوماتية

حققت حوسبة اللغة العربية إنجازات مهمة في العقدين الأخيرين، بجهود عدة مؤسسات مثل صخر ومايكروسوفت. إلا أن الكثير بقي منتظراً للتحقق. وتظهر هذه الإنجازات فيما تحقق للحرف والكلمة والجملة.

فعلى صعيد الحرف، تم تطوير نظم تشغيل OS ثنائية اللغة (ع/E)، ابتداء من نظام صخر msx. كما تحققت إنجازات مهمة على مستوى العتاد hardware مثل وحدات الإدخال والإخراج I/O بما فيها لوحات المفاتيح والطابعات، وشاشات العرض، وبرامج تنسيق الكلمات WP، وقراءة النصوص آلياً باستخدام الماسحات الضوئية للحروف OCR.

وعلى مستوى الكلمة طُوِّر معالج صرفي آلي، قادر على تحليل الكلمة إلى عناصرها الاشتقاقية والتصريفية من لواحق وسوابق. مما يسر اكتشاف أخطاء التهجئة. كما طورت نظم بحث في النصوص العربية على أساس صرفي، وتم بناء قواعد بيانات معجمية (ق ب م LDB) مع معالج صرفي آلي يتعامل مع النص العربي على مستوى الجملة.

وعلى مستوى الجملة، طُور نظام آلي لإعراب الجملة العربية، مما سهّل تطوير نظام آلي لتشكيل الجملة تلقائياً. وهذا مكّن من تطوير برنامج تحويل النصوص العربية إلى مقابلها المنطوق Text to Speech (TTS).

ومع ذلك، يمكن أن نشير إلى بعض مناحي القصور في هذا الميدان، ومنها:

أ‌- محاولة استيعاب العربية في نطاق التقنيات المصممة أصلاً للغة الإنجليزية، وهذا خطأ جوهراً وشكلاً.

ب‌- معظم جهود التعريب هي خارج حدود الوطن العربي. أو من مؤسسات أجنبية.

ج- غياب البحوث الأساسية في مجال اللسانيات أو إنَّها دون الحد المطلوب.

تكنولوجيا المعلومات كأداة للغة العربية

منذ ظهور الحاسوب في أواخر الأربعينات من القرن الماضي، وصلته باللغة تتوقف وتزداد تأصيلاً في كلا الاتجاهين. فكون اللغة تجسيداً لما في الذهن البشري من نشاط، واتجاه الحاسوب لمحاكاة وظائف الإنسان وقدراته الذهنية فرض هذا اللقاء المتواصل، مع تفاعل علمي وتقني بصورة لا مثيل لها. وهذا أدى إلى الثالوث: "اللغة- الحاسوب- التطبيق". فقد تهيأت اللغة للمعالجة الآلية بدخولها مجالات التحليل الرياضي والمنطقي والإحصائي. وتهيأ الحاسوب للقائه مع اللغة بالسرعة الفائقة، وضخامة الذاكرة، وصغر الحجم، وأساليب الذكاء الاصطناعي، ولغات البرمجة الراقية. وأما التطبيق فقد شق السبيل إلى مجالات التعليم والإنسانيات والنظم الخبيرة.

ويمكن حصر ميادين تكنولوجيا المعلومات كأداة للغة العربية فيما يأتي:

أ‌- أداة للإحصاء اللغوي

وهذا يشمل مجالات عدة، نذكر منها:

(1) التقييم الكمي لبعض خصائص اللغة، مثل معدل استعمال الحروف والكلمات والصيغ المصرفية في النصوص المختلفة.

(2) التوصيف الكمي لبعض العلاقات اللغوية، أو علاقات النصوص، مثل العلاقات بين نوع المبتدأ، ونوع خبره، أو طول الجملة، أو يسر تعليمها.

(3) تفسير بعض الظواهر اللغوية، مثل ظاهرة القلب لدى الأطفال (جبذ محل جذب)..

ب- في معالجة الكتابة العربية

يمكن تطبيق الحوسبة في نظم قراءة آلية للنصوص المكتوبة طباعة أو باليد. أما إظهار النصوص وطباعتها، فقد قطع شوطاً متقدماً.

ج- أداة للصرف العربي

نعني بذلك معالجات آلية للصرف العربي، قادرة على القيام بعمليات التحليل والتركيب لمفردات اللغة. فالجزء التحليلي يفكك الكلمة إلى عناصرها الأولى من اشتقاقية وصرفية وإعرابية، وتبيان السوابق واللواحق. والجزء التركيبي هو عكس ذلك.

د- أداة للنحو العربي

هنا يقوم نظام النحو الآلي بتفكيك الجملة إلى عناصرها الأولية من أسماء وأفعال وحروف، ويحدد الوظيفة النحوية لكل عنصر (فاعل، مفعول،...) وقد قام د. نبيل علي بتطوير نظام تحليل نحوي للغة العربية، مشكولة وغير مشكولة. يعرب الجملة، ومن ثم يشكلها تلقائياً. ()







هـ - أداة في الفهم الأوتوماتي للسياق اللغوي

الهدف الأسمى لمعالجة اللغات الإنسانية آليا هو الوصول إلى نظام أوتوماتي يتيح فهم السياق اللغوي في صورته المنطوقة. وليس هذا سهلاً، فالمطلوب أولاً التصدي لمعضلة "المعنى في اللغة" على المستوى المعجمي والمنطقي والسياقي.

و- أداة لتحليل الإنتاج الأدبي وتحديد أساليب الكتّاب

جرى استخدام أساليب الإحصاء والتحليل اللغويين في تحليل الإنتاج الأدبي لتحقيق ما يأتي:

(1) تحقيق التراث، للتأكد (مثلاً) من تفرد هوميروس بتأليف الألياذة.

(2) التقييم الكمي لخصائص أساليب الكتّاب.

(3) التحديد الموضوعي لأثر السابقين على اللاحقين من كتاب وشعراء.

(4) فهرسة النصوص آلياً. (المعجم المفهرس لألفاظ القرآن الكريم).

(ز) أداة لمكننة المعجم العربي

يعاني المعجم العربي حالياً، من أزمة حادة مزمنة. من مظاهرها عزوف الناطقين بالعربية عن استعمال معاجم لغتهم، مع قصور حاد في المصطلحات. ومن أسباب ذلك:

(1) جمود النظر إلى آليات (وسائل) تكوين الكلمات word formation في العربية. وطغيان الاشتقاق على الآليات الأخرى كالتركيب والنحت.

(2) إهمال العلاقات بين المفردات والفصائل اللغوية مثل علاقات الترادف والتضاد والاشتراك اللفظي.

(3) إغفال البعد التاريخي في البحث المعجمي العربي. ولا توجد دراسات شاملة لتطور معاني الألفاظ.

(4) الانفصال الحاد بين مجامع اللغة وجماعاتها، وبخاصة في عمليات التحديث المعجمي والاستخدام الفعلي في المجالات المختلفة. ولقد خطا مجمع اللغة العربية الأردني خطوة واسعة رائدة في عمله في "معجم ألفاظ الحياة".

(5) ضمور عنصر الدلالة (المعنى) في الدراسات المعجمية.

(6) فوضى لغة تعريف مفردات المعجم، وعدم التزامها بأنماط محددة.

(7) إغفال الجهود الجارية للسانيات الحاسوبية في تحليل بنية المعجم، واستخدام تكنولوجيا المعلومات في مكننة المعاجم، ودعم جهود العمل المصطلحي.

وسنتحدث عن المعاجم وصناعتها لاحقاً في هذه المحاضرة.

ووجوب المكننة automation في المعجم العربي تحتمه بنية هذا المعجم، وغنى مفرداته، وتعقد علاقاته. ونقصد من وراء ذلك ما يأتي:

(1) توفير خدمة أفضل للمستخدم باستعمال أساليب متطورة لاسترجاع المعلومات وفرز المفردات، واستخراج قوائمها حسب معايير محددة.

(2) حصر التعابير المشكولة اصطلاحياً Idiomatic مثل " أجهش بالبكاء، الأمن الغذائي..."

(3) محاصرة ظاهرة الإزاحة الدلالية Semantic shift التي تطرأ على المفردات العربية كتحولها من وصف إلى اسم...

(4) تنميط لغة تعريف معاني المفردات.

(5) إمكان دمج المعجم الممكنن في النظم الآلية الأشمل مثل نظم الإعراب الآلي والفهم الأوتوماتي للنصوص، ومن ثم الترجمة الأوتوماتية.

ومن الجهود الخيّرة في هذا الميدان، ما قام به د. نبيل علي في تجهيز قاعدة لذخيرة النصوص العربية، ثم تحليلها صرفياً، باستخدام معالج صرفي آلي، وتحوي هذه الذخيرة على ما يزيد على (12) مليون كلمة. () وقد أخبرنا الدكتور مأمون حطاب أنهم خزنوا ما يربو على 50 مليون كلمة.

(ح) أداة لدعم العمل المصطلحي

يكاد يكون عمل المصطلحات الشغل الشاغل للمجامع العربية اللغوية، ومع ذلك نذكر عدداً من التحديات التي يواجهها عمل المصطلحات.

(1) ندرة التأليف والترجمة باللغة العربية، وبخاصة في المجالات العلمية، مما لا يعطي فرصة لتأصيل المصطلح، وزيادة استساغته، وشيوعه وتوحيده.

(2) المعارضة الشديدة لتعريب العلوم، وعلى عدة مستويات.

(3) ظاهرة الانفجار العلمي، مما يزيد في معدلات طلب المصطلحات زيادة تعجز عن تلبيتها الآليات الحديثة.

(4) إهمال الرصيد التراثي للعربية، وهو رصيد يمثل مخزوناً استراتيجياً للمصطلحات.

(5) عدم كفاية المعاجم المتخصصة الممهدة لدخول المصطلح المعجم العام.

(6) إغفال المجامع اللغوية ثورة اللسانيات والمعلومات.



(ط) أداة في مجال الترجمة الآلية.

من قضايا الترجمة الآلية الأساسية، نذكر:

(1) الاستعارة والمجاز، والأساليب البلاغية.

(2) نطاق المعلومات subject domain وشريحة اللغة sublanguage التي تتعامل معها نظم الترجمة الآلية. عموماً، تركز أكثر النظم على موضوع واحد أو نطاق ضيق لموضوعات متقاربة لغوياً ومعرفياً، لتقليص لبس معاني الكلمات.

(3) التباين بين اللغات، وبخاصة المندرجة تحت فصائل لغوية مختلفة، وهذا مشكلة أساسية في نظم الترجمة الآلية.

(4) ومعضلة أخرى، هي دقة الترجمة الآلية، وأسلوب تقييم نظمها المختلفة، مما يؤثر على حجم التدخل البشري المطلوب قبل ترجمة النص أو بعدها.

وعموماً، فالترجمة إلى العربية أبسط من الترجمة منها.

(ي) أداة لتعلم اللغة العربية وتعليمها.

من مشكلات ذلك حاسوبياً، نذكر:

(1) غياب عنصر الكلام المنطوق.

(2) صعوبة محاكاة المواقف الطبيعية للاستخدامات اللغوية.

(3) حاجة معظم البرامج إلى سعة تخزين هائلة لحفظ المادة التعليمية.

وتوجد محاولات مشجعة لاستخدام الحاسوب التعليمي لتدريس قواعد اللغة والأبجدية للصغار. وإتقان تهجئة الكلمات، وتمييز أقسام الكلام، وإعراب الجمل، واستخلاص الجذور، وتصريف الكلمات، وتكوين جمل قصيرة، والتدريب على استعمال المعجم العربي.

(ك) توليد الكلام العربي آلياً

وهذا تحد آخر أمام مختصي الذكاء الاصطناعي، لتطوير نظم قادرة على تمييز الكلام المنطوق، وفهمه آلياً، والتعرف على شخصية المتكلم، ومحاكاة النطق البشري، وحتى على مستوى الكلمات المنفردة. ()
avatar
ونشريس
عضو ممتاز
عضو ممتاز

عدد المساهمات : 393
نقاط : 2436
تاريخ التسجيل : 20/09/2012

الرجوع الى أعلى الصفحة اذهب الى الأسفل

رد: 3. العلاقة بين تكنولوجيا المعلومات واللغة العربية

مُساهمة من طرف أسير القافية في الخميس 28 مارس 2013, 21:22






avatar
أسير القافية
عضو ممتاز
عضو ممتاز

عدد المساهمات : 496
نقاط : 3149
تاريخ التسجيل : 19/01/2011
الموقع : وكن رجـــلاً إن أتــو بعـــــده ** يقــــولـــون مرّ وهــــذا الأثــــر

الرجوع الى أعلى الصفحة اذهب الى الأسفل

استعرض الموضوع السابق استعرض الموضوع التالي الرجوع الى أعلى الصفحة


 
صلاحيات هذا المنتدى:
لاتستطيع الرد على المواضيع في هذا المنتدى