غير مصنف

مؤشر سلامة استخدام اللغة العربية، قراءة توضيحية موجزة

إن للغة العربية أهمية بالغة لدى الناطقين وغير الناطقين بها من المسلمين في أنحاء المعمورة. فبها كلمة التوحيد، وصلواتهم الخمس في اليوم والليلة، وكذلك قراءتهم للقرآن الكريم.

و ترتبط اللغة بشكل قوي بهوية الإنسان، فهي الوعاء الحافظ لتاريخه وتراثه. والعلاقة بينها وبين الهوية من أهم ركائز المجتمع، وتتجلى في الوظائف التي تقوم بها اللغة في إطار التعبير عن الهوية، راجع مقالي “اللغة والهوية” للاستزاده.

ومن منطلق اهتمامها بسلامة اللغة العربية من الأخطاء، قامت مؤسسة لسان للذكاء الاصطناعي مشكورة بإعداد تقريرها الموسوم بـ (مؤشر سلامة استخدام اللغة العربية)، والذي سنتناوله في هذا المقال بحول الله.

ما هو تقریر مؤشر حالة اللغة العربیة على الشبکة للعام 2022 ؟

هو تقریر سنوي یقیس مدى التزام الجهات المعنیة بقواعد اللغة العربیة الصرفیة والنحویة والإملائیة، قیاساً علمیاً ذا منهجیة واضحة، بهدف تشجیع هذه الجهات على اتباع سیاسات لتقویم محتواها وضبط نصوصها لأنها الأکثر تأثیراً
في الشارع العربي. انظر التقرير.

عمله:

يستخرج “مؤشر سلامة وفصاحة استخدام اللغة العربية” الأخطاءَ والمصطلحات الدخيلة المتفق عليها. والتي لا يختلف فيها المختصون، في الدول العربية المشمولة بالدراسة. وهو ما يعني أن مقدار الأخطاء الحقيقية هو أعلى من الأرقام الواردة في التقرير.

ماهي مؤسسة لسان؟

يعرّفها مديرها التنفيذي نور الأسدي:

مؤسسة بحثية مستقلة تضم باحثين من مختلف الدول العربية، وتستخدم تقنيات الذكاء الاصطناعي وتقنيات اللسانيات الحاسوبية، وتهدف إلى تعزيز المحتوى القويم الخالي من الأخطاء وحمايته ونشره.

أنشأت المؤسسة مؤخرًا “نظام لسان” وهو مدقق لغوي آلي ذكي ومعلم للكتابة الاحترافية. يوثّق الآيات القرآنية والأحاديث النبوية وأسماء الأعلام لتفادي الخطأ فيها.

يحتوي التقرير على أربعة فصول

الفصل الأول: أنواع البيانات ومصادرها:

البيانات المستخدمة:

جمعَ قسم البيانات نصوص المقالات من عدة مؤسسات لها مواقع إليكترونية على الشبكة، وشمل التقرير هذا العام 378 مؤسسة.

الدول التي شملتها الدراسة:

عمان، قطر، الإمارات، البحـرین، السعودیة، الکویت، الیمن، الأردن، العراق، سوريا، فلسطین، لبنان، مصر، السودان، لیبیا، تونس، المغرب، الجزائر، موريتانيا، جیبوتي، أمريكا، فرنسا، المملکـة المتحدة، روسيا، ترکیا.

صورة من موقع لسان للدول التي شملتها دراسة سلامة اللغة العربية 2022
صورة من موقع لسان للدول التي شملتها دراسة سلامة اللغة العربية 2022

المؤسسات حسب الدول:

هناك تفاوت في عدد المؤسسات في الدول المشمولة بالدراسة، حيث ظهرت أدناها في روسيا وتركيا والمملكة المتحدة وجيبوتي بعدد مؤسسة واحدة في كل منها.

وظهرت أعلاها في الإمارات حيث بلغت 72 مؤسسة. تليها مصر بـ51 مؤسسة. فالسعودية بـ34 مؤسسة.

أما في دول المغرب العربي فكانت أعلاها في ليبيا حيث بلغت 9 مؤسسات، وأدناها في الجزائر حيث بلغت 5مؤسسات فقط.

وفي دول الشام، احتلت الأردن المرتبة الأعلى بـ28 مؤسسة، وفلسطين كانت الأدنى حيث بلغت 10مؤسسات فقط. مزيد من التفاصيل في الصورة الآتية:

صورة من موقع لسان تبين عدد المؤسسات التي شملها التقرير بحسب الدول
صورة من موقع لسان تبين عدد المؤسسات التي شملها التقرير بحسب الدول

المؤسسات حسب التصنيف:

تم تصنيف المؤسسات المشمولة بالدراسة إلى إعلامية، تعليمية، ثقافية، دينية وفنية.

وكانت المؤسسات الفنية هي الأقل بعدد 3 مؤسسات. أما الإعلامية فبلغت 225 مؤسسة.

صورة من موقع لسان تبين عدد المؤسسات حسب التصنيف
صورة من موقع لسان تبين عدد المؤسسات حسب التصنيف

الفصل الثاني: منهجية القياس:

1- مؤشر سلامة استخدام اللغة العربية:

أ. اختيار المصدر:

تم اختيار وسائل الإعلام وفقًا لمعيار موثوقية النطاق على شبكة الويب. مع مراعاة الحد الأدنى بأن لا يقل عن 5 وسائل إعلام لكل دولة، و 10 كلمات كحد أدنى لكل مقال.

ب. توليد الأخطاء:

استخدم قسم العمليات “نظام لسان” للفحص الآلي، لتوليد قائمة بكل الأخطاء الناتجة عن هذه العملية. بعدها جرت عملية قياس إحصائي للأخطاء، ونتج عنها قائمة بأكثر الأخطاء تكرارًا في البيانات المدققة.

ج. تدقيق الأخطاء:

دققت الأخطاء النحوية والصرفية والاملائية والدلالية والأسلوبية، تدقيقًا يدويًا في قسم اللغة العربية.

وحُدِّثَتْ قائمة الأخطاء الإملائية واللغوية. مع تجاهل أخطاء علامات الترقيم والفراغات.

د. القياس الإحصائي:

روجعت النصوص المدروسة آليًا وسُجل عدد الأخطاء. واستنتج المقدار المئوي لهذه الأخطاء قياسًا إلى عدد الكلمات الكلي خلال فترة الدراسة.

2- مؤشر فصاحة استخدام اللغة العربية:

أ. اختيار المصادر:

تم استخدام مصادر البيانات المدروسة في فصل “سلامة استخدام اللغة العربية”.

ب. استخراج المصطلحات الدخيلة:

تم استخراج المصطلحات والكلمات الدخيلة من نصوص المقالات المدروسة.

ج. توليد المقابلات الفصيحة للمصطلحات الدخيلة:

تم تدقيق المصطلحات الدخيلة المستخرجة من نصوص المقالات المدروسة، وإيجاد المقابل الفصيح لها.

د. القياس الإحصائي:

عدد الكلمات الدخيلة + 1

مؤشر الفصاحة = ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ

عدد الكلمات الدخيلة + عدد الكلمات الفصيحة +2

الفصل الثالث: نتائج الدراسة:

1. مؤشر سلامة استخدام اللغة العربية (نسبة الخطأ):

ظهرت نسبة الخطأ الأقل في مؤسسات دولة قطر حيث بلغت 1.28%، وأقل منها في الإمارات حيث بلغت 0.93%.

أما النسبة الأكثر فكانت في مؤسسات دولة العراق حيث بلغت 10.36%. تلتها مؤسسات دولة الكويت بنسبة 8.33%،

عدد الكلمات الداخل في الدراسة أكثر من 12 مليار كلمة.

نسبة الخطأ العامة 3.93%

صورة من موقع لسان تبين نسبة الخطأ في المؤسسات المشمولة بالدراسة
صورة من موقع لسان تبين نسبة الخطأ في المؤسسات المشمولة بالدراسة

مؤشر فصاحة استخدام اللغة العربية:

جاءت النسب متقاربة مابين الدول العربية. حيث احتلت البحرين المركز الأول بنسبة 0.9%.

تليها كل من ليبيا وعمان والإمارات بنسبة 0.89% لكل منها. فيما جاءت لبنان في المركز الأخير بنسبة 0.65%.

عدد الكلمات الكلي في الدراسة يربو على 12 مليار كلمة.

مؤشر الفصاحة العامة 86%

الفصل الرابع: المؤسسات المشمولة بالمؤشر:

أ. من حيث عدد الكلمات:

أعلى عدد كلمات مشمولة بالدراسة كانت 619217116 كلمة لمؤسسة الشروق الجزائرية، مؤسسة إعلامية، وبلغت نسبة الخطأ 5.18% ونسبة اللحن 0.145%.

وأقل عدد كلمات مشمولة بالدراسة كانت 235 كلمة للمؤسسة القطرية للإعلام بنسبة خطأ 4.29% ونسبة لحن 0.5%.

ب. من حيث نسبة الخطأ:

ظهرت أعلى نسبة خطأ من مؤسسة الوسط اليمنية، مؤسسة إعلامية، حيث بلغت نسبة الخطأ 14.35%، من مجموع كلمات 817798 كلمة، أما نسبة اللحن فيها فكانت 0.138%.

أما أقل نسبة خطأ فكانت لمؤسسة الأيام السعودية، مؤسسة إعلامية لم يسجل لها أي خطأ في الدراسة التي شملت 9594484 كلمة، مع نسبة لحن 0.105%.

ج. من حيث نسبة اللحن:

ظهرت أعلى نسبة لحن عند مؤسسة جمهرة -غير محددة الدولة- والمصنفة أنها منوعة حيث بلغت 0.779% من مجموع كلمات 3837365 كلمة، مع نسبة خطأ 0.77%.

الفصل الرابع: المؤسسات المشمولة بالمؤشر:

أ. من حيث عدد الكلمات:

أعلى عدد كلمات مشمولة بالدراسة كانت 619217116 كلمة لمؤسسة الشروق الجزائرية، مؤسسة إعلامية، وبلغت نسبة الخطأ 5.18% ونسبة اللحن 0.145%.

وأقل عدد كلمات مشمولة بالدراسة كانت 235 كلمة للمؤسسة القطرية للإعلام بنسبة خطأ 4.29% ونسبة لحن 0.5%.

ب. من حيث نسبة الخطأ:

ظهرت أعلى نسبة خطأ من مؤسسة الوسط اليمنية، مؤسسة إعلامية، حيث بلغت نسبة الخطأ 14.35%، من مجموع كلمات 817798 كلمة، أما نسبة اللحن فيها فكانت 0.138%.

أما أقل نسبة خطأ فكانت لمؤسسة الأيام السعودية، مؤسسة إعلامية لم يسجل لها أي خطأ في الدراسة التي شملت 9594484 كلمة، مع نسبة لحن 0.105%.

ج. من حيث نسبة اللحن:

ظهرت أعلى نسبة لحن عند مؤسسة جمهرة -غير محددة الدولة- والمصنفة أنها منوعة حيث بلغت 0.779% من مجموع كلمات 3837365 كلمة، مع نسبة خطأ 0.77%.

الفصل الرابع: المؤسسات المشمولة بالمؤشر:

أ. من حيث عدد الكلمات:

أعلى عدد كلمات مشمولة بالدراسة كانت 619217116 كلمة لمؤسسة الشروق الجزائرية، مؤسسة إعلامية، وبلغت نسبة الخطأ 5.18% ونسبة اللحن 0.145%.

وأقل عدد كلمات مشمولة بالدراسة كانت 235 كلمة للمؤسسة القطرية للإعلام بنسبة خطأ 4.29% ونسبة لحن 0.5%.

ب. من حيث نسبة الخطأ:

ظهرت أعلى نسبة خطأ من مؤسسة الوسط اليمنية، مؤسسة إعلامية، حيث بلغت نسبة الخطأ 14.35%، من مجموع كلمات 817798 كلمة، أما نسبة اللحن فيها فكانت 0.138%.

أما أقل نسبة خطأ فكانت لمؤسسة الأيام السعودية، مؤسسة إعلامية لم يسجل لها أي خطأ في الدراسة التي شملت 9594484 كلمة، مع نسبة لحن 0.105%.

ج. من حيث نسبة اللحن:

ظهرت أعلى نسبة لحن عند مؤسسة جمهرة -غير محددة الدولة- والمصنفة أنها منوعة حيث بلغت 0.779% من مجموع كلمات 3837365 كلمة، مع نسبة خطأ 0.77%.

أما أقل نسبة لحن فكانت عند مجموعة مؤسسات تساوت فيها نسبة اللحن حيث بلغت 0.002%، وهي:

  1. وزارة الصناعة والتكنولوجيا المتقدمة في الإمارات، مؤسسة حكومية، ومجموع الكلمات قيد الدراسة 6652561 كلمة، مع نسبة خطأ 1.85%.
  2. هيئة المكتبات، مؤسسة سعودية ثقافية، بمجموع كلمات 281079 كلمة، مع نسبة خطأ 0.14%.
  3. الهيئة العامة للأوقاف في السعودية، مؤسسة دينية، بمجموع كلمات 191845 كلمة، ونسبة خطأ 0.79%.

اختتمت المؤسسة تقريرها بتوصية بينت فيها:

  1. الحاجة إلى رصد الواقع ومعطياته.
  2. تحليل المعطيات المرصودة لتقديم رؤية مستقبلية لحماية اللغة العربية.
  3. إيلاء المزيد من الاهتمام بأقسام التصحيح والتدقيق اللغوي في المؤسسات، وتطويرها، ودعمها بالتقنيات الحديثة.

ملاحظتي على التقرير:

لست من المؤهلين لنقد التقارير الجيدة مثل هذا؛ ولكنها وجهة نظر أحببت تبيينها، ولا تُفقد التقرير أهميته.

  1. التقرير جيد، واضح ومختصر.
  2. بالرغم من أن التقرير صدر لدعم اللغة العربية وسلامتها إلا أن به بعض الأخطاء الإملائية، كما استُعيض عن جملة “لا يوجد” بـ “nan” في نفي وجود أخطاء لدى مؤسسة الأيام السعودية.
  3. الرؤى في خاتمة التقرير لم تكن حلولًا عملية ؛ وإنما قُدمت كنتائج على استحياء.

رأي واحد حول “مؤشر سلامة استخدام اللغة العربية، قراءة توضيحية موجزة”

أضف تعليق