ص1       الفهرس        31-40

اللغة العربية والمعالجة الآلية

برامج صخر نموذجا

 

تقديم :  عبد الغني أبو العزم

شرعت شركة صخر منذ بداية الثمانينات من الألفية الثانية في تحضير قاعدة مشروع معلوماتي على صعيد العالم العربي، وكانت تملك تصورا يحكمه الوعي بمدى السرعة الهائلة التي يعرفها قطاع الإعلام والتواصل في مجال التقنية الإلكترونية وما تم تحقيقه من منجزات أوروبية وأمريكية في هذا الميدان في ضوء التجارب الأولى التي أنجزت، وما أصبحت تتوفر عليه من بنوك المعطيات وحواسيب ضخمة لتخزين المعلومات والمفردات بكميات هائلة جدا.

لقد تمكنت شركة صخر منذ شروعها في وضع برامجها في خانة التطور التي تعرفه الصناعة الإليكترونية دوليا وعلى قواعد وكفاءات علمية، وذلك لجعل اللغة العربية في مصاف اللغات العالمية، واستطاعت أن تحقق خلال عقدين من الزمن طفرة هائلة، وفجرت طاقات الإبداع والخلق والإنجازات في مجال تطوير أعمال وبرامج هي الآن تشكل خزانة هامة في المدارس والمؤسسات والمعاهد والإدارات.

نود من خلال هذا التقديم إبراز الجوانب الثقافية والأسس العلمية التي اعتمدتها الشركة العالمية من خلال إنجازاتها الكبيرة والمتعددة في مجال تطويع الحاسوب لخدمة اللغة العربية وثقافتها وحضارتها.

لم يكن من السهل على القطاع الخاص أن ينجز مخططا شاملا ذا رؤية مستقبلية لإعداد المجتمع العربي لعصر المعلومات، واستخدام الحواسيب، نظرا لوضعه الداخلي اجتماعيا واقتصاديا وسياسيا، ولأن هذا المخطط بكل المقاييس يرتبط ارتباطا عضويا بجهاز الدول في إطار التسابق الدولي للتمكن من الإعلام، الشيء الذي يسمح بالتحكم من جهة في دواليب الأجهزة القومية، ومسايرة التطور العلمي من جهة أخرى للسيطرة آليا على كل التوجهات العلمية على الصعيد الدولي.

يمكن القول في هذا الصدد إن وعي الأنظمة العربية كان غائبا بأهمية الطفرة الإعلامية التي تحققت دوليا في مجال التخطيط  لعصر المعلومات، أي تصاميم الحواسيب، وأنظمتها, ووضع برامجها، ونظم تشغيلها، وتطويع تقنياتها، حيث تلعب اللغات الوطنية حجر الزاوية، إما أن تكون قوة وذات فعالية في التخطيط القومي من أجل تنمية مستديمة والدفع بعجلة الصناعة الوطنية التي أصبحت خاضعة للتقنيات الحديثة في مضمار ما أضحت تفرضه العولمة من آليات جديدة للتعامل مع التطور الصناعي العالمي، وإما ألا تكون، فتغرق حينذاك في تبعية مطلقة، وتفقد هويتها وقدرتها على اللحاق بالركب الحضاري الذي أصبحت سيمته الأساسية قائمة على وسائل الاتصال.

تعد اللغة في هذا المضمار الوجه اللامع والبارز في الخريطة الإعلامية، وأساس كل المشاريع العلمية، لا باعتبارها أداة التخاطب والتواصل والتعليم والثقافة، بل لكونها أضحت معيارا قائما على التحدي لارتباطها بالتخطيط والتصنيع والتنمية، وأي لغة لم تدخل مجال التقنيات الإلكترونية ولم تستوعب التطور الحاصل في مجال الإعلاميات فإن مصير أهلها سيعرف تدهورا وانحطاطا.

إن أهم ما يميز عصرنا هو تضخم المعلومات، وضرورة الإحاطة بها لمعالجتها وتحليلها وتنظيمها وفهرستها، الأمر الذي لم يعد بإمكان الطاقات البشرية القيام به، هذا بالإضافة إلى أن شيوع استخدام الحواسيب في عملية التعليم والتعلم، أضحى حجر الزاوية للتزود بالعلم ومواكبة الفيض الهائل من المعلومات، مما يدعو حتما ضرورة التعامل مع الحاسوب، وتطوير أدواته على قاعدة اللغة الوطنية، أي إدخالها في غمار التقنيات الحديثة، واستخدامها في ضوء الوسائل العلمية المتاحة لكي تصبح أداة عملية في مجال النشر الإلكتروني.

اللغة العربية و"العالمية" : شركة صخر للبرمجيات

عندما بدأت الشركة العالمية تفكر في وضع مخطط شامل لبرامجها في ضوء التطور التقني الذي عرفته اللغات اللاتينية وفي مقدمتها اللغة الإنجليزية كانت تواجه معضلة أساسية في كيفية تعامل الحاسوب مع اللغة العربية نظرا لانعدام دراسات  لسانية حاسوبية ، وكما يقول د. نبيل علي "إن النظم الآلية تفرض على الموضوع الذي تعالجه (أي اللغة في حالتنا هذه) انضباطا واكتمالا يتعذر دونهما إخضاعه لمنطق الآلة وحسمها القاطع"(


[1]). ويضيف على ذلك إن هذا النقص سيكون تحديا قاسيا لدى التصدي لمشكلة قصور الدراسات اللغوية وضمورها في العربية، إذ أثبتت المنجزات التي تمت على صعيد اللغات الأخرى ما لتزاوجها مع الحاسوب من قدرة فريدة على إكساب هذه اللغة مزيد ارتقاء وكفاءة وحيوية ومرونة، وخصوبة، ومنطقية وصمود للزمن، قياسا على ذلك – لنا أن نتصور ما يمكن أن يؤديه الحاسوب في تعويض تخلفنا اللغوي: تنظيرا وتقعيدا، واستخداما"([2]) .

ومما لا شك فيه إن هذه الرؤية هي التي قادت خطوات الشركة العالمية(صخر) لكي تضع كل ثقلها ورهانها الضخم في مجال تطوير آلياتها من جهة، والمساهمة الفعالة في دعم تطوير الدراسات والأبحاث اللغوية المتعلقة باللغة العربية من جهة أخرى، والانفتاح على عالم جديد تتحكم في تقدمه الصناعة الإلكترونية المرتبطة بالمعلومات.

ارتبطت هذه الرؤية بإعادة النظر في كثير من الآراء المسبقة حول طبيعة اللغة العربية والادعاء بعدم قابليتها للمعالجة الآلية باستخدام الحاسوب، بالإضافة إلى ما ظلت تتعرض إليه من هجوم يمس كيانها وحضارتها وتراثها، وهنا يبرز التحدي الأكبر، إذ"أن إثبات زيف وتضليل هذه الإدعاءات على المستويين اللغوي والتقني، ليس فقط ضربا من ضروب الحمية القومية اللغوية، ولكنه عامل مهم لتخليص أخصائيي الحاسوب ومستخدميه من أسر هذا المفهوم الخاطئ الذي يحد طموحهم، ويضع قيودا مصطنعة على أداء البشر وما يبدعونه من نظم آلية"([3]) وهذا التحدي في بدايته كان عليه أن يبدد من خلال التطبيق والممارسة العلمية كل" المفاهيم الخاطئة عن العلاقة بين اللغة العربية والحاسوب، وإبراز خصائص هذه اللغة التي تؤهلها كموضوع مثير للمعالجة الآلية" وقد تم في هذا الصدد الاستفادة من التجارب الأجنبية فيما يخص المعالجة الآلية للغات الطبيعية، وتعميق البحث في حقل الدراسات اللسانية الحاسوبية في ضوء علاقتها بالظواهر اللغوية والتقنية.

لقد استطاعت الشركة العالمية (صخر) أن تواجه هذا التحدي وما يفرضه من رهانات بصبر وتؤدة، وبخطى ثابتة، وتمكنت من وضع مشاريعها وبرامجها في عداد الانجازات الآلية لتطويع اللغة العربية في إطار منظومة اللغة وتقنيات الحاسوب، ونظم المعلومات وإخضاعها للمتطلبات العديدة الخاصة بالمعالجة الآلية لقضايا اللغة وتراكيبها في مجال النحو والصرف والمعجم، وسنستعرض فيما يلي أهم الانجازات والأعمال التي حققتها صخر وتمكنت من خلالها احتلال الصدارة والريادة في عالم البرمجة الآلية.

المكنز العربي Corpus

لقد عرف المكنز على صعيد اللغات اللاتينية تطورا مدهشا منذ بداية الستينات وأصبح يتوفر على تقنيات هائلة في مجال تخزين المعلومات والنصوص والمفردات والمصطلحات واسترجاعها وفق معايير وأنساق منهجية([4]). ولم يعد بالإمكان الاستغناء عما يقدمه من خدمات وحلول آنية في مجال اللغة نحوها وصرفها ومعجمها، وتخزين مختلف نصوص المعرفة، هذا بالإضافة إلى ركنه الأساس في إعداد وتجهيز واختبار كل البرامج المبنية على تطبيقات معالجة اللغات الطبيعية الإنسانية، NLP.

عكفت شركة صخر منذ نشأتها على إيجاد مكنز عربي متطور تمكن في فترة وجيزة من مواكبة التطور العالمي الذي تعرفه مكانز اللغات اللاتينية، وكانت غايته في البداية تنحصر في دعم تجهيز واختبار المحلل النحوي فيما يخص تصنيف المفردات إلى أقسامها المكونة لها (اسم، فعل، صفة، حرف) وما يرتبط بتقييس الجمل بأنواعها (جملة بسيطة وجملة مركبة.. جملة خبرية وجملة إنشائية)، أي فهم خصائص النحو العربي للتمكن من إبراز المطالب الأساسية للمعالجة الآلية، وذلك بالتركيز على العلاقة العضوية بين النحو والصرف، ورتبة المفردات داخل الجملة العربية، وما تتميز به في موقع النحو العربي، وبعد هذه الخطوة اتسع نطاق مهام المكنز إلى ما هو أعم وأشمل، أي تجهيز واختبار كل البرامج العربية التي طورتها صخر والمرتبطة بتطبيقات معالجة اللغات الطبيعية.

ما هي المعايير التي اعتمدتها صخر في إنشائها للمكنز العربي؟

إذا كان المكنز في بدايته قد ركز مهمته الأولى على دعم تجهيز واختبار المحلل النحوي, ثم تطور في اتجاه تجهيز واختبار كل البرامج العربية، فإن هذه المهام قد فرضت ضرورة توسيع حجم المكنز على أساس دراسات دقيقة من أجل حصر فروع المعرفة المتداولة على نطاق واسع، وعلى اختلاف أنواعها وأساليبها وأنماط كتابتها لكي تعكس ما هو سائد في الكتابات العربية على اختلاف موضوعاتها، كما أن عملية الحصر هاته ارتبطت بمجموعة من المعايير تم تحديدها زمنيا:

1 - اِنتقاء نصوص أدبية ومعرفية قديما وحديثا، والوقوف من خلالها على سمات التطور الدلالي سواء فيما يتعلق بالألفاظ ومعانيها، أو الأساليب وتراكيبها، والتركيز على النصوص العربية الحديثة المعاصرة في المناطق العربية، الأمر الذي سيؤدي بالضرورة إلى فرز الألفاظ المولدة والمصطلحات المستحدثة.

لم تكن عملية اختيار وانتقاء النصوص بالأمر الهين، ولقد خضعت بدورها إلى وضع معايير يمكن إجمالها فيما يلي:

   أ - التركيز على النصوص الأدبية والدينية ذات الطبيعية السردية.

  ب - انتقاء نصوص معبرة تاريخيا بما فيها نصوص ذات أساليب مجازية.

  ج - تجنب النصوص الحوارية.

   د - إبعاد النصوص الشعرية نسبيا.

لقد أفرزت هذه المعايير في البداية مصادر أساسية نذكر من بينها.

   أ - القرآن الكريم.

  ب - كتب السنة (صحيحا البخاري ومسلم، ومسند أحمد وموطأ مالك، وسنن          

الترمذي وأبي داود والنسائي والدارمي).

  ج – كتب معرفية وأدبية سردية تتضمن موضوعات مختلفة.

  د – مقالات متنوعة مأخوذة من صحف ومجلات عربية ذات انتشار واسع، ولقد روعي في اختيار النصوص الأدبية الصفة التمثيلية لمؤلفيها على نطاق أقطار العالم العربي.

الاختيار والتجهيز

إذا كان المكنز وعاء لتخزين النصوص واسترجاعها، فإن هذه المهمة تعد ثانوية جدا، إذا فقدت ماهية التصرف فيها صرفيا ونحويا ومعجميا، وبذلك تم الشروع في:

   1 - إجراء تحليل صرفي/ نحوي/ دلالي لنصوص المكنز العربي بما فيها بنية الكلمة وعملية الاشتقاق والتركيب والمزج داخل منظومة الصرف وأنماطها والضبط الإعرابي، أي تهيئ المكنز لحل المشاكل المرتبطة بمعالجة الصرف العربي آليا، إذ أي تقدم في مجال إدخال اللغة العربية إلى عالم الحاسوبية والمعلوماتية مرهون بحل كل القضايا الصرفية، والإحاطة بمواضيعه من حيث تصريف الأفعال والاشتقاق والتوليد، والتغلب على ما هو من طبيعة اللغة، أي الإعلال والإبدال، هذا بالإضافة إلى ما يطرحه موضوع الشكل في اللغة العربية صرفيا ونحويا ومعجميا، بجانب تعدد بنية الكلمة وإعرابها وتركيبها من حيث اللواحق والزوائد.

وقد تم التغلب على كل هذه المشاكل بوضع أسس عملية لمعالجة الصرف العربي آليا، نذكر منها حسب ما جاء به د. نبيل علي في كتابه "اللغة العربية والحاسوب([5]).

"ضرورة تعامل المعالج الصرفي الآلي مع أطوار التشكيل المختلفة للنصوص العربية.

   - تجزيئ نظام الصرف الآلي لغويا.

   - تعامل المعالج الصرفي الآلي مع ثنائية الصيغة الصرفية والميزان الصرفي (البنية العميقة والبنية السطحية).

   - شمولية المعالج الصرفي لجميع الجذور المعجمية الممكنة والصيغ الصرفية المسموح بها.

   - فصل القواعد الصرفية عن البرنامج الآلي.

   - مراعاة ثنائية التحليل والتوليد.

   - دمج المعالج الصرفي في كثير من النظم اللغوية الأشمل.

   - خضوع المعالج الصرفي لاختيارات دقيقة للتأكد من تغطيته لجميع الحالات

      الصرفية والمعجمية للكلمة العربية.

   - الاهتمام بالمعنى باعتباره الغاية القصوى للتنظير اللغوي للصرف ومعالجته الآلية بالتالي".

2 - تصنيف الكلمات غير المحللة صرفيا.

يساعد هذا التصنيف على حصر الأخطاء بجميع أنواعها.

   أ - أخطاء إملائية.

  ب - أخطاء إدخال.

  ج - علامات ترقيم أو أرقام سقطت المسافات بينها، وبين الكلمات النهائية.

  د - كلمات قديمة الاستخدام.

  هـ – كلمات عربية مستحدثة غير موجودة بالمعاجم.

  و - كلمات أجنبية.

  ن - أسماء الأعلام الأجنبية.

  ج - كلمات عامية.

  ط - أخطاء شائعة.

يقود هذا التصنيف بمجمل الكلمات المشار إليها أعلاه إلى تحديد طبيعتها وفي ضوئه يتم:

  أ - تصويب الأخطاء الإملائية وأخطاء الإدخال.

  ب - إقامة المسافات بين علامات الترقيم أو الأرقام، وبين الكلمات النهائية.

  ج - تعديل زمن استخدام الكلمات القديمة بما أنها مستخدمة في بعض الكتابات الحديثة.

  د - إضافة الكلمات العربية المستحدثة إلى قاعدة البيانات المعجمية.

  هـ  - إضافة الكلمات والأعلام الأجنبية إلى قاعدة البيانات المعجمية.

  و - وضع رموز خاصة بالكلمات العامية والأخطاء الشائعة، حتى يمكن البحث عنها.

  ز - ترميز النصوص لتحديد الكلمات الفريدة.

  ح - تجهيز بيانات فك اللبس الصرفي والنحوي والدلالي.

يشكل تجميع النصوص وتصنيف الكلمات حسب القواعد التي أشرنا إليها قاعدة أساسية لجهاز المكنز لإعداد البرامج والأدوات البرمجية مما يساهم عمليا في استخدامه وتطويره، الأمر الذي يتيح :

1 - عرض نتائج البحث بطرق مرنة على مستوى: الكلمة أو الجذر أو الميزان الصرفي أو قسم الكلم أو التركيب أو المعنى.

2 - استخراج إحصائيات أساسية مثل:

   أ - النظم الإحصائية لقياس التردد ومعرفة الكلمات الشائعة الاستخدام.

   ب -نظم إحصائيات السياق الموجه للكلمة Word collocation

   ج - النظم الإحصائية لبناء نموذج لغوي N-gram statistics

يعتبر الإحصاء اللغوي من المجالات الحيوية التي يقدمها المكنز، ويجعل الباحث يملك تصورا لطبيعة اللغة، إذ بجانب قدرته على التحليل الكمي وإفراز النتائج المطلوب تحصيلها فإنه بإمكانه أن يعطينا كمية الحروف التي يخزنها، وعدد الكلمات والموازين الصرفية والصيغ النحوية ونسب الأفعال الصحيحة والمعتلة، والإفراد والتثنية والجمع، وعدد الحركات القصيرة والطويلة وأساليب التعدية ومعاني الكلمات وصيغ المجاز وسياق الألفاظ ، وهناك جانب إحصائي آخر في مجال الكتابة العربية له أهمية بالغة في تصميم نظم المعالجة الآلية للغة العربية ولقد أوجزه د. نبيل علي في ثلاثة محاور([6]) :

   أ - إحصائيات عن التوزيع النسبي لاستخدام الحروف العربية المفردة (بغض النظر عن أشكالها) وأزواجها وثلاثياتها، وكذلك معدلات احتمال وقوع كل حرف في المواضع المختلفة من الكلمة.

  ب - إحصائيات عن التوزيع النسبي لعلامات التشكيل في النص القرآني الكريم وذلك لتقدير علاقات الترابط بين الحروف وعلامات التشكيل على أساس كمي.

حجم المكنز

لقد أشرت إلى أن المكنز اللغوي، له قدرة ضخمة وهائلة على تخزين المعلومات والنصوص والمفردات والمصطلحات، ويمكن الإشارة هنا إلى أن المكنز بالحرف اللاتيني في السبعينات تمكن من تخزين 470 مليارا من الحرف وعلى هذا الأساس يمكن أن يستوعب مليون كتاب، أي بمعدل مائتي صفحة لكل كتاب([7]). وبالنسبة للمكنز العربي الذي أنجزته صخر "لقد بلغ حجمه في المرحلة الأولى من بنائه 10 ملايين كلمة، ثم وصل في مرحلته الثانية إلى 160 مليون كلمة، وقد تم تحديد البيانات الخاصة بها بواسطة برنامج المشكل الآلي تلقائيا، حيث يقوم بإجراء عمليات فك اللبس الصرفي والنحوي بالاعتماد على تقنيات متطورة، ومن المفروض أن يصل حجمه إلى 500 مليون كلمة.

أهداف وغايات المكنز

يمكن للقارئ الآن أن يتساءل عن المهام والخدمات التي يقدمها المكنز للباحث من جهة وللبرامج والنظم الآلية التي يتم إعدادها من جهة أخرى.

إن أهم إنجازات المكنز يمكن تلخيصها فيما يلي:

 1 - المحلل الصرفي الآلي

يعد المحلل الصرفي الآلي من الآليات الأساسية للتعامل مع طبيعة الكلمات سواء كانت مجردة أو مرتبطة بزوائد ولواحق، وذلك باستخلاص العناصر الأولية لبنية الكلمة وتحديد سماتها الصرفية.

2 -  قاعدة البيانات المعجمية، أو ما يمكن تسميته أيضا بأساسيات المعطيات المعجمية، وتتجلى أهميتها في كونها مهيأة ومجهزة لتحليل الأنماط المعجمية وقدرتها على الإجابة عن كل التساؤلات المتعلقة بالمفردات داخل سياقاتها دلالة وتركيبا، وهو ما يجسد أهمية قاعدة المعطيات النصية الخاضعة لمعالجة حاسوبية وفق منهجية دقيقة ومكثفة وذات مردودية عالية([8]).

تستمد قاعدة المعطيات المعجمية قوتها من المكنز، وهو بذلك يزودها ب:

   أ - المعاني الناقصة في المعاجم.

  ب - التعابير الاصطلاحية.

  ج - كل أنواع الظروف.

  د -  ألفاظ الحضارة والمصطلحات العلمية الحديثة.

  هـ – أنماط مختلفة للإزاحة الدلالية.

  و –  معلومات عن الحذف العهدي لبعض مكملات الجملة الفعلية.

  ز –  معلومات عن الصفة السببية.

  ح –  معلومات قابلية حذف الموصوف الإنسان أو المعنى المجرد.

  ط –  معلومات صرفية نحوية كالتنوين، أو المنع من الصرف والإفراد والتثنية والجمع والتذكير والتأنيث وما إلى ذلك.

  ي – الأنماط التركيبية للجمل العربية السائدة في الكتابات المختلفة.

  كـ – أسماء الأعلام العربية والأجنبية.

3 - التشكيل والإعراب الآلي

لقد أصبح بالإمكان التغلب على أكبر معضلات اللغة العربية المتجلية في الكتابة العربية وذلك بالتمكن من التشكيل باعتباره من مكوناتها الأساسية  وما يلابسها من إشكالات ليس هنا مجال لطرحها فيما يمس الكتابة والقراءة والتعليم والوظائف النحوية، وعلى الرغم من كل هذه الإشكالات، ونظرا لكون تشكيل الكلمات يؤدى إلى تحديد معانيها وحالاتها الصرفية كان من الضروري إيجاد حلول آلية وتجاوز المشاكل في التعامل مع النصوص العربية في الحواسيب، وهذا بالضبط ما أنجزته صخر بكثير من الدقة تصل إلى 98 % حيث بإمكان المستخدم لهذا البرنامج أن يحدد نوع التشكيل المطلوب سواء أكان تشكيلا كاملا أم تشكيلا جزئيا لازما لفك اللبس الصرفي، سواء تعلق الأمر باللغة العربية في نصوصها القديمة أو المعاصرة.

وتعتبر تقنية التشكيل الآلي في ضوء دراسات لسانية إحصائية دقيقة ساهم في بلورتها نظريا وتطبيقيا د. نبيل علي، من أهم منجزات صخر في ميدان تطويع اللغة العربية في تعاملها مع الحاسوب، وقد اعتمدت تقنية التشكيل الآلي على عدة مستويات لتحليل ومعالجة اللغة، منها المستوى الصرفي للكلمات، والمستوى الإعرابي، ومستوى التحليل الدلالي، وسمحت هذه التقنية باستخدام أنظمة متطورة جدا في الذكاء الاصطناعي، والاعتماد على المعاجم اللغوية الضخمة، الأمر الذي تطلب سنوات طويلة من البحث الدقيق، ولم يأت برنامج المشكل الآلي من فراغ، فهو جزء من مشروع ضخم يهدف أساسيا إلى معالجة اللغة العربية آليا، ولقد ساعد على إنجاز العديد من البرامج المتطورة نشير هنا إلى بعضها : برنامج القرآن الكريم والحديث الشريف، ونظام الاسترجاع في قواعد النصوص العربية، والبرامج العديدة في مجال التعليم والتكوين والثقافة، بالإضافة إلى كل هذا فإن المشكّلِ الآلي يتم توظيفه في العديد من التطبيقات التقنية التي تهتم بمعالجة النصوص العربية مثل البحث في الإنترنت، وتحويل النص المكتوب إلى منطوق، وكذلك الترجمة الآلية من وإلى العربية.

4 - المصحح الآلي

يعد المصحح الآلي من الأدوات الإجرائية التي تضع النصوص تحت مراقبة دقيقة مما يساعد على تلافي الأخطاء الشائعة، ولقد خضع إنجاز هذا البرنامج إلى دراسات وأبحاث صرفية ونحوية لطبيعة اللغة العربية، وقابلية إخضاعها للتعامل الآلي، ولقد ساعد تطور البحث في هذا الصدد ما تم تراكمه أثناء عملية التخزين في المكنز، وما أصبح يقدمه المحلل الصرفي من خدمات، كما أن هناك جانبا لغويا ساعد على تقدم البحث فيها يمس بنية الكلمة في اللغة العربية،ودور الجذر في تحديد صحتها، وعلاقته بمجموع الصيغ المنبثقة عنه، مما مكن من اكتشاف الأخطاء الإملائية آليا في ارتباطها بالتحليل الصرفي "ولأن المحلل الصرفي متعدد الأطوار وله القدرة على التعامل مع الأطوار المختلفة لتشكيل النصوص العربية يصبح هو أساس عملية اكتشاف صحة حروف الكلمات وعلامات تشكيلها على حد سواء، ونتيجة للعلاقة الوثيقة بين الصرف والنحو في العربية، لا يجب أن يكتفي في تدقيق النصوص العربية باكتشاف الأخطاء الإملائية على مستوى الكلمات القائمة بذاتها، بل يجب أن تمتد عملية التدقيق لتشمل الجوانب المختلف للتآخي النحوي ما بين الكلمات"([9]).

وعلى هذا الأساس فإن المصحح الآلي يحدد ويبرز :

   أ - صور وأنماط الأخطاء الإملائية والنحوية الشائعة في النصوص، وعلى سبيل المثال الأخطاء المتمثلة في الخلط بين همزتي القطع والوصل، والخطأ في رسم الهمزات المتوسطة والمتطرفة، وكذلك الخلط بين الهمزة والمدة، والتاء المربوطة والهاء، والألف المقصورة والممدودة، كما يقوم المصحح الآلي بتصويب الأخطاء الناتجة عن وجود حرف ناقص أو حرف خطأ، أو مكرر، أو زائد، وغير ذلك من الأخطاء الإملائية في كتابة اللغة العربية.

   ب – إنجاز إحصائيات دقيقة وشاملة لأفضل اقتراحات التصويب.

   ج – إضافة المتلازمات السياقية مما يعزز دقة التصويب من خلال الموارد التالية:

    أ – القواعد اللغوية الموضوعة لتصويب الأخطاء الإملائية والنحوية في المكنز العربي.

   ب – قاعدة بيانات معجمية تحتوي على جميع التصنيفات النحوية والدلالية لعناصر الجملة العربية والتعبيرات الاصطلاحية والكلمات الأجنبية.

   ج - قاعدة بيانات تحتوي على أكثر من 20 ألف تعبير مسكوك .

   د - قاعدة بيانات تحتوي على أكثر من 65 ألف كلمة متلازمة سياقيا، ثم تجميعها من المكنز العربي لتحسين ترتيب التصويبات المقترحة. ويعد المعجم الآلي من بين البرامج الناجحة التي تم استخلاصها وتحصيلها في ضوء تجارب ودراسات وأبحاث علمية أجريت على المكنز العربي.

 

 

 

 5-  المصحح النحوي.

ويأتي في نفس السياق المصحح النحوي، الذي أصبح بإمكانه القيام بتصحيح الأخطاء النحوية التي نجدها شائعة في العديد من الكتابات الصحفية والإنشائية وغيرها مثل تصحيح إعراب الكلمات التي تلزم حالة الرفع والجر، والأفعال التي تلزم حالة النصب والجزم، وكذلك أخطاء الممنوع من الصرف والمفعول المطلق، وعدم المطابقة النحوية بين الصفة والموصوف والمعطوف والمعطوف عليه، وأخطاء كتابة الأعداد البسيطة والمركبة والمعطوفة وتمييزها، وأخطاء الجملة الفعلية والاسمية، وغيرها من الأخطاء النحوية الأخرى في اللغة العربية.

ويمكن القول في هذا الصدد أن معالجة النحو آليا على نطاق اللغات الطبيعية قد قطعت أشواطا في دمج وامتزاج الدراسات اللسانية بالدراسات الحاسوبية، وأصبحت العلاقة بينهما علاقة تبادل واقتراض، وأي تنظير للغات الطبيعية أصبح مرهونا بمعرفة دقيقة للأساليب المنهجية والتحليلية لعلوم الحاسوب، الأمر الذي يؤهل اللغوي لكي يستخدمها في صياغة جديدة للمنظومة النحوية، وتطوير علم الدلالة وكل ما يتعلق أيضا بالصناعة المعجماتية.

6 - المصنف الآلي

يعد المصنف الآلي الذي طورته صخر من بين البرامج العملية التي تساهم في توثيق الوثائق العربية، وتصنيفها بالإضافة إلى وثائق اللغة الإنجليزية، تكمن أهمية المصنف الآلي في قدرته على تحديد مواضيع الوثائق بطريقة آلية، كما يقوم بإتاحة خيار عرض الموضوعات العامة في الوثيقة فقط، أو عرض جميع الموضوعات التي يتضمنها محتوى الوثيقة.

ومن بين خصائص المصنف الآلي أنه يعتمد في تصنيفه للوثائق على ركيزتين اثنتين:

  أ - التحليل الإحصائي

يقوم التحليل الإحصائي على قياس نسبة تردد الكلمات التي تمثل الموضوعات العامة والفرعية التي تدور حولها الوثيقة، وتنقسم هذه الكلمات إلى نوعين: كلمات تمثل موضوع الوثيقة بشكل قاطع، وأخرى قابلة لأن تدمج في أكثر من موضوع في وقت واحد.

  ب - مجموعة الموارد الأساسية التي يعتمد عليها المصنف الآلي، وهي تشتمل على تقنية التحليل الصرفي (للوثائق العربية) وتقنية تحديد ساق الكلمة stemmer (للوثائق الأنجليزية) وقاعدة بيانات تغطي الموضوعات العامة، وأهم ما يندرج تحتها من موضوعات فرعية، ومكنز صخر العربي الذي يعتبر حجر الزاوية حيث تتم الاستفادة منه في رصد وتصنيف الموضوعات العامة والفرعية في الوثائق العربية على اختلاف الفترات الزمنية التي شهدت كتابتها، وبجانب هذا المورد، هناك موارد أخرى اعتمد عليها المصنف الآلي منها: قاعدة بيانات ضخمة تغطي أشهر التعابير الاصطلاحية ذات الصلة المباشرة بالموضوعات العامة والفرعية، ومعاجم عامة ومتخصصة، تغطي معظم جوانب المعرفة، وأعلام المشاهير والمفكرين ذوي الصلة المباشرة بشتى موضوعات المعرفة الإنسانية.

7 - المفهرس الآلي

يشكل المفهرس الآلي خطوة كبرى في مجال العقلنة الآلية لفهرسة الكتب العربية ويعد هذا البرنامج الأول من نوعه على الصعيد العربي، وينجز بدقة أعقد عمليات الفهرسة للمكتبات.

ويمكن تحديد المهام التي يقوم بها المفهرس الآلي في مهمتين أساسيتين :

1 – فهرسة الكتب وذلك عن طريق استخلاص الكلمات والتراكيب المفتاحية، كما أنه يتيح عدة اختيارات في مجال الفهرسة: ألفبائيا، أو وفق ساق الكلمة، أو حسب تكرارها، كما يقوم البرنامج بوضع أرقام الصفحات في حالة فهرسة الكتب.

يشتغل المفهرس الآلي في فضاء واسع أثناء عملية الفهرسة، سواء بالنسبة للكتب العربية أو الإنجليزية، وذلك لاعتماده على ركيزتين أساسيتين :

  1 - التحليل الإحصائي.

 2 - تقنيات التحليل المحددة في:

  أ - تقنية التحليل الصرفي للكلمات العربية.

  ب - تقنية تحديد ساق الكلمة stemmer بالنسبة للكلمات الأنجليزية.

  ج - قواعد بيانات بالكلمات والتراكيب السائدة في النصوص العربية والأنجليزية.

  د - قاعدة بيانات للأعلام والأماكن الشهيرة.

  هـ – قاعدة بيانات لفهارس آيات القرآن الكريم.

يتميز المفهرس الآلي بمجموعة أخرى من الخصائص، زيادة على اعتماده في التحليل الإحصائي على قياس نسبة تردد الكلمات والتراكيب المفتاحية في الوثائق، ومن بين هذه الخصائص:

  أ - استخدامه لمعايير منهجية إضافية مثل ارتباط الكلمات وتراكيب الموضوعات السائدة.

  ب - تحليل العلاقات الصرفية والنحوية والدلالية بين تلك الكلمات والتراكيب وبين السياقات التي وردت فيها.

  ج - تحديد موقع الكلمات والتراكيب في الوثيقة، ومدى قوة تلك الكلمات والتراكيب المكتسبة من دلالاتها على محتوى الوثيقة.

  و - إبراز نوع الكلمات والتراكيب في قسم الكلم، إذ يفضل البرنامج الأسماء والمصادر لأنها أقدر على نقل المفاهيم والأفكار التي تكشف عن محتوى الوثيقة.

  هـ – إظهار الكلمات المعرفة والمكتوبة بمؤثرات الطباعة المختلفة، مثل الخطوط البارزة والسميكة.

وأصبح الآن بإمكان تثبيت المفهرس الآلي في الحاسوب بشكل يتيح الوصول إليه بمنتهى السهولة من خلال أيقونة صغيرة تظهر في واجهة الاستخدام في برنامج مكروسفت ورد Microsoft Word

8 - الملخص الآلي

يأتي الملخص الآلي بدوره ليعزز مجموعة البرامج العربية التي طورتها أخيرا صخر، ويتميز هذا البرنامج بخاصية التلخيص الآلي للوثائق، والبريد الإلكتروني وصفحات الإنترنت بالإضافة إلى استعراض الأفكار الرئيسية التي يتضمنها أي نص باللغتين العربية والأنجليزية.

لقد اعتمد الملخص الآلي على ما تم إنجازه من تقنيات صخر في مجال البرمجة المعلوماتية، أي المحلل الصرفي والمفهرس الآلي، والمشكل الآلي، ويمكن تلخيص خصائصه في المهام التالية :

أ – قدرته الفائقة على استخراج الأفكار الرئيسية من الوثيقة وتقديمها بطريقة مختصرة مما يؤدي إلى اختصار الوقت اللازم للقراءة، الأمر الذي يستلزم توظيف العديد من التقنيات المتقدمة في الإحصاء، بالإضافة للفهم الدلالي للنص الذي يتطلب قاعدة لغوية تغطي معظم مفردات اللغة.

ب – تحديد حجم النص الأصلي المرغوب إيجاده في النسخة الملخصة.

ج – تحديد عدد الجمل الأصلية التي تظهر في النسخة الملخصة.

د – تحديد عدد كلمات النص الأصلي التي يراد إدراجها في النسخة الملخصة.

تمثل هذه الخصائص مجرد حلقة أولى، إذ أن الملخص الآلي حسب تقدير مهندسي صخر مهيأ ليصبح إحدى تقنيات المستقبل اللازمة إلى أدوات المكتب الأنترنت والأنترانت نظرا لدوره الحيوي في توفير الوقت عند التعامل مع الكميات الضخمة من المعلومات.

9 – الرابط الآلي

يسعى الرابط الآلي إلى تنظيم المعلومات وتصنيفها، والحصول عليها بسهولة ويسر، وبدقة تامة، حتى ولو كانت موزعة في العديد من المستندات، دون الحاجة إلى تصفحها كاملة، وتقوم الفكرة الرئيسية لهذا البرنامج على ربط الجمل التي يحددها المستخدم للبحث عنها داخل المستندات، أو جمل رئيسية يتم تحديدها تلقائيا، بحيث يسهل التنقل بين هذه الجمل بمجرد الضغط على أحد الروابط من الصفحة الرئيسية، فينتقل إلى الكلمة نفسها، أو إلى الجملة ذاتها في نص آخر، ومنه إلى نص آخر إذا كانت موجودة فيه إلى أن يتم الرجوع التلقائي إلى الصفحة الرئيسية.

يخضع برنامج الرابط الآلي إلى طريقة ممنهجة أثناء تشغيله فيما يخص عرض المستندات أو ربطها، أو عرض محتويات صفحة كلمات هامة أو إضافة جملة  جديدة لصفحة كلمات هامة، أو حذف جملة موجودة منها.

10 – البحث الموضوعي 

يتميز برنامج البحث الموضوعي بتقنية خاصة، إذ يسمح بربط الكلمات المراد البحث عنها بالكلمات التي يمكن أن تشترك معها في تصنيف موضوعي معين داخل الوثائق العربية. تعتمد تقنية البحث الموضوعي على الموارد التالية.

أولا: قاعدة بيانات تغطي الموضوعات والمفاهيم العامة، بجانب ما يندرج تحتها من موضوعات ومفاهيم فرعية، وعند إجراء البحث الموضوعي مثلا عن كلمة المجتمع، تمدك بـ المجتمع الإسلامي، المجتمع العربي، المجتمع البدائي، المجتمع الطبقي، المجتمع اللاطبقي، علم الاجتماع، التغيير الاجتماعي، والتكيف الاجتماعي.

وإذا تم البحث عن كلمة الإسلام، تجد ما يتعلق بها: الشريعة الإسلامية، الدين الإسلامي، القرآن الكريم، علوم القرآن، علم الفقه الإسلامي، أصول الفقه الإسلامي، الأعياد الدينية الإسلامية، حروب الردة، وهكذا دواليك.

ثانيا: المحلل الصرفي الآلي

يقوم المحلل الصرفي الآلي بربط الكلمات التي تندرج تحت موضوعات أو مفاهيم معينة، سواء كانت تلك الكلمات مشتقة أو مصرفة، حيث يتم الربط بين المفرد والمثنى  والجمع، والنكرة والمعرفة إذا كان لها نفس الساق.

ثالثا: مكنز عربي Computerized Arabic corpus

يحتوي هذا المكنز على أزيد من 160 مليون كلمة، وقد خضع لعدد من البحوث العلمية والتجارب بهدف استخلاص نتائج نهائية دقيقة فيما يخص الموضوعاتوالمفاهيم السائدة في الكتابات العربية، وما يندرج تحتها من موضوعات ومفاهيم فرعية، وتجدر الإشارة هنا إلى أن هذه الكتابات قد خضعت إلى استقصاء على اختلاف فتراتها الزمنية وموضوعاتها ومؤلفيها.

11 - القارئ الآلي : O C R

يعد القارئ الآلي إحدى التقنيات المتطورة جدا في مجال الصناعة الإلكترونية المعلوماتية وجعل اللغة العربية تحتل مكانتها اللائقة بها بين اللغات الطبيعية، إذ أصبح بالإمكان التعرف على النصوص العربية بمختلف أشكال كتابة حروفها سواء كانت مشكلة أو غير مشكلة، حيث يتم تحويلها إلى ملفات إلكترونية قابلة للمعالجة والتصرف فيها بالإضافة أو الحذف، ولقد أصبح القارئ الآلي يملك قدرة التعرف على حروف الكتابة العربية بجميع أشكالها بسرعة فائقة تزيد على 500 حرف في الثانية الواحدة، وبالإضافة إلى ذلك يتيح إمكانية تخزين النصوص وحفظها بشتى أنواع الصيغ المعروفة، وحتى صيغة HTML  وUNICOM.

يعتبر تطوير القارئ الآلي من المنجزات الرائعة التي تمكنت صخر من تحقيقها في مجال دعم اللغة العربية، وأصبح يشكل معيارا أساسيا في صناعة التعرف الضوئي على الحروف، وكما صرح بذلك السيد جميل عزو إذ " أن القارئ الآلي أسوة بالعديد من منتجات صخر الأخرى المتطورة يمثل محور الارتكاز لسياسة صخر التحويلية في الألفية الثالثة" ([10]).

ومن بين خصائص القارئ الآلي:

- قدرته على تمييز عدد كبير من اللغات وتعرفها بواسطة أدوات التمييز المتاحة، فبالإضافة إلى اللغة العربية والفارسية فإنه يدعم إحدى عشر لغة أوروبية وهي: الأنجليزية والفرنسية والألمانية والإيطالية و الإسبانية والبرتغالية والنرويجية والسويدية والدنماركية والنمساوية والفلندية.

- احتواؤه على 26 مكتبة خطوط عربية.

- تحديد الصور في الملف آليا وإخراجها مع النص الناتج.

- القيام بفهرسة آلية فعالة لوثائق النص الناتجة عن عملية التمييز

12 - الإملاء العربي الآلي

من بين البرامج التقنية التي تطورت في السنوات الأخيرة على صعيد اللغات الأوروبية إمكانية التعرف على الكلام وتسجيله كتابة على شاشة الحاسوب، وفي هذا الصدد عكفت صخر على اللحاق بالركب بصبر وتؤدة، حيث بدأت الترتيبات الأولية منذ منتصف العقد الأخير من القرن الماضي لتطوير نظام عربي للإملاء الآلي.

لقد اعتمد هذا الإنجاز الآلي من جهة على الإمكانات التي أصبحت تملكها شركة صخر في مجال معالجة اللغة العربية آليا، الأمر الذي سيمكن نظام التعرف على الكلام بدقة وأداء متميزين، ومن جهة أخرى اعتماده على مكنز لغوي ضخم ونماذج لغوية دقيقة إحصائيا وضوئيا.

ومن خصائص برنامج الإملاء العربي الآلي :

أ – استخدامه بكيفية سهلة وبسيطة بعد تثبيته على الجهاز.

ب – قدرة التعرف على الإملاء المتواصل باللغة العربية الفصحى الحديثة.

ج – التآلف مع الأصوات التي يتلقاها، أي يكفي تمرين النظام على صوت المستخدم قبل الإملاء بهدف زيادة قدرة التعرف على الكلام.

ومما لاشك فيه إن إنجاز نظم الإملاء العربي الآلي، بالإضافة إلى مجمل الإنجازات التي تحدثنا عنها تشكل قفزة نوعية في مجال عولمة اللغة العربية وجعلها مسلحة بآخر التقنيات الحديثة التي أنجزت على صعيد اللغات الطبيعية.

الإنترنت والمعلوماتية العربية

لقد بات الهم الأساسي لشركة صخر في مدى قدرتها على اختراق عالم تكنولوجية المعلومات والإنترنت، ولقد استطاعت في هذا المجال في ضوء اعتمادها على تقنيات حديثة وذلك من خلال الدور الرائد الذي تقوم به لمواجهة متطلبات السوق العربية ومسايرة التطور الهائل الذي ستعرفه صناعة البرمجيات خلال الألفية الثالثة.

ولقد قامت صخر فعلا في هذا الصدد بطرح نظم جديدة وتطبيقات هائلة فيما يخص الترجمة الآلية والكلام والمكتب، ويمكن إيجازها فيما يلي:

- إيجاد حلول عربية أصيلة ومتكاملة للهيئات والمؤسسات العربية الكبرى.

- تطوير أدوات النشر الإلكتروني والنشر على الإنترنت.

- تطوير برنامج سندباد 4.6  المتصفح العربي للإنترنت.

- تنمية سوق صخر الألكتروني، أي تكوين بنية أولى للتجارة الإلكترونية باللغة العربية على شبكة الإنترنت، ولقد تم في هذا الإطار توفير أفضل وسائل الحماية والأمان لضمان سلامة العمليات التجارية بالسوق .

- إنجاز الآلة القارئة وتطوير نظم الترجمة من وإلى العربية التي تخدم ذوي الإعاقة البصرية.

- إطلاق برنامج نظام إدارة الوثائق العربية Arab Docs الذي يتيح للمستخدمين بالمؤسسات الكبرى التعامل بسهولة مع مختلف الوثائق وإجراء العمليات المختلفة عليها.

الإنترنت، موقع صخر

لقد استطاعت شركة صخر بما تتوفر عليه من تقنيات حديثة أن تضع قدما راسخة في عالم الإنترنت، وتمكنت بذلك من احتلال موقع ممتاز خدمة للغة العربية وثقافتها، وأصبح زائر هذا الموقع أمام عدة اختيارات حسب تكوينه ومستواه الثقافي، لما يتضمنه من ثروة لغوية ضخمة تضم معاجم عديدة وبرامج ثقافية متنوعة، مثل: المتنبي الذي يضم شعره، وقد نشر بدقة متناهية متضمنا مقدمة عن حياته، بالإضافة إلى خمسة شروح لشعره، أي شرح المعري والبرقوقي والياجزي والعكبري وابن جني، وكتاب في جريدة، وسينما العرب، بالإضافة إلى برامج ترفيهية وتكوينية مجانية يمكن تحميلها من الموقع.

ومن المعاجم التي أصبح بإمكان أي زائر لموقع صخر الوقوف عندها: المحيط ومحيط المحيط، والوسيط، والغني، وقاموس المحيط، ولسان العرب، كما يضم قاموس المصطلحات الأدبية، وتأتي صفحة القاموس كتجربة رائدة لوضع كم هائل من المفردات والمصطلحات العربية وترجمتها بلغات عديدة.

وتحتل الثقافة العربية مكانا متميزا على خريطة موقع صخر، حيث نجد عددا متنوعا من الأبواب الثقافية التي يتم تحديثها دوريا كحكمة اليوم، وزيارة اليوم، ولوحة اليوم، وقصيدة اليوم، وحكاية اليوم، وهي حكاية تراثية تحت عنوان ألف حكاية وحكاية، هذا بالإضافة إلى العديد من الخدمات الثقافية الأخرى كاستضافة المواقع، وبهذا العمل  تساهم صخر في توسيع نطاق استخدام الإنترنت على الساحة العربية، وإتاحة الفرصة للقارئ العربي بأن يطلع على آخر المستجدات على شبكة الإنترنت، وتمكينه من إنشاء صفحات خاصة به باللغتين العربية والأنجليزية على شبكة الويب، ويتميز هذا الموقع بالسهولة الفائقة، والتمكن من إدارته، ولا تقف المساهمة عند هذا الحد، إذ تمنح صخر كل مستفيد من هذه الخدمة مساحة لنشر موقعه على الإنترنت، كما توفر معلومات دقيقة عن إجمالي المساحة التي قام باستخدامها، والمساحة المتبقية له لكي يتمكن من متابعة عمله بدقة، وعن طريق مركز الموقع يمكن للمستخدم أن ينشئ ملفات أو مجلدات جديدة، كما يمكنه مسح أو إضافة أو تعديل أي بيانات، وبعد الانتهاء من العمل يمكن إرسال الملفات إلى المساحة المخصصة له، وفي نفس الاتجاه سخرت صخر برنامجها الشهير ناشرنت البرنامج العربي الوحيد لإنشاء وإدارة المواقع على شبكة الإنترنت باللغة العربية ، ولا يحتاج هذا البرنامج إلى خبرة سابقة في التعامل مع لغة HTML، لأنه يعمل بخاصية Wysiwyg، أي أن كل ما تراه على الشبكة تحصل عليه.

تهدف هذه الخدمة التي توفرها شركة صخر إلى تمكين المستخدم العربي أينما كان في العالم من الحصول على موقع خاص به في الإنترنت وباللغة العربية، دون أي تكلفة على الإطلاق.

تطور مستمر لتقنيات الإنترنت العربية

ولا تتوقف مساهمة صخر في تطوير ما سبقت الإشارة إليه في مجال الإنترنت العربية، حيث تسعى جادة إلى تطويع اللغة العربية وجعلها في متناول المستخدم العربي تطبيقا وممارسة، وفي هذا المجال بالتحديد قامت بإنجاز أو خطوة هائلة غير مسبوقة, تجلت في إزاحة الستار عن أول خدمة في العالم لترجمة صفحات ويب الأنجليزية إلى اللغة العربية، وذلك بشكل تلقائي على الشبكة، ودون أي مغالاة فإن هذه التقنية تعد من أهم التطورات بالنسبة لمستخدمي الإنترنت الناطقين باللغة العربية، ولا شك أن هذه الأهمية الاستثنائية قد دفعت شركة صخر إلى جعل هذه الخدمة مجانا لجميع مستخدمي شبكة الإنترنت حول العالم.

ولم يأت هذا التطور في مجال الترجمة من عدم، بل جاء نتيجة جهود متراكمة وأبحاث ودراسات علمية دقيقة، استغرق إنجازها أزيد من عشر سنوات في مجال معالجة اللغات الطبيعية، وهذا ما عبر عنه الأستاذ جميل عزو بقوله :" إن هدف صخر من توفير هذه الخدمة هو تمكين مستخدمي إنترنت العرب من زيارة المواقع الأنجليزية الرائجة وقراءتها بلغتهم الأم مما يسمح لهم بالاستفادة من شبكة الإنترنت على أكمل وجه من خلال الترجمة التلقائية لمحتواها".

الإنترنت والبريد الإلكتروني

يرتبط الإنترنت بالبريد الإلكتروني لكونه يعتبر دون منازع التطبيق الأهم المستعمل عبر الشبكة في يومنا هذا، وله قيمة آنية ليس فقط بالنسبة للمستخدمين العاديين لشبكة الإنترنت، بل أيضا بالنسبة لمستخدمي شبكات إنترانت المؤسساتية، ومما ساهمت به صخر في هذا الصدد هو إيجاد حل للبريد الإلكتروني باللغة العربية المخصص للشركات، الأمر الذي سيساعد على ضبط آليات الاتصال بسرعة فائقة، ويمكن طبعا للأفراد أن يستفيدوا من ذلك، ولم يعد خافيا أن هذا البريد قد أصبح الأكثر استخداما من بين تطبيقات برامج المجموعات الأخرى الشائعة حاليا، مثل تطبيقات إدارة المعلومات، وتطبيقات انسياب الأعمال والجدولة، وما إلى ذلك ، وحسب ما جاء في استطلاع شركة زونا للأبحاث فإن التطبيق الأفقي الأكثر شيوعا عبر الإنترنت والإنترانت حاليا هو البريد الإلكتروني.

وبمقدار ازدياد حجم البريد الإلكتروني، تزداد الحاجة لإدارة محتوى البريد الإلكتروني الذي يتكون من معلومات نصوص كاملة، وفي هذا الصدد  سعت صخر بالتحديد إلى تطوير حل ثنائي اللغة يعتمد على مقترحات لمعالجة اللغة التطبيقية لتعزيز قدرات فعالية إدارة البريد الإلكتروني، ويتكون هذا الحل من:

1 – مركز لإدارة محتوى البريد الإلكتروني لدى المستخدم، بجانب ما يتوفر عليه برنامج سندباد للمراسلة من حل إضافي.

ومن مزاياه المتطورة جدا :

 - إجراء عمليات البحث السريعة والذكية لمحتوى البريد الإلكتروني.

- التنقل عبر البريد الإلكتروني باستخدام كلمات مفتاحية وموقع web  افتراضي.

- تصنيف البريد الإلكتروني.

- قاموس On-point.

- دعم Qsp.

  وبهذه المزايا فإن المستخدم العربي للبريد الإلكتروني يجد ضالته، ويتعامل بلغته القومية بامتياز.

دليل الإنترنت

يشكل دليل الإنترنت باعتباره وحدة البحث العربية إنجازا آخر للمستخدم العربي، إذ يمكنه من تصنيف المواقع والصفحات العربية أو الأنجليزية على حد سواء في الإنترنت إلى فئات محددة يسهل الوصول إليها بسهولة ودقة.

يوازي دليل الإنترنت حسب معايير صخر الدليل العالمي yahoo، إلا أنه يتجاوزه ليتحول إلى مرجع أساسي للبحث عن المواقع العربية، والمواقع التي تعني بالشؤون العربية في شتى الميادين.

ومن مميزات هذا الدليل أنه يجمع بين قوة محرك صخر في مجال البحث مع وجود أداة لبناء الأدلة للحصول على حل متكامل للبحث، أو التصفح من خلال موضوعات سابقة الإعداد، هذا بالإضافة إلى قدرته الفائقة على التعامل مع اللغتين العربية والأنجليزية في آن واحد لكونه يقوم بالبحث في المواقع الأنجليزية عند إدخال مفردات أنجليزية، وفي المواقع العربية عند إدخال مفردات، أنجليزية، وفي المواقع العربية عند إدخال المفردات العربية.

يتضمن هذا الدليل تقنيات صخر المتطورة التي تم استثمارها من أجل تطويره لكونه يشتمل على محرك البحث الإدريسي، وجامع الصفحات، والمفهرس Keywords Indexer.

وظائف الدليل

من الوظائف التي يقوم بها الدليل:

- ترتيب المواقع والوثائق ترتيبا شجريا من خلال واجهة استخدام بسيطة وفعالة، إذ يتم تصنيف الوثائق العربية تحت عدد من الموضوعات الرئيسية تندرج تحتها موضوعات، الأمر الذي يتيح للمستخدم أن يجد ما يريده من المعلومات الخاصة بموضوع ما بمنتهى السهولة والدقة.

- اعتماد الدليل على جامع المواقع Web Crawler في البحث عن المواقع البعيدة من الشبكة.

- قيامه بالاحتفاظ بقائمة للمواقع العربية فقط، إذ يقوم بزيارتها بصفة دورية لجمع المعلومات اللازمة للبحث.

- يلعب الإدريسي لكونه محرك البحث المتطور وأداة البحث العربية المتطورة الأولى في الإنترنت دورا أساسيا في الدليل، إذ يحتوي على الكثير من أنواع البحث المتاحة فيه، مثل البحث بالمشتقات، والبحث بالجذور، والبحث بالتطابق، والبحث بالسياق مما يمكن من البحث في التصنيفات المختلفة، أو البحث في محتوى الوثائق، ويعمل الإدريسي بتوافق تام مع تقنيات جامع المواقع، مما يتيح للمستخدم عند عرض النتائج النهائية للبحث أن يحدد أي موضوع للبحث فيه، أو  أن يبحث في أي موقع معين في الإنترنت.

وبهذا الدليل يمكن للمستخدم العربي أن يرتاح أثناء تعامله مع كل المواقع التي يود البحث فيها.

نظام التعاميم للمؤسسات العربية الكبرى

يشكل نظام التعاميم للمؤسسات العربية الكبرى إنجازا جديدا وهائلا لما يقدمه من خدمة لتطوير المؤسسات والوزارات والهيئات العربية الكبرى في شبكة الإنترنت.

ومن أهم ما يتيحه هذا النظام :

- وضع مناهج موحدة لتصنيف وتبويب كل التعاميم زمنيا وأبجديا لتسهيل عملية البحث والاسترجاع.

- خفض تكاليف نشر التعاميم مع ضمان وصولها في الوقت المحدد.

- تنظيم أسلوب العمل داخل الهيئات والمؤسسات والوزارات.

- إيصال جميع التعاميم إلى المعنيين في الوقت المناسب مما يتيح لهم الإطلاع عليها والرجوع إليها عند الحاجة وربطها بالتعاميم الأخرى.

ولقد تم تطوير هذا النظام بكيفية فعالة وذات جاذبية لكونه يتسم بواجهة تجمع بين جاذبية الشكل وسهولة الاستخدام وذلك ب  :

  أ - إمكانية تصفح التعاميم بسهولة وبأكثر من طريقة للبحث.

  ب - استخدام رقم التعميم وتاريخه، والحرف الذي يبدأ به، والموضوع الذي يندرج تحته.

  ج - إمكانية البحث الحر والمبسط في نصوص التعاميم عن طريق إدخال كلمة أو جملة يريد المستخدم البحث عنها، وبإمكانه عن طريق البحث الحر أن يقوم بتحديد بعض الاختيارات لضمان دقة النتائج.

ومن أهم إيجابية هذا النظام الخاص بالإدارة اتسامه بالسهولة واليسر لكونه يتكون من أربعة أقسام:

  أ - استعراض التعاميم ومراجعتها.

  ب - إضافة تعاميم جديدة .

  ج - ربط التعاميم .

  د - البحث عن التعاميم .

ومن مميزات هذا النظام :

  أ - توظيفه لتقنيات صخر المختلفة، مثل القارئ الآلي الذي يتيح إدخال صور النصوص الأصلية للتعاميم والموقعة من قبل المديرين والوزراء.

  ب - ربط التعاميم بعضها ببعض بواسطة الربط الآلي.

  ج - استخدام برنامج ناشرنت لمراجعة ونشر التعاميم على صفحات الشبكة العالمية.

  د – تمكين الإدريسي من البحث داخل ملفات التعاميم.

ولقد حرصت صخر على توفير أرقى وسائل الحماية التقنية الممكنة لهذا الحل.

الأرشفة  Sakhr Press Archiving

تعد الأرشقة في العمل الصحفي من أهم الركائز التي أضحت تمد الصحافي بالمادة التي يحتاجها، وبذلك فإن السرعة هنا تمكنه من مواكبة الأحداث ومساءلتها والاضطلاع على الوثائق، ولقد عمدت صخر إلى إيجاد حل عملي لوسائل الإعلام، وذلك بتوفير نظام الأرشفة.

لقد حرصت صخر على دعم هذا النظام بأرشفة متكاملة إلكترونية، تعتمد على كم هائل من المعلومات الصحافية المتوفرة باللغة العربية، مثل المقالات والتقارير والصور الفوتوغرافية، والتمكن في آن من قدرات البحث والاسترجاع المتطورة، وما هو أساسي في هذا النظام المتطور أن عملية الأرشفة لا تتطلب البدء من لا شيء، بل توفر أداة خاصة للأرشفة للاستفادة من السجلات القائمة، حيث تتولى هذه الأداة تحويل السجلات الحالية تلقائيا إلى صيغة قواعد بيانية قياسية يمكن استضافتها عبر قاعدة بيانات متوافقة مع  ODBC وذلك بحسب النظام الذي يفضله المستخدم مثل نظام أوراكل و MS SQL .

يعد هذا الحل المرتبط بالبحث المتطور والمخصص لسجلات الصحف بمثابة أداة بحث متطورة لسجلات الصحف المرتكزة على الإنترنت، وعلى عكس حل أرشفة الصحف يركز هذا الحل على قدرات البحث والاسترجاع المخصصة للصحف التي تحتفظ بموقع على الإنترنت، وهي تحتاج بالضرورة إلى قدرات بحث واسترجاع متطورة باللغة العربية.

نظام المكتبات العربية

من بين الحلول التي ساهمت بها صخر في مجال المعلوماتيات، تطويرها لنظام المكتبات العربية، وذلك بإيجاد برنامج مرن وعملي قائم على تنظيم محتويات المكتبة من كتب ومجلات وشرائط وبرامج الحاسوب مما يساعد على سرعة الوصول إلى البيانات في حالة البحث عنها، وجعلها متاحة للبحث من الإنترنت والأنترانت أيضا، ولقد أعد هذا البرنامج لتسهيل العمل لكل من أمين المكتبة والباحث عند البحث عن مادة علمية معينة داخل المكتبة.

من خصائص هذا البرنامج باعتباره نظاما قائم الذات قيامه بتقسيم مكونات المكتبة إلى فئات، يحتوي كل منها على مجموعة من معلومات هذه الفئة من المكتب، مثل اسم الكتاب، واسم المؤلف، واسم الناشر، ورقم الطبعة.

يوفر هذا النظام في ضوء هذا التقسيم ثلاثة أنواع من البحث :

  أ - البحث البسيط الذي يسهل عملية البحث للمستخدم .

  ب - البحث المتقدم الذي يتيح للمستخدم إمكانات متقدمة تساعده على الحكم في دقة النتائج، مثل المعاملات المنطقية التي تستخدم للبحث عن طريق إقامة علاقة منطقية بين كلمات البحث.

  ج - البحث مع التصفح لاستعراض كافة البيانات المتاحة عن أي بند موجود بالمكتبة، ولإجراء عملية البحث يقوم المستخدم أولا بإدخال جملة البحث، ثم اختيار القائمة التي يريد البحث فيها، بعد ذلك يتم تحديد مستويات التطابق المتاحة، وذلك للبحث، عن الكلمة المدخلة كما هي، أو لواحق، وذلك للبحث عن جميع صيغ الكلمة المدخلة بالسوابق واللواحق، أو البحث بالمشتقات، وذلك للبحث عن مشتقات الكلمة أو المترادفات للبحث عن الكلمة وجميع مرادفاتها، أو المعاني لترجمة الكلمة المدخلة إلى العربية أو الأنجليزية.

ويمكن للمستخدم تحديد خاصية تجاهل الأخطاء العربية الشائعة التي تحدث أثناء الكتابة، كما يمكن اختيار البحث عن الكلمات التي تتشابه في النطق باللغة الأنجليزية مع كلمة البحث المدخلة، كما يمكن للمستخدم أن يحدد أحد حقول البحث المتاحة مثل اسم الكتاب واسم المؤلف والناشر، موضوع الكتاب، ثم الطبعة وتاريخ النشر، بعد ذلك يتم الضغط على أمر بحث، ليقوم البرنامج بالبحث عن الكلمة أو الجملة المدخلة.

ويقوم النظام بعرض نتائج البحث بأكثر من طريقة، إذ يمكن ترتيب نتائج البحث حسب الموضوع، كما يمكن ترتيب النتائج حسب التكرار، وكذلك حسب حقول البحث، ويمكن للمستخدم اختيار نوع ترتيب النتائج إما تصاعديا أو تنازليا أو أبجديا، كما يمكنه تحديد عدد النتائج التي يريد ظهورها في كل صفحة.

ومن مميزات هذا البرنامج قدرته على العمل وفقا لنظام الشبكة إذا كانت متعددة المستخدمين، بالإضافة إلى أنظمة متعددة لحماية وصيانة البيانات.

إدارة الوثائق العربية

يعد برنامج إدارة الوثائق العربية والأنجليزية تطورا آخر في مجال نظم الإدارة لكونه يحمل حلا متكاملا لإدارة الكمية المتزايدة من المعلومات غير المصنفة، إذ يمكن المستخدمين في الشركات الكبرى من التعامل مع وثائق مختلفة سهلة، ولكنه في الوقت نفسه يمتاز بمزايا متعددة تمكنه من تنفيذ عمليات مختلفة، وتسهيل التواصل والتعاون الفعال بين الأقسام المتنوعة التابعة للإدارة.

يتيح هذا البرنامج سهولة فائقة في مجال إدارة الوثائق العربية بما يقدمه من حلول أساسية بدءا من التقاط المعلومات من كافة المصادر مثل الورق والفاكس والبريد الالكتروني والنصوص، وما إلى ذلك، وبموازاة هذا الحل يتم تصنيف كل المعلومات المحصل عليها استنادا إلى خصائص قواعد البيانات لتصبح بعد ذلك جاهزة للمستخدمين، كما يمكن العثور عليها باستخدام متصفح الإنترنت، وهذه العملية تتم كما أو ضحها جميل عزو "بإجراء عمليات المسح الضوئي على الوثائق لتحويلها إلى صور إلكترونية، وتعرفها بعد ذلك بواسطة تقنية التعرف الضوئي على الحروف العربية لكي تصنف بحسب خصائص قواعد البيانات" وتؤدي هذه العملية التحويلية إلى استخلاص الكلمات المحورية من النص وتلخيصه، وكل هذه المعلومات يتم تخزينها مع الصور الأصلية، ويعد هذا البرنامج كما عبر عن ذلك جميل عزو : "بأنه من الإنجازات المثالية المكملة لمنتجات صخر المكتبية الحالية التي تساهم في تلبية كافة احتياجات المكاتب العربية "ADocs"، ويكمل العديد من المنتجات الأخرى، كما أنه يشكل جزءا هاما من الاتجاه الاستراتيجي الجديد الذي يوجه كل توجهات صخر بهدف توفير حلول عربية حقيقة لقطاع الأعمال في العالم العربي".

 

 



[1]-  د. نبيل علي "اللغة العربية والحاسوب"، ط، تعريب، 1998 ص. 9.

[2]-  نفس المرجع السابق، ص. 9.

[3]- نفس المرجع السابق، ص. 10.

[4] - انظر عبد الغني أبو العزم، الحاسوب والصناعة المعجماتية، اللسان العربي العدد السادس والأربعون شعبان 1419هـ/ ديسمبر (كانون الأول) 1998. René Moreau et Isabell warmesson : ordinateur et lexicographie. «Lexique » le dictionnaire, 1983, Pul. P. 12 /13.  B.Quemeda : Bases de données informatisées et dictionnaires-  (Lexique) 2/ le dictionnaire, 1983.

[5]- د. نبيل علي على نفس المرجع السابق، ص. 299، 230.

[6]- نفس المرجع السابق، ص. 220.

[7]- انظر عبد الغني أبو العزم، الحاسوب والصناعة المعجماتية، ص 28، 29.

[8] -  B.Quemada : Bases de donées iformatisées et dictionnaires . p. 101, 120.

[9]- د. نبيل علي، نفس المرجع السابق، ص. 327.

 

[10]-  من وثائق صخر الصحفية.