تأهيل اللغة العربية لمرحلة العولمة وثورة المعلومات

محمد عبد الرحمن الشارخ

 

أين تكمن قوتنا إذن؟ الجواب: إنها تكمن في اللغة العربية وسوقها الواسع في العالمين العربي والإسلامي. بهذا المعنى فإن هدفي لم يكن أن أعطي الكمبيوتر للعالم العربي بل أن أعطي اللغة العربية للكمبيوتر. وأقول بثقة إن صخر وحدها هي التي دخلت هذا المجال وقبلت مخاطره ووظفت فيه بسخاء أكثر من ثلاثة عشر سنة.

 

في كل مرة يطلب مني فيها التحدث(*) عن تجربة صخر وصناعة البرمجيات العربية أجدني بصورة عفوية أخرج عن موضوع الورقة التي أعددتها لأخاطب المستمعين مباشرة بأسلوب التفاعل الحار والمباشر. وفي هذه المرة أيضا إذ أقف أمام الجمهور المرموق لهذه الندوة المتميزة في عالمنا العربي أخشى أن الشيء نفسه سيقع. لكنني جاهدت هذه المرة أن أضع في هذه الورقة خلاصة تجربتنا في صخر في تصرف الجمهور الفاحص لهذه الندوة وربما في تصرف الجمهور الأوسع من المهتمين من خارجها، وأرجو من الله أن يوفقني في أن أكون واضحا في العرض وأمينا للحقيقية حتى عندما يتعلق الأمر بقصورنا والثغرات التي قد تكون ما زالت تشوب عملنا.

 

أفكر مجددا في ظاهرة خروجي الدائم عن النص الجاهز إلى الحديث المرسل والعفوي فأجد لذلك هذه المرة تفسيرا ذا دلالة. فهذه الظاهرة تقول الكثير عن الطريقة التي اتبعت في بناء وتطوير صخر وما زالت تسيّرها إلى الآن. وهي طريقة الحذر الغريزي من النظريات والاعتماد بصورة أساسية على الحدس الصائب والتفاعل المباشر مع الواقع المعاش ومع حاجات السوق واتجاهات تطورها. فعن هذا الطريق وبفضل اليقظة الدائمة لتطور حاجات مستخدمي الكمبيوتر والعوامل التي تؤثر على خياراتهم استطاعت صخر أن تضع استراتيجية سليمة ومقدامة للتوظيف الواسع والطويل الأجل في الأبحاث والتطوير والاستعداد للمستقبل. ونحن عندما قررنا السير بمغامرة صنع الكمبيوتر العربي لم نفعل ذلك بالاستناد إلى حلم أو نقاش نظري بل بالاستناد إلى تقارير مندوبي المبيعات الذين قالوا لنا إن السوق يطلب كمبيوترا عربيا. منذ تلك اللحظة التمع في خاطري ماذا يعني كمبيوتر عربي وما هو الطريق الذي علينا أن نأخذه لبلوغ ذلك الهدف.

 

طبعا هناك سوء فهم مستمر. إذ عندما أقول "كمبيوتر عربي"  يعتقد الناس أني أتحدث عن الأجهزة أو عن تعريب البرامج، لكني في الواقع لا أتحدث عن إعطاء الكمبيوتر برامج معرّبة بل إعطائه اللغة العربية نفسها. وهناك فارق كبير لأن الحالة الأخيرة وهي التي عملنا عليها طيلة السنوات العشر أو الإحدى عشرة الأخيرة تجعل الكمبيوتر يتكلم ويفهم العربية مثلما يفهم اللاتينية، وعندها فإن مسألة صياغة البرامج والتطبيقات العربية تصبح نتيجة طبيعية وسهلة نسبيا.

 

هناك تجربة أولية بالغة الأهمية خضناها عندما أنتجنا جهاز صخر MSX وبعنا منه نحو 600.000 جهاز ونحو مليوني برنامج. كل ذلك في سوق كان هشا وضعيفا. وقد قمنا أولا بتعريب نظام التشغيل المعروف بذلك الاسم (وهو اختصار لتسمية Microsoft Exchange). وتعشيت يومها مع بيل غيتس لتنفيذ هذا الاتفاق، واتفقنا يومها مع مايكروسوفت اليابان التي كانت قد اشترت براءة النظام. ولاقى الجهاز العربي الذي صنعناه إقبالا كبيرا  في كافة الدول العربية.

 

لم نكن قد دخلنا بعد مرحلة تأسيس الكمبيوتر العربي كما فهمناه. لكن تجربة جهاز MSX كانت مع ذلك إرهاصا مهما ومختبرا عظيم الفائدة يمكن تلخيص أهم نتائجه بالتالي:

 

         1.   ساعدت عمليات البيع الواسع النطاق في كافة أنحاء العالم العربي على بناء قاعدة التوزيع التي ستدعم نمو منتجاتنا وربحيتنا في ما بعد.

 

         2.   لعب هذا الجهاز الذي سمي جهاز صخر دورا كبيرا في إطلاق الشركة كعلامة تجارية إذ أدخلها ملايين البيوت والمكاتب في العالم العربي.  ونجم عن الأداء العالي لذلك الجهاز في ذلك الحين بناء سمعة صخر التجارية وشهرتها كشركة قوية وموثوقة.

 

         3.   أدت تلك التجربة إلى تحقيق مداخيل كبيرة للشركة وساعدت بالتالي على تصليب عودنا وزيادة قدرتنا على الاستثمار في توسيع قاعدة الباحثين والمبرمجين ومهدت بالتالي الطريق للمرحلة التالية من الأبحاث وصناعة البرمجيات العربية.

 

         4.   أخيرا فإن تلك التجربة جعلتنا نحس مباشرة بعمق الحاجة إلى الكمبيوتر العربي في السوق وبالتالي أقنعتنا بأن السوق موجود وأنه يحمل إمكانات هائلة. فتضاعف حماسنا لدفع عملية التعريب إلى أقصاها وذلك بالانتقال من تعريب البرنامج إلى تعريب الجهاز نفسه بأن نجعله يفهم العربية. وسأشرح هذه الفكرة لاحقا عندما أتحدث عن الأبحاث الرائدة لصخر في مجال ما نسميه في صناعة البرمجيات "معالجة اللغة الطبيعية" N L P .

 

حدث ذلك الانتقال في عام 1985 وكان قد بدا واضحا لنا أن البرمجيات هي التي بدأت تقود صناعة الكمبيوتر الدولية وليس الأجهزة نفسها. كان مهما جدا عند ذلك المنعطف أن نعرف أين تكمن قوتنا وأين يكمن ضعفنا في المدى الطويل وبالتالي أين يمكننا أن ننافس. ولقد وجدت أن قوتنا لا تكمن في صنع الأجهزة أو المكونات الدقيقة للكمبيوتر لأننا لا نملك القاعدة الأوسع لذلك في بلداننا كما أنه لا يمكننا منافسة تايوان أو اليابان في مجالها. أين تكمن قوتنا إذن؟ الجواب: إنها تكمن في اللغة العربية وسوقها الواسع في العالمين العربي والإسلامي. بهذا المعنى فإن هدفي لم يكن أن أعطي الكمبيوتر للعالم العربي بل أن أعطي اللغة العربية للكمبيوتر. وأقول بثقة إن صخر وحدها هي التي دخلت هذا المجال وقبلت مخاطره ووظفت فيه بسخاء أكثر من ثلاثة عشر سنة. هناك محاولات وشركات تعمل على تعريب البرامج الأجنبية أو تكييفها ولكن لا أحد غيرنا، حكومات أو شركات أو أفرادا استثمر كما استثمرنا وخاطر كما خاطرنا في مشروع إنتاج الكمبيوتر العربي. إني قمت يوما بحساب بسيط فتبين لي أن صخر أنفقت حتى الآن أكثر من مليوني ساعة من الأبحاث على بناء القاعدة المعرفية للغة العربية.

 

أود أن أقر أمامكم بأني مررت بظروف كنت فيها وحيدا مع رؤيتي ولم يكن لي فيها مؤنس، لا بين رجال الأعمال ولا بين المسؤولين ولا بين أهل الرأي، لأنه ليس أصعب من أن تحاول إقناع أي كان في العالم العربي بأنك مقبل على إنتاج تكنولوجيا رفيعة Hi-tech عربية. كأنما القنوط المعشش أصبح يحجبنا عن ذاتنا وعن قدراتنا فيشل فينا إرادة العمل وروح الإقدام التي وصلت بأجدادنا إلى غرب الصين شرقا وشواطئ الأطلسي غربا وجعلت شمس العرب تسطع في أربع رياح الأرض.

 

لكننا لم نخاطر في فراغ، بل كانت تقودنا رؤية جلية جعلتنا نرى اتجاهات السوق وإلى أين تسير. ومما قوى عزيمتنا أكثر هو أننا وجدنا شركات الكمبيوتر والبرامج الدولية نفسها أهملت تطوير تطبيقات اللغة العربية رغم أنها تملك أضعاف أضعاف ما نملك من الموارد للأبحاث والتطوير. شركة IBM مثلا بدأت محاولات ثم توقفت لأنها وهي التي تحقق مبيعات تبلغ 70 بليون دولار سنويا لم تجد السوق مهما أو على الأقل لم تضعه بين أولوياتها في ذلك الوقت. أما نحن فإن السوق العربي أو سوق اللغة العربية كان كل شيء بالنسبة لنا لأنه ليس في إمكاننا أن نطور برامج للإيطالية مثلا أو الروسية لكن العربية هي رأسمالنا الهائل الذي نبدأ به صناعتنا. الآن اختلف الوضع بالطبع وعادت الشركات الدولية لتفتح أعينها على أهمية السوق العربي لكنهم تأخروا كثيرا في هذا المجال وتقدمنا كثيرا لدرجة أنIBM  نفسها أصبحت تأخذ ترخيصا باستخدام منتجاتنا العربية.

 

صخر وتدويل اللغة العربية

 

لا أريد من هذا القول المبالغة في الثقة أو الظهور بمظهر المتهاون مع المستقبل. فنحن على يقظة دائمة لأننا نعمل في صناعة تعتبر أكثر الصناعات مخاطرة (وبالتالي ربحية) في العالم. فهي صناعة لا تعيش فيها المنتجات طويلا قبل أن يأتي جديد يجعلها قطع من الذكريات أو مادة للمتاحف. لكن مصدر ثقتنا الكبيرة بالمحافظة على السبق التكنولوجي الذي حققناه هو أن هذا السبق جاء نتيجة لجهود أكثر من 70 باحثا عملوا أكثر من ثلاثة عشر سنة على بناء القاعدة المعرفية للغة العربية ووضع ألوف المعادلات والقواعد التي ستساعدنا على تعليم العربية للكمبيوتر وجعله يفهمها ويتعامل معها بصورة طبيعية. وهذه القاعدة المعرفية موجودة لدى صخر وحدها ولا توجد طرق مختصرة للحصول عليها.

 

لقد كنا أمام أحد أمرين: إما أن نقوم كما يفعل غيرنا بمحاولة تحجيم العربية ضمن البرامج الأجنبية. وإما أن نقوم بتوليد حلول خاصة للغة العربية آخذين بالتقنيات المهيأة للغة الإنكليزية كنقطة انطلاق.

 

لقد تبين لنا سريعا أن الحل الأول غير ممكن لأن اللغة العربية أكثر تعقيدا بكثير من اللغة الإنكليزية ولا يمكن للغة بسيطة أن تستوعب لغة معقدة. وسأبدأ بمثال بسيط لإعطاء فكرة عن حجم الصعوبات التي تطرحها العربية وهو مثال النطق الآلي. لقد قامت صخر بتطوير نظام لقراءة النصوص العربية والأجنبية آليا بواسطة الكمبيوتر، وذلك في ثورة تقنية يمكن أن تفتح الباب واسعا أمام المكفوفين وضعاف النظر بشكل خاص لمتابعة الدراسة دون أي قيود وكذلك الاطلاع المنتظم على الصحف ومطالعة الكتب وغير ذلك. لكن كيف يمكن للكمبيوتر أن يقرأ نصا عربيا وبصوت قريب جدا من الصوت الإنساني؟ المعروف أن النص العربي كله غير مشكل وبالتالي فإن كلمة عـَلـِمَ مثلا يمكن من دون تشكيل أن تقرأ عَـلـَمْ أو عُـلـِمَ أو عَلـَّم أو عُلّـِمَ أو عِـلْم. فكيف يمكن لبرنامج النطق الآلي أن يقرأ تلك الكلمة قراءة صحيحة؟

 

في اللغة الأجنبية لا توجد مشكلة. لأن النص يقرأ كما يكتب. والتشكيل يتم من خلال الحروف الصوتية Vowels. فكلمات مثل some أو sum أو same تقرأ وفق قواعد للفظ يحددها الحرف الصوتي وموقعه بين الحروف الساكنة. لكن تخيلوا لو أننا رفعنا الحروف الصوتية من الكلمات الثلاث وبقينا مع الحرفين الساكنين sm فقط؟ هل يمكنكم استنتاج الكلمات الثلاث بمجرد الاعتماد على الحرفين الساكنين؟ طبعا لا. لكن هذا بالضبط ما يحدث شبيه له في العربية في النص غير المشكل.

 

                 نص لاتيني

  انظر                                     اقرأ                                               افهم

 

 

                                          نص عربي

 

 
 

 

 

  انظر                              حلـّل    افهم 

 

 

يظهر المثال أعلاه الاختلاف الجوهري في مستوى الصعوبة بين تعامل الكمبيوتر مع العربية وبين تعامله مع اللاتينية.  ففي النص اللاتيني ينظر القارئ إلى النص فيقرأه ثم يفهمه. أما في العربية فإن القارئ يرى النص فيقوم بسرعة هائلة بتحليله وفك نواحي اللبس والإبهام فيه، فيفهمه ثم أخيرا يقرأه.

 

لكن الصعوبات التي تواجه الكمبيوتر في التعامل مع النص العربي (أي الصعوبات الفريدة الخاصة باللغة العربية دون غيرها) لا تقف عند هذا الحد. فهناك صعوبات أخرى تتعلق بالطابع الاشتقاقي للغة العربية واختفاء الجذر Root غالبا في الاشتقاق الأمر الذي يحير الكمبيوتر عند سعيه لتحديد معنى الكلمة. في المقابل تستند اللغة الأجنبية إلى الساق Stem الذي لا يختفي في الكلمة بل يبقى ويحصل التبديل عليه على شكل إضافات أو تحولات بسيطة. ثم هناك انعدام علامات الوقف في اللغــة العربيــة مما يــواجه الكمبيــوتر بمشكلة تغلبنا عليها في صخر من خلال المجزّئ الآلي Automatic Fragmenter، وهناك  طول الجملة العربية الأمر الذي يزيد احتمالات الخطأ في الترجمة الآلية مثلا أو النطق الآلي، وعدم وجود سياق إجباري للجملة إذ يمكن للكاتب سعيا وراء البلاغة أو إعطاء إيحاء معين أن يقلب ترتيب الكلمات وفق هواه. أضف إلى ذلك تعدد الدلالات للكلمة الواحدة وهناك كلمات يمكن أن يكون لها 30 دلالة.

 

هذه الصعوبات الخاصة باللغة العربية يحلها الشخص العربي بالاستناد إلى قاعدة البيانات الهائلة التي يحويها دماغه والتي تساعده على "فهم" النص وبالتالي التنبّؤ عفويا بطريقة نطقه وبأماكن الوقف فيه وبمعانيه المحددة بل وإيحاءاته الخفية. لكن إذا كان فهم النص العربي يحتاج إلى قدر كبير من الفطرة والذكاء البشريين فكيف يمكن نقل هذا المستوى من الذكاء أو قدر كبير منه إلى الكمبيوتر بحيث يصبح هذا  قادرا على "فهم" النص العربي وفك نواحي اللبس فيه، وكلها شروط لا بد منها لكي يتمكن من التعامل مع العربية كما نفعل نحن يوميا؟

 

في مثال الآلة القارئة مثلا على الكمبيوتر أن يفهم النص ثم يحلله صرفيا وقواعديا لكي يقوم بتشكيله تشكيلا صحيحا ثم يقرأه من دون خطأ. في حال الترجمة الآلية الأمر نفسه. إذ يحتاج الكمبيوتر لأن يفهم النص ومعنى الكلمة في سياقها المحدد لكي يلفظها قبل أن يقترح الترجمة الصحيحة، ليس من حيث المعنى فقط بل من حيث التركيب الصرفي والنحوي آخذا في الاعتبار مثلا أن الفاعل عاقل أو غير عاقل وأنه مؤنث أو مذكر مفرد أو مثنى أو جمع متكلم أو مخاطب أو غائب أو مجهول..

 

لكن لكي يفهم الكمبيوتر النص العربي فإن عليك أن تضع له قواعد لا عد لها ولا حصر يقوم بتطبيقها في محاولته فهم النص. باختصار على الكمبيوتر أن يتصرف بطريقة مماثلة للعقل البشري وأن يقوم وبسرعة مذهلة (ملايين العمليات في الثانية) بكافة عمليات التحليل والحسابات اللغوية لكي يدرك مغزى ما يقرأ ولا يتوه في غياهب الجمل والاشتقاقات والتشكيل وانعدام علامات الوقف أو استخدامها الاعتباطي في النصوص العربية.

 

فــي هذا المجال قامت صخـر عـبر أكثر من ثلاثة عشر سنــة (خسرنا وقتا بالطبـع بسبب الاجتيـاح العراقي للكويت وما تبعه) بتنفيذ أضخم برنامج لأبحاث اللسانيات الحاسوبية Computational Linguistics  في تاريخ اللغة العربية. وحشدت لهذا البرنامج أكثر من 70 من علماء اللغة وخبراء اللسانيات الحاسوبية والمطورين والمبرمجين الذين عملوا بصورة متواصلة لأكثر من عقد في سبيل إيجاد الحلول التي تجعل الكمبيوتر قادرا على التعامل مع العربية مثل تعامله مع الإنجليزية أو أي لغة بسيطة التركيب.

 

كان على فريق صخر أن ينقل للكمبيوتر تدريجيا كافة القوانين والقواعد وكافة الاحتمالات التي تحكم تصرف اللغة العربية الحديثة والكلاسيكية. وقام الفريق بحل الصعوبات اللصيقة باللغة العربية خطوة خطوة وبدءا بمستوى الحرف وانتقالا إلى مستوى الكلمة فالجملة فالنص الكامل. وكان الفريق كلما انتهى من معالجة مستوى صعوبة انتقل إلى المستوى الأعلى وذلك إلى أن تجمع لصخر كنز حقيقي من المحركات والأدوات والمكونات اللغوية التي بات يمكننا بواسطتها وضع تطبيقات بالعربية لم يكن لأحد أن يحلم بإمكان وجودها قبل سنوات.

 

كيف تعمل كل هذه التطبيقات؟ ما هي أدوات الذكاء الصناعي التي بنيت عليها والتي تم توليدها في صخر عبر السنوات الطويلة من الأبحاث؟ سأعرض بعد قليل لبعض الأدوات والمبتكرات التي قمنا بتطويرها وتمكنا بفضلها من تأهيل اللغة العربية حقا لمسايرة مرحلة العولمة وثورة الاتصالات في العالم. لكني أريـد هنـا بالـذات أن أدخـل علـى هذا العـرض مفهـوما مركزيـا بــل المفهــوم المركـزي الذي يختصــر النتائج العامة لجهودنا البحثية والعلمية. هذا المفهوم هو العمل باللغة الطبيعية أو Natural Language Processing (NLP).

 

فما هو مفهوم اللغة الطبيعية؟ هذه الكلمة التي نسمعها كثيرا اليوم وسنسمعها أكثر في المستقبل هي التعبير الذي اختارته صناعة الكمبيوتر لتلخيص الحاجة إلى تأهيل اللغات العالمية كلها لتصبح لغات مفتوحة أي قابلة للتعامل مع أي نظام تشغيل وأي تطبيق وكذلك التعامل مع بعضها البعض. ولقد أدركت صناعة الكمبيوتر الدولية التي تواكب دوما اتجاهات السوق أن اتجاه العالم إلى العولمة سيرافقه حتما تزايد الحاجة لكسر الحواجز بين اللغات وارتباط الدول والمؤسسات والأفراد بعضها ببعض بأنظمة اتصال وتعامل شفافة ونمطية لا مجال فيها للتضارب والاختلاف.

 

 لكن شرط كل ذلك على صعيد كل لغة عريقة هو أن يتم تأهيلها جذريا لهذا الاندماج أو التكامل مع النسيج اللغوي للعالم. وما لم يتولى أحد تلك المهمة فإن اللغة المعنية ستهمل من المجتمع الدولي وتجد تأثيرها يتضاءل تدريجيا. لأنه ما لم تكن لغتك صالحة للتعامل مع العالم في حقبة العولمة فإن الناس سيلجئون إلى لغة أخرى (الإنجليزية مثلا) على حساب مزيد من التهميش للغتك الأم. لذلك فإننا عندما نتحدث عن "اللغة العربية الطبيعية" فإننا نعني أن معالجة صخر للصعوبات التي جعلت هذه اللغة الجميلة والغنية في السابق لغة صعبة بل مغلقة استطاعت نقل هذه اللغة من خانة اللغات الخاصة المغلقة (أو غير الحية بمصطلح العولمة) إلى خانة اللغة التي يستطيع الكمبيوتر التعامل معها كما يتعامل مع الإنجليزية.

 

ترسانة صخر اللغوية

 

آتي الآن إلى استعراض أهم الأدوات اللغوية التي ستزود الكمبيوتر في كل مكان بالأدوات والقواعد التي تجعله يتعامل دون مشقة مع اللغة العربية. وسأقتصر على تعريفات موسعة حتى لا أضجر القارئ أو المستمع بالمصطلحات التقنية.

 

         1.   المحلل الصرفي: يستطيع إعادة أي كلمة عربية إلى جذرها ويقوم بتحليل مكوناتها الأخرى مثل اللواصق والصيغة الصرفية للفعل وجنس الفاعل أو المفعول به، كما يمكنه أن يعيد تركيب أي كلمة انطلاقا من مكوناتها الصرفية.

 

         2.   المحلل النحوي: يستطيع تحليل مكونات أي جملة عربية ليصل إلى المعنى الصحيح لكلماتها مستبعدا المعاني الأخرى المحتملة لكل كلمة لعدم صلاحيتها أو مطابقتها للسياق ثم يقوم بإعراب الجملة. وسيتم لاحقا تطوير المحلل النحوي لنظام يمكنه "فهم" النصوص أوتوماتيكيا.

 

         3.   المشكل الآلي: يعمل بالاستناد إلى المحلل الصرفي والمحلل النحوي فيقوم بتشكيل أي نص عربي تشكيلا صحيحا وبسرعة مائة صفحة في الدقيقة وبنسبة دقة تصل إلى 90 في المائة، ستزيد مع الوقت إلى 98% وهي نسبة توازي أو تزيد عن الدقة التي يصل لها أغلب كبار اللغويين المتخصصين

 

         4.   المجزئ الآلي: وهو يحل مشكلة غياب علامات الوقف في النصوص العربية ويعدها للمعالجات المختلفة مثل الترجمة الآلية والقراءة الآلية والنطق الآلي. وهو يعتمد في عملية التجزئة على العلامات المتضمنة في النص نفسه فضلا عن فهم سياق المعنى أيضا.

 

         5.   المصحح الآلي: يعتمد المصحح على المحلل الصرفي ليكتشف الأخطاء الصرفية واقتراح الكلمات الصحيحة بينما يقوم المصحح النحوي باكتشاف الأخطاء القواعدية واقتراح بدائل لتصحيحها. ويمكن إغناء المصحح الإملائي والنحوي عبر إضافة كلمات خلال العمل على النصوص.

 

 

         6.   المفهرس الآلي: يقوم آليا بفحص محتويات النص أو الوثيقة بهدف تحديد الكلمات أو الجمل المفتاحية. وأصبح في الإمكان لأول مرة بالاستناد إلى المفهرس الآلي إنشاء فهارس الكتب العربية أوتوماتيكيا.

 

         7.   المصنف الآلي: يقرأ النص ويقوم بتصنيف محتوياته فيقرر أوتوماتيكيا تحت أي باب أو أي تصنيف جغرافي أو كرونولوجي يجب تصنيف الوثيقة في قاعدة البيانات. ويقوم المصنف بذلك بالاستناد إلى عمل المفهرس لكنه يضيف أيضا اعتبارات أخرى مثل إعطاء أوزان محددة  للعنوان الرئيسي والعناوين الفرعية والكلمات المشددة وغير ذلك.

 

         8.   الملخص الآلي: يعتمد على المفهرس وعلى قواعد حسابية معينة ليستخرج الجمل الأهم في النص. ويقوم المستخدم بتحديد حجم التلخيص الذي يريده كنسبة مئوية من النص الأصلي.

 

         9.   رابط النصوص: يتولى إحداث الروابط المنطقية بين النصوص في قواعد البيانات ويساعد بالتالي على استرجاع الوثائق المتعلقة بالموضوع المحدد عند عمليات البحث عن النصوص.

 

هذه بعض –وأعني بالفعل بعض- نتائج التوظيف السخي في الأبحاث والتطوير التي قامت به صخر على مدى عقد وأكثر. ولا بد من أن أوضح بأن توظيفنا كان للمدى الطويل وكنا نعلم منذ البداية أن بناء القاعدة المعرفية والتقنية للغة العربية يحتاج إلى أكثر من عشر سنوات، ولم نكن بالتالي ننتظر عائدا مباشرا عليه بل لم يكن في إمكاننا تحقيق هذا العائد قبل تكامل الأدوات اللغوية في يدنا لأن الأدوات والمحركات اللغوية سلسلة مترابطة لا يمكن لأي منها أن يعمل إلا بالتضافر مع المحركات والأدوات الأخرى.  تلك مخاطرة، قليلون هم الذين يقبلون باحتمالها، ولكنها بالنسبة لصخر كانت مخاطرة مبنية على رؤية واضحة ولم تكن قفزة في المجهول. كان من الصعب على مجتمعاتنا تفهم قبول فكرة المخاطرة الاستثمارية، وفكرة الاستثمار طويل الأجل. ناهيك عن إمكانية بناء تقنيات محلية بأيدينا. وأقصد بمجتمعاتنا بالذات تلك الجهات التي يتطلب عملنا التعامل معها ومنها البنوك والحكومات والمستثمرين.

 

اليوم وصلنا إلى نهاية مرحلة الأبحاث الأساسية. وبعد أن أصبحت لدينا معظم الأدوات والمكونات دخلنا بالفعل مرحلة الاستغلال الواسع لتلك القاعدة المعرفية في صنع التطبيقات والبرامج الذكية التي تماشي آخر التطورات في حقل الصناعة البرمجية في العالم.

 

لقد صبرنا لأكثر من عشر سنوات واستثمرنا الموارد العزيزة حتى وصلنا إلى مرحلة قطف الثمار. خلال تلك الفترة حافظنا على تجارة التجزئة في مجموعة "العالمية" وقمنا بتنويع كبير لمنتجاتنا في حقول التعليم والتراث الإسلامي وبرامج المكتب وغيرها، وذلك من أجل الإبقاء على تدفقات الموارد اللازمة لتمويل الأبحاث، خصوصا وأن الأبحاث اللغوية لا يمكن استخدامها قبل اكتمالها لكن عندما تكتمل فإنها تفتح الباب واسعا لقطف الثمار. والثمار هي التطبيقات التي لا تحصي للغة العربية الطبيعية. وسأعطي هنا أيضا نماذج عن التطبيقات التي وضعناها في السنتين الأخيرتين فقط بالاستناد إلى نتائج الأبحاث.

 

                                  §          أنظمة المخاطبة الآلية  Speech Technology.

 

                                  §          القارئ الضوئي للنصوص OCR.

 

                                  §          نظام الترجمة الآلية Machine Translation.

 

                                  §          نظام النشر الإلكتروني العربي .

 

                                  §          أدوات الفهرسة الآلية للنصوص العربية .

 

                                  §          أدوات البحث في قواعد البيانات واسترجاعها وتلخيصها .

 

          §   أنظمة إنشاء المواقع العربية على الإنترنت وتصفحها والترجمة الآلية لنصوص الإنترنت بواسطة مساعد المترجم لصفحات الإنترنت.

 

يمكنني المضي بلائحة التطبيقات خصوصا إذا وددت إدراج العديد من المنتجات والمبتكرات التي نعمل عليها حاليا ولم نكشف عنها بعد.

 

ملاقـاة القرن :  أين تقف صخر الآن؟

 

آمل أن يكون العرض السابق قد أعطى فكرة واضحة عن الموقع الذي نحتله الآن كشركة للبرامج. فنحن بهذه الصفة نقف اليوم كتفا لكتف مع شركات البرمجة العالمية بمعنى قدرتنا على إنتاج البرامج العربية لكافة التطبيقات ولكافة فئات المستخدمين أفرادا وشركات وحكومات. إننا نقف أيضا بموازاة الشركات الدولية بمعنى تقدمنا الكبير في حقل إدخال الذكاء الصناعي بدرجة كبيرة على كافة برامج معالجة اللغة، وبمعنى دخولنا بالفعل، بفضل تلك التقنيات الذكية، مجال المعالجة الآلية للغة على أكثر من صعيد. بل إن صخر تجاوزت الآن دورها كلاعب في السوق المحلي لتنتقل إلى السوق الشامل إذ بدأت بالفعل تسويق مكوناتها العربية في أوساط شركات البرمجة الدولية التي تحتاج إلى تلك المكونات لتكون برامجها قابلة للعمل في بيئة اللغة العربية.

 

وبذلك صرنا الشركة التي تملك تقنياتها الخاصة Proprietary technologies التي تحتاجها الشركات الدولية التي تعمل في حقلي الاتصالات والكومبيوتر لتستخدمها في منتجاتها وبذلك تعطي المستخدم العربي،أو مستخدم اللغة العربية، منتجات أفضل أي تتمشى مع متطلباته اللغوية. فالشركات الدولية تعتبر نمــو تطوير المكونات الخاصة باللغة العربية مسئولية الشركات المحلية ودورنا هو تجهيز هذه المكونات لتوائم الأنظمة الدولية والبروتوكولات التقنية للاتصالات والكمبيوتر. وبهذا ننضم لعملية العولمة لا كمستهلكي تقنيات فقط بل أيضاً كفاعلين ومزودين للعولمة. و كمثال على ذلك فإن تقنية البحث الحر على الإنترنت والأدوات اللازمة للتفاعل السريع والدقيق مع الكم الهائل للمعلومات كالفهرسة والتصنيف والتصحيح والتلخيص الآلي، وكذلك تقنيات الترجمة والمخاطبة Speech الآلية، ما كانت لتتم لولا استثمارنا الطويل الأجل في الأبحاث اللغوية NLP .

 

خاتـمة

 

أود أن أختم بتصريح قد يبدو مفاجئا للكثيرين، وأرجو أن يكون بعيدا عن التبجح، وهو أنه لم يحدث منذ عصر طويل أن فعلت جهة واحدة للغة العربية ما فعلته صخر. وأسارع إلى القول بأننا لم نفعل ذلك على سبيل التبرع بالطبع بل مدفوعين بمصالح تجارية وبرؤية سباقة للسوق. لكن لا يمنع ذلك من القول أن المليوني ساعة أو أكثر التي وظفناها في درس التركيبة المعقدة للغتنا القومية ولغة كتابنا الكريم والعمود الفقري لحضارتنا الإسلامية، وتلك النتائج والحلول التي توصلنا إليها، ستبقى كلها في تصرف الأجيال المقبلة لمجتمعنا وشعوبنا.  لقد قمت غالبا بتفسير الدور الريادي الذي وقع على صخر في هذا المجال بالإشارة إلى المفارقة الكبرى التي تجعل اللغة العربية برغم انتشارها الكوني، بل ربما بسبب هذا الانتشار من دون أب يرعاها حقا. العربية ليس لها أب، لا توجد في العالم جهة رسمية تأخذ على عاتقها خدمة هذه اللغة والاهتمام باستمرارها حية وفعالة بين لغات الأمم. اللغة الفرنسية في العالم مثلا عندها أب هي الدولة الفرنسية. الإنجليزية عندها أيضا أكثر من أب في بريطانيا أو الولايات المتحدة. الروسية كذلك اليابانية الخ.. لكن اللغة العربية يتيمة لأنه لا توجد دولة عربية واحدة يمكن أن تقول أني سآخذ على عاتقي تعهد اللغة العربية باسم جميع الناطقين بها.

 

قد يكون لهذه المفارقة في بلادنا وجه آخر. وهو الفارق الكبير بين عقلية البيروقراطية الحكومية وعقلية القطاع الخاص. فالبيروقراطية الحكومية مشغولة أكثر بالهموم اليومية، كما أنها لا تملك دوما المخيلة والجرأة الضروريتين لقبول مخاطرة المشاريع البعيدة الأمد ويهمها أكثر تحقيق نتائج منظورة وفي المدى القريب. وربما أيضا لا تعتقد بأنها ستستمر في مسؤولياتها بما يكفي لمتابعة مشروع طويل الأجل. القطاع الخاص على العكس لا توجد قيود على تفكيره وطموحاته عندما يقرر أخذ الطريق الصعب. وهو حر أكثر في مراقبة السوق وما يجري في العالم وأسرع تعلما لأنه أكثر يقظة ويحفظ عن ظهر قلب قاعدة  البقاء للأصلح والأقوى، فلا يوجد عذر للتهاون أو الخطأ وأخيرا الفشل

 

عندما بدأنا مشروعنا اجتمعت بوزير صديق مقتدر وطويل الباع وكان أول رد فعل له عندما كاشفته بالمشروع القول: هذه مقامرة! لم أفاجأ بالطبع فكنت قد أصبحت معتادا على مواقف العجب من عزمي على صنع "الكمبيوتر العربي". مضى على تلك الحادثة أكثر من 14 سنة الآن. وربما بعد هذه السنوات الأربعة عشر تبدلت قناعات الوزير الصديق. لكننا في صخر لم يكن بإمكاننا الانتظار كل ذاك الوقت لنبدأ… إن الزمن ليس آسنا والحركة مستمرة، هو ذا التقدم البشري الدائم. كيف ننتظر في عصر الإنترنت والمعلومات، هذا العصر الجديد حيث الحركة أسرع كثيرا،وحيث العالم يتكامل تقنياً، وثقافةً، وقيماً. كيف ننتظر 14 عاما لنبدأ؟

 

أيها الأخوة، نحن في القطاع الخاص نريد اللحاق بالعالم المعاصر، نريد اللحاق بالركب، ولنا كل الثقة بأنفسنا أن تكون البناة، الفاعلين، المتفاعلين مع الركب الدولي الذي نحن جزءا منه.

 

والسلام عليكم .

 

المصدر: http://www.aljabriabed.net/n31_05charikh.htm

أنواع أخرى: 

الأكثر مشاركة في الفيس بوك