الخميس, أبريل 16, 2026
الرئيسيةالصحة واللياقة البدنيةنظم ذكاء اصطناعي... لجميع اللغات والثقافات

نظم ذكاء اصطناعي… لجميع اللغات والثقافات

لطالما رغب المبرمج المصري عاصم صبري في نموذج ذكاء اصطناعي يُمثل ثقافته. لكن المشكلة تكمن في عدم عثوره على نموذج مثل هذا. ويقول صبري: «صناعة الذكاء الاصطناعي في مصر… غير موجودة». لذا قام ببناء نموذجه الخاص: «حورس»، نسبةً إلى إله السماء المصري القديم.

«حورس» على منصة «Hugging Face»

يقول صبري إن الهدف كان التوقف عن «الاعتماد على نماذج أخرى، مثل النماذج الأميركية أو الصينية»، والتوجه بدلاً من ذلك عن شكل النموذج الذي يُركز بشكل أكبر على الثقافة المصرية. ولجعل «حورس» يعمل، قام بتدريبه باستخدام وحدات معالجة الرسومات من «غوغل كولاب» Google Colab ومزودي خدمات سحابية آخرين، إلى جانب مجموعات بيانات مفتوحة المصدر. وقد حقق النموذج، الذي تم إصداره في أوائل أبريل (نيسان) الحالي، أكثر من 800 عملية تنزيل في أسبوعه الأول على منصة «Hugging Face».

ويُعدّ صبري واحداً من بين عدد متزايد من المطورين الذين يسعون لتصحيح خللٍ مزمن في مجال الذكاء الاصطناعي. فالنماذج تتقن الإنجليزية، وإلى حدٍّ أقل، الصينية، لكنها أقل كفاءةً بكثير في معظم اللغات الأخرى. واللغات التي تُصنّف على أنها لغات أقلية، هي في الواقع لغات الأغلبية العالمية. ومع ذلك، وبفضل طريقة تدريب النماذج (على كميات هائلة من البيانات المُستخرجة من الإنترنت)، بالإضافة إلى اقتصاديات صناعة التكنولوجيا، تبقى الإنجليزية هي اللغة المهيمنة.

في عام 2023، نشرت الباحثة علياء بهاتيا، بالتعاون مع زميل لها في مركز الديمقراطية والتكنولوجيا، دراسةً تُشير إلى أن اللغات غير القياسية «ضاعت في الترجمة» بسبب تأثيرات التنعيم والحوافز التجارية التي تُشكّل شركات التكنولوجيا الكبرى. ففي خضمّ التهافت على الاستفادة من الذكاء الاصطناعي، أعطت الشركات الأولوية لدعم اللغة الإنجليزية، ويعود ذلك جزئياً إلى محدودية بيانات التدريب، ولم تبذل جهداً يُذكر لسدّ هذه الفجوة.

لسنوات، عزّزت الاعتبارات الاقتصادية هذه المشكلة. فتدريب نماذج الذكاء الاصطناعي مُكلف، ولا تملك الشركات حافزاً يُذكر لتطوير نماذج تدعم مجموعات لغوية أصغر حجماً دون عائد واضح.

قد يهمك أيضًا: كيف تؤثر التمارين الرياضية على القلب؟

وقد بدأ هذا الوضع بالتغيّر أخيراً، أدى صعود نماذج الذكاء الاصطناعي المحلية، بالتزامن مع تشديد شركات الذكاء الاصطناعي الكبرى لحدود الرموز الرقمية، إلى فتح المجال أمام الشركات الصغيرة. يقول صبري: «قبل عامين، لم يكن الذكاء الاصطناعي بمثل هذه الكفاءة، ولم تكن نماذج الذكاء الاصطناعي مفتوحة المصدر. أما الآن، فيمكننا بناء نماذجنا الخاصة من الصفر».

ومع ذلك، لا تزال هناك عقبات. وتشير بهاتيا إلى أن «بعض العوائق لا تزال قائمة فيما يتعلق بالحوسبة، والبنية التحتية، والتمويل»، وهو ما يمثل مجتمعاً «عائقاً كبيراً». ومع ذلك، فإن التقدم واضح.

وما يتبلور ليس نظاماً بيئياً رسمياً بقدر ما هو شبكة عالمية غير رسمية من النماذج ذات التركيز المحلي: Apertus السويسرية، و Latam-GPT في أميركا اللاتينية، وN-ATLaS النيجيرية، و Sahabat-AI الإندونيسية، وSEA-LION السنغافورية، وGreenMind الفيتنامية، وOpenThaiGPT التايلاندية، وTeuken 7B الأوروبية. يقدم كل منها بديلاً للنماذج السائدة من «أوبن إيه آي» و«أنثروبيك» و«علي بابا».

لا تزال بعض الجهود شعبية، مثل جهود صبري. بينما تحظى جهود أخرى بدعم مؤسسي. وعلى سبيل المثال، يُعدّ مشروع «أبيرتوس» ثمرة تعاون بين جامعتين سويسريتين والمركز الوطني السويسري للحوسبة الفائقة، الذي ساهم بأكثر من 10 ملايين ساعة معالجة رسومية، أي ما يعادل عشرات الملايين من الدولارات في الحوسبة التجارية.

إلا أن معظم المشاريع تعمل على نطاق أصغر بكثير من ذلك. ومع ذلك، فإن القدرة على تدريب ونشر نماذج محلية بتكلفة منخفضة نسبياً تُغيّر قواعد اللعبة. فقد سجّلت نسخة مُحسّنة من برنامج «لاما 3.2» التابع لشركة «ميتا»، الذي تم تدريبه على 14,500 زوج من الأمثلة القانونية الهندية، ما يزيد قليلاً على 1000 عملية تنزيل منذ أوائل أبريل (نيسان). وهذا جانب مُتخصص، لكنه ذو أهمية. وكان من الصعب تبرير الاستثمار فيه اقتصادياً حتى وقت قريب.

يشير هذا الإقبال المبكر إلى وجود سوق أوسع من السوق السائد. كما أنه يطرح تساؤلاً أمام كبرى شركات الذكاء الاصطناعي. تقول بهاتيا: «ما تقدمه هذه البدائل هو دليل على إمكانية بناء أنظمة تمثل بشكل أفضل أغلبية المستخدمين واللغات في العالم، طالما أن شركات الذكاء الاصطناعي الكبرى ترغب فعلاً في الاستفادة من هذه التجارب والتعلم منها».

* مجلة «فاست كومباني».

مقالات ذات صلة
- اعلان -

الأكثر شهرة

احدث التعليقات