لا يعتقد رئيس قسم ميتا للذكاء الاصطناعي (Meta AI) أن الذكاء الاصطناعي الفائق سيصل قريبا، ويرى أن الحصول على ذكاء “القطط والكلاب” ربما يكون أقرب من الحصول على ذكاء البشر.
ويجزم كبير علماء ميتا ورائد التعلم العميق يان ليكون بأن أنظمة الذكاء الاصطناعي الحالية بعيدة عن الوصول إلى بعض مظاهر الوعي التي تجعلها ذكية والتي يمكن أن تدفع قدراتها إلى ما هو أبعد من مجرد تلخيص النصوص بطرق إبداعية.
وتتناقض وجهة نظر ليكون مع وجهة نظر جنسن هوانغ الرئيس التنفيذي لشركة “إنفيديا”(Nvidia)، الذي قال مؤخرا إن الذكاء الاصطناعي سيكون “منافسا إلى حد ما” للبشر في أقل من خمس سنوات، وسيتفوق على الأشخاص في العديد من المهام التي تتطلب جهدا عقليا.
وقال ليكون: “أنا أعرف جنسن”، وأشار مبررا لوجهة نظر جنسن إلى أن الرئيس التنفيذي لإنيفديا لديه الكثير ليكسبه من انتشار الذكاء الاصطناعي، “هناك حرب بين الشركات في مجال الذكاء الاصطناعي، وهو يزودنا بالأسلحة”.
وجاءت تصريحات ليكون في حدث أقيم مؤخرا لتسليط الضوء على الذكرى السنوية العاشرة لتأسيس الشركة الأم لموقع التواصل الاجتماعي فيسبوك لفريق أبحاث الذكاء الاصطناعي الأساسي.
وتابع ليكون قائلا عن الشركات التي تحاول تطوير الذكاء العام الاصطناعي: “الذكاء الاصطناعي العام موجود بسبب عدد المعالجات التي يتعين عليك شراؤها من المزودين مثل إنفيديا”.
ويرى ليكون أنه طالما يواصل الباحثون في شركات مثل أوبن إيه آي (OpenAI) سعيهم وراء تطوير الذكاء الاصطناعي العام، فسوف يحتاجون إلى المزيد من معالجات الحواسيب التي تنتجها شركة نيفديا.
وقال إن البشرية من المرجح أن تحصل على ذكاء اصطناعي “على مستوى القطط” أو “على مستوى الكلاب”، قبل سنوات من الذكاء الاصطناعي على المستوى البشري.
وأشار ليكون إلى أن تركيز صناعة التكنولوجيا الحالي على نماذج اللغة والبيانات النصية لن يكون كافيا لإنشاء أنواع أنظمة الذكاء الاصطناعي المتقدمة الشبيهة بالبشر والتي ظل الباحثون يحلمون بها لعقود من الزمن.
وأضاف أن “النص مصدر ضعيف للغاية للمعلومات”، موضحا أنه من المحتمل أن يستغرق الإنسان 20 ألف عام لقراءة كمية النص التي استُخدمت لتدريب نماذج اللغة الحديثة. وتابع: أنهم “دربوا النظام على ما يعادل 20 ألف عام من مواد القراءة، وما زال النظام لا يفهم أنه إذا كان أ هو نفسه ب، فإن ب هو نفسه أ”. وأكد أن “هناك الكثير من المعلومات الأساسية حول العالم التي لم يحصلوا عليها من خلال هذا النوع من التدريب”.
وقام ليكون وغيره من المديرين التنفيذيين في “ميتا إيه آي” بإجراء أبحاث مكثفة على كيفية تصميم ما يسمى بنماذج المحولات المستخدمة لإنشاء تطبيقات مثل تشات جي بي تي للعمل مع مجموعة متنوعة من البيانات، بما في ذلك معلومات الصوت والصورة والفيديو.
وتكمن أهمية المحولات في أنها تساعد أنظمة الذكاء الاصطناعي في تحقيق المزيد من الأعمال الفائقة بسبب قدرتها على اكتشاف المليارات المحتملة من الارتباطات الخفية بين هذه الأنواع المختلفة من البيانات.
وتتضمن بعض أبحاث شركة ميتا برامج يمكنها المساعدة في تعليم الأشخاص كيفية لعب التنس بشكل أفضل أثناء ارتداء نظارات الواقع المعزز الخاصة بالشركة، والتي تمزج الرسومات الرقمية مع العالم الحقيقي.
وأظهر المسؤولون التنفيذيون عرضا توضيحيا تمكن فيه شخص يرتدي نظارات الواقع المعزز أثناء لعب التنس من رؤية إشارات بصرية تعلمه كيفية حمل مضارب التنس بشكل صحيح وأرجحة أذرعه بشكل مثالي.
وتتطلب نماذج الذكاء الاصطناعي اللازمة لتشغيل هذا النوع من مساعد التنس الرقمي مزيجا من البيانات المرئية ثلاثية الأبعاد إضافة إلى النص والصوت.
وتمثل أنظمة الذكاء الاصطناعي متعددة الوسائط المستوى القادم في مجال الذكاء الاصطناعي، لكن تطويرها لن يكون رخيصا. فتطوير نماذج ذكاء اصطناعي أكثر تقدما يمكن أن يُكسب شركة إنيفديا المزيد من التفوق، خاصة إذا لم يظهر أي منافس آخر.
وقد كانت إنيفديا أكبر مستفيد من الذكاء الاصطناعي التوليدي، حيث أصبحت وحدات معالجة الرسومات الباهظة الثمن هي الأداة القياسية المستخدمة لتدريب نماذج لغوية ضخمة. واعتمدت ميتا على 16 ألف وحدة معالجة رسوميات من طراز إنيفديا إيه 100 (Nvidia A100) لتدريب برنامج إل لاما (Llama AI) الخاص بها للذكاء الاصطناعي.