تنامى استخدام روبوتات الذكاء الاصطناعي في الآونة الأخيرة بفضل قدراتها الواسعة واعتمادها على نماذج اللغة الكبيرة التي تجعلها قادرة على توليد النصوص بشكل يماثل البشر، فضلا عن كتابة الأكواد البرمجية المختلفة أو الإجابة على الأسئلة والتحديات الموجهة إليها.
ورغم هذه القدرات المذهلة التي تحاكي البشر في بعض الأحيان، فإن نماذج الذكاء الاصطناعي هذه ما زالت قاصرة في وجه بعض التحديات البسيطة التي تتطلب آلية تفكير بشرية وقدرة على استنتاج المعلومات بشكل صحيح.
ويظهر هذا العجز بوضوح في تحدي إحصاء الحروف المتكررة في الكلمات مثل كلمة فراولة بالإنجليزي “ستروباري” (Strawberry) أوهيبوبوتمس (hippopotamus) مثلا، إذ تقدم نماذج الذكاء الاصطناعي على اختلافها إجابات خاطئة في كل مرة يتم توجيه هذا السؤال إليها.
عجز عن عد الحروف
يستطيع الذكاء الاصطناعي تلخيص أي نص مهما كان مع الحفاظ على النص الأصلي، كما أنه قادر على إجابة التحديات المختلفة والمسائل اللغوية المتنوعة، فضلا عن كتابة أكواد برمجية وتصحيح أكواد برمجية أخرى، وهو الأمر الذي أوهم كثيرين بأن قدرات الذكاء الاصطناعي غير محدودة.
ويظهر السؤال السابق عجز الذكاء الاصطناعي على التعرف على الحروف في كلمة واحدة وتقديم عدد صحيح لها، ورغم بساطة هذا السؤال، فإن الذكاء الاصطناعي يخفق فيه بكل مرة، ويعود السبب في ذلك إلى آلية عمل الذكاء الاصطناعي وطريقة تعامله مع الحروف والكلمات المختلفة.
ورغم التصور الشائع عن الذكاء الاصطناعي، فإنه ليس قادرا على التعامل مع الكلمات والحروف بالشكل الذي يتعامل به البشر فهو لا يعتبر النصوص والحروف والأرقام جزءا من مدخلاته التي يستطيع تحويلها وفهمها، ويعتمد بدلا من ذلك على رموز تدعى “توكين” (Token)، وهي آلية ترميز تدعى (tokenization) تحول الحروف والنصوص إلى أرقام يستطيع الذكاء الاصطناعي فهمها.
وتختلف آلية عمل الترميز بين نموذج ذكاء اصطناعي وآخر، وفي بعض الأحيان تختلف داخل النموذج الواحد بناء على طريقة توجيه السؤال له، ولكن في المجمل، فإن جميع نماذج الذكاء الاصطناعي تعتمد على آليات الترميز، وهي الآليات التي تقيس عبرها معدل الاستخدام والاستهلاك للنموذج، فضلا عن وضع تسعير استخدام النموذج في النماذج المدفوعة.
وفي بعض الحالات، يقوم الذكاء الاصطناعي بتقسيم كلمة مثل “سلسبيل” إلى مقطعين، أي إلى “سلس” و”بيل” وفي بعض الأحيان الأخرى “سل” س” “بيل”، أي إلى 3 مقاطع مختلفة، وعبر هذه المقاطع، يستطيع الذكاء الاصطناعي توقع الإجابة أو الكلمة التالية للمقطع، وهذا يعني أن الذكاء الاصطناعي لا ينظر إلى كلمة “سلسبيل” على أنها مكونة من الحروف الفردية “س” ل” “س”ب”ي”ل”، وبالتالي لا يمكنه عد حرف “س” المذكور في الكلمة، لأنه لا يرى الحرف منفردا، بل يرى المقطع الذي يضم الحروف، وإذ ظهر الحرف في 3 مقاطع، فإن هذا يجعل الذكاء الاصطناعي يظن أن الكلمة تضم 3 حروف “س” حتى وإن كانت تضم حرفين فقط.
هل يمكن تخطي هذه العوائق؟
سرعة تطور نماذج الذكاء الاصطناعي في الآونة الأخيرة تشير إلى أن النماذج المستقبلية قد لا تواجه مثل هذه العوائق، ولا يمكن القول إن هذا العائق يصعب تخطيه، إذ إن النماذج الاحترافية المدفوعة مثل “أو 1” من “شات جي بي تي” قادرة على تخطيه بشكل كبير، وهذا لأنها تعتمد على آلية عمل مختلفة تدعى “المنطق”.
وفي آلية عمل المنطق تخضع الكلمات والحروف إلى عملية ترميز أكثر دقة، وبالتالي قدرة أكبر على فهم الحروف والكلمات دون الاقتصار على آلية المقاطع المذكورة سابقا، وبالتالي تقديم نتائج أكثر دقة وأعلى جودة من نماذج الذكاء الاصطناعي المجانية، بالطبع تتطلب آلية عمل “المنطق” موارد أكثر من آليات العمل المعتادة لدى الذكاء الاصطناعي، وبالتالي تطلب تكلفة أعلى من كلفة النماذج المجانية، وهو ما كان واضحا في تسعير نموذج “أو 1” من “شات جي بي تي”.
هل الذكاء الاصطناعي عاجز؟
ورغم وجود هذه العوائق في آلية عمل نماذج الذكاء الاصطناعي، فإنه لا يعني عجز الذكاء الاصطناعي بشكل عام، إذ تفيد آلية الترميز والمقاطع التي تعتمد عليها نماذج الذكاء الاصطناعي في فهم الجمل والطلبات المركبة بشكل صحيح، لذا تجد الذكاء الاصطناعي بارعا في بعض الجوانب دون غيرها.
وبفضل آلية المقاطع، تظهر براعة الذكاء الاصطناعي في البرمجة وكتابة الأكواد، إذ يمكن بكل سهولة الآن جعل “شات جي بي تي” أو أي نموذج ذكاء اصطناعي آخر توليد نصوص عميقة ومفهومة بشكل كامل عبر الاعتماد على مجموعة من الأوامر المتتالية المباشرة.
وحتى في الوظائف التي تعتمد على هذه المهام، لا يمكن القول إن الذكاء الاصطناعي يمكنه استبدال البشر فيها، إذ لن يستطيع الوصول إلى آلية التفكير البشري المنطقية من أجل تقديم الحلول الملائمة للمشاكل المختلفة، فضلا عن ربط النتائج بالطلبات الموجهة إليه، خاصة إن كانت طلبات تحتاج إلى مهام خفية تتكون من أكثر من مرحلة.