استمرارا لصراع الذكاء الاصطناعي الحالي، ركزت غوغل في مؤتمرها للمطورين “آي/ أو” لعام 2024 على أحدث مميزات نموذجها للذكاء الاصطناعي التوليدي “جيميناي”.
واختتم سوندار بيتشاي، الرئيس التنفيذي لغوغل، الكلمة الافتتاحية بأنه “ذكر كلمة الذكاء الاصطناعي في أثناء حديثه على مدار الحدث 121 مرة”، وهو ما يؤكد أهمية هذا المجال وتحديثاته وتطوراته بالنسبة للشركة العملاقة. وهذا ملخص لأهم تلك التصريحات التي جاءت في الكلمة الافتتاحية لمؤتمر غوغل “آي/ أو”.
عصر جيميناي
أعلن بيتشاي أن نسخة “جيميناي 1.5 برو” ستضيف إطارا أوسع للسياق يصل إلى 2 مليون “توكين” (Token)، وهي كمية المعلومات التي يمكن لنموذج الذكاء الاصطناعي فهمها، بينما تملك النسخة الحالية مليون توكين.
أضافت غوغل مجموعة من الميزات الجديدة إلى نموذج “جيميناي” للذكاء الاصطناعي، ومن أقوى تلك الميزات خيار التخصيص المسمى “جيمز” (Gems)، الذي يتيح للمستخدمين إنشاء نسخ مخصصة من النموذج بشخصيات مختلفة.
يتيح “جيمز” إنشاء نسخ من روبوتات المحادثة التي يمكنها المساعدة في مهام معينة والاحتفاظ بخصائص محددة، وهو يشبه إلى حد ما إنشاء الروبوتات المخصصة في موقع “كاراكتر إيه آي” (Character.AI)، وهي الخدمة التي تتيح التحدث إلى نسخ افتراضية من الشخصيات العامة والمشاهير أو حتى طبيب نفسي افتراضي.
تبدو تلك الميزة مشابهة لمتجر “جي بي تي” الخاص بشركة أوبن إيه آي الذي يتيح إنشاء نسخ روبوتات محادثة مخصصة من “شات جي بي تي”.
كما سيحصل مساعد الذكاء الاصطناعي “جيميناي” على إمكانات المحادثة الصوتية الجديدة لمشتركي خدمة “جيميناي أدفانست” خلال هذا العام.
ستتيح هذه الميزة، التي تحمل اسم “جيميناي لايف” (Gemini Live)، إمكانية إجراء محادثة بالكلام مع روبوت المحادثة، بالإضافة إلى منحه قدرات المساعد الذكي ومميزات الرؤية، وهو ما يشبه كثيرا ما أعلنت عنه “أوبن إيه آي” لنموذجها الجديد “جي بي تي-4 أو”.
وتذكر غوغل أن المساعد الذكي سيتكيف مع أنماط كلام المستخدمين، وسيوفر ردودا موجزة ومختصرة أكثر من الردود النصية الطويلة التي عادة ما يقدمها.
وستوفر هذه الميزة 10 خيارات صوتية، كما تقول الشركة إن الميزة ستكون قادرة على استخدام كاميرات الهواتف الذكية لرؤية وتفسير مقاطع الفيديو في الوقت الفعلي.
ويمكن استخدامها أيضا في تنفيذ مهام المساعد الرقمي، مثل تحديث التقويم الشخصي، عبر الاستعانة بمعلومات من منشور لحفل موسيقي التقط المستخدم صورة له على سبيل المثال.
كما ذكرت الشركة أن بإمكانه أيضا البحث في حسابات المستخدمين في بريد “جيميل” (Gmail) لجمع معلومات خطة السفر مثل مسارات الرحلات الجوية أو البحث عن بعض المعلومات مثل عناوين المطاعم القريبة من الفندق.
كما أعلنت غوغل أنها تعمل على تحديث نموذج “جيميناي” على نظام أندرويد لتتيح للذكاء الاصطناعي الاستفادة مما يظهر على شاشة الهاتف بصورة أفضل.
مثلا، إذا حدد المستخدم “جيميناي” مساعدا رقميا افتراضيا على هاتف بنظام أندرويد، فيمكنه تلخيص أو الإجابة عن أسئلة حول صفحة الويب التي يتصفحها أو لقطة شاشة يفتحها أمامه. قريبا، سيتمكن أيضا من معرفة إذا كان هناك مقطع فيديو على الشاشة وسيطلب من المستخدم طرح أسئلة حول هذا المقطع.
يستخدم النموذج الكلمات النصية التلقائية للفيديو لإيجاد الإجابات، وهو أمر يمكنك الحصول عليه فعلا بطرق أخرى.
تحديثات قوية
منذ عام وفي نسخة المؤتمر 2023، ذكرت غوغل أنها ترى الذكاء الاصطناعي مستقبل البحث على الإنترنت. وفي نسخة هذا العام، بدأت الرؤية تتضح أكثر، إذ ستبدأ غوغل في طرح “ملخصات الذكاء الاصطناعي” (AI Overviews)، التي كانت تُعرف سابقا باسم “تجربة البحث التوليدية” (SGE)، للمستخدمين في الولايات المتحدة وقريبا في جميع أنحاء العالم.
في المستقبل القريب، سيشاهد المليارات من مستخدمي غوغل ملخصا مولدا بالذكاء الاصطناعي في أعلى صفحة نتائج البحث، وربما تكون هذه هي البداية لكيفية تغيير الذكاء الاصطناعي لتجربة البحث على محرك غوغل.
وفي المؤتمر، عرضت غوغل نسخة أولية لما تأمل الشركة أن يصبح المساعد الشخصي الشامل، وأطلقت عليه “مشروع أسترا” (Project Astra)، وهو مساعد ذكي متعدد الوسائط يعمل بالذكاء الاصطناعي في الوقت الفعلي وتمكنه رؤية العالم ومعرفة أماكن الأشياء وأين تركتها، كما تمكنه الإجابة عن الأسئلة أو مساعدتك في القيام بأي شيء تقريبا، وهو نوع من وكلاء الذكاء الاصطناعي (AI Agents)، وهي روبوتات لا تكتفي بالردود على الأسئلة لكنها تنفذ المهام المختلفة نيابة عن المستخدم.
كما أعلنت الشركة عن نموذج جديد، يسمى “جيميناي 1.5 فلاش” (Gemini 1.5 Flash)، مصمم لكي يعمل بسرعة أكبر للمهام العامة، مثل تلخيص المحتوى والتعليق على مقاطع الفيديو. بجانب نموذج جديد آخر يسمى “فيو” (Veo)، يستطيع توليد مقطع فيديو من توجيه نصي من المستخدم.
أما بالنسبة لنموذج “جيميناي نانو”، وهو النموذج المصمم ليُستخدم داخليا على الأجهزة كالهاتف الذكي وجهاز الحاسب الشخصي، فمن المفترض أن يصبح أسرع من السابق أيضا.
وستضيف الشركة هذا الإصدار الخفيف من “جيميناي” إلى متصفحها كروم على أجهزة الحاسوب، إذ سيستفيد من الذكاء الاصطناعي على الجهاز لمساعدة المستخدم في إنشاء نصوص لمنشورات وسائل التواصل الاجتماعي ومراجعات المنتجات وغيرها من داخل متصفح كروم مباشرة.
ميزات جديدة
أعلنت الشركة في مؤتمر المطورين أنها ستوفر نموذجها الأحدث “جيميناي 1.5 برو” في الشريط الجانبي لتطبيقات مستندات غوغل وجداول البيانات والعروض التقديمية وخدمة “جيميل”. سيكون المساعد الرقمي نفسه في كل هذه التطبيقات، والأهم أنه سيعرف كل ما حفظه المستخدم في أي مكان. وتهدف هذه الفكرة إلى استخدام “جيميناي” لربط كافة تطبيقات العمل “وركسبيس” بسلاسة أكبر.
كما سيحصل تطبيق جيميل على الهواتف الذكية على نسخة من المساعد الرقمي “جيميناي”، بداية من الشهر القادم، لمشتركي خدمة “وركسبيس” وخدمة “إيه آي بريميوم” ضمن اشتراك “غوغل وان”، وتشير الشركة إلى أن بإمكان المستخدمين طرح أسئلة على النموذج حول رسائل البريد الإلكتروني أو أن يكتب ردودا بناء على سياق تلك الرسائل.
وبينما تتمتع خدمة “صور غوغل” بقدرات بحث مميزة، فإن غوغل ستستعين بروبوت “جيميناي” للارتقاء بهذه القدرات إلى المستوى الأعلى، عبر إضافة ميزة “اسأل الصور” “Ask Photos”، وهي ميزة جديدة قادمة بحلول هذا الصيف للتطبيق ستجعله أكثر ذكاء عندما يتعلق الأمر بفهم ما يبحث عنه المستخدم، وذلك عبر استخدام الذكاء الاصطناعي للربط بين العناصر للحصول على نتائج أكثر تعقيدا.
كما تتيح ميزة جديدة في خدمة “غوغل لينس” (Google Lens) إمكانية البحث في شبكة الإنترنت عن طريق تصوير فيديو بكاميرا الهاتف وطرح سؤال على النموذج ليبحث عن إجابة على الإنترنت. ويعود الفضل في هذا الأمر إلى إطار السياق الكبير الذي يتمتع به نموذج “جيميناي”، مما يعني أن بإمكانه الوصول إلى كم هائل من المعلومات في وقت واحد.