الرئيس التنفيذي لشركة Google ساندر بيتشاي يتحدث في مؤتمر مطوري Google I/O.
أندريه سوكولوف | تحالف الصورة | صور جيتي
جوجل استخدمت مؤتمرها السنوي للمطورين لعرض ما تسميه الشركة نماذج الذكاء الاصطناعي الأخف والأكثر كفاءة.
في Google I/O يوم الثلاثاء، أعلنت الشركة عن Gemini 1.5 Flash، أحدث إضافة إلى سلسلة Gemini. وقالت جوجل في تدوينة إن النموذج الجديد يمكنه تلخيص المحادثات والتسميات التوضيحية للصور ومقاطع الفيديو بسرعة واستخراج البيانات من المستندات والجداول الكبيرة.
وقال ديميس هاسابيس، الرئيس التنفيذي لشركة Google DeepMind، في مؤتمر صحفي: “لقد سمعنا من المطورين أنهم يريدون شيئًا أسرع وأكثر فعالية من حيث التكلفة”.
يأتي هذا الكشف في الوقت الذي تعيد فيه شركات التكنولوجيا التركيز بشكل متزايد على تطوير منتجاتها ونشرها حول الذكاء الاصطناعي التوليدي، وهو أمر ذو أهمية خاصة لشركة Google لأن الأدوات الجديدة تمنح المستهلكين طرقًا أكثر تقدمًا وإبداعًا للوصول إلى المعلومات عبر الإنترنت مقارنة ببحث الويب التقليدي.
أطلقت OpenAI يوم الاثنين نموذجًا جديدًا للذكاء الاصطناعي وإصدار سطح المكتب من ChatGPT، إلى جانب واجهة مستخدم جديدة. وقالت الشركة إن النموذج الجديد، المسمى GPT-4o، أسرع بمرتين من GPT-4 Turbo وبنصف التكلفة.
أعلنت Google مؤخرًا عن نموذج Gemini 1.5 Pro المحسّن، والذي يمكنه فهم العديد من المستندات الكبيرة – إجمالي 1500 صفحة – أو تلخيص 100 رسالة بريد إلكتروني، وفقًا لنائب الرئيس الذي يعمل في Gemini.
وقال Sissie Hsiao، نائب رئيس Google والمدير العام لتجارب Gemini، إن Gemini 1.5 Pro سيكون قادرًا قريبًا على التعامل مع ساعة من محتوى الفيديو، أو قواعد الأكواد التي تحتوي على أكثر من 30 ألف سطر.
وقال هسياو: “يمكنك الحصول بسرعة على إجابات ورؤى حول المستندات الكثيفة، مثل معرفة تفاصيل سياسة الحيوانات الأليفة في اتفاقية الإيجار الخاصة بك أو مقارنة الحجج الرئيسية لعدة أوراق بحثية طويلة”.
أحدث ترقية لـ OpenAI تجلب معها جودة وسرعة محسنة وتسمح لـ ChatGPT بالتعامل مع 50 لغة مختلفة. وقال المسؤولون التنفيذيون إنه سيكون متاحًا أيضًا عبر واجهة برمجة التطبيقات الخاصة بـ OpenAI، أو API، مما يسمح للمطورين بالبدء في إنشاء التطبيقات باستخدام النموذج الجديد على الفور.
مع 35 لغة، تقول Google إن Gemini 1.5 Pro لديه نافذة تحتوي على 2 مليون رمز، والتي تقيس السياق وتشير إلى مقدار المعلومات التي يمكن للنموذج معالجتها في وقت واحد. وقال مسؤولون تنفيذيون في الشركة إن النموذج الجديد أدى إلى تحسين التفكير المحلي والتخطيط وفهم الصورة.
وقال ساندر بيتشاي، الرئيس التنفيذي لشركة Alphabet، في المؤتمر الصحفي: “إنه يوفر أطول نافذة سياقية لأي نموذج تأسيسي حتى الآن”. وفي هذا الحدث، قدم مثالاً لأحد الوالدين الذي طلب من جيميني تلخيص جميع رسائل البريد الإلكتروني الأخيرة من مدرسة طفلهم.
سيكون Gemini 1.5 Pro متاحًا في البداية للاختبار في Workspace Labs. سيكون Gemini 1.5 Flash متاحًا للاختبار في Vertex AI، وهي منصة التعلم الآلي من Google التي تتيح للمطورين تدريب ونشر تطبيقات الذكاء الاصطناعي.