أعلنت شركة الذكاء الاصطناعي الشهيرة “أوبن إيه آي” عن إطلاق نموذج الذكاء الاصطناعي الجديد والمطور، وأطلقت عليه اسم “تشات جي بي تي 4 تيربو” (ChatGPT 4 Turbo)، ويتوفر النموذج الجديد حاليا للمطورين، وسيُطرح لجميع المستخدمين في الأسابيع القادمة حيث أضيفت له العديد من الميزات والتحسينات بالإضافة إلى خفض سعر الاشتراك.
ميزات تطبيق تشات جي بي تي 4 تيربو
يعتبر نموذج تشات جي بي تي 4 تيربو الجديد أكثر قدرة من الإصدارات السابقة وأرخص سعرا ويسمح بعدد كلمات للنص حتى 128 ألف كلمة. كما أضيفت له ميزات خاصة بالوسائط مثل تحويل النص المكتوب إلى مسموع، وتحويل النص المكتوب إلى صورة إبداعية عن طريق برنامج توليد الصور “دال إيه 3” (DALL E 3).
أما بالنسبة للمطورين فأصبحت واجهة برمجة تطبيقات المساعدات الجديدة التي تجعل بناء تطبيقات الذكاء الاصطناعي أكثر سهولة، كما تسمح لهم بجلب النماذج والأدوات لتسهيل عملهم.
ويتميز “تشات جي بي تي 4 تيربو” بأنه أكثر كفاءة من حيث التحليل والفهم وإعطاء النتائج المناسبة، والأهم من ذلك أنه يمتلك معرفة بالأحداث العالمية حتى تاريخ أبريل/نيسان 2023. كما أنه يمكنه استيعاب إدخال نص حتى 128 ألف كلمة -أي ما يعادل أكثر من 300 صفحة نصية- في عملية واحدة.
وقد خُفضت كلفة الاشتراك مقارنة بـ”تشات جي بي تي 4″ بمعدل 3 أضعاف بالنسبة للإدخالات النصية التي تقدم إلى التطبيق، وبمعدل ضعفين للإخراجات والإجابات، مما يتيح التوسع في الشرح والإجابة.
تشات جي بي تي 4 تيربو والرؤية
يمكن لتطبيق “تشات جي بي تي 4 تيربو” قبول الصور كإدخالات في واجهة المستخدم المكتملة (Chat Completions API)، مما يسمح له بإنشاء التسميات التوضيحية، وتحليل صور العالم الحقيقي بالتفصيل، وقراءة المستندات التي تحتوي على أشكال.
فعلى سبيل المثال، يستخدم تطبيق “بي ماي آيز” (BeMyEyes) هذه التكنولوجيا لمساعدة الأشخاص المصابين بالعمى أو لديهم رؤية ضعيفة في المهام اليومية مثل تحديد منتج في متجر.
ويمكن للمطورين الوصول إلى هذه الميزة عن طريق استخدام واجهة المستخدم. وتخطط “أوبن إيه آي” لتوفير دعم الرؤية في إصدار تيربو، ويعتمد التسعير على حجم الصورة المدخلة. فمثلا يكلف إدخال صورة بحجم 10801080 x بيكسل إلى 0.00765 نحو دولار واحد.
تحويل النص إلى صورة
يمكن للمطورين دمج برنامج توليد الصور “دال إيه 3” -الذي أُطلق مؤخراً لمستخدمي “تشات جي بي تي بلس”- مباشرة في تطبيقاتهم ومنتجاتهم عبر واجهة برمجة التطبيقات.
واستخدمت شركات مثل سناب وكوكاكولا وشاترستوك برنامج “دال إيه 3” لإنشاء صور وتصاميم لعملائها وحملاتها الإعلانية.
ومثل النسخة السابقة، تتضمن واجهة برمجة التطبيقات تدابير ضبط ذاتي مدمجة لمساعدة المطورين على حماية تطبيقاتهم من سوء الاستخدام. وتقدم خيارات مختلفة لتنسيق ورفع جودة الصورة بأسعار تبدأ من 0.04 دولار لكل صورة تم إنشاؤها.
تحويل النص إلى كلام
يمكن للمطورين الآن إنشاء كلام أو صوت ذي جودة عالية وأقرب للواقع من خلال النص المدخل عن طريق ميزة تحويل النص إلى كلام. وسيتم تزويد طراز تشات جي بي تي 4 تيربو الجديد بست أصوات متنوعة للاختيار من بينها، ونوعين من نماذج تحويل النص إلى صوت هما تي تي إس1 (tts-1) وتي تي إس1 إتش دي (tts-1-hd). وبالنسبة للسعر فيبدأ من 0.015 دولار لكل 1000 حرف من النص.
بين النموذجين الحالي والسابق
– “تشات جي بي تي 4 تيربو” يقدم المعلومات المتوفرة حتى أبريل/نيسان من عام 2023، بينما “تشات جي بي تي 4” العادي فيتوقف عند شهر يناير/كانون الثاني من عام 2022 ولا يقدم أي أحداث بعد ذلك التاريخ.
– يتفوق إصدار تيربو بما يخص طول المدخلات، فالإصدار السابق كان يقيّد المستخدم بإدخال نص يصل إلى 3000 كلمة فقط. بينما مع إصدار تيربو يمكن للمستخدم إدخال ما يصل إلى 128 ألف كلمة، أي ما يعادل 300 صفحة. وهذا يعني أن المستخدم يمكنه الآن تلخيص الكتب بأكملها.
– يتفوق إصدار تيربو بأنه يدعم ميزة تحويل النص إلى كلام، وميزة تحويل النص إلى صورة، وهذا ما لا يوجد في الإصدار العادي.
– وأخيراً، فإن أسعار “تشات جي بي تي 4 تيربو” أقل عن الإصدار السابق، وهذا يعني أن المطورين سيوفرون المزيد من الدولارات عند استخدامهم نماذج الذكاء الاصطناعي.
وفي ظل المخاوف المستمرة بشأن حقوق النشر، تنضم “أوبن إيه آي” إلى “غوغل” و “مايكروسوفت” في القول بأنها ستتحمل المسؤولية القانونية إذا قاضاها عملاؤها بتهمة انتهاك حقوق النشر.