سام ألتمان، الرئيس التنفيذي لشركة OpenAI، في حدث أقيم في سيول، كوريا الجنوبية، في 9 يونيو 2023.
بلومبرج | بلومبرج | صور جيتي
أعلنت الشركة يوم الاثنين أن ChatGPT من OpenAI يمكنه الآن “الرؤية والسماع والتحدث” أو على الأقل فهم الكلمات المنطوقة والرد بصوت اصطناعي ومعالجة الصور.
يتيح التحديث الذي تم إجراؤه على chatbot – وهو الأكبر من OpenAI منذ تقديم GPT-4 – للمستخدمين الاشتراك في المحادثات الصوتية على تطبيق ChatGPT للهاتف المحمول والاختيار من بين خمسة أصوات اصطناعية مختلفة ليرد عليها الروبوت. سيتمكن المستخدمون أيضًا من مشاركة الصور مع ChatGPT وتسليط الضوء على مجالات التركيز أو التحليل (فكر: “ما أنواع هذه السحب؟”).
وقالت OpenAI إنه سيتم تطبيق التغييرات على المستخدمين الذين يدفعون رسومًا في الأسبوعين المقبلين. في حين أن الوظائف الصوتية ستقتصر على تطبيقات iOS وAndroid، فإن إمكانيات معالجة الصور ستكون متاحة على جميع الأنظمة الأساسية.
تأتي هذه الدفعة الكبيرة من الميزات جنبًا إلى جنب مع المخاطر المتزايدة باستمرار لسباق تسلح الذكاء الاصطناعي بين قادة برامج الدردشة الآلية مثل OpenAI، مايكروسوفت, جوجل والأنثروبي. في محاولة لتشجيع المستهلكين على تبني الذكاء الاصطناعي التوليدي في حياتهم اليومية، يتسابق عمالقة التكنولوجيا لإطلاق ليس فقط تطبيقات chatbot جديدة، ولكن أيضًا ميزات جديدة، خاصة هذا الصيف. أعلنت Google عن عدد كبير من التحديثات لبرنامج Bard chatbot الخاص بها، وأضافت Microsoft البحث المرئي إلى Bing.
في وقت سابق من هذا العام، أدى استثمار مايكروسوفت الموسع في OpenAI – بقيمة 10 مليارات دولار إضافية – إلى جعله أكبر استثمار في الذكاء الاصطناعي لهذا العام، وفقًا لـ PitchBook. في أبريل، أفادت التقارير أن الشركة الناشئة أغلقت بيع أسهم بقيمة 300 مليون دولار بتقييم يتراوح بين 27 مليار دولار و29 مليار دولار، مع استثمارات من شركات مثل سيكويا كابيتال وأندريسن هورويتز.
أثار الخبراء مخاوف بشأن الأصوات الاصطناعية التي يولدها الذكاء الاصطناعي، والتي في هذه الحالة يمكن أن تتيح للمستخدمين تجربة أكثر طبيعية ولكنها تتيح أيضًا تزييفًا عميقًا أكثر إقناعًا. وقد بدأت الجهات الفاعلة والباحثون في مجال التهديد السيبراني بالفعل في استكشاف كيفية استخدام التزييف العميق لاختراق أنظمة الأمن السيبراني.
اعترفت شركة OpenAI بهذه المخاوف في إعلانها يوم الاثنين، قائلة إن الأصوات الاصطناعية “تم إنشاؤها باستخدام ممثلين صوتيين عملنا معهم بشكل مباشر”، بدلاً من جمعها من الغرباء.
كما قدم الإصدار أيضًا القليل من المعلومات حول كيفية استخدام OpenAI للمدخلات الصوتية للمستهلك، أو كيف ستقوم الشركة بتأمين تلك البيانات إذا تم استخدامها. تنص شروط الخدمة الخاصة بالشركة على أن المستهلكين يمتلكون مدخلاتهم “إلى الحد الذي يسمح به القانون المعمول به”.
أحالت شركة OpenAI قناة CNBC إلى إرشادات الشركة بشأن التفاعلات الصوتية، والتي تنص على أن OpenAI لا تحتفظ بالمقاطع الصوتية وأن المقاطع الصوتية نفسها لا تُستخدم لتحسين النماذج.
لكن الشركة تشير أيضًا إلى أن النسخ يعتبر مدخلات ويمكن استخدامه لتحسين نماذج اللغات الكبيرة.