أثارت شركة “أوبن إيه آي” الناشئة في مجال الذكاء الاصطناعي الجدل على وسائل التواصل الاجتماعي الأسابيع الأخيرة، بسبب برنامج جديد يولد الفيديوهات بواسطة الذكاء الاصطناعي أطلقت عليه اسم “سورا” (Sora).
وذكر تقرير لموقع الجزيرة الإنجليزية أن “أوبن إيه آي” أعطت الممثلين والمخرجين في هوليود نظرة أولية على التكنولوجيا وفرصة لتجربتها، قبل إطلاق “سورا” علنا.
ونشرت “أوبن إيه آي” منشورا على مدونة يوم 24 مارس/آذار الجاري بعنوان انطباعات “سورا” الأولى، يعرض العمل الذي أنتجه عديد من الأستوديوهات والمخرجين الإبداعيين باستخدام مولد الفيديو.
ويتوقع بعض خبراء الإعلام أن “سورا” سيكون مدمرا للغاية لصناعة السينما الإبداعية.
وفي هذا السياق، تحدث موقع الجزيرة الإنجليزية مع أحد المسؤولين التنفيذيين الذي يعمل في هوليود، والذي طلب عدم الكشف عن هويته في التقرير نظرا لحساسية الموضوع.
وعندما سُئل عن رد فعله الأولي عندما رأى قدرة سورا للمرة الأولى، قال “كان رد فعلي على سورا مثل أي شخص آخر؛ لقد دهشت. كان الأمر كما لو كنا نرى قاتلتنا، لكنها كانت جميلة في الوقت نفسه، ومثيرة للإعجاب، ومرعبة بشكل كبير”.
لقد شعر البعض في صناعة الأفلام بالتغيير الذي سببه سورا.
في مقابلة مع موقع “ذا هوليود ريبورتر” في فبراير/شباط الماضي، صرح الممثل والمخرج ومالك الأستوديو تايلر بيري بأنه سيعلق توسعة الأستوديو التي تبلغ تكلفتها 800 مليون دولار في أتلانتا بعد رؤية قدرة سورا على إنتاج الفيديوهات.
وأضاف: “لذلك أنا قلق للغاية من فقدان كثير من الوظائف في المستقبل القريب. أنا حقا أشعر بذلك جدا”.
ما سورا؟
سورا هو نموذج الذكاء الاصطناعي المولد لتحويل النص إلى فيديو من “أوبن إيه آي”. وعلى غرار “شات جي بي تي”، يمكنك إدخال مطالبة نصية، ولكن بدلا من إنشاء إجابات للأسئلة أو المطالبات في شكل نصي، سيقوم سورا بإنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة.
يمكن أدناه مشاهدة مثال فيديو لقدرات سورا، تم إصداره بواسطة “أوبن إيه آي”:
مثال للأمر النصي: “مقطع دعائي لفيلم يعرض مغامرات رجل فضاء يبلغ من العمر 30 عاما يرتدي خوذة دراجة نارية من الصوف الأحمر، وسماء زرقاء، وصحراء مالحة، بأسلوب سينمائي، تم تصويره على فيلم مقاس 35 مم، وألوان زاهية”.
كما نشر سام ألتمان، الرئيس التنفيذي لشركة “أوبن إيه آي”، عدة أمثلة عبر حسابه على موقع إكس، ومنها ما يلي:
مثال لأمر نصي سريع: “جلسة طهي تعليمية لطبق جنوكتشي محلي الصنع تستضيفه إحدى الجدات المؤثرات على وسائل التواصل الاجتماعي في مطبخ ريفي توسكاني مع إضاءة سينمائية”.
https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw
— Sam Altman (@sama) February 15, 2024
سورا بعيد عن الكمال، إذا نظرت عن كثب إلى فيديو “جلسة الطبخ التعليمية”، فإن الملعقة في اليد اليمنى تختفي بعد توقف “الجدة” عن الخلط.
ورغم كونها واقعية للغاية، فإن القدرة على اكتشاف المنتجات المزيفة لا تزال موجودة في بعض مقاطع الفيديو التي ينتجها سورا.
وأثار هذا سؤالا آخر عن مدى نجاح منتج مثل هذا في الصناعة.
من جهته، صرح مصدر في هوليود لموقع الجزيرة الإنجليزي بأنه: “سوف نخرج على الجانب الآخر أكبر وأفضل، لأن البشر سيكونون قد اكتشفوا مكانهم على قمة التكنولوجيا التي من الواضح أنها أقوى مما يمكننا تخيله حاليا. لكن الرغبة في التمثيل، والكتابة، والتوجيه، والتأليف، والتعاون، وما إلى ذلك، هي رغبة فطرية عميقة لدى البشر. لن تذهب إلى أي مكان. فهل هذا سيئ بالنسبة للبشر في هذه الصناعة؟ الجواب هو لا، ثم نعم، ثم لا. هل هو جيد للصناعة نفسها؟ نعم”.
كيف يعمل سورا؟
كما هي الحال مع “شات جي بي تي”، يكتب المستخدمون أمرا نصيا أو سؤالا أو طلبا ويستجيب الذكاء الاصطناعي، في حالة سورا، بتسلسلات فيديو تم إنشاؤها.
للقيام بذلك، يستخدم سورا مزيجا من التعلم الآلي ومعالجة اللغة الطبيعية (NLP) لإنشاء تسلسل فيديو. معالجة اللغة الطبيعية هي شكل من أشكال الذكاء الاصطناعي الذي يفهم التفاعل بين أجهزة الحاسوب واللغة البشرية. ويسمح التعلم الآلي لسورا بالتحسن مع مرور الوقت مع تحسين استجاباته من خلال الأنماط والملاحظات.
يستخدم سورا “رؤية الحاسوب” لفهم وتفسير المعلومات المرئية من الصور أو مقاطع الفيديو. الرؤية الحاسوبية هي إطار عمل برمجي يخبر سورا “بالتعرف” على التمثيلات المرئية للأشياء والأشخاص والبيئات في العالم الحقيقي من خلال أوصاف النص التي تتضمن اللغة المرئية.
على سبيل المثال، تشير الأوامر “تتحرك القطة” أو “انكسار الأمواج في المحيط” إلى سمات وخصائص معينة. يحتاج سورا إلى هذه اللغة المرئية لتفسير الأمر النصي، ثم تقديم تصوير مرئي للكائن بدقة.
يمكن لسورا جمع بيانات غير كاملة أو جزئية وتحويلها إلى محتوى فيديو مفهوم يبدو حقيقيا جدا. يعمل سورا كأداة تكبير أو تصغير فائقة القوة. يبدأ الأمر بكتل كبيرة وغير واضحة من الألوان أو الكائنات، ثم يقوم بتحسينها إلى أشكال أصغر وأكثر تحديدا بناء على مطالبتك.
ماذا يعني سورا بالنسبة للوظائف الإبداعية في صناعة السينما؟
لا يزال من غير الواضح المهام التي يتولاها المبدعون البشريون عادة، إن وجدت، والتي يمكن أن يتولاها سورا. إن قدرة الذكاء الاصطناعي على تكرار لقطات الكاميرا والإضاءة والشخصيات بسرعة، تفتح المجال أمام المخرجين وصانعي الأفلام. ومع ذلك، يتوقع محترفو السينما أن يحدث هذا تغييرا جذريا في الصناعة.
وفي السياق، قال أحد المطلعين على شؤون هوليود، الذي تحدث إلى الجزيرة شريطة عدم الكشف عن هويته، “لا أرى أن هذا يمثل تهديدا للإنتاج بقدر ما يمثل تهديدا للطريقة التي يتم بها الإنتاج كما نعرفها حاليا”.
لقد رأينا مثل هذه الأحداث في الماضي، لا سيما في مرحلة ما بعد الإنتاج عندما بدأ الأشخاص في التحرير على أجهزة الحاسوب المحمولة بدلا من مكاتب البريد الكبيرة باهظة الثمن. لقد تم القضاء على كثير من الأشخاص في تلك الفترة الانتقالية، بينما تمكن آخرون فجأة من تحمل تكلفة محرر مناسب دون النفقات العامة التي تتطلبها دار البريد.
وعندما سُئل عن الوظائف التي يمكن استبدالها بمولدات الذكاء الاصطناعي، أضاف: “ربما يكون السؤال: من الذي سيتم استبداله؟ هو السؤال الخاطئ. أعتقد أن هذا هو النظام الذي سيتم التخلص منه واستبداله”.
وفي غضون بضع سنوات، ربما يشير مصطلح “المخرج” إلى الرجل الذي يحفز الذكاء الاصطناعي، ويتم تنفيذ الباقي رقميا بالكامل. وإذا قبل الجمهور هذا النهج، وحقق المال، وجعل الناس يشعرون بالمشاعر الإنسانية، فستنتهي اللعبة بالنسبة لمعظمنا.