تقول شركة OpenAI إنها تعمل على الذكاء الاصطناعي الذي يحاكي الأصوات البشرية

فريق التحرير
كتب فريق التحرير 4 دقيقة للقراءة

كشفت شركة OpenAI عن أداة جديدة للذكاء الاصطناعي يمكنها تقليد الأصوات البشرية بدقة مذهلة. يحتوي مولد الصوت المدعم بالذكاء الاصطناعي على مجموعة من التطبيقات المحتملة، بما في ذلك خدمات إمكانية الوصول، ولكنه قد يثير أيضًا مخاوف بشأن المعلومات الخاطئة وغيرها من أشكال سوء الاستخدام.

شاركت OpenAI يوم الجمعة عينات من الاختبارات المبكرة للأداة، التي تسمى Voice Engine، والتي تستخدم عينة مدتها 15 ثانية لشخص يتحدث لإنشاء نسخة مقنعة من صوته. يمكن للمستخدمين بعد ذلك تقديم فقرة من النص وستقوم الأداة بقراءتها بصوت تم إنشاؤه بواسطة الذكاء الاصطناعي.

هناك العديد من الخدمات الصوتية المولدة بواسطة الذكاء الاصطناعي متاحة بالفعل للجمهور، ولكن كما فعلت مع برنامج الدردشة الآلي ChatGPT، أثبتت OpenAI مهارة خاصة في الحصول على اعتماد واسع النطاق لأدوات الذكاء الاصطناعي.

تقول الشركة إن أداة تحويل النص إلى صوت المدعومة بالذكاء الاصطناعي يمكن أن تساعد في الترجمة أو مساعدة القراءة للأطفال أو مساعدة الأشخاص الذين فقدوا القدرة على التحدث. لكن بعض المتشككين يشعرون بالقلق من أن ذلك قد يؤدي أيضًا إلى خلق معلومات مضللة أو تسهيل ارتكاب عمليات الاحتيال.

تقول OpenAI إن Voice Engine يُستخدم حاليًا من قبل “مجموعة صغيرة من الشركاء الموثوق بهم”، بما في ذلك شركات التعليم والتكنولوجيا الصحية، وستستخدم اختباراتهم لتحديد ما إذا كان سيتم السماح باستخدام أكثر انتشارًا وكيفية ذلك. وقد وافق هؤلاء المختبرون على عدم إعادة إنشاء أصوات الأشخاص دون موافقتهم الصريحة، وأن يحددوا بوضوح للمستمعين أن ما يسمعونه هو ناتج عن الذكاء الاصطناعي، وفقًا للشركة.

وقالت OpenAI في تدوينة: “نحن ندرك أن توليد خطاب يشبه أصوات الناس ينطوي على مخاطر جسيمة، والتي تتصدر أولوياتنا بشكل خاص في عام الانتخابات”. أقرت الشركة بالحاجة إلى تغييرات كبيرة حيث أصبح الصوت الناتج عن الذكاء الاصطناعي متاحًا على نطاق أوسع، على الرغم من أنها لا تخطط لإصدار Voice Engine للجمهور على الفور. على سبيل المثال، اقترحت الشركة التخلص التدريجي من المصادقة الصوتية للحسابات المصرفية.

“يجب أن يكون أي نشر واسع النطاق لتقنية الصوت الاصطناعي مصحوبًا بتجارب مصادقة صوتية تتحقق من أن المتحدث الأصلي يضيف صوته إلى الخدمة عن عمد، وقائمة صوت محظورة تكتشف وتمنع إنشاء أصوات مشابهة جدًا للأصوات البارزة”. قال OpenAI: “الأرقام”.

يمكن لـ Voice Engine استخدام عينة صوتية بلغة واحدة لإنشاء نسخة صوتية يمكنها التحدث بعدة لغات أخرى.

يتضمن منشور مدونتها مثالاً لمقطع صوتي لإنسان يقرأ فقرة عن الصداقة، إلى جانب الصوت الذي تم إنشاؤه بواسطة الذكاء الاصطناعي والذي يبدو وكأنه نفس الشخص يقرأ نفس المقطع باللغات الإسبانية والماندرين والألمانية والفرنسية واليابانية. وفي كل عينة من العينات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، يتم الحفاظ على نغمة ولهجة المتحدث الأصلي.

تأتي معاينة Voice Engine في الوقت الذي ينتظر فيه المستخدمون الإصدار العام لـ Sora، أداة الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتي قامت OpenAI بالتشويق لها الشهر الماضي. يمكن لـ Sora إنشاء مقاطع فيديو ذات مظهر واقعي مدتها 60 ثانية من التعليمات النصية، مع القدرة على تقديم مشاهد بشخصيات متعددة وأنواع محددة من الحركة وتفاصيل خلفية مفصلة. يمكن لـ ChatGPT الخاص بـ OpenAI أيضًا إنشاء صور من مطالبة نصية.

شارك المقال
اترك تعليقك

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *