التكنولوجيا ، اتجاهات الإنترنت ، الألعاب ، بيانات كبيرة

EMO على بابا: ثورة في مقاطع الفيديو التي تتحدث وتغني

EMO على بابا: ثورة في مقاطع الفيديو التي تتحدث...

By mariya

EMO على بابا: ثورة في مقاطع الفيديو التي تتحدث وتغني: ومؤخرًا. قام خبراء في معهد الحوسبة الذكية التابع لشركة علي بابا بتطوير نظام ذكاء اصطناعي جديد يسمى “EMO”. يمكن لهذا النظام تحريك صورة شخصية واحدة وإنشاء مقاطع فيديو يتحدث فيها الشخص الموجود في الصورة أو يغني بطريقة واقعية بشكل مذهل.

EMO على بابا: ثورة في مقاطع الفيديو التي تتحدث وتغني: كيف يعمل الايمو

يستفيد نظام EMO من نموذج نشر الذكاء الاصطناعي، الذي أظهر قدرة ملحوظة في توليد صور اصطناعية واقعية. وقام خبراء علي بابا بتدريب النموذج على مجموعة بيانات كبيرة تضم أكثر من 250 ساعة من مقاطع الفيديو لأشخاص يتحدثون. من الخطب والأفلام والبرامج التلفزيونية والعروض الغنائية.

على عكس الطرق التقليدية التي تعتمد على نماذج الوجه ثلاثية الأبعاد أو مزج الأشكال لتقريب حركات الوجه. يقوم EMO بتحويل الموجة الصوتية مباشرة إلى إطارات فيديو. وهذا يسمح بالتقاط الحركات الدقيقة والخصائص الخاصة بالهوية المرتبطة باللغة الطبيعية.

فوائد الايمو

يمثل EMO تقدمًا كبيرًا في إنشاء مقاطع فيديو موجهة صوتيًا للأشخاص الذين يتحدثون. وفقًا للتجارب الموصوفة في ورقتهم البحثية، تتفوق EMO بشكل كبير على الأساليب الحالية من حيث جودة الفيديو والحفاظ على الهوية والتعبير.

أجرى باحثو علي بابا أيضًا دراسة للمستخدمين أظهرت أن مقاطع الفيديو التي تم إنشاؤها بواسطة EMO أكثر طبيعية وعاطفية من تلك التي تنتجها الأنظمة الأخرى.

EMO على بابا: ثورة في مقاطع الفيديو التي تتحدث وتغني: إنشاء مقاطع فيديو لأشخاص يغنون

بالإضافة إلى مقاطع الفيديو التحادثية، يمكن لـ EMO أيضًا تحريك صور الأشخاص الذين يغنون. وإنشاء حركات مناسبة للفم وتعبيرات وجه مثيرة للذكريات متزامنة مع الغناء. يمكن للنظام إنشاء مقاطع فيديو لمدة عشوائية بناءً على طول صوت الإدخال.

تظهر النتائج التجريبية أن EMO لا يمكنها إنتاج مقاطع فيديو مقنعة لأشخاص يتحدثون فحسب. بل يمكنها أيضًا إنتاج مقاطع فيديو لأشخاص يغنون بأساليب مختلفة، مما يتجاوز المنهجيات الحالية بشكل كبير من حيث التعبير والواقعية.

الآثار الأخلاقية

على الرغم من التقدم الكبير الذي حققته تقنية EMO والتقنيات المماثلة، إلا أن هناك آثارًا أخلاقية يجب أخذها في الاعتبار. تثير القدرة على تجميع محتوى فيديو مخصص من صورة بسيطة ومقتطف صوتي مخاوف بشأن إساءة استخدام هذه التكنولوجيا لانتحال شخصية الأشخاص دون موافقتهم أو نشر معلومات مضللة.

ويقول خبراء علي بابا إنهم يخططون لاستكشاف طرق للكشف عن مقاطع الفيديو المركبة من أجل مواجهة الانتشار المحتمل للمحتوى المزيف.