"مايكروسوفت" تطور أداة تحوّل صورة ومقطعاً صوتياً إلى "وجه ناطق"

20 ابريل 2024
أطلقت "مايكروسوفت" على البرنامج اسم "فاسا-1" (Getty)
+ الخط -
اظهر الملخص
- باحثون في "مايكروسوفت" طوروا أداة ذكاء اصطناعي تحول صور الوجوه والمقاطع الصوتية إلى فيديوهات واقعية لوجوه تتكلم، مع التأكيد على الاستخدام الإيجابي وتجنب التضليل.
- الذكاء الاصطناعي التوليدي يثير مخاوف بشأن الاستغلال للتضليل والاحتيال، لكن "مايكروسوفت" تشدد على التركيز على الاستخدامات الإيجابية مثل الأفاتار الافتراضية.
- "مايكروسوفت" لا تخطط لإتاحة الأداة الجديدة حاليًا خوفًا من الاستخدام غير المسؤول، بينما تبرز فوائد مثل تعزيز المساواة في التعليم ودعم العلاجي.

ابتكر باحثون من "مايكروسوفت" أداة ذكاء اصطناعي قادرة على تحويل صورة وجه ومقطع صوتي إلى فيديو واقعي جداً لـ"وجه يتكلّم"، وفقاً لوثيقة نشرتها شركة التكنولوجيا الكبرى هذا الأسبوع. وأشارت الشركة إلى أن "هدف الأداة لا يتمثل في إنشاء محتوى بقصد التضليل أو الخداع"، ولفتت إلى أن "الأداة، وعلى غرار تقنيات إنشاء محتوى أخرى، قد تُستخدم لأهداف مسيئة وانتحال صفة أيّ كان".

ويثير النمو السريع للذكاء الاصطناعي التوليدي، الذي يتيح بسهولة إنتاج مختلف أنواع المحتوى (نصوص وصور وأصوات...) بجودة عالية جداً، مخاوف كثيرة خصوصاً في ما يتعلق بالاستغلال لأغراض الاحتيال والتضليل. وأكّدت "مايكروسوفت" أن "بحثها يركز على (...) الصور الرمزية الافتراضية (أفاتار)، بهدف الاستخدام الإيجابي"، وشددت على أنها "تعارض أي سلوك يهدف إلى إنشاء محتوى مضلل أو ضار".

ولا تعتزم شركة التكنولوجيا، وهي مستثمر رئيسي في "أوبن إيه آي"، مبتكرة برنامج "تشات جي بي تي"، إتاحة الأداة الجديدة أو تقديم معلومات تقنية "طالما أنها غير متأكدة من أنّ الأداة ستُستخدم بشكل مسؤول بحسب القوانين المعمول بها".

ويلتقط البرنامج المسمى "فاسا-1" (VASA-1) صورة وجه بسيطة، ويسجل مقطعاً صوتياً، ويحولهما إلى شريط فيديو يظهر وجهاً يتحرك ويتكلم بطريقة واقعية جداً. وتعمل شركات أخرى على هذه التقنية، على غرار "رَنواي"، إحدى الشركات المتخصصة في الذكاء الاصطناعي التوليدي للفيديو. وأنشأ باحثون من "غوغل" برنامج ذكاء اصطناعي اسمه "فلوغر"، قادراً على إنشاء مقاطع فيديو واقعية لوجوه ناطقة.

وأشارت "مايكروسوفت" إلى أنّ فوائد ابتكار هذه الأداة "مثل تعزيز المساواة في مجال التعليم، ومساعدة مَن يعانون صعوبات في التواصل، وتوفير الدعم العلاجي لمَن يحتاجونه"، تبرر العمل عليها.

(فرانس برس)

المساهمون