بعدما صدمت العالم بـ"تشات جي بي تي"، روبوت الدردشة الذي يغيّر حياة الناس المهنية كل يوم بالرغم من ظهوره منذ وقت قصير، ها هي شركة أوبن إيه آي تطلق Sora (سورا)، الذكاء الاصطناعي الذي يصنع فيديو بالغ الواقعية بأسطر من الكلمات.
وتنضم الشركة إلى كل من "ميتا" و"غوغل" و"رانواي إيه آي"، التي عرضت نماذج عن تطبيقات مماثلة تسمى text-to-video (تحويل النصوص إلى مقاطع فيديو).
وتقول "أوبن ايه آي" على موقعها الإلكتروني إنّ البرنامج يستطيع إنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة "مع الحفاظ على الجودة المرئية واحترام طلب المستخدم".
وكتب رئيس "أوبن ايه آي" سام ألتمان، على منصة إكس، أنّ الشركة سوف تتيح استخدام الأداة الجديدة "لعدد محدود" من صنّاع المحتوى كمرحلة تجريبية.
حقيقية "سورا" المدهشة
"أوبن إيه آي" المتحالفة مع "مايكروسوفت" عرضت مقاطع فيديو وصفت بالمدهشة، إذ سيشكّ المشاهد في عينيه وسيعتقد أنها حقيقة.
تقول الشركة إن بإمكان "سورا" إنشاء "مشاهد معقدة تضمّ شخصيات عدة وأنواعاً محددة من الحركات وتفاصيل دقيقة". كما تتيح "سورا" إنشاء فيديو من صورة ثابتة، أو توسيع مقاطع الفيديو الموجودة.
وفي المثالين التاليين، يمكن للمشاهد أن يتحدى نفسه باكتشاف علامات الفبركة وعدم حقيقة المقطعين التاليين:
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
"سورا" تخطئ وتخيف
نبّهت "أوبن ايه آي" إلى أن ثمة "عيوباً" في "النموذج الحالي" للمنصة، ومنها الالتباس بين اليسار واليمين أو عدم القدرة على الحفاظ على الاستمرارية البصرية طوال الفيديو.
وأوضحت أن شخصاً في مقطع فيديو "قد يأكل جزءاً من قطعة بسكويت، لكنّ آثار القضمة قد لا تظهر على قطعة البسكويت" في مشهد ثانٍ من مقطع الفيديو.
لكن المخاوف حول هذه المنصة لا تأتي من أخطائها بل من إتقانها المستقبلي. أثبتت أدوات الذكاء الاصطناعي التوليدي سرعةً في التعلم والتطور، مع قدرات واضحة على إحداث الضرر.
وجرى تداول مقطع فبركه الذكاء الاصطناعي عبر الإنترنت للمذيعة الأميركية غيل كينغ، للترويج لمنتَج لم تستخدمه أو حتى سمعت عنه من قبل.
كما انتشر مقطع مزيف لمذيع "سي أن أن" أندرسون كوبر وهو يشتم دونالد ترامب، وشاركه ترامب وابنه على منصة تروث سوشال المتطرفة و"إكس".
وتُستخدَم المقاطع المفبركة بالذكاء الاصطناعي في نشر معلومات خاطئة أو مضللة، والاحتيال، وتغيير مسار الانتخابات، والاكتتابات العامة للشركات، وغيرها من الأحداث والمواقف عالية الحساسية.
وكما تسبّب روبوت توليد الصور في غضب ومخاوف المصممين من فقدان سبل عيشهم، بسبب قدرة الذكاء التوليدي على القيام بعملهم في ثوانٍ، وينضم صنّاع الفيديو الآن إلى جوقة الخائفين.
وعند دمج أكثر من أداة من أدوات الذكاء الاصطناعي تظهر أسباب خوف الفنّانين البصريين. فليتخيّل القارئ أن إنساناً عادياً يريد صنع فيديو كليب للممثل المصري أحمد حلمي وهو يغني أغنية "أكثر" لأصالة على سطح في المريخ. يمكن للذكاء الاصطناعي توليد أغنية "أكثر" بصوت أحمد حلمي، ثم يمكن للتزييف العميق أن يحرّك شفاه أحمد حلمي لتتطابق مع كلمات الأغنية، ثم يمكن لـ"سورا" إبداع فيديو كليب الأغنية من وحي المريخ.
بدمج العناصر الثلاثة، وبأسطر قليلة من الكلمات، سوف يحصل المستخدم العادي على كليب جاهز للنشر من دون دفع المال لأحمد حلمي، أو أصالة، أو استديو التسجيل، أو فريق التصوير، ومن دون ميزانية إنتاج.
وأكّدت "أوبن إيه آي" أن مسألة الأمن ستكون أساسية في ما يتعلق بـ"سورا"، مشيرةً إلى أنها ستنظم عمليات محاكاة لتحديد حدود المنصة بشكل أفضل.
وأضافت "أوبن ايه آي": "سنعمل على إشراك صنّاع السياسات والمعلّمين والفنانين في مختلف أنحاء العالم لفهم مخاوفهم وتحديد حالات الاستخدام الإيجابي لهذه التكنولوجيا الجديدة".