الناس كلها مقلوبة حالياً على حكاية تسريب موديل Seedance 2.0 بتاع شركة ByteDance (اللي هما أصحاب تيك توك) في المنتديات الروسية. الموضوع كبير تعالوا نفك التشابك ده على السريع.
إيه هو الـ Seedance 2.0 أصلاً؟
ده مش مجرد موديل بيحول نص لفيديو زي Sora أو Kling، ده وحش جديد بمعمارية اسمها (Dual-Branch Diffusion Transformer). الميزة المرعبة فيه إنه بيطلع الفيديو والصوت "سوا" في نفس اللحظة، يعني مفيش مشاكل عدم تطابق حركة الشفايف مع الصوت اللي بنشوفها حالياً.
فخ الـ 96 جيجا VRAM!
الإشاعة اللي طالعة مع التسريب بتقول إن الموديل محتاج 96 جيجا رام فيديو (VRAM) عشان يشتغل. طبعاً الرقم ده "ليتيرالي" معناه إنك محتاج سيرفر كامل مش مجرد كارت شاشة في البيت، وده اللي خلى الناس تشك إن الحكاية كلها ممكن تكون مجرد "بروباجندا" أو ملفات ملغومة (Malware) متغلفة في شكل تسريب عبقري.
ليه الموديل ده جامد؟
بعيداً عن التسريب، التقنية الحقيقية وراء الموديل ده بتعتمد على نظام الـ 12 ملف مرجعي:
* 9 صور: عشان تثبت شكل الشخصية واللوكيشن بالظبط.
* 3 فيديوهات: عشان توصف حركة الكاميرا والـ Action اللي إنت عاوزه.
* 3 ملفات صوتية: عشان تحدد الموود والموسيقى.
يعني إنت هنا "مخرج" بجد مش مجرد واحد بيكتب برومبت ويستنى حظه، إنت بتديله المراجع وهو بينفذها بدقة تقضي تماماً على فكرة الـ "Uncanny Valley" أو المناظر اللي شكلها بيبقى "مش طبيعي" وبيرعبنا.
الخلاصة.. هل الخبر حقيقي ولا فخ؟
لو التسريب ده حقيقي، فإحنا قدام نقلة هتخلي صناعة المحتوى بالـ AI تروح لمكان تاني خالص، بس الحذر واجب لأن المنتديات الروسية مابتهزرش في حوار الفيروسات. إحنا مستنيين النسخة الـ (Quantized) اللي هيتم ضغطها عشان تشتغل على أجهزتنا "الغلابة" بدل الـ 96 جيجا الخرافية دي.
تفتكروا ByteDance هتقدر تخلص على أسطورة Sora قبل ما يبدأ؟
لو حابب أجربلك برومبت معين يتوافق مع معمارية الـ 12 ملف دي، قولي وأجهزهولك؟