إطلاق نموذج مفتوح المصدر من Tencent لتوليد الفيديو بالذكاء الاصطناعي
في خطوة جديدة نحو تطوير الذكاء الاصطناعي، أعلنت شركة Tencent الصينية عن إطلاق نموذج HunyuanVideo المفتوح المصدر لتوليد الفيديو باستخدام تقنيات الذكاء الاصطناعي.
ويعتبر هذا النموذج، الذي يتضمن أكثر من 13 مليار معلمة، من أكبر نماذج الذكاء الاصطناعي التي أُتيحت للعامة حتى الآن.
تفوق النموذج على الأنظمة الأخرى
وفقًا للوثائق التقنية التي نشرتها Tencent، يتفوق HunyuanVideo على العديد من الأنظمة المشابهة الأخرى في السوق مثل Runway Gen-3 وLuma 1.6، بالإضافة إلى بعض النماذج الصينية الرائدة. الاختبارات أكدت أن هذا النموذج يقدم نتائج مميزة، خصوصًا في جودة الحركة داخل مقاطع الفيديو التي يتم إنشاؤها، مما يجعله منافسًا قويًا في مجال توليد الفيديو بالذكاء الاصطناعي.
القدرات المتعددة للنموذج
يتميز نموذج HunyuanVideo بقدرات متعددة تتضمن:
1. توليد مقاطع الفيديو من الأوصاف النصية: يمكن للنموذج إنشاء فيديوهات بناءً على النصوص التي يتم تزويده بها.
2. تحويل الصور الثابتة إلى مقاطع متحركة: يتيح للنصوص أن تتفاعل مع الصور وتتحول إلى محتوى مرئي.
3. إنشاء شخصيات متحركة: من خلال الذكاء الاصطناعي، يمكن إنشاء شخصيات تفاعلية تنبض بالحياة.
4. إضافة الصوت إلى الفيديوهات: يمكن إضافة الصوت بشكل متكامل إلى مقاطع الفيديو، مما يعزز من التجربة التفاعلية.
نهج التدريب المتقدم
اعتمدت Tencent على نهج تدريب متعدد المراحل لنموذج HunyuanVideo. تبدأ العملية بتدريب النموذج على صور ذات دقة منخفضة (256 بكسل)، ثم تنتقل العملية إلى تدريبات مختلطة على مقاييس أعلى.
أما في المرحلة الأخيرة، يتم إجراء تدريبات تدريجية على مقاطع الفيديو والصور مع زيادة دقة الفيديو وطوله بشكل تدريجي، مما يساعد على تحسين جودة الفيديو الناتج.
هدف مفتوح المصدر
إطلاق النموذج كمشروع مفتوح المصدر على منصة GitHub هو خطوة استراتيجية من Tencent لتقليص الفجوة بين الأنظمة المملوكة للشركات الكبرى وبين النماذج المفتوحة التي يمكن للمطورين والباحثين في الذكاء الاصطناعي الاستفادة منها. هذه الخطوة تعكس رغبة الشركة في دفع حدود الابتكار وتشجيع التفاعل المجتمعي.
المنافسة في السوق
مع إطلاق هذا النموذج، تدخل Tencent في منافسة مباشرة مع شركات رائدة أخرى في هذا المجال مثل OpenAI، التي تطور نموذجها Sora، بالإضافة إلى الشركات الصينية مثل KLING التي تعمل على تطوير نماذج مماثلة.