إكس إيه آي تطلق غروك إيماجين فيديو 1.5 بجودة واقعية أعلى وإنتاج أسرع

NewsDesk
بواسطة
4 دقيقة للقراءة
xAI Unveils Grok Imagine Video 1.5 | AI-Generated Image

كشفت إكس إيه آي عن غروك إيماجين فيديو 1.5 في 17 يونيو 2026، معلنة عن تطورات في تقنيتها لتوليد الفيديو من الصورة تشمل واقعية بصرية أشد وضوحاً ونمذجة فيزيائية محسنة وأوقات توليد أقل. وبحسب منشور على الحساب الرسمي للشركة في منصة إكس، يستغرق النموذج الآن نحو 25 ثانية لإنتاج فيديوهات بدقة 720p، مقارنة بأكثر من 40 ثانية سابقاً. كما يضم الإصدار دعماً أصلياً للصوت لإضافة الأصوات والحوار والموسيقى المتزامنة ضمن المقاطع المولدة.

ونشرت الشركة أن «غروك إيماجين فيديو 1.5 وصل. نموذجنا الجديد لتحويل الصور إلى فيديو مع واقعية أكثر حدة وفيزياء أفضل وتوليد أسرع» ضمن إعلان تضمن سلسلة من مقاطع الفيديو التوضيحية. وأعلنت الشركة عن تحسن بـ52 نقطة في تصنيف إيلو للنموذج الذي احتل الصدارة على لوحة تصنيف Image-to-Video Arena متفوقاً على منافسيه مثل سيدانس 2.0 وفيو من غوغل. وتظهر الأمثلة المبكرة التي شاركها المستخدمون حركة واقعية وتقديماً متسقاً للشخصيات وتفاعلات بيئية دقيقة تعالج القيود السابقة في المحتوى المولد بالذكاء الاصطناعي.

ويتيح النموذج تمديد الفيديو وربط اللقطات المتعددة مع الحفاظ على تفاصيل الإضاءة وثبات الأجسام عبر التسلسلات وفق وثائق إكس إيه آي. ويعمل كنظام مستقل منفصل عن برنامج الدردشة غروك، على الرغم من أنهما جزء من جهود الشركة في التطوير متعدد الوسائط. ويستطيع المطورون الوصول إليه من خلال واجهة برمجة تطبيقات إكس إيه آي، حيث يمكن دمجه في بضعة أسطر برمجية فقط لاستخدامه في التسويق والتعليم وإنتاج المحتوى الترفيهي.

ويبدأ سعر الخدمة من 0.08 دولار لكل ثانية من الفيديو بدقة 480p، مع أسعار أعلى للإخراج بدقة 720p ورسوم إضافية على مدخلات الصور حسب المواصفات الفنية لإكس إيه آي. وجرى تطوير النموذج باستخدام موارد حاسوبية ضخمة شملت التدريب على مجموعة كبيرة من وحدات معالجة الرسوميات التابعة لإنفيديا، الأمر الذي ساهم في تحقيق التقدم في السرعة والجودة. ويتناسب هذا الاستثمار في البنية التحتية مع مساعي إكس إيه آي الأوسع للتقدم في قدرات الذكاء الاصطناعي التوليدي بعيداً عن النظم القائمة على النصوص.

وفي سوق مولدات فيديو الذكاء الاصطناعي النامي، توقعت شركة أبحاث الأعمال نمو القطاع من 0.85 مليار دولار في 2025 إلى 1.04 مليار دولار في 2026 بمعدل نمو سنوي مركب قدره 22.4 بالمئة. وتتمثل عوامل الطلب في الحاجة إلى إنشاء محتوى بكفاءة في التسويق الرقمي والتجارة الإلكترونية حيث يعد إنتاج الفيديو التقليدي مستهلكاً للوقت والمال. ويميز إضافة إكس إيه آي لتوليد الصوت الأصلي منتجها عن العديد من المنافسين الذين ما زالوا بحاجة إلى أدوات منفصلة لتصميم الصوت والتزامن.

وقد ركز منافسون مثل بايت دانس بنموذجها سيدانس وغوغل بنموذج فيو على الواقعية وعناصر التحكم في الكاميرا حسب توجيه المستخدم في إصداراتهم الأخيرة. أما نموذج سورا السابق من أوبن إيه آي فقد واجه صعوبات في التكاليف التشغيلية المرتفعة والاحتفاظ بالمستخدمين مما أدى إلى تقليص نطاق توافره. ويوجه تركيز إكس إيه آي على أوقات التطوير الأسرع نحو معالجة ملاحظات المبدعين حول العقبات في تدفق العمل بالمنصات الحالية.

ويأتي الإصدار 1.5 امتداداً مباشراً لإصدار غروك إيماجين الأول، منتقلاً من مرحلة المعاينة إلى توفر أوسع عبر واجهة البرمجة ومنصة grok.com. ودعت إكس إيه آي المستخدمين لاختبار النموذج بصورهم الخاصة أو العبارات النصية لإنتاج مقاطع مدتها من ست إلى 15 ثانية بسرعة 24 إطاراً في الثانية. وتشير الوثائق إلى أن تحسين التماسك الزمني ودقة الوجوه سيظل أولوية في التحديثات المقبلة.

شارك هذا المقال
بواسطةNewsDesk
Continental Bulletin NewsDesk is the desk responsible for Continental Bulletin's daily news coverage, monitoring and reporting developments across the Gulf from official sources, including national news agencies and government communications. Its focus is accurate, timely and factual coverage of the region.