ما هو Sand AI؟ تحليل شامل للنقاط الست الرئيسية للحصان الأسود في توليد الفيديو مفتوح المصدر الذي ابتكره فريق Swin Transformer

إذا كنت قد لاحظت تكرار اسم Sand AI مؤخرًا على منصات مثل Hugging Face أو GitHub أو في مجتمعات الذكاء الاصطناعي باللغة الإنجليزية، وكنت تشعر بالفضول تجاه نموذج MAGI-1 / MAGI-1.1 الذي أطلقته، فهذا المقال مخصص لك. على عكس العديد من "فرق نماذج الفيديو التي تظهر فجأة"، تمتلك Sand AI خلفية تقنية قوية للغاية: فمؤسسها والرئيس التنفيذي لها، تساو يوي (Cao Yue)، هو المؤلف الرئيسي لنموذج Swin Transformer، وهي الورقة البحثية التي حازت على جائزة أفضل ورقة بحثية في مؤتمر ICCV 2021 (جائزة مار)، وتجاوزت استشهاداتها في Google Scholar أكثر من 30 ألف استشهاد، كما تم اعتمادها على نطاق واسع في منتجات كبرى مثل Microsoft Office 365 وAzure وTikTok وKuaishou. بعبارة أخرى، Sand AI ليست فريقاً طارئاً، بل هي نتاج لخبرة تراكمت على مدار عقد من الزمن في النماذج البصرية من قبل الفريق الأصلي لـ Swin Transformer، والتي تم نقلها الآن إلى مجال توليد الفيديو.

وما أثار حماس المجتمع التقني العالمي أكثر هو أن Sand AI لم تكتفِ ببناء نموذج قوي لتوليد الفيديو فحسب، بل اختارت فتح مصدره بالكامل؛ حيث أتاحت حزمة MAGI-1 الكاملة (الأوزان + الكود + أدوات الاستدلال) بموجب ترخيص Apache 2.0، ووضعتها مباشرة على GitHub وHugging Face. في موجة "فتح مصدر نماذج الفيديو المحلية" التي نشهدها في الفترة 2025-2026، تُعد Sand AI واحدة من الفرق القليلة التي نجحت في تنفيذ مسار "توليد الفيديو بالاسترجاع الذاتي" (Autoregressive Video Generation) وفتحت مصدره. سيتناول هذا المقال ستة أبعاد: خلفية الشركة، سيرة المؤسس، البنية التقنية لـ MAGI، استراتيجية فتح المصدر، والفئات المستهدفة، لنشرح بوضوح "ما هي Sand AI".

what-is-sand-ai-magi-autoregressive-video-generation-ar 图示

نظرة سريعة على معلومات Sand AI الأساسية

قبل البدء في التفاصيل، قمنا بتلخيص جميع الحقائق الأساسية حول "ما هي Sand AI" في جدول واحد ليسهل عليك استيعابها.

البعد معلومات Sand AI العامة
اسم الشركة بالإنجليزية Sand AI (الموقع sand.ai)
خلفية التأسيس أسسها المؤلف الرئيسي لـ Swin Transformer، تساو يوي
موقع المقر بكين، الصين
حجم الفريق أقل من 30 شخصاً، بمتوسط عمر أقل من 30 عاماً
مهمة الشركة "دفع الذكاء الاصطناعي ليفيد الجميع"، وتبني المصادر المفتوحة والتعاون المفتوح
الرئيس التنفيذي تساو يوي (Yue Cao)، المدير السابق لمركز أبحاث النماذج البصرية في معهد بكين للذكاء الاصطناعي (BAAI)
المنتج الرئيسي نماذج توليد الفيديو بالاسترجاع الذاتي MAGI / MAGI-1 / MAGI-1.1
تاريخ الإصدار الأول 21 أبريل 2025 (MAGI-1)
أحدث إصدار MAGI-1.1 (مفتوح المصدر بنسبة 100%)
مواصفات النموذج نسختان بمعاملات 24B و4.5B
ترخيص المصدر المفتوح Apache 2.0، على GitHub SandAI-org/MAGI-1 وHugging Face sand-ai/MAGI-1
الابتكار الأساسي الجمع بين الاسترجاع الذاتي والانتشار (Autoregressive Denoising Diffusion)
بوابة الويب magi.sand.ai/app/projects
منصة API platform.sand.ai/docs
المنافسون الرئيسيون سلسلة Wan، وHunyuanVideo، وHailuo، وSora، إلخ.

🎯 نصيحة للفهم السريع: إذا كنت تريد تذكر Sand AI في جملة واحدة، يمكنك قول: "إنها شركة ناشئة مفتوحة المصدر نقلت خبرة النمذجة البصرية الخاصة بـ Swin Transformer إلى مجال توليد الفيديو". إذا كنت ترغب في تجربة الفرق بين سلسلة MAGI ونماذج الفيديو الأخرى الآن، ننصحك أولاً بتجربة النماذج الناضجة مثل Sora 2 أو Veo 3.1 أو Kling على منصة موحدة مثل APIYI (apiyi.com)، ثم التوجه إلى sand.ai أو Hugging Face لتجربة MAGI-1.1 وإجراء مقارنة؛ فهذا سيجعلك تلاحظ فوراً الاختلاف الذي يقدمه "مسار الاسترجاع الذاتي".

خلفية شركة Sand AI وجينات الفريق

لفهم سبب قدرة Sand AI على إنتاج نموذج فيديو تنافسي منذ بدايتها، يجب أولاً إلقاء نظرة على خلفية فريقها.

المؤسس: كاو يوي (Yue Cao)، الأب الروحي لـ Swin Transformer

يُعد الرئيس التنفيذي لشركة Sand AI، كاو يوي (Yue Cao)، اسماً مألوفاً جداً في أوساط الذكاء الاصطناعي في الصين، وكذلك في الأوساط الأكاديمية الدولية. يمكن تلخيص مسيرته المهنية الأساسية في النقاط التالية:

الفترة الخبرة
2019-2022 باحث أول في مايكروسوفت للأبحاث في آسيا (Microsoft Research Asia)، والمؤلف الرئيسي لـ Swin Transformer
2021 فاز Swin Transformer بجائزة أفضل ورقة بحثية في مؤتمر ICCV 2021 (جائزة مار)
2022-2023 شارك في تأسيس Lightyear AI، والتي استحوذت عليها شركة Meituan لاحقاً
2023-2024 شغل منصب رئيس مركز أبحاث النماذج البصرية في معهد بكين للذكاء الاصطناعي العام (BAAI)، مع التركيز على نماذج الرؤية الأساسية ونماذج اللغة الكبيرة متعددة الوسائط
2024 حتى الآن أسس Sand AI ويشغل منصب الرئيس التنفيذي

لا يزال تأثير Swin Transformer مستمراً حتى يومنا هذا؛ فقد تم الاستشهاد بهذه الورقة البحثية أكثر من 30,000 مرة في Google Scholar، وتُستخدم على نطاق واسع في مسارات الفهم البصري لمنتجات مثل Microsoft Office 365، وAzure Cognitive Service، وTikTok، وKuaishou. كما أنها تمثل العمل التمهيدي لـ Video Swin Transformer، وبطريقة ما، يمثل كاو يوي نفسه الاستمرارية في مسار التكنولوجيا "من الفهم البصري إلى توليد الفيديو".

حجم الفريق: "فريق النخبة الصغير" المكون من أقل من 30 شخصاً

يختلف هيكل فريق Sand AI اختلافاً جذرياً عن معظم شركات النماذج الكبيرة: يضم الفريق بأكمله أقل من 30 شخصاً، يغطون 4 مجالات هي المنتج، والتسويق، والهندسة، والأبحاث، ويقل متوسط عمر الفريق الأساسي عن 30 عاماً. هذا الهيكل الصغير نادر نسبياً في موجة الشركات الناشئة في مجال النماذج الكبيرة خلال السنوات القليلة الماضية، لكنه يعني أيضاً:

  • سلسلة اتخاذ قرار قصيرة، وسرعة تكرار عالية؛
  • تكامل عالٍ بين الهندسة والأبحاث، حيث يمكن تحويل الابتكارات البحثية مباشرة إلى منتجات؛
  • غياب "جدران الأقسام" الموجودة في الشركات الكبرى، حيث يمكن لثلاثة أشخاص إنجاز مسار عمل جديد بالكامل.

هذه الجينات "الصغيرة والقوية" هي السبب المهم وراء قدرة Sand AI على تقديم نموذج عالي الجودة مثل MAGI-1 في أبريل 2025.

مهمة الشركة وموقفها من المصادر المفتوحة

تُعرف Sand AI مهمتها في صفحة "من نحن" بأنها: "دفع عجلة الذكاء الاصطناعي ليفيد الجميع"، وتصرح بوضوح بأنها "تتبنى المصادر المفتوحة، وتدفع عجلة التقدم من خلال التعاون المفتوح، وتجعل الذكاء الاصطناعي المتطور متاحاً للجميع". هذه ليست مجرد شعار تسويقي؛ فقد قامت Sand AI بفتح مصادر نماذج MAGI-1 وMAGI-1.1 بالكامل بموجب ترخيص Apache 2.0، حيث وضعت الأوزان، ورموز الاستدلال، وإصدارات التقطير (Distill) على GitHub وHugging Face، وهو موقف من المصادر المفتوحة يعتبر جريئاً جداً في مسار توليد الفيديو الحالي.

what-is-sand-ai-magi-autoregressive-video-generation-ar 图示

بعد التعرف على الفريق، ننتقل الآن إلى جوهر الموضوع: سلسلة MAGI، المنتج الرائد لشركة Sand AI. يتبنى هذا النموذج نهجاً تقنياً يختلف جذرياً عن النماذج الرائدة مثل Sora وKling وVeo وHunyuanVideo؛ فبدلاً من كونه نموذج انتشار (Diffusion) خالصاً "يولد الفيديو دفعة واحدة"، يدمج MAGI بين "الاستنتاج الذاتي" (Autoregression) و"الانتشار" لتوليد الفيديو في أجزاء (Chunks) متتالية.

حقائق أساسية حول MAGI

البعد MAGI / MAGI-1 / MAGI-1.1
تاريخ الإصدار الأول 21 أبريل 2025
أحدث إصدار MAGI-1.1 (مفتوح المصدر بالكامل)
مواصفات المعلمات 24 مليار (نسخة كاملة) + 4.5 مليار (نسخة خفيفة)
نسخ التقطير 4.5B Distill + Distill+Quant (صدرت في 26 مايو 2025)
رخصة المصدر المفتوح Apache 2.0
المستودع github.com/SandAI-org/MAGI-1 / huggingface.co/sand-ai/MAGI-1
مدة توليد الفيديو حالياً 1-10 ثوانٍ، مع دعم التمديد اللانهائي
عدد الإطارات لكل مقطع 24 إطاراً لكل جزء (chunk)، مع إزالة الضوضاء المشتركة
قدرة المعالجة المتزامنة معالجة ما يصل إلى 4 أجزاء في وقت واحد
وقت التوليد يستغرق عادةً من 1 إلى 2 دقيقة
الأنماط المدعومة فيديو واقعي + نمط ثلاثي الأبعاد شبه كرتوني
قدرات التحكم تحكم في الجدول الزمني بالثانية + توجيه (prompting) مجزأ
الفهم الفيزيائي تفوق ملحوظ في استكمال الفيديو بناءً على معيار Physics-IQ
التموضع في الأداء الأفضل في فئته (SOTA) بين النماذج مفتوحة المصدر، متفوقاً على Wan-2.1 / HunyuanVideo، ومتجاوزاً Hailuo المغلق

الاستنتاج الذاتي + الانتشار: لماذا يعتبر نموذجاً جديداً؟

عادةً ما تقوم نماذج انتشار الفيديو السائدة (مثل Sora وVeo وKling) بمعالجة الفيديو بالكامل كموتر واحد (Tensor) لإزالة الضوضاء. ورغم قوة هذا النهج في جودة الصورة، إلا أنه يعاني من عيبين متأصلين:

  1. صعوبة التمديد اللانهائي: طول الفيديو الذي يمكن للنموذج توليده في المرة الواحدة مقيد بذاكرة الفيديو (VRAM) وزمن الاستجابة أثناء الاستدلال.
  2. ضعف الاتساق الفيزيائي: بما أن الفيديو يُنتج دفعة واحدة، فإنه يفتقر إلى سلسلة السببية التي تربط "الإطار السابق بالإطار اللاحق".

اختار MAGI مساراً مختلفاً، حيث يقسم الفيديو إلى أجزاء (Chunks) يتكون كل منها من 24 إطاراً، ويتم إجراء إزالة الضوضاء داخل كل جزء، بينما تخضع العلاقة بين الأجزاء لقيود سببية ذاتية الاستنتاج. وهذا يعني:

  • هل تريد فيديو أطول؟ ما عليك سوى الاستمرار في الاستنتاج الذاتي للأجزاء التالية، ولا يوجد حد أقصى نظرياً، وهذا هو السبب في تأكيد موقع sand.ai على "قدرات تمديد الفيديو اللانهائية".
  • هل تريد واقعية فيزيائية أكبر؟ كل إطار يعتمد على الإطارات التي تم توليدها مسبقاً، مما يمنحه ميزة هيكلية في معايير التنبؤ الفيزيائي مثل Physics-IQ.
  • هل تريد تحكماً أدق؟ يمكنك إدخال موجه (Prompt) منفصل لكل جزء، مما يخلق تأثيراً يشبه "الإخراج السينمائي المجزأ".

أظهر هذا التصميم أداءً متميزاً في الاختبارات الداخلية لشركة Sand AI: حيث تفوق على منافسين أقوياء مثل Wan-2.1 وHunyuanVideo في النماذج مفتوحة المصدر، وتجاوز أداء Hailuo في المقارنات المغلقة، كما أنه "أفضل بكثير من جميع النماذج الحالية" وفقاً لمعيار Physics-IQ.

الابتكارات الهندسية في بنية MAGI

لجعل مسار "الاستنتاج الذاتي + الانتشار" قابلاً للتنفيذ فعلياً، قامت Sand AI بإدخال مجموعة كاملة من التعديلات الهيكلية في MAGI:

الوحدة الوظيفة
Block-Causal Attention إنشاء روابط سببية بين الأجزاء لتجنب تسرب المعلومات المستقبلية
Parallel Attention Block تحسين كفاءة التوازي داخل الجزء الواحد
QK-Norm + GQA استقرار التدريب + تقليل عبء ذاكرة التخزين المؤقت (KV Cache)
Sandwich Normalization in FFN زيادة استقرار تدريب نماذج اللغة الكبيرة
SwiGLU تحسين قدرة التعبير غير الخطي
Softcap Modulation التحكم في القيم المتطرفة لتوزيع الانتباه
Transformer-based VAE سرعة أكبر في فك التشفير

قد لا تبدو هذه الابتكارات "ثورية" عند النظر إليها بشكل منفصل، ولكن عند دمجها معاً، منحت MAGI-1 أربع قدرات يصعب الجمع بينها عادةً: الفيديو الطويل، الفيزياء القوية، التحكم العالي، والقابلية للتوسع.

🎯 نصيحة حول اختيار البنية: إذا كان عملك يتطلب "استكمال الفيديوهات الطويلة" أو "تحكماً دقيقاً على مستوى اللقطات"، فإن نموذج الاستنتاج الذاتي + الانتشار الخاص بـ MAGI يستحق أن يكون ضمن خياراتك. قبل توفير واجهة برمجة تطبيقات (API) تجارية رسمية له، يمكنك البدء بنماذج تجارية مثل Sora 2 أو Veo 3.1 أو Kling 3.0 عبر منصة APIYI (apiyi.com) لبناء نموذج أولي لمنتجك، ثم الانتقال بسلاسة إلى MAGI بمجرد نضوج واجهة البرمجة الخاصة به.

what-is-sand-ai-magi-autoregressive-video-generation-ar 图示

كيف تقدم Sand AI نموذج MAGI للمطورين

لا يكفي امتلاك نموذج لغة كبير قوي فحسب، بل صممت Sand AI مسار التسليم الخاص بها بأسلوب هندسي متقن. حيث وفرت منصة sand.ai ثلاثة مداخل مختلفة تناسب الجميع، بدءاً من المستخدم العادي وصولاً إلى المطورين والباحثين.

ثلاث طرق لاستخدام MAGI

المدخل العنوان الفئة المستهدفة
تطبيق الويب magi.sand.ai/app/projects صناع المحتوى / المستخدمون العاديون، لإنشاء الصور مباشرة عبر المتصفح
منصة API platform.sand.ai/docs المطورون، لدمج MAGI في منتجاتهم الخاصة
مستودع مفتوح المصدر github.com/SandAI-org/MAGI-1 + huggingface.co/sand-ai/MAGI-1 الباحثون / فرق النشر الذاتي، لتشغيل الأوزان محلياً

تغطي هذه المسارات الثلاثة الطيف الكامل للاحتياجات، من "إنشاء الصور بدون برمجة" إلى "الدمج الهندسي" وصولاً إلى "الاستضافة الذاتية الكاملة". وبالمقارنة مع الفرق التي "تنشر الأوراق البحثية دون أوزان" أو "تكتفي بالعروض التوضيحية دون مصدر مفتوح"، فإن نهج Sand AI أكثر شمولاً وجدية.

الأهمية الهندسية لإصداري 24B و 4.5B

يوفر نموذج MAGI-1 نسختين بمعايير 24B و 4.5B، وهذا بحد ذاته يوضح رغبة Sand AI في تلبية احتياجات فئتين من المستخدمين:

  • نسخة 24B الكاملة: موجهة للباحثين والشركات التي تمتلك موارد GPU كافية وتسعى للحصول على أعلى جودة للصورة.
  • نسخة 4.5B المقطرة (Distilled): موجهة لفرق النشر الهندسي التي تبحث عن توازن بين التكلفة وزمن الاستجابة، وقد أضيف إليها في مايو إصدار Distill+Quant لتقليل استهلاك ذاكرة الفيديو (VRAM) بشكل أكبر.

إن إيقاع الإصدار هذا، الذي يعتمد على "نموذج مزدوج (عالي ومنخفض الأداء) + تقطير مستمر"، هو الأسلوب الأكثر نضجاً لنماذج اللغة الكبيرة مفتوحة المصدر في الفترة 2025-2026، حيث تتماشى Sand AI في هذا الجانب مع كبرى الشركات المفتوحة المصدر مثل Mistral و Qwen.

موقع Sand AI في سباق توليد الفيديو والدروس المستفادة

بعد ربط الخلفية والمنتج ومسار التسليم، أصبح موقع Sand AI في سباق توليد الفيديو لعام 2026 واضحاً تماماً.

لماذا يستحق الاهتمام؟

الزاوية القيمة التنافسية لـ Sand AI
العمق الأكاديمي جينات فريق Swin Transformer، مع ابتكار مستمر في بنية الشبكات
اختيار المسار الجمع بين "الانحدار الذاتي" و"الانتشار" هو المسار الثالث الذي نادراً ما يسلكه الآخرون، وليس مجرد تقليد لـ Sora
الانفتاح المصدري ترخيص Apache 2.0 + الأوزان + الكود + إصدارات Distill متاحة بالكامل
شكل المنتج توفر المداخل الثلاثة (ويب / API / استضافة ذاتية)
الفهم الفيزيائي تفوق ملحوظ في معيار Physics-IQ، مما يجعله مناسباً للمحتوى التعليمي والعلمي
الفيديوهات الطويلة مسار الانحدار الذاتي يدعم طبيعياً تمديد الفيديوهات إلى ما لا نهاية

ثلاث رؤى صناعية

ترك صعود Sand AI السريع ثلاث دروس رئيسية لقطاع توليد الفيديو بأكمله:

  1. تنوع المسارات: بعيداً عن Sora / Veo / Kling، أثبت مسار "الانحدار الذاتي + الانتشار" نجاحه، مع ميزة هيكلية في الاتساق الفيزيائي.
  2. الفرق الصغيرة + المصدر المفتوح يمكنها تحقيق SOTA: فريق يقل عن 30 شخصاً مع ترخيص Apache 2.0، يمكنه التفوق على العديد من الشركات الكبرى ذات الأنظمة المغلقة في معيار Physics-IQ.
  3. عودة الأصول الأكاديمية: خبرات التدريب في "نماذج الرؤية الكلاسيكية" مثل Swin Transformer لا تزال تحمل قيمة استمرارية قوية في عصر توليد الفيديو.

هذه النقاط الثلاث تمثل مرجعاً مباشراً للفرق التي ترغب في دخول مجال توليد الفيديو في عام 2026؛ فأنت لا تحتاج إلى 1000 وحدة H100 لصنع نموذج جيد، لكنك تحتاج بالتأكيد إلى ثقافة هندسية "تفهم البنية، وتجرؤ على فتح المصدر، وتلتزم بالاتساق الفيزيائي".

🎯 نصيحة لدمج النظام البيئي: بالنسبة للفرق التي تأمل في دمج نماذج فيديو "مفتوحة ومغلقة المصدر" في منتجاتها، ننصح بإدارة Sora 2 و Veo 3.1 و Kling 3.0 و MAGI-1 تحت واجهة برمجية موحدة. وحتى يتم فتح API التجاري الخاص بـ MAGI على نطاق واسع، يمكنكم البدء بدمج نماذج الفيديو التجارية عبر خدمة وكيل API مثل APIYI (apiyi.com) لإنجاز سير العمل، بانتظار المزيد من الانفتاح من منصة platform.sand.ai التابعة لـ Sand AI.

لمن يصلح Sand AI، ولمن لا يصلح؟

بالعودة إلى سؤال عملي للغاية: هل يجب عليك استخدام نموذج MAGI من Sand AI الآن؟ الإجابة تعتمد على متطلباتك المحددة في توليد الفيديو.

الفئات المستهدفة

الفئة سبب الملاءمة
الباحثون / مؤلفو الأوراق العلمية مفتوح المصدر بالكامل + نموذج استدلال ذاتي جديد، مناسب للعمل الأكاديمي اللاحق
فرق الاستضافة الذاتية / النشر الخاص ترخيص Apache 2.0 + نسخة 4.5B المقطرة، يمكن تشغيل الأوزان محلياً
صانعو المحتوى التعليمي / العلمي تفوق في Physics-IQ، واتساق فيزيائي عالٍ
احتياجات تمديد الفيديوهات الطويلة مسار الاستدلال الذاتي يدعم التمديد اللانهائي (infinite extension) بشكل طبيعي
بناء منتجات "تحكم في التوليد على مستوى اللقطات" دعم الجدول الزمني بالثواني + توجيه مقسم (chunk-wise prompting)
المشاركون في منظومة محتوى الذكاء الاصطناعي الصيني فريق من بكين، ويدعم الموجهات (prompts) باللغة الصينية بشكل جيد

الفئات غير المستهدفة

الفئة السبب
المستخدمون الذين لا يبرمجون ويريدون "نتائج فورية" تجربة المستخدم في Sora 2 / Kling أكثر سلاسة
الفرق الصغيرة التي ترفض النشر الذاتي تماماً منصة platform.sand.ai التجارية لا تزال قيد التطوير المستمر
من يحتاج إلى مخرجات سينمائية (4K + مدة طويلة + صوت) التموضع الحالي لا يزال يميل للبحث / الإبداع، وليس لمرحلة ما بعد الإنتاج السينمائي
المستخدمون الذين لا يهتمون بـ "ترخيص الأوزان" استخدام واجهات برمجة تطبيقات (API) مغلقة المصدر أسهل وأكثر راحة

🎯 نصيحة للتجربة: إذا كان هدفك هو "رؤية النتائج فوراً"، ننصحك بزيارة magi.sand.ai وتجربة التطبيق عبر الويب بدون تسجيل أو بتسجيل سريع؛ أما إذا أردت مقارنة الفروقات الحقيقية بين Sand AI ونماذج الفيديو الأخرى، يمكنك استخدام خدمة وكيل API مثل APIYI (apiyi.com) لاستدعاء Sora 2 / Veo 3.1 / Kling 3.0، واستخدام نفس مجموعة الموجهات (Prompts) للمقارنة، لتقرر بنفسك ما إذا كان مسار الاستدلال الذاتي لـ MAGI يناسب عملك فعلاً.

what-is-sand-ai-magi-autoregressive-video-generation-ar 图示

الأسئلة الشائعة حول Sand AI

س1: ما هي شركة Sand AI؟ وهل هي من نفس فئة Stability AI و Midjourney؟

Sand AI هي شركة ناشئة في مجال الذكاء الاصطناعي مقرها بكين، أسسها "تساو يوي" (Yue Cao)، المؤلف الرئيسي لنموذج Swin Transformer، ويضم الفريق الأساسي أقل من 30 شخصاً. وعلى عكس Stability AI التي تركز على الصور، وMidjourney التي تعتمد على الاشتراكات المغلقة، تتخصص Sand AI في توليد الفيديو، وقد اختارت مسار المصدر المفتوح بالكامل (Apache 2.0). منتجها الرائد هو نموذج توليد الفيديو بالاستدلال الذاتي MAGI-1 / MAGI-1.1.

س2: ما هو الفرق الجوهري بين MAGI-1 ونماذج Sora و Kling و Veo؟

الفرق الأكبر يكمن في المسار التقني: بينما تقوم النماذج الرئيسية مثل Sora / Veo / Kling بتوليد مقطع الفيديو بالكامل دفعة واحدة، يقوم MAGI بتقسيم الفيديو إلى أجزاء (chunks) كل جزء يتكون من 24 إطاراً، حيث يتم إجراء إزالة الضجيج (Diffusion) داخل الجزء، بينما يتم الربط بين الأجزاء عبر الاستدلال الذاتي (Autoregressive causal connection). هذا النموذج يمنح MAGI ميزة هيكلية في "تمديد الفيديو اللانهائي" و"الاتساق الفيزيائي" – وقد أظهرت النتائج الرسمية لـ sand.ai تفوقاً ملحوظاً في معيار Physics-IQ.

س3: هل MAGI-1 مفتوح المصدر بالكامل حقاً؟ وهل يمكن استخدامه تجارياً؟

نعم. تم إصدار MAGI-1 و MAGI-1.1 بموجب ترخيص Apache 2.0 على GitHub (SandAI-org/MAGI-1) و Hugging Face (sand-ai/MAGI-1)، مع توفر الكود والأوزان وأدوات الاستدلال. ترخيص Apache 2.0 هو ترخيص مفتوح المصدر ودود للغاية، يسمح بالاستخدام التجاري، والتعديل، والاشتقاق المغلق، بشرط الاحتفاظ بإشعار حقوق النشر. هذا يعني أنه يمكنك استخدام MAGI-1 في منتجك الخاص، أو إجراء تدريب إضافي عليه.

س4: ما هي الأجهزة المطلوبة لتشغيل MAGI-1 محلياً؟

النسخة الكاملة من MAGI-1 تحتوي على 24 مليار معامل (24B)، وتتطلب استدلالاً محلياً على وحدات معالجة رسومية (GPU) احترافية متعددة؛ إذا كانت ميزانية الأجهزة محدودة، نوصي باستخدام نسخة 4.5B المقطرة (Distill) أو نسخة Distill+Quant التي أصدرتها Sand AI في مايو 2025، حيث تنخفض متطلبات ذاكرة الفيديو (VRAM) بشكل كبير، مما يسمح بتشغيلها على بطاقة رسومية استهلاكية عالية الأداء. إذا كنت ترغب فقط في "رؤية النتائج"، ننصحك باستخدام تطبيق الويب على magi.sand.ai دون الحاجة لإعدادات محلية.

س5: هل لدى Sand AI واجهة برمجة تطبيقات (API) تجارية؟ وكيف تقارن بـ Sora و Kling؟

منصة API التجارية لـ Sand AI المعروفة بـ platform.sand.ai متاحة بالفعل، لكن نضج المنظومة لا يزال في مرحلة اللحاق بنماذج مثل Sora و Kling التي تم تسويقها بالكامل. إذا كنت تبني منتجاً لتوليد الفيديو يحتاج إلى "جاهزية فورية، وحصص كافية، ودعم للموجهات الصينية"، ننصحك باستخدام منصة وسيطة مثل APIYI (apiyi.com) لاستدعاء Sora 2 و Veo 3.1 و Kling 3.0 لإنجاز عملك، مع متابعة وتيرة فتح API الخاص بـ Sand AI، والتبديل أو الربط المتوازي في الوقت المناسب.

س6: هل يستحق Sand AI المتابعة في المستقبل؟

بالتأكيد. لسببين: أولاً، الخلفية الأكاديمية لفريق Swin Transformer تعني أن إصدارات MAGI اللاحقة من المرجح أن تبتكر على مستوى البنية، وليس فقط عبر زيادة البيانات؛ ثانياً، اختارت Sand AI مساراً متميزاً يجمع بين "الاستدلال الذاتي + الانتشار (Diffusion) + المصدر المفتوح بالكامل"، وإذا نجح هذا المسار، سيؤثر على اختيار النموذج في مجال توليد الفيديو مفتوح المصدر للفترة 2026-2027. سواء كنت باحثاً، أو مطور منتجات، أو صانع محتوى، ننصحك بإضافة sand.ai إلى قائمة مراقبتك المستمرة.

ملخص: ما هي الإجابة النهائية حول Sand AI

بالعودة إلى السؤال الأصلي — "ما هي Sand AI؟" يمكننا الآن تقديم إجابة كاملة نسبياً: Sand AI هي شركة ناشئة في مجال الذكاء الاصطناعي تضم فريقاً صغيراً لا يتجاوز 30 شخصاً، أسسها في بكين "تساو يوي" (Cao Yue)، المؤلف الرئيسي لنموذج Swin Transformer. تقدم الشركة نموذج توليد الفيديو ذاتي الانحدار مفتوح المصدر MAGI-1 / MAGI-1.1 كمنتج رئيسي لها، والذي حقق نتائج متفوقة على معظم النماذج مفتوحة المصدر وبعض النماذج مغلقة المصدر في معايير الاتساق الفيزيائي مثل Physics-IQ، كما وفرت كامل الأوزان والرموز البرمجية بموجب ترخيص Apache 2.0 على منصتي GitHub و Hugging Face. إنها "حصان أسود" في مجال توليد الفيديو، تتميز بـ "خلفية أكاديمية قوية، مسار تقني مبتكر، وموقف جذري تجاه المصادر المفتوحة".

بالنسبة للمطورين والباحثين، فإن المعنى الحقيقي لـ Sand AI ليس مجرد "إضافة نموذج فيديو جديد"، بل هو توفير مسار متميز وقابل للتكرار لمجال توليد الفيديو بأكمله: لا يعتمد على قدرات حوسبة هائلة، ولا على احتكار النماذج المغلقة، ولا على حملات التسويق المكثفة، بل يعتمد على الأساس الأكاديمي المتين + الابتكار في البنية الهندسية + الانفتاح الكامل للمصادر. إذا كان مجال توليد الفيديو قبل عام 2025 يهيمن عليه Sora بمفرده، فإن ظهور Sand AI يمنح النظام البيئي للفيديو مفتوح المصدر في عام 2026 إمكانية جديدة مفادها أن "الفرق الصغيرة يمكنها أيضاً تحقيق حالة SOTA (أحدث ما توصلت إليه التقنية)".

🎯 نصيحة نهائية: لمتابعة تطورات Sand AI و MAGI أولاً بأول، نقترح عليك القيام بثلاثة أمور: 1) متابعة التحديثات على موقع sand.ai ومنظمة sand-ai على Hugging Face؛ 2) تجربة متطلباتك الفعلية باستخدام تطبيق الويب magi.sand.ai للحصول على انطباع أولي مباشر؛ 3) إجراء مقارنة أفقية بين MAGI ونماذج تجارية أخرى مثل Sora 2 و Veo 3.1 و Kling 3.0 عبر ربطها بمنصة موحدة مثل APIYI (apiyi.com)، لتقييم قيمتها الحقيقية لأعمالك بناءً على معاييرك الخاصة. بعد إتمام هذه الخطوات، ستتضح لك الإجابة تلقائياً حول ما إذا كانت Sand AI تستحق أن تكون ضمن حزمة أدوات توليد الفيديو الخاصة بك.


بقلم: فريق APIYI | نركز على تطبيق نماذج اللغة الكبيرة والأنظمة البيئية مفتوحة المصدر، للمزيد من تقييمات نماذج الفيديو والوسائط المتعددة، يرجى زيارة APIYI على apiyi.com.

موضوعات ذات صلة