الرئيسية
» ويكي
»
أفضل 3 ميزات جديدة في Meta AI Llama 4 Model
أفضل 3 ميزات جديدة في Meta AI Llama 4 Model
في أوائل أبريل 2025، أطلقت Meta Llama 4 ، أحدث سلسلة من نماذج الذكاء الاصطناعي المصممة لنقل الشركة إلى المستوى التالي. يتمتع كل طراز جديد من Llama 4 بتحسينات كبيرة مقارنة بالطرازات السابقة، وهذه هي الميزات الجديدة البارزة التي يمكنك تجربتها.
3. هندسة مزيج الخبراء (وزارة التعليم)
ومن أبرز ميزات طرازات Llama 4 هو بنية MoE الجديدة، وهي الأولى من نوعها في سلسلة Llama، والتي تستخدم نهجًا مختلفًا عن الطرازات السابقة. في الهندسة المعمارية الجديدة، يتم تنشيط جزء صغير فقط من معلمات النموذج لكل رمز، على عكس نماذج المحولات الكثيفة التقليدية مثل Llama 3 وما دونه، حيث يتم تنشيط جميع المعلمات لكل مهمة.
على سبيل المثال، يستخدم Llama 4 Maverick 17 مليار معلمة نشطة فقط من أصل 400 مليار، مع 128 خبيرًا موجهًا وخبير مشترك واحد. Llama 4 Scout، هو الأصغر في السلسلة، ويحتوي على إجمالي 109 مليار معلمة، ويتم تنشيط 17 مليار منها فقط مع 16 خبيرًا.
تستخدم النسخة الأكبر من الثلاثي، Llama 4 Behemoth، 288 مليار معلمة نشطة (مع 16 خبيرًا) من إجمالي ما يقرب من تريليوني معلمة. بفضل هذه الهندسة المعمارية الجديدة، يتم تعيين اثنين فقط من المتخصصين لكل مهمة.
بفضل التغيير المعماري، أصبحت النماذج في سلسلة Llama 4 أكثر كفاءة حسابيًا أثناء التدريب والاستدلال. يؤدي تمكين جزء صغير فقط من المعلمات إلى تقليل تكاليف الخدمة والزمن الكامن. بفضل بنية MoE، تدعي Meta أن Llama يمكن تشغيلها على وحدة معالجة رسومية واحدة من نوع Nvidia H100، وهو إنجاز مثير للإعجاب بالنظر إلى عدد المعلمات. على الرغم من عدم وجود مقاييس محددة، فمن المعتقد أن كل استعلام إلى ChatGPT يستخدم وحدات معالجة رسومية متعددة من Nvidia، مما يؤدي إلى إنشاء تكلفة إضافية أكبر في كل مقياس قابل للقياس تقريبًا.
2. قدرات المعالجة متعددة الوسائط الأصلية
أحد التحديثات المهمة الأخرى لنماذج Llama 4 AI هي المعالجة المتعددة الوسائط الأصلية، مما يعني أن الثلاثي يمكنه فهم النصوص والصور في وقت واحد.
ويرجع الفضل في ذلك إلى التركيبة التي تم إجراؤها في مرحلة التدريب الأولية، حيث يتم دمج الرموز النصية والمرئية في بنية موحدة. يتم تدريب النماذج باستخدام كميات كبيرة من النصوص والصور ومقاطع الفيديو غير المصنفة.
لا يوجد شيء أفضل من هذا. إذا كنت تتذكر، فإن ترقية Meta's Llama 3.2 ، التي تم إصدارها في سبتمبر 2024، قدمت عددًا من النماذج الجديدة (10 في المجموع)، بما في ذلك 5 نماذج رؤية متعددة الوسائط و5 نماذج نصية. مع هذا الجيل، لم تعد الشركة بحاجة إلى إصدار نماذج نصية ورؤية منفصلة بفضل قدرات المعالجة المتعددة الوسائط الأصلية.
بالإضافة إلى ذلك، يستخدم Llama 4 مشفرًا بصريًا محسنًا، مما يسمح للنماذج بالتعامل مع مهام الاستدلال البصري المعقدة ومدخلات الصور المتعددة، مما يجعلها قادرة على التعامل مع التطبيقات التي تتطلب فهمًا متقدمًا للنصوص والصور. وتسمح المعالجة متعددة الوسائط أيضًا باستخدام نماذج LLama 4 عبر مجموعة متنوعة من التطبيقات.
1. نافذة سياقية رائدة في الصناعة
تتميز نماذج الذكاء الاصطناعي في Llama 4 بنافذة سياقية غير مسبوقة تصل إلى 10 ملايين رمز. في حين أن Llama 4 Behemoth لا يزال قيد التطوير في وقت النشر، فقد وضع Llama 4 Scout معيارًا جديدًا للصناعة بقدرته على دعم ما يصل إلى 10 ملايين رمز في طول السياق، مما يسمح لك بإدخال نص أطول من 5 ملايين كلمة.
يُعد طول السياق الممتد هذا زيادة كبيرة عن 8 آلاف رمز في Llama 3 عندما تم إطلاقه لأول مرة وحتى التوسعة اللاحقة إلى 128 ألفًا بعد ترقية Llama 3.2. وليس فقط طول سياق Llama 4 Scout الذي يصل إلى 10 ملايين هو الشيء المثير للاهتمام؛ حتى فيلم Llama 4 Maverick، مع طول سياقه الذي يصل إلى مليون سياق، يعد إنجازًا مثيرًا للإعجاب.
يُعد Llama 3.2 حاليًا أحد أفضل روبوتات الدردشة بالذكاء الاصطناعي للمحادثات الطويلة. ومع ذلك، فإن نافذة السياق الموسعة لـ Llama 4 تضع Llama في الصدارة، متجاوزة نافذة سياق أعلى 2 مليون رمز في Gemini سابقًا، و200 ألف في Claude 3.7 Sonnet، و128 ألف في GPT-4.5.
بفضل نافذة السياق الكبيرة، يمكن لسلسلة Llama 4 التعامل مع المهام التي تتطلب إدخال كميات هائلة من المعلومات. تُعد هذه النافذة الكبيرة مفيدة للمهام مثل تحليل المستندات الطويلة والمتعددة، وتحليل قواعد البيانات الكبيرة بالتفصيل، والتفكير في مجموعات البيانات الكبيرة.
كما يسمح لـ Llama 4 بإجراء محادثات مطولة، على عكس نماذج Llama السابقة والنماذج من شركات الذكاء الاصطناعي الأخرى. إذا كان أحد الأسباب التي تجعل Gemini 2.5 Pro هو أفضل نموذج استدلالي هو نافذة السياق الكبيرة الخاصة به، فيمكنك أن تتخيل مدى قوة نافذة السياق 5x أو 10x.
لقد كانت نماذج Llama من سلسلة Meta 3 من أفضل نماذج Llama الموجودة في السوق. ولكن مع إصدار سلسلة Llama 4، تتخذ Meta خطوة أخرى للأمام ليس فقط من خلال التركيز على تحسين أداء الاستدلال (بفضل نافذة السياق الجديدة الرائدة في الصناعة) ولكن أيضًا من خلال ضمان النماذج الأكثر كفاءة ممكنة باستخدام بنية MoE جديدة أثناء التدريب والاستدلال.
إن قدرات المعالجة المتعددة الوسائط الأصلية لـ Llama 4، وهندسة MoE الفعالة، ونافذة السياق الكبيرة تجعلها نموذج ذكاء اصطناعي مفتوح وعالي الأداء ومرن ومرجح الوزن يمكنه التنافس مع النماذج الرائدة أو تجاوزها للاستدلال والتشفير والعديد من المهام الأخرى.