أعلنت شركة OpenAI للتو عن برنامج Pioneers - وهو جهد يهدف إلى تعزيز تطبيق الذكاء الاصطناعي في مواقف العالم الحقيقي. يركز البرنامج على تحسين طريقة تقييم نماذج الذكاء الاصطناعي، حيث يعتمد المطورون والشركات بشكل متزايد على المعايير المرجعية لاختيار النماذج المناسبة وتحسينها.
وتأتي هذه الخطوة بعد اتهام شركة Meta ��التلاعب بمعيار LMArena لتعزيز تصنيفات طراز Llama 4 الخاص بها. يهدف برنامج الرواد إلى العمل مع الشركات وباحثي OpenAI لتطوير معايير التقييم التي تعكس التحديات الواقعية، بدلاً من مجرد السباق للحصول على الدرجات على لوحة المتصدرين.
وبحسب OpenAI، ستتلقى الشركات المختارة دعمًا مباشرًا من فرق البحث الخاصة بها، مع التركيز على هدفين رئيسيين:
- إنشاء معايير لكل مجال : تطوير أساليب تقييم منفصلة لكل مجال (القانون، المالية، الطب، التأمين، المحاسبة).
- تدريب النموذج الدقيق : قم بتطوير نماذج الذكاء الاصطناعي العميقة التي تعالج حالات الاستخدام التجارية الثلاثة الأكثر أهمية.
وتؤكد OpenAI أنه لا يوجد حاليًا معيار مشترك لقياس أداء الذكاء الاصطناعي في العديد من هذه المجالات، مما يؤدي إلى صعوبات في تقييم النماذج أو تحسينها بشكل عادل. ومن خلال العمل المباشر، تأمل الشركة أن تحدد بوضوح "ما هو فعال" في كل صناعة وتنشر هذه المعايير لكي يطبقها المجتمع.
وعلى صعيد ضبط النماذج، سيتم دعم الشركات المشاركة في تدريب إصدارات مخصصة من الذكاء الاصطناعي باستخدام الضبط الدقيق للتعزيز (RFT) - وهي طريقة OpenAI لإنشاء نماذج "خبيرة" تتفوق في مجموعات ضيقة من المهام. هذه النماذج ملتزمة بأن تكون جاهزة للنشر على نطاق الإنتاج.
وفيما يتعلق بخارطة الطريق للتنفيذ، ستركز المرحلة الأولى بشكل أساسي على مجموعة من الشركات الناشئة المختارة بناءً على التأثير الفعلي للمنتج. تعمل OpenAI على إعطاء الأولوية للفرق التي تعالج مشكلات محددة حيث يمكن للذكاء الاصطناعي العميق أن يحدث فرقًا ملموسًا. إلى جانب ذلك، يتم التوسع في المستقبل ليشمل الشركات الكبرى والمجالات الأكثر تعقيدًا.