أطلقت OpenAI رسميًا ترقية رائعة لقدرة إنشاء الصور بالذكاء الاصطناعي في ChatGPT، وهي خطوة مهمة إلى الأمام بدلاً من استخدام نموذج إنشاء صور منفصل مثل DALL-E السابق. تم دمج هذه الميزة الجديدة مباشرة في GPT-4o، مما أدى إلى تحسينات كبيرة.
التغلب على القيود المتأصلة
على الرغم من أن العديد من نماذج توليد الصور بالذكاء الاصطناعي الحالية يمكنها إنشاء صور فنية رائعة، إلا أنها غالبًا ما تواجه صعوبات في التعامل مع عناصر مثل النصوص أو الشعارات أو الأشياء اليومية. تزعم شركة OpenAI أن GPT-4o الجديد يمكنه التغلب على هذه القيود بفضل قدرته على:
- عرض النص بشكل صحيح
- الالتزام الصارم بمتطلبات المستخدم
- الاستفادة من المعرفة الخلفية وسياق المحادثة
- يسمح بتحرير الصور التي تم تحميلها أو إنشاء صور جديدة بناءً على الصور الأصلية
- متوفر على نطاق واسع
يتم حاليًا طرح هذه الميزة الجديدة لمستخدمي ChatGPT Free وChatGPT Plus وPro وTeam، وستتوفر على ChatGPT Enterprise وEdu في الأسابيع المقبلة. ومن الجدير بالذكر أن هذه ستكون أداة إنشاء الصور الافتراضية في ChatGPT، مما يسهل على المستخدمين الوصول إليها دون خيارات إضافية. يمكن للمستخدمين تخصيص الصور باستخدام:
- نسبة العرض إلى الارتفاع المحددة
- اللون الدقيق (باستخدام رمز سداسي عشري)
- خلفية شفافة
- دعم منصات متعددة

بالإضافة إلى ChatGPT، ستكون هذه الميزة متاحة أيضًا على منصات بما في ذلك Sora (إنشاء الصور)، وDALL·E GPT المخصص، وواجهة برمجة التطبيقات GPT-4o (للمطورين، سيتم إطلاقها في الأسابيع المقبلة).
وعلى الرغم من وعوده بالعديد من التحسينات، إلا أن النموذج الجديد لا يزال يعاني من بعض القيود:
- يمكن أن يصل وقت إنشاء الصورة إلى دقيقة واحدة بسبب التفاصيل العالية
- الاقتصاص غير المرغوب فيه مع الصور الرأسية
- في بعض الأحيان يتم "اختلاق" المعلومات دون الحاجة إلى سياق كبير
- صعوبة معالجة أكثر من 10-20 مفهومًا في وقت واحد
- صعوبة مع اللغات غير اللاتينية
- التصحيحات التفصيلية (مثل الأخطاء الإملائية) ليست فعالة جدًا
- من الصعب عرض معلومات مفصلة بأحجام صغيرة
ستحتوي جميع الصور التي تم إنشاؤها بواسطة GPT-4o على بيانات تعريفية C2PA، مما يسمح بالتحقق من المصدر باستخدام أدوات OpenAI الداخلية.
على الرغم من بعض القيود، فإن GPT-4o يعد بتقديم صور أكثر دقة وقابلة للتخصيص. وتقول شركة OpenAI إنها ستواصل تحسين النموذج في الأشهر المقبلة، مما يفتح إمكانيات جديدة لإنشاء محتوى مرئي مدعوم بالذكاء الاصطناعي.
مع هذا التحديث الرئيسي، تواصل OpenAI تعزيز ريادتها في سباق الذكاء الاصطناعي الإبداعي، مما يوفر تجربة أكثر سلاسة وقوة للمستخدمين عبر منصات متعددة.