في الشهر الماضي، أصدرت OpenAI تحديثًا رئيسيًا لميزة إنشاء الصور في ChatGPT، مدعومًا بنموذج جديد. حقق هذا التحديث نجاحًا كبيرًا على مستوى العالم مع أكثر من 130 مليون مستخدم، وإنشاء أكثر من 700 مليون صورة في أسبوع واحد فقط من إطلاقه.
اليوم، تقوم OpenAI رسميًا بإتاحة نموذج إنشاء الصور المحسن هذا للمطورين عبر واجهة برمجة التطبيقات gpt-image-1. تتيح واجهة برمجة التطبيقات الجديدة للتطبيقات والخدمات دمج إنشاء صور عالية الجودة، ودعم مجموعة متنوعة من الأنماط المرئية، وتحرير الصور بدقة، ومعرفة العالم الغنية، وتقديم نص حاد.
gpt-image-1 متاح الآن على Images API، مع خطط لدعم Responses API قريبًا.
ميزات التحكم المرنة:
- الإشراف : يمكن للمطورين ضبط حساسية الإشراف عبر معلمة الإشراف. يتم تطبيق الفلتر القياسي بشكل افتراضي، ولكن يمكن تحديد الوضع المنخفض لتقليل التقييد.
- تخصيص الإخراج : التحكم في جودة الصورة، وعدد الصور التي تم إنشاؤها، والخلفية الشفافة/غير الشفافة، وتنسيق الإخراج (JPEG، PNG، WebP).
هذا اشتراك مدفوع، وتعتمد التكلفة على الرمز مع معالم محددة على النحو التالي:
- إدخال النص : 5 دولار أمريكي/1 مليون رمز.
- إدخال الصورة : 10 دولارات أمريكية/1 مليون رمز.
- إخراج الصورة : 40 دولارًا أمريكيًا/مليون رمز.
مثال من العالم الواقعي: تبلغ تكلفة كل صورة مربعة ذات جودة منخفضة ومتوسطة وعالية حوالي 0.02 دولار، و0.04 دولار، و0.19 دولار، على التوالي.
يمكن للمطورين تجربة هذا النموذج على OpenAI Playground. لقد قامت العديد من الشركات مثل Adobe وAirtable وFigma وGamma وHeyGen وWix وPhotoroom وCanva وGoDaddy وHubSpot وInstacart وInvideo وOpusClip بدمج واجهة برمجة تطبيقات إنشاء الصور الخاصة بـ OpenAI في منتجاتها وحصلت على ردود فعل إيجابية من مجتمع المستخدمين.