Home
» ويكي
»
لماذا لا تستطيع الذكاء الاصطناعي كتابة نص على الصور؟
لماذا لا تستطيع الذكاء الاصطناعي كتابة نص على الصور؟
إذا كنت قد استخدمت أدوات الذكاء الاصطناعي التوليدي لإنشاء الصور، فمن المحتمل أنك واجهت مشاكل في كتابة النص في الصور. إن معرفة سبب حدوث ذلك سيساعدك على تجنب هذه المشكلة، بالإضافة إلى إيجاد طرق لحلها.
لماذا لا تستطيع الذكاء الاصطناعي كتابة نص في الصور؟
السبب الأكبر لعدم قدرة الذكاء الاصطناعي على كتابة النص هو بيانات الإدخال السابقة. في حين أن الذكاء الاصطناعي جيد جدًا في إنشاء الصور بشكل عام، إلا أن بعض الجوانب مثل النص لم يتم استخدامها على نفس المستوى لتدريب نماذج اللغة الكبيرة (LLMs) . لذلك، لا تتمتع الذكاء الاصطناعي بالمهارة الكافية في توليد النصوص في الصور.
على الرغم من تقدمها الكبير، إلا أن أدوات الذكاء الاصطناعي لا تزال في مراحلها المبكرة من الناحية التقنية. علاوة على ذلك، فإن بعض أدوات الذكاء الاصطناعي تعاني من نقص بيانات التدريب. لا يزال هناك احتمال أن تتمكن أدوات المولد من إنشاء نص أفضل، ولكن في الوقت الحالي، سيتعين عليك تجربة بديل.
هل يوجد بديل للنص غير القابل للقراءة في صور الذكاء الاصطناعي؟
على الرغم من أن إنشاء نص في صور الذكاء الاصطناعي أمر صعب للغاية، إلا أنه ليس مستحيلاً. وهنا الطرق الأكثر فعالية في الوقت الراهن...
1. امنح الأداة مطالبات أكثر تحديدًا
عندما يبدأ الأشخاص في استخدام الذكاء الاصطناعي لأول مرة، غالبًا ما تكون مهاراتهم في الكتابة السريعة دون المستوى المطلوب. إن الخطأ الأكبر هو إعطاء مطالبات غامضة مثل "إنشاء صورة لمشهد الشارع".
ليس من المستغرب أن تحصل على نتائج دون المستوى المطلوب. أفضل طريقة لاستخدام الذكاء الاصطناعي التوليدي هي التفكير في مطالبتك باعتبارها موجزًا إبداعيًا. كلما كانت أكثر تحديدًا كان ذلك أفضل. فيما يلي مثال على المطالبة:
إنشاء صورة للجزء الخارجي من مقهى إيطالي. أريد أن يكون مكتوبًا عليه "مقهى" كعلامة، ويجب أن يكون في يوم مشمس.
إنشاء صورة خارجية لمقهى إيطالي. أريد أن تحتوي الصورة على كلمة "مقهى" على اللافتة وفي يوم مشمس.
كما يمكنك أن ترى من الصورة أدناه، كان أداء ChatGPT جيدًا جدًا. لن يحدث هذا إذا قلت فقط "إنشاء صورة خارجية لمقهى إيطالي".
صورة لمقهى تم إنشاؤه في DALL-E
في تجربتي الشخصية، يبدو أن الصور البسيطة أكثر فعالية. على سبيل المثال، تحتوي الصورة أعلاه على عناصر أقل من الصورة التي تم اختبارها أدناه - مما يعني أن الذكاء الاصطناعي لديه القليل لمحاولة تعلمه.
مشهد الشارع المعدل في تطبيق DALL-E 3
2. استخدم أشكالًا مختلفة من كلمة "نص"
إن تغيير اللغة في موجه الأوامر قليلاً قد يحدث فرقًا كبيرًا. بعد تجربة مصطلح "النص" عدة مرات، ستشعر وكأنك تدور في حلقة مفرغة، لذا حاول استخدام مرادفات مختلفة.
على سبيل المثال، بدلاً من "النص"، يمكنك تجربة:
عنوان
الأبجدية
الكلمة المكتوبة
رمز
إذا لم ينجح أي من هذه الحلول، استمر في تجربة البدائل. ما ينجح وما لا ينجح قد يختلف اعتمادًا على ما تحاول إنشاءه. على سبيل المثال، ربما لن تستخدم كلمة "رمز" إذا كنت تحاول تصميم بطاقة عيد ميلاد. إن تجربة أفكار الذكاء الاصطناعي المختلفة أمر أساسي هنا، ويمكن للأدوات المختلفة أن تعمل بطرق مختلفة.
3. أضف نصًا باستخدام أدوات الاستبدال
لا ينبغي عليك إضافة نص عبر أدوات الاستبدال إذا كان من المفترض أن تكون الكلمات جزءًا من الصورة، ولكنها فكرة جيدة إذا كنت تحاول إنشاء المزيد من الرسومات. سوف يعمل هذا إذا كنت تريد تصميم بطاقة أو رسم أو غلاف كتاب أو شيء مشابه.
إذا كنت ستفعل هذا، تأكد من وجود مساحة كافية في الصورة. يمكنك استخدام أي أداة تريدها لإضافة نص إلى صورتك. يُعد Canva أو Adobe Photoshop Express من الخيارات الموصى بها، ولكن التطبيقات الأخرى التي تتيح لك إضافة نص إلى الصور على هاتفك الذكي ستعمل أيضًا مع المحتوى الذي تنشئه باستخدام الذكاء الاصطناعي.
يجب عليك أيضًا التأكد من أن النص يتطابق مع الصورة التي تم إنشاؤها بواسطة الذكاء الاصطناعي. استخدم الخطوط التي تتناسب مع الحالة المزاجية التي تحاول نقلها وأعد تشكيل الأشياء بالطريقة التي تشعر أنها ضرورية.
4. حافظ على النص قصيرًا
تفشل عملية إنشاء نص الصورة بالذكاء الاصطناعي في كثير من الأحيان بسبب محاولتك إضافة الكثير من النص. بصراحة، يحدث هذا عندما تحاول إنشاء أي شيء أطول من 10 أحرف. على غرار التوصية بالحفاظ على بساطة الصور، يجب عليك أن تفعل كل ما بوسعك للحفاظ على نصك قصيرًا.
لاختبار ذلك، حاول المؤلف توجيهًا آخر:
الرجاء إنشاء صورة للبنك مع النص "البنك" على الخارج. أريد أن يكون في منطقة وسط المدينة وبمبنى حديث، مثل ما تراه في مدينة أمريكية.
ترجمة تقريبية : اصنع صورة لبنك مع كلمة "بنك" على الخارج. أردت أن يكون في وسط المدينة وأن يكون له هيكل حديث، مثل ما تراه في مدينة أمريكية.
كما ترى أدناه، قام محرك الذكاء الاصطناعي بعمل جيد جدًا في الاستماع إلى المستخدم. ولكن هناك بعض الأخطاء في جزء واحد من الصورة. لذا أخبر الذكاء الاصطناعي أنك تريد إشارة واحدة أو اثنتين فقط للحد من فرصة حدوث ذلك. يبدو أن هذه المشكلات تحدث أيضًا عندما يكون النص أصغر حجمًا، لذا ضع ذلك في الاعتبار.
صورة مبنى حديث تم إنشاؤها في DALL-E
5. استخدم الأدوات لتصحيح أخطاء النص
على غرار الطريقة التي يمكنك بها إزالة العيوب في الصور الملتقطة بكاميرتك، يمكنك محاولة استخدام أداة تساعدك في إصلاح أخطاء النص في الصور. هناك العديد من التطبيقات التي تعمل على إصلاح الهراء في الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مثل Storia Lab.
خطأ في أداة Textify من Storia Lab AI
عند استخدام هذه الأدوات، يمكنك عادةً تحديد النص وتغيير المحتوى حسب الحاجة. بعض التطبيقات مجانية، ولكن في حالات أخرى ستحتاج إلى اشتراك مدفوع. إذا قمت بإنشاء الكثير من الصور باستخدام الذكاء الاصطناعي، فيمكنك شراء خطة شهرية أو سنوية للوصول إليها وقتما تحتاج إليها.
6. استخدم أدوات الذكاء الاصطناعي لإنشاء نص دقيق
ربما سمعت عن Midjourney وDALL-E وFirefly ومولدات الصور بالذكاء الاصطناعي المماثلة. ولكن هل تعلم أن هناك مولدات فنية خاصة بالذكاء الاصطناعي تعمل على توليد نصوص دقيقة في الصور؟
نظرًا لأن إحدى ميزات Ideogram المتخصصة هي إنشاء نص قابل للقراءة، فيمكنك بالتأكيد تجربة هذا التطبيق لبعض إبداعاتك. يتمتع Ideogram بميزة Magic Prompt التي تعمل على توسيع الميزة الأصلية لديك، مما يعني أنه يمكنك الحصول على نتائج أكثر دقة. بالإضافة إلى الخطة المجانية، تبدأ خطط الاشتراك المدفوعة من 8 دولارات أمريكية شهريًا.
على الرغم من أن الذكاء الاصطناعي لديه عيوبه في إنشاء صور تحتوي على نصوص قابلة للقراءة، فستجد بعض البدائل إذا كنت على استعداد للتفكير خارج الصندوق. في بعض الأحيان يكون الخيار الأفضل هو إعطاء أداتك مطالبات تفصيلية تكون أقل تعقيدًا في المعالجة. قد ترغب أيضًا في إصلاح المشكلات الموجودة في صورك باستخدام برامج أخرى أو استخدام أدوات مصممة خصيصًا لإنشاء نص دقيق.