أعلنت مجموعة التكنولوجيا الصينية علي بابا للتو عن نموذج ذكاء اصطناعي جديد يسمى QVQ-Max من سلسلة Qwen، وهو ما يمثل اختراقًا في مجال الذكاء الاصطناعي متعدد الوسائط. الميزة الخاصة لهذا النموذج هي القدرة على تحليل محتوى الصورة/الفيديو، ثم تقديم الحجج والحلول بناءً على المعلومات التي تم الحصول عليها.
قدرة مثيرة للإعجاب
يصف علي بابا QVQ-Max بأنه جسر بين نماذج الذكاء الاصطناعي القائمة على النصوص والعالم الحقيقي. بفضل قدرات التفكير البصري، يستطيع النظام:
- تحليل الصور وتحديد العناصر الرئيسية
- تطبيق متعدد الاستخدامات في العديد من المجالات من تصميم الرسوم التوضيحية وإنشاء نصوص الفيديو إلى لعب أدوار الشخصيات
- حل المشكلات باستخدام المخططات (الرياضيات والفيزياء)
- تعليمات الطبخ خطوة بخطوة بناءً على صور الوصفة
وتقول شركة علي بابا إن هذا النموذج يساعد في سد الفجوة بين الذكاء الاصطناعي الذي يعالج النصوص فقط والمعلومات الواقعية. بفضل قدرتها على التفكير البصري، تستطيع QVQ-Max "رؤية وفهم والتفكير" في العالم المحيط بها. وتؤكد الشركة على نموذجها المتفوق في تحليل الصور وتحديد العناصر الرئيسية ومرونتها في التطبيق في العديد من المجالات مثل تصميم الرسوم التوضيحية أو إنشاء نصوص الفيديو أو لعب الأدوار.

مثل روبوتات الدردشة الأخرى التي تعمل بالذكاء الاصطناعي، يدعم QVQ-Max العمل والتعليم والحياة الشخصية، ولكن بفضل التكامل البصري، فإنه يحل أيضًا مهام أكثر تحديدًا مثل: حل مسائل الرياضيات/الفيزياء باستخدام المخططات، وتعليمات الطبخ من خلال صور الوصفات.
تعتبر شركة علي بابا أن QVQ-Max هو الإصدار الأول وقد حددت خارطة طريق للترقية للإصدارات اللاحقة. أولاً، أرادوا تحسين دقة التعرف على الصور باستخدام تقنيات التأريض. ثانياً، سيتم تحسين النموذج للتعامل مع المهام المتعددة والمشكلات المعقدة مثل العمل مع الهواتف أو أجهزة الكمبيوتر أو ممارسة الألعاب. وفي نهاية المطاف، تخطط علي بابا للتوسع من التفاعل النصي إلى التحقق من الأدوات وإنشاء محتوى الصور.
يمكن للمستخدمين تجربة QVQ-Max من خلال:
- قم بزيارة chat.qwen.ai
- حدد قائمة النموذج في الزاوية اليسرى → " توسيع المزيد من النماذج "
- حدد QVQ-Max وابدأ الدردشة
- قم بإرفاق ملفات الصور لاستكشاف قدرات معالجة الذكاء الاصطناعي
ومع إطلاق QVQ-Max، تواصل شركة علي بابا تأكيد مكانتها في السباق لتطوير الذكاء الاصطناعي المتعدد الوسائط، والتنافس بشكل مباشر مع عمالقة التكنولوجيا العالمية. ويعد النموذج بتقديم تطبيقات عملية في العمل والتعليم والحياة الشخصية.