الرئيسية
» ويكي
»
الذكاء الاصطناعي يتعلم خداع البشر على الرغم من تدريبه على الصدق
الذكاء الاصطناعي يتعلم خداع البشر على الرغم من تدريبه على الصدق
توصلت دراسة جديدة إلى أن العديد من أنظمة الذكاء الاصطناعي المتقدمة، على الرغم من تدريبها على أن تكون صادقة، تتعلم الخداع من خلال التدريب و"تحث المستخدمين بشكل منهجي على الاعتقادات الخاطئة".
كان فريق البحث بقيادة الدكتور بيتر إس. بارك، طالب الدراسات العليا في معهد ماساتشوستس للتكنولوجيا (MIT) في مجال بقاء الذكاء الاصطناعي والسلامة، وأربعة أعضاء آخرين. خلال البحث، تلقى الفريق أيضًا نصائح من العديد من الخبراء، وكان أحدهم جيفري هينتون، أحد مؤسسي تطوير مجال الذكاء الاصطناعي.
الرسم التوضيحي: متوسط.
ركز البحث على نظامين للذكاء الاصطناعي، نظام للأغراض العامة مدرب لأداء مهام متعددة مثل نظام GPT-4 الخاص بشركة OpenAI ؛ والأنظمة المصممة خصيصًا لإنجاز مهمة محددة، مثل نظام شيشرون التابع لشركة ميتا.
وقال السيد بارك إن أنظمة الذكاء الاصطناعي هذه مدربة على أن تكون صادقة، ولكن أثناء التدريب فإنها غالبًا ما تتعلم حيلًا خادعة لإكمال المهام.
ووجدت الدراسة أن أنظمة الذكاء الاصطناعي المدربة على "الفوز في الألعاب ذات العنصر الاجتماعي" من المرجح بشكل خاص أن تخدع.
على سبيل المثال، حاول الفريق استخدام شيشرون المدرب على ميتا للعب الدبلوماسية، وهي لعبة إستراتيجية كلاسيكية تتطلب من اللاعبين بناء تحالفات لأنفسهم وتفكيك التحالفات المنافسة. ونتيجة لذلك، فإن الذكاء الاصطناعي غالبًا ما يخون حلفاءه ويكذب صراحةً.
أظهرت التجارب التي أجريت على GPT-4 أن أداة OpenAI نجحت في "التلاعب نفسياً" بموظف في TaskRabbit، وهي شركة تقدم خدمات تنظيف المنازل وتجميع الأثاث، من خلال القول إنه كان في الواقع إنسانًا ويحتاج إلى مساعدة في تمرير رمز Captcha، مشيرًا إلى ضعف شديد في الرؤية. ساعد هذا الموظف الذكاء الاصطناعي التابع لشركة OpenAI في "تجاوز الخط" على الرغم من الشكوك السابقة.
واستشهد فريق بارك بأبحاث من شركة Anthropic، وهي الشركة التي تقف وراء Claude AI، والتي وجدت أنه بمجرد أن يتعلم نموذج اللغة الكبير (LLM) الخداع، تصبح أساليب التدريب الآمنة عديمة الفائدة و"من الصعب عكسها". وتعتقد المجموعة أن هذه مشكلة مثيرة للقلق في مجال الذكاء الاصطناعي.
وتم نشر نتائج أبحاث الفريق في مجلة Cell Press - وهي مجموعة من التقارير العلمية متعددة التخصصات الرائدة.
ولم تعلق شركة Meta وOpenAI على نتائج هذا البحث.
وخوفا من أن تشكل أنظمة الذكاء الاصطناعي مخاطر كبيرة، دعا الفريق أيضا صناع السياسات إلى إدخال لوائح أقوى للذكاء الاصطناعي.
وبحسب فريق البحث، هناك حاجة إلى لوائح الذكاء الاصطناعي، وإجبار النماذج ذات السلوك الاحتيالي على الامتثال لمتطلبات تقييم المخاطر، والرقابة الصارمة على أنظمة الذكاء الاصطناعي ومخرجاتها. إذا لزم الأمر، قد يكون من الضروري حذف كافة البيانات وإعادة التدريب من البداية.