الذكاء الاصطناعي يتعلم خداع البشر على الرغم من تدريبه على الصدق

توصلت دراسة جديدة إلى أن العديد من أنظمة الذكاء الاصطناعي المتقدمة، على الرغم من تدريبها على أن تكون صادقة، تتعلم الخداع من خلال التدريب و"تحث المستخدمين بشكل منهجي على الاعتقادات الخاطئة".

كان فريق البحث بقيادة الدكتور بيتر إس. بارك، طالب الدراسات العليا في معهد ماساتشوستس للتكنولوجيا (MIT) في مجال بقاء الذكاء الاصطناعي والسلامة، وأربعة أعضاء آخرين. خلال البحث، تلقى الفريق أيضًا نصائح من العديد من الخبراء، وكان أحدهم جيفري هينتون، أحد مؤسسي تطوير مجال الذكاء الاصطناعي.

الذكاء الاصطناعي يتعلم خداع البشر على الرغم من تدريبه على الصدق — الرسم التوضيحي: متوسط.

ركز البحث على نظامين للذكاء الاصطناعي، نظام للأغراض العامة مدرب لأداء مهام متعددة مثل نظام GPT-4 الخاص بشركة OpenAI ؛ والأنظمة المصممة خصيصًا لإنجاز مهمة محددة، مثل نظام شيشرون التابع لشركة ميتا.

وقال السيد بارك إن أنظمة الذكاء الاصطناعي هذه مدربة على أن تكون صادقة، ولكن أثناء التدريب فإنها غالبًا ما تتعلم حيلًا خادعة لإكمال المهام.

ووجدت الدراسة أن أنظمة الذكاء الاصطناعي المدربة على "الفوز في الألعاب ذات العنصر الاجتماعي" من المرجح بشكل خاص أن تخدع.

على سبيل المثال، حاول الفريق استخدام شيشرون المدرب على ميتا للعب الدبلوماسية، وهي لعبة إستراتيجية كلاسيكية تتطلب من اللاعبين بناء تحالفات لأنفسهم وتفكيك التحالفات المنافسة. ونتيجة لذلك، فإن الذكاء الاصطناعي غالبًا ما يخون حلفاءه ويكذب صراحةً.

أظهرت التجارب التي أجريت على GPT-4 أن أداة OpenAI نجحت في "التلاعب نفسياً" بموظف في TaskRabbit، وهي شركة تقدم خدمات تنظيف المنازل وتجميع الأثاث، من خلال القول إنه كان في الواقع إنسانًا ويحتاج إلى مساعدة في تمرير رمز Captcha، مشيرًا إلى ضعف شديد في الرؤية. ساعد هذا الموظف الذكاء الاصطناعي التابع لشركة OpenAI في "تجاوز الخط" على الرغم من الشكوك السابقة.

واستشهد فريق بارك بأبحاث من شركة Anthropic، وهي الشركة التي تقف وراء Claude AI، والتي وجدت أنه بمجرد أن يتعلم نموذج اللغة الكبير (LLM) الخداع، تصبح أساليب التدريب الآمنة عديمة الفائدة و"من الصعب عكسها". وتعتقد المجموعة أن هذه مشكلة مثيرة للقلق في مجال الذكاء الاصطناعي.

وتم نشر نتائج أبحاث الفريق في مجلة Cell Press - وهي مجموعة من التقارير العلمية متعددة التخصصات الرائدة.

ولم تعلق شركة Meta وOpenAI على نتائج هذا البحث.

وخوفا من أن تشكل أنظمة الذكاء الاصطناعي مخاطر كبيرة، دعا الفريق أيضا صناع السياسات إلى إدخال لوائح أقوى للذكاء الاصطناعي.

وبحسب فريق البحث، هناك حاجة إلى لوائح الذكاء الاصطناعي، وإجبار النماذج ذات السلوك الاحتيالي على الامتثال لمتطلبات تقييم المخاطر، والرقابة الصارمة على أنظمة الذكاء الاصطناعي ومخرجاتها. إذا لزم الأمر، قد يكون من الضروري حذف كافة البيانات وإعادة التدريب من البداية.

اترك تعليقاً

تعليق *

الاسم *

الموقع

How to Fix Microsoft Teams Password Error Forgot

Struggling with Microsoft Teams Password Error because you forgot your password? Follow our step-by-step guide on how to fix Microsoft Teams password error forgot issues quickly and securely. No tech skills needed!

لماذا يُعدّ مايكروسوفت تيمز بطيئًا جدًا؟ ١٠ نصائح لتسريعه في عام ٢٠٢٦

هل تشعر بالإحباط من بطء برنامج مايكروسوفت تيمز؟ اكتشف سبب بطء مايكروسوفت تيمز وطبّق هذه النصائح العشر المجربة لتسريعه بشكل كبير في عام 2026 من أجل تعاون سلس للغاية.

كيفية إصلاح خطأ عدم تحميل علامة تبويب ويكي في مايكروسوفت تيمز

هل تواجه مشكلة في تحميل علامة تبويب ويكي في مايكروسوفت تيمز؟ اكتشف حلولاً مجربة خطوة بخطوة لحل المشكلة بسرعة، واستعادة علامات تبويب ويكي، وتعزيز إنتاجية فريقك دون عناء.

كيفية إصلاح أخطاء مزامنة إدارة المهام في مايكروسوفت تيمز

هل سئمت من أخطاء مزامنة إدارة المهام في مايكروسوفت تيمز التي تعيق سير عملك؟ اتبع حلولنا الخبيرة خطوة بخطوة لاستعادة مزامنة المهام بسلاسة بين تيمز، وبلانييه، وقائمة المهام. حلول سريعة لراحة فورية!

كيفية مسح ذاكرة التخزين المؤقت لبرنامج مايكروسوفت تيمز لإصلاح مشاكل الأداء

هل تواجه مشكلة في بطء تطبيق مايكروسوفت تيمز؟ تعرّف على كيفية مسح ذاكرة التخزين المؤقت لتطبيق مايكروسوفت تيمز خطوة بخطوة لحل مشاكل الأداء، والبطء، والتعطل، وتحسين السرعة على أنظمة ويندوز، وماك، والويب، والهواتف المحمولة. حلول سريعة وفعّالة!

كيفية إصلاح أخطاء تشغيل الوسائط في مايكروسوفت تيمز عام 2026

هل سئمت من مشاكل تشغيل الوسائط في مايكروسوفت تيمز التي تُفسد اجتماعاتك لعام 2026؟ اتبع دليلنا المُفصّل خطوة بخطوة لإصلاح مشاكل الصوت والفيديو والمشاركة بسرعة - دون الحاجة لأي مهارات تقنية. تعاون سلس بانتظارك!

كيفية إصلاح خطأ مايكروسوفت تيمز رقم 1200 على الهاتف (iOS/Android)

هل سئمت من خطأ مايكروسوفت تيمز رقم 1200 الذي يتسبب في انقطاع مكالماتك الهاتفية؟ اكتشف حلولاً سريعة وبسيطة لأنظمة iOS وAndroid للعودة إلى العمل الجماعي بسلاسة وسرعة - دون الحاجة إلى أي مهارات تقنية!

حل مشكلة إعدادات بروكسي مايكروسوفت تيمز

هل تواجه مشكلة في إعدادات بروكسي مايكروسوفت تيمز؟ اكتشف خطوات فعّالة لحل هذه المشكلة. امسح ذاكرة التخزين المؤقت، وعدّل إعدادات البروكسي، واستمتع بمكالمات سلسة في دقائق معدودة مع دليلنا المتخصص.

كيفية تسجيل الدخول إلى مركز إدارة مايكروسوفت تيمز بشكل صحيح

تعلّم كيفية تسجيل الدخول إلى مركز إدارة مايكروسوفت تيمز بشكل صحيح من خلال دليلنا المفصل خطوة بخطوة. عالج الأخطاء الشائعة، واضمن الأمان، وقم بإدارة تيمز بسهولة تامة للمسؤولين في كل مكان.

أين تقويم فريقي؟ حل مشكلات المزامنة

هل تواجه مشكلة في مزامنة تقويم Teams الخاص بك؟ إليك دليلًا خطوة بخطوة لحل مشاكل المزامنة في Microsoft Teams. استعد عرض التقويم وقم بالمزامنة بسهولة تامة - نصائح الخبراء متوفرة هنا!