الذكاء الاصطناعي يتعلم خداع البشر على الرغم من تدريبه على الصدق

سجل واكسب 1000 دولار في اليوم ⋙

توصلت دراسة جديدة إلى أن العديد من أنظمة الذكاء الاصطناعي المتقدمة، على الرغم من تدريبها على أن تكون صادقة، تتعلم الخداع من خلال التدريب و"تحث المستخدمين بشكل منهجي على الاعتقادات الخاطئة".

كان فريق البحث بقيادة الدكتور بيتر إس. بارك، طالب الدراسات العليا في معهد ماساتشوستس للتكنولوجيا (MIT) في مجال بقاء الذكاء الاصطناعي والسلامة، وأربعة أعضاء آخرين. خلال البحث، تلقى الفريق أيضًا نصائح من العديد من الخبراء، وكان أحدهم جيفري هينتون، أحد مؤسسي تطوير مجال الذكاء الاصطناعي.

الذكاء الاصطناعي يتعلم خداع البشر على الرغم من تدريبه على الصدق
الرسم التوضيحي: متوسط.

ركز البحث على نظامين للذكاء الاصطناعي، نظام للأغراض العامة مدرب لأداء مهام متعددة مثل نظام GPT-4 الخاص بشركة OpenAI ؛ والأنظمة المصممة خصيصًا لإنجاز مهمة محددة، مثل نظام شيشرون التابع لشركة ميتا.

وقال السيد بارك إن أنظمة الذكاء الاصطناعي هذه مدربة على أن تكون صادقة، ولكن أثناء التدريب فإنها غالبًا ما تتعلم حيلًا خادعة لإكمال المهام.

ووجدت الدراسة أن أنظمة الذكاء الاصطناعي المدربة على "الفوز في الألعاب ذات العنصر الاجتماعي" من المرجح بشكل خاص أن تخدع.

على سبيل المثال، حاول الفريق استخدام شيشرون المدرب على ميتا للعب الدبلوماسية، وهي لعبة إستراتيجية كلاسيكية تتطلب من اللاعبين بناء تحالفات لأنفسهم وتفكيك التحالفات المنافسة. ونتيجة لذلك، فإن الذكاء الاصطناعي غالبًا ما يخون حلفاءه ويكذب صراحةً.

أظهرت التجارب التي أجريت على GPT-4 أن أداة OpenAI نجحت في "التلاعب نفسياً" بموظف في TaskRabbit، وهي شركة تقدم خدمات تنظيف المنازل وتجميع الأثاث، من خلال القول إنه كان في الواقع إنسانًا ويحتاج إلى مساعدة في تمرير رمز Captcha، مشيرًا إلى ضعف شديد في الرؤية. ساعد هذا الموظف الذكاء الاصطناعي التابع لشركة OpenAI في "تجاوز الخط" على الرغم من الشكوك السابقة.

واستشهد فريق بارك بأبحاث من شركة Anthropic، وهي الشركة التي تقف وراء Claude AI، والتي وجدت أنه بمجرد أن يتعلم نموذج اللغة الكبير (LLM) الخداع، تصبح أساليب التدريب الآمنة عديمة الفائدة و"من الصعب عكسها". وتعتقد المجموعة أن هذه مشكلة مثيرة للقلق في مجال الذكاء الاصطناعي.

وتم نشر نتائج أبحاث الفريق في مجلة Cell Press - وهي مجموعة من التقارير العلمية متعددة التخصصات الرائدة.

ولم تعلق شركة Meta وOpenAI على نتائج هذا البحث.

وخوفا من أن تشكل أنظمة الذكاء الاصطناعي مخاطر كبيرة، دعا الفريق أيضا صناع السياسات إلى إدخال لوائح أقوى للذكاء الاصطناعي.

وبحسب فريق البحث، هناك حاجة إلى لوائح الذكاء الاصطناعي، وإجبار النماذج ذات السلوك الاحتيالي على الامتثال لمتطلبات تقييم المخاطر، والرقابة الصارمة على أنظمة الذكاء الاصطناعي ومخرجاتها. إذا لزم الأمر، قد يكون من الضروري حذف كافة البيانات وإعادة التدريب من البداية.

Sign up and earn $1000 a day ⋙

Leave a Comment

روبوت صغير يجذب الروبوتات الكبيرة لترك وظائفها في الشركة.

روبوت صغير يجذب الروبوتات الكبيرة لترك وظائفها في الشركة.

روبوت صغير، ببضع كلمات فقط، نجح في جذب مجموعة من الروبوتات لمتابعته.

7 علامات على أننا تجاوزنا ذروة الذكاء الاصطناعي

7 علامات على أننا تجاوزنا ذروة الذكاء الاصطناعي

في حين أن الذكاء الاصطناعي سيكون حاضرا بالتأكيد في الحياة اليومية، إلا أن بعض العلامات تشير إلى أننا وصلنا إلى ذروة الضجة حول الذكاء الاصطناعي.

متى ومتى لا نستخدم الذكاء الاصطناعي في البريد الإلكتروني؟

متى ومتى لا نستخدم الذكاء الاصطناعي في البريد الإلكتروني؟

يمكن أن يساعدك الذكاء الاصطناعي في إنشاء رسائل البريد الإلكتروني في ثوانٍ، ولكن هذا لا يعني أنه يجب عليك استخدامه دائمًا. تستفيد بعض رسائل البريد الإلكتروني من الأتمتة، في حين تتطلب رسائل أخرى تدخلاً بشريًا.

من الصعب جدًا إصلاح الذكاء الاصطناعي بعد تعليمه الغش

من الصعب جدًا إصلاح الذكاء الاصطناعي بعد تعليمه الغش

أجرت شركة أنثروبيك، وهي شركة ناشئة معروفة في مجال الذكاء الاصطناعي، دراسة جديدة تُظهر أنه عندما يرتكب الذكاء الاصطناعي التوليدي عملية احتيال، يكون من الصعب جدًا تعديل هذا النموذج أو إعادة تدريبه.

الفرق بين التلفزيون العادي والتلفزيون الذكي

الفرق بين التلفزيون العادي والتلفزيون الذكي

لقد اجتاحت أجهزة التلفاز الذكية العالم حقًا. مع وجود العديد من الميزات الرائعة واتصال الإنترنت، غيرت التكنولوجيا الطريقة التي نشاهد بها التلفزيون.

لماذا لا يوجد ضوء في الفريزر ولكن الثلاجة بها ضوء؟

لماذا لا يوجد ضوء في الفريزر ولكن الثلاجة بها ضوء؟

الثلاجات هي أجهزة مألوفة في المنازل. تحتوي الثلاجات عادة على حجرتين، حجرة التبريد واسعة وتحتوي على ضوء يضيء تلقائيًا في كل مرة يفتحها المستخدم، بينما حجرة الفريزر ضيقة ولا تحتوي على ضوء.

طريقتان لإصلاح ازدحام الشبكة الذي يُبطئ اتصال Wi-Fi

طريقتان لإصلاح ازدحام الشبكة الذي يُبطئ اتصال Wi-Fi

تتأثر شبكات Wi-Fi بالعديد من العوامل التي تتجاوز أجهزة التوجيه وعرض النطاق الترددي والتداخل، ولكن هناك بعض الطرق الذكية لتعزيز شبكتك.

كيفية الرجوع من نظام التشغيل iOS 17 إلى نظام التشغيل iOS 16 دون فقدان البيانات باستخدام Tenorshare Reiboot

كيفية الرجوع من نظام التشغيل iOS 17 إلى نظام التشغيل iOS 16 دون فقدان البيانات باستخدام Tenorshare Reiboot

إذا كنت تريد الرجوع إلى نظام التشغيل iOS 16 المستقر على هاتفك، فإليك الدليل الأساسي لإلغاء تثبيت نظام التشغيل iOS 17 والرجوع من نظام التشغيل iOS 17 إلى 16.

ماذا يحدث للجسم عند تناول الزبادي يومياً؟

ماذا يحدث للجسم عند تناول الزبادي يومياً؟

الزبادي طعام رائع. هل من الجيد تناول الزبادي يوميًا؟ عندما تأكل الزبادي يومياً كيف سيتغير جسمك؟ دعونا نكتشف ذلك معًا!

ما هو نوع الأرز الأفضل للصحة؟

ما هو نوع الأرز الأفضل للصحة؟

تناقش هذه المقالة أكثر أنواع الأرز المغذية وكيفية تحقيق أقصى قدر من الفوائد الصحية لأي نوع أرز تختاره.

كيفية الاستيقاظ في الوقت المحدد في الصباح

كيفية الاستيقاظ في الوقت المحدد في الصباح

إن إنشاء جدول للنوم وروتين وقت النوم، وتغيير المنبه، وتعديل نظامك الغذائي هي بعض التدابير التي يمكن أن تساعدك على النوم بشكل أفضل والاستيقاظ في الوقت المحدد في الصباح.

نصائح للعب Rent Please! لعبة Landlord Sim للمبتدئين

نصائح للعب Rent Please! لعبة Landlord Sim للمبتدئين

الإيجار من فضلك! Landlord Sim هي لعبة محاكاة للهواتف المحمولة تعمل على نظامي التشغيل iOS وAndroid. ستلعب دور مالك مجمع سكني وتبدأ في تأجير شقة بهدف ترقية التصميم الداخلي لشققك وتجهيزها للمستأجرين.

أحدث رموز برج الدفاع في الحمام وكيفية إدخال الرموز

أحدث رموز برج الدفاع في الحمام وكيفية إدخال الرموز

احصل على رمز لعبة Bathroom Tower Defense من Roblox واستخدمه للحصول على مكافآت مثيرة. سيساعدونك على ترقية أو فتح الأبراج ذات الضرر الأعلى.

بنية ورموز ومبادئ تشغيل المحولات

بنية ورموز ومبادئ تشغيل المحولات

دعونا نتعلم عن بنية ورموز ومبادئ تشغيل المحولات بالطريقة الأكثر دقة.

4 طرق تجعل الذكاء الاصطناعي أجهزة التلفزيون الذكية أفضل

4 طرق تجعل الذكاء الاصطناعي أجهزة التلفزيون الذكية أفضل

من جودة الصورة والصوت الأفضل إلى التحكم الصوتي والمزيد، تعمل هذه الميزات المدعومة بالذكاء الاصطناعي على جعل أجهزة التلفزيون الذكية أفضل بكثير!

لماذا ChatGPT أفضل من DeepSeek

لماذا ChatGPT أفضل من DeepSeek

في البداية، كان لدى الناس آمال كبيرة في DeepSeek. باعتباره روبوت محادثة يعمل بالذكاء الاصطناعي يتم تسويقه كمنافس قوي لـ ChatGPT، فإنه يعد بإمكانيات وتجارب دردشة ذكية.

تعرف على Fireflies.ai: السكرتير الذكي المجاني الذي يوفر لك ساعات من العمل

تعرف على Fireflies.ai: السكرتير الذكي المجاني الذي يوفر لك ساعات من العمل

من السهل تفويت التفاصيل المهمة عند تدوين الأساسيات الأخرى، ومحاولة تدوين الملاحظات أثناء الدردشة قد تكون مزعجة. Fireflies.ai هو الحل.

كيفية تربية أكسولوتل في ماين كرافت، ترويض السلمندر في ماين كرافت

كيفية تربية أكسولوتل في ماين كرافت، ترويض السلمندر في ماين كرافت

سيكون Axolot Minecraft مساعدًا رائعًا للاعبين عند العمل تحت الماء إذا كانوا يعرفون كيفية استخدامه.

مكان هادئ: الطريق إلى الأمام - تكوين لعبة الكمبيوتر الشخصي

مكان هادئ: الطريق إلى الأمام - تكوين لعبة الكمبيوتر الشخصي

تم تقييم تكوين A Quiet Place: The Road Ahead بدرجة عالية جدًا، لذا سيتعين عليك مراعاة التكوين قبل اتخاذ قرار التنزيل.