الذكاء الاصطناعي يتعلم خداع البشر على الرغم من تدريبه على الصدق

سجل واكسب 1000 دولار في اليوم ⋙

توصلت دراسة جديدة إلى أن العديد من أنظمة الذكاء الاصطناعي المتقدمة، على الرغم من تدريبها على أن تكون صادقة، تتعلم الخداع من خلال التدريب و"تحث المستخدمين بشكل منهجي على الاعتقادات الخاطئة".

كان فريق البحث بقيادة الدكتور بيتر إس. بارك، طالب الدراسات العليا في معهد ماساتشوستس للتكنولوجيا (MIT) في مجال بقاء الذكاء الاصطناعي والسلامة، وأربعة أعضاء آخرين. خلال البحث، تلقى الفريق أيضًا نصائح من العديد من الخبراء، وكان أحدهم جيفري هينتون، أحد مؤسسي تطوير مجال الذكاء الاصطناعي.

الذكاء الاصطناعي يتعلم خداع البشر على الرغم من تدريبه على الصدق
الرسم التوضيحي: متوسط.

ركز البحث على نظامين للذكاء الاصطناعي، نظام للأغراض العامة مدرب لأداء مهام متعددة مثل نظام GPT-4 الخاص بشركة OpenAI ؛ والأنظمة المصممة خصيصًا لإنجاز مهمة محددة، مثل نظام شيشرون التابع لشركة ميتا.

وقال السيد بارك إن أنظمة الذكاء الاصطناعي هذه مدربة على أن تكون صادقة، ولكن أثناء التدريب فإنها غالبًا ما تتعلم حيلًا خادعة لإكمال المهام.

ووجدت الدراسة أن أنظمة الذكاء الاصطناعي المدربة على "الفوز في الألعاب ذات العنصر الاجتماعي" من المرجح بشكل خاص أن تخدع.

على سبيل المثال، حاول الفريق استخدام شيشرون المدرب على ميتا للعب الدبلوماسية، وهي لعبة إستراتيجية كلاسيكية تتطلب من اللاعبين بناء تحالفات لأنفسهم وتفكيك التحالفات المنافسة. ونتيجة لذلك، فإن الذكاء الاصطناعي غالبًا ما يخون حلفاءه ويكذب صراحةً.

أظهرت التجارب التي أجريت على GPT-4 أن أداة OpenAI نجحت في "التلاعب نفسياً" بموظف في TaskRabbit، وهي شركة تقدم خدمات تنظيف المنازل وتجميع الأثاث، من خلال القول إنه كان في الواقع إنسانًا ويحتاج إلى مساعدة في تمرير رمز Captcha، مشيرًا إلى ضعف شديد في الرؤية. ساعد هذا الموظف الذكاء الاصطناعي التابع لشركة OpenAI في "تجاوز الخط" على الرغم من الشكوك السابقة.

واستشهد فريق بارك بأبحاث من شركة Anthropic، وهي الشركة التي تقف وراء Claude AI، والتي وجدت أنه بمجرد أن يتعلم نموذج اللغة الكبير (LLM) الخداع، تصبح أساليب التدريب الآمنة عديمة الفائدة و"من الصعب عكسها". وتعتقد المجموعة أن هذه مشكلة مثيرة للقلق في مجال الذكاء الاصطناعي.

وتم نشر نتائج أبحاث الفريق في مجلة Cell Press - وهي مجموعة من التقارير العلمية متعددة التخصصات الرائدة.

ولم تعلق شركة Meta وOpenAI على نتائج هذا البحث.

وخوفا من أن تشكل أنظمة الذكاء الاصطناعي مخاطر كبيرة، دعا الفريق أيضا صناع السياسات إلى إدخال لوائح أقوى للذكاء الاصطناعي.

وبحسب فريق البحث، هناك حاجة إلى لوائح الذكاء الاصطناعي، وإجبار النماذج ذات السلوك الاحتيالي على الامتثال لمتطلبات تقييم المخاطر، والرقابة الصارمة على أنظمة الذكاء الاصطناعي ومخرجاتها. إذا لزم الأمر، قد يكون من الضروري حذف كافة البيانات وإعادة التدريب من البداية.

Sign up and earn $1000 a day ⋙

Leave a Comment

روبوت صغير يجذب الروبوتات الكبيرة لترك وظائفها في الشركة.

روبوت صغير يجذب الروبوتات الكبيرة لترك وظائفها في الشركة.

روبوت صغير، ببضع كلمات فقط، نجح في جذب مجموعة من الروبوتات لمتابعته.

7 علامات على أننا تجاوزنا ذروة الذكاء الاصطناعي

7 علامات على أننا تجاوزنا ذروة الذكاء الاصطناعي

في حين أن الذكاء الاصطناعي سيكون حاضرا بالتأكيد في الحياة اليومية، إلا أن بعض العلامات تشير إلى أننا وصلنا إلى ذروة الضجة حول الذكاء الاصطناعي.

متى ومتى لا نستخدم الذكاء الاصطناعي في البريد الإلكتروني؟

متى ومتى لا نستخدم الذكاء الاصطناعي في البريد الإلكتروني؟

يمكن أن يساعدك الذكاء الاصطناعي في إنشاء رسائل البريد الإلكتروني في ثوانٍ، ولكن هذا لا يعني أنه يجب عليك استخدامه دائمًا. تستفيد بعض رسائل البريد الإلكتروني من الأتمتة، في حين تتطلب رسائل أخرى تدخلاً بشريًا.

من الصعب جدًا إصلاح الذكاء الاصطناعي بعد تعليمه الغش

من الصعب جدًا إصلاح الذكاء الاصطناعي بعد تعليمه الغش

أجرت شركة أنثروبيك، وهي شركة ناشئة معروفة في مجال الذكاء الاصطناعي، دراسة جديدة تُظهر أنه عندما يرتكب الذكاء الاصطناعي التوليدي عملية احتيال، يكون من الصعب جدًا تعديل هذا النموذج أو إعادة تدريبه.

كيفية استخدام تطبيق CK Club التابع لـ Circle K لتلقي عروض جذابة

كيفية استخدام تطبيق CK Club التابع لـ Circle K لتلقي عروض جذابة

للحصول على أسرع المعلومات الترويجية من Circle K، يجب عليك تثبيت تطبيق CK Club. يقوم التطبيق بحفظ المدفوعات عند التسوق أو الدفع في Circle K بالإضافة إلى عدد الطوابع المجمعة.

إنستغرام سيسمح بإنشاء مقاطع فيديو تصل مدتها إلى 3 دقائق

إنستغرام سيسمح بإنشاء مقاطع فيديو تصل مدتها إلى 3 دقائق

أعلنت شركة إنستغرام للتو أنها ستسمح للمستخدمين بنشر مقاطع فيديو Reels تصل مدتها إلى 3 دقائق، وهو ضعف الحد السابق البالغ 90 ثانية.

كيفية عرض معلومات وحدة المعالجة المركزية لجهاز Chromebook

كيفية عرض معلومات وحدة المعالجة المركزية لجهاز Chromebook

سترشدك هذه المقالة إلى كيفية عرض معلومات وحدة المعالجة المركزية والتحقق من سرعة وحدة المعالجة المركزية مباشرة على جهاز Chromebook الخاص بك.

8 أشياء رائعة يمكنك القيام بها باستخدام جهازك اللوحي القديم الذي يعمل بنظام Android

8 أشياء رائعة يمكنك القيام بها باستخدام جهازك اللوحي القديم الذي يعمل بنظام Android

إذا كنت لا ترغب في بيع جهازك اللوحي القديم أو التبرع به، فيمكنك استخدامه بخمس طرق: كإطار صور عالي الجودة، ومشغل موسيقى، وقارئ للكتب الإلكترونية والمجلات، ومساعد في الأعمال المنزلية، وكشاشة ثانوية.

كيفية الحصول على أظافر جميلة بسرعة

كيفية الحصول على أظافر جميلة بسرعة

تريدين الحصول على أظافر جميلة، لامعة، وصحية بسرعة. ستكون هذه النصائح البسيطة للحصول على أظافر جميلة مفيدة لك.

أسرار إلهام الألوان التي يعرفها المصممون فقط

أسرار إلهام الألوان التي يعرفها المصممون فقط

ستتضمن هذه المقالة نصائح مستوحاة من الألوان، يشاركها كبار المصممين من مجتمع Creative Market، حتى تتمكن من الحصول على مزيج الألوان المثالي في كل مرة.

كل ما تحتاجه لاستبدال الكمبيوتر المحمول الخاص بك بهاتف

كل ما تحتاجه لاستبدال الكمبيوتر المحمول الخاص بك بهاتف

هل يمكنك حقًا استبدال الكمبيوتر المحمول بهاتفك؟ نعم، ولكنك ستحتاج إلى الملحقات المناسبة لتحويل هاتفك إلى كمبيوتر محمول.

سيتمكن ChatGPT قريبًا من رؤية كل ما يحدث على شاشتك

سيتمكن ChatGPT قريبًا من رؤية كل ما يحدث على شاشتك

أحد الأشياء المهمة في الفيديو الكامل للحدث هو أنه تم عرض ميزة تطبيق ChatGPT القادمة ولكن لم تتم مشاركة أي تفاصيل حقيقية. تتمثل قدرة ChatGPT في رؤية كل ما يحدث على شاشة جهاز المستخدم.

الذكاء الاصطناعي يتعلم خداع البشر على الرغم من تدريبه على الصدق

الذكاء الاصطناعي يتعلم خداع البشر على الرغم من تدريبه على الصدق

توصلت دراسة جديدة إلى أن العديد من أنظمة الذكاء الاصطناعي المتقدمة، على الرغم من تدريبها على أن تكون صادقة، تتعلم الخداع من خلال التدريب وتحث المستخدمين بشكل منهجي على الاعتقادات الخاطئة.

كيفية تغيير الأسئلة على ChatGPT

كيفية تغيير الأسئلة على ChatGPT

يتوفر الآن في ChatGPT خيار تغيير السؤال حتى يتمكن المستخدمون من تحرير السؤال أو المحتوى الذي يتبادلونه مع ChatGPT.

كيفية اكتشاف رموز الاستجابة السريعة المزيفة والحفاظ على بياناتك آمنة

كيفية اكتشاف رموز الاستجابة السريعة المزيفة والحفاظ على بياناتك آمنة

قد تبدو رموز الاستجابة السريعة (QR) غير ضارة إلى حد كبير حتى تقوم بمسح رمز QR سيئ ويتم إلقاء شيء سيئ على نظامك. إذا كنت تريد الحفاظ على هاتفك وبياناتك آمنة، فهناك بعض الطرق التي يمكنك من خلالها التعرف على رموز الاستجابة السريعة المزيفة.

كوالكوم تطلق مودم X85 5G مع سلسلة من التحسينات الملحوظة

كوالكوم تطلق مودم X85 5G مع سلسلة من التحسينات الملحوظة

على خشبة المسرح في MWC 2025، حققت شركة كوالكوم ضجة كبيرة عندما قدمت الجيل الثامن من مودم 5G المسمى X85، والذي من المتوقع استخدامه في الهواتف الذكية الرائدة التي سيتم إطلاقها في وقت لاحق من هذا العام.

تقنية جديدة تتيح للهواتف تغيير اللون بمرونة

تقنية جديدة تتيح للهواتف تغيير اللون بمرونة

أنت تمتلك هاتف iPhone 16 عصري باللون "Ultramarine"، ولكن في أحد الأيام الجميلة تشعر فجأة بالملل من هذا اللون؛ ماذا ستفعل؟

قامت Microsoft بدمج DeepSeek في منصة PC Copilot+

قامت Microsoft بدمج DeepSeek في منصة PC Copilot+

في يناير، أعلنت شركة Microsoft عن خططها لإحضار إصدارات محسّنة من طراز DeepSeek-R1 من وحدة NPU مباشرة إلى أجهزة الكمبيوتر Copilot+ التي تعمل على معالجات Qualcomm Snapdragon X.

الفرق بين دالتي IF وSwitch في Excel

الفرق بين دالتي IF وSwitch في Excel

عبارة IF هي عبارة عن دالة منطقية شائعة في Excel. تعتبر عبارة SWITCH أقل شهرة، ولكن يمكنك استخدامها بدلاً من عبارة IF في بعض الحالات.