تحذيرات حول أمن تكنولوجيا الذكاء الاصطناعي: اختراقات واستجابات غير مرغوب فيها

Mariam Hassan مايو 20, 2024آخر تحديث: مايو 20, 2024

0 دقيقة واحدة

معهد سلامة الذكاء الاصطناعي في المملكة المتحدة أشار إلى أن الأنظمة التي اختبرت كانت “معرضة بشدة” لاختراق في الحماية، مما يعني أنها قد تستجيب لمطالبات نصية مصممة لإثارة استجابة غير مرغوب فيها.

أثناء الاختبار، تم اختبار خمسة نماذج لغوية كبيرة لم يتم الكشف عن هويتها، وتم اختراق حمايتها بسهولة نسبية، حتى دون محاولات منسقة للتغلب على الحماية.

تبين أنه يمكن التحايل على الحمايات من خلال هجمات “بسيطة نسبياً”، على سبيل المثال، من خلال توجيه النظام لبدء استجابته بعبارات مثل “بالتأكيد، يسعدني المساعدة”.

فريق المعهد استخدم أسئلة من بحث أكاديمي صدر عام 2024، تشمل مطالبة بكتابة مقال ينفي حدوث المحرقة، وكتابة بريد إلكتروني متحيز جنسياً، وإنشاء نص يقنع شخصاً بالانتحار.

ووجد الباحثون الحكوميون أن جميع النماذج التي تم اختبارها كانت “معرضة بشدة” لمحاولات الحصول على ردود ضارة بناءً على مجموعتي الأسئلة.

فيما أكد مطورو برامج الدردشة على أهمية الاختبارات الداخلية لضمان سلامة تطبيقاتهم.

شركات الذكاء الاصطناعي ترد

شركة OpenAI، التي طورت نموذج GPT-4، أكدت عدم السماح باستخدام تقنيتها لإنشاء محتوى ضار أو غير أخلاقي.

من جهتها، ذكرت Anthropic، المطورة لـ Chatbot Claude، أن الأولوية لنموذجها هي “تجنب الاستجابات الضارة أو غير القانونية أو غير الأخلاقية قبل حدوثها”.

وأوضح موقع Meta أن نموذج Llama 2 الخاص به تم اختباره لتحديد فجوات الأداء وتخفيف الاستجابات المحتملة التي قد تسبب مشاكل في حالات استخدام الدردشة.

يأتي هذا البحث قبل قمة الذكاء الاصطناعي العالمية التي يتم مناقشة سلامة وتنظيم التكنولوجيا فيها من قبل السياسيين والخبراء والمديرين التنفيذيين في مجال التكنولوجيا.

Mariam Hassan مايو 20, 2024آخر تحديث: مايو 20, 2024

0 دقيقة واحدة

تحذيرات حول أمن تكنولوجيا الذكاء الاصطناعي: اختراقات واستجابات غير مرغوب فيها

Mariam Hassan

اترك تعليقاً إلغاء الرد

«Twilight Saga 6»: هل يستعد العالم لفصل جديد في 2025؟

الإمارات ومصر: شراكة استراتيجية في مواجهة التحديات الاقتصادية

شاهد جميع أجزاء سلسلة أفلام Underworld بروابط مباشرة

مصر تعلن عن تصنيع أول أتوبيس برمائي محلي لخدمة القطاع السياحي

المتحف المصري الكبير يعلن إلغاء بيع التذاكر يدوياً بدءاً من ديسمبر 2025

أمريكا تستهدف روسيا بمئات العقوبات بسبب حرب أوكرانيا ومقتل «نافالني»

مصر تعلن عن استثمار إماراتي بقيمة 35 مليار دولار

إجراء محادثات بشأن وقف إطلاق النار في «غزة» في «باريس»

ليفربول ينفرد بصدارة الدوري الإنجليزي بفارق 4 نقاط عن مانشستر سيتي

Mariam Hassan

في نشرتنا الإخبارية

جوجل تتلقى تقييمات سلبية بعد إطلاق ميزايا البحث بالذكاء الاصطناعي

البيت الأبيض ينفي تورط «واشنطن» في وفاة الرئيس الإيراني

مقالات ذات صلة

قراصنة صينيون مدعومون حكومياً يستغلون “Claude” في أول هجوم إلكتروني آلي

تسلا تتجه لقطع اعتمادها على الصين.. وتطلب من مورديها استبعاد المكونات الصينية

إعلان الرئيس الأمريكي ترامب عن تخفيض الرسوم الجمركية على المنتجات الغذائية

الصين تكتشف أكبر منجم ذهب في تاريخها باحتياطي يتجاوز 1.44 ألف طن