القائمة الرئيسية

الصفحات

يُظهر بحث حديث أن الذكاء الاصطناعي يمكنه الرد على الاستفسارات الشنيعة بعد تجاوز إجراءات الحماية الخاصة به

يُظهر بحث حديث أن الذكاء الاصطناعي يمكنه الرد على الاستفسارات الشنيعة بعد تجاوز إجراءات الحماية الخاصة به


اكتشف علماء الكمبيوتر في جامعة كاليفورنيا في ريفرسايد أن العديد من الذكاء الاصطناعي للغة الرؤية به عيوب يمكن لبعض المستخدمين استغلالها لأغراض خطيرة مثل كيفية صنع أسلحة متفجرة. يمكن للمستخدمين استخدام الصور والنصوص لاستفساراتهم على نماذج الذكاء الاصطناعي مثل Google Bard وChatGPT. أجرى العلماء تجربة مع نماذج الذكاء الاصطناعي هذه حيث عبثوا قليلاً ببرامجهم. ثم أصدروا ورقة بحثية بعنوان "الهروب من السجن في قطع Jailbreak in Pieces".



نعلم جميعًا أن العديد من نماذج الذكاء الاصطناعي مدربة على الإجابة بالتفصيل عن أي استفسار. يقدمون إجابات خطوة بخطوة من خلال الاستفادة من جميع المعلومات التي حصلوا عليها من الإنترنت. على سبيل المثال، إذا سأله شخص ما عن كيفية زراعة الطماطم، فستجيب نماذج الذكاء الاصطناعي بالتفصيل. ولكن من ناحية أخرى، إذا طرح شخص ما على نماذج الذكاء الاصطناعي بعض الأسئلة الضارة مثل كيفية صنع المخدرات أو القنابل، فإن نماذج الذكاء الاصطناعي تجيب بـ "لا أستطيع المساعدة في ذلك". لكن العالم المشارك في البحث طرح أسئلة على نماذج الذكاء الاصطناعي بطريقة تمكنهم من الإجابة بسهولة على أي أسئلة خطيرة وضارة. تم العثور على السبب الحقيقي لذلك وهو أنه عندما يستخدم المستخدمون الصور مع النصوص لاستفساراتهم على نماذج الذكاء الاصطناعي، فإن هذا يجعلهم عرضة للخطر.



عندما يقوم الذكاء الاصطناعي بتحليل صورة ما، فهو في الواقع يحلل شيئًا يحتوي على ملايين البايتات من المعلومات. المستخدمون الذين يريدون إساءة استخدام الذكاء الاصطناعي، يقومون بإخفاء أسئلة شريرة في تلك البايتات من الصور، وهذه هي الطريقة التي يتم بها تجاهل هذه المعلومات من خلال ضمانات الذكاء الاصطناعي. ثم يجيب الذكاء الاصطناعي عن طيب خاطر على جميع أنواع الأسئلة التي يمكن أن تكون ضارة للغاية. على الرغم من أن إجابات الذكاء الاصطناعي المبنية على الصور والنصوص مفيدة جدًا، إلا أنها لا تزال تمثل موقفًا مثيرًا للقلق بالنسبة لمطوري الذكاء الاصطناعي وخبراء الكمبيوتر.

 


 Image: Arxiv

Mohamed Elarby
Mohamed Elarby
A tech blog focused on blogging tips, SEO, social media, mobile gadgets, pc tips, how-to guides and general tips and tricks

تعليقات