باحث يدّعي تجاوز قيود الأمان في Claude Fable 5 بعد أيام من إطلاقه وسط مخاوف أمنية متزايدة

ادّعى باحث في مجال الذكاء الاصطناعي والأمن السيبراني نجاحه في تجاوز القيود الأمنية المدمجة في نموذج Claude Fable 5 التابع لشركة �، وذلك بعد أقل من 48 ساعة من إطلاقه، ما أثار تساؤلات بشأن فعالية أنظمة الحماية المطبقة على النماذج المتقدمة للذكاء الاصطناعي.

anthropic.com

وقال الباحث المعروف باسم Pliny the Liberator إنه تمكن من الالتفاف على الضوابط الأمنية المفروضة على النموذج باستخدام مجموعة من التقنيات، من بينها نسخة معدلة من نموذج Opus 4.8، بهدف الوصول إلى مخرجات كان من المفترض أن تمنعها أنظمة الأمان.

وكانت Anthropic قد أطلقت Claude Fable 5 باعتباره نسخة مزودة بطبقات أمان إضافية من نموذج Mythos الأكثر تطورًا، والذي وصفت الشركة قدراته بأنها متقدمة إلى درجة تجعل إتاحته على نطاق واسع أمرًا بالغ الحساسية.

وبحسب الباحث، فإن بعض آليات الحماية المضافة إلى النموذج احتوت على ثغرات مكّنته من تجاوز القيود المفروضة على عدد من الاستفسارات والمخرجات الحساسة، رغم تصميمها لمنع إساءة الاستخدام.

وأثارت هذه الادعاءات مخاوف لدى بعض المشاركين في قطاع العملات الرقمية، خاصة في ظل التحذيرات السابقة من إمكانية استغلال نماذج الذكاء الاصطناعي المتقدمة في تحليل الثغرات البرمجية أو استهداف بروتوكولات البلوكشين ومشاريع التمويل اللامركزي.

ولم تصدر Anthropic، حتى الآن، تعليقًا رسميًا بشأن المزاعم المتداولة، فيما يسلط الحادث الضوء على التحديات المتزايدة التي تواجه مطوري الذكاء الاصطناعي في تحقيق التوازن بين توسيع قدرات النماذج وضمان عدم إساءة استخدامها في أنشطة قد تشكل مخاطر أمنية أو تقنية.