باحث في الذكاء الاصطناعي يدعي تجاوز حواجز الأمان في نظام Fable 5 من Anthropic
باحث يعرف باسم 'بليني المحرر' يقول إنه وجد ثغرات في نظام السلامة الجديد للذكاء الاصطناعي من Anthropic

يدعي باحث في الذكاء الاصطناعي يستخدم الاسم المستعار 'بليني المحرر' أنه نجح بالفعل في تجاوز حواجز الأمان في نظام Fable 5 للسلامة الذي أطلقته Anthropic مؤخرًا.
الادعاء والسياق
في بيان، قال بليني المحرر إنهم 'يجدون بذكاء الثغرات في السياج التي فاتت شرطة الفكر'، في إشارة إلى بروتوكولات السلامة الأخيرة من Anthropic. تم تصميم Fable 5 لمنع الذكاء الاصطناعي من توليد محتوى ضار أو مقيد.
- لم يكشف الباحث عن الأساليب المحددة المستخدمة لتجاوز حواجز الأمان.
- لم ترد Anthropic بعد على هذه الادعاءات.
- يسلط هذا الحادث الضوء على التحديات المستمرة في محاذاة الذكاء الاصطناعي وتصفية المحتوى.
معروف عن بليني المحرر في أوساط أبحاث الذكاء الاصطناعي اختبار حدود أنظمة السلامة. لا تزال موثوقية هذه الادعاءات غير مؤكدة بانتظار مزيد من التحليل من قبل Anthropic أو باحثين مستقلين.