technology·11 thg 6, 2026·1 phút đọc

Nhà nghiên cứu AI tuyên bố vượt qua được rào cản Fable 5 của Anthropic

Một nhà nghiên cứu có biệt danh Pliny the Liberator cho biết ông đã tìm ra lỗ hổng trong hệ thống an toàn AI mới của Anthropic

Một nhà nghiên cứu trí tuệ nhân tạo sử dụng bút danh "Pliny the Liberator" tuyên bố đã vượt qua được các rào cản của hệ thống an toàn Fable 5 mới ra mắt của Anthropic.

Tuyên bố và bối cảnh

Trong một tuyên bố, Pliny the Liberator cho biết họ đã "khéo léo tìm ra những lỗ hổng trong hàng rào mà cảnh sát tư tưởng đã bỏ sót," ám chỉ các giao thức an toàn mới nhất của Anthropic. Fable 5 được thiết kế để ngăn AI tạo ra nội dung có hại hoặc bị hạn chế.

Nhà nghiên cứu chưa tiết lộ phương pháp cụ thể được sử dụng để vượt qua các rào cản.
Anthropic vẫn chưa phản hồi về những tuyên bố này.
Sự việc này làm nổi bật những thách thức đang diễn ra trong việc căn chỉnh AI và lọc nội dung.

Pliny the Liberator được biết đến trong giới nghiên cứu AI vì thử nghiệm giới hạn của các hệ thống an toàn. Độ tin cậy của những tuyên bố này vẫn chưa được xác minh, cần chờ phân tích thêm từ Anthropic hoặc các nhà nghiên cứu độc lập.

#ai #safety #anthropic #fable-5 #guardrails #security

Tuyên bố và bối cảnh

Bài liên quan