technology··1 분 분량
AI 연구원, Anthropic의 Fable 5 안전장치 우회 주장
'해방자 플리니'로 알려진 연구원이 Anthropic의 새로운 AI 안전 시스템에서 취약점을 발견했다고 밝혔다.

가명 '해방자 플리니'를 사용하는 인공지능 연구원이 Anthropic이 새로 출시한 Fable 5 안전 시스템의 안전장치를 이미 우회했다고 주장합니다.
주장과 맥락
성명에서 '해방자 플리니'는 '사상 경찰이 놓친 울타리의 구멍을 교묘하게 찾고 있다'고 밝혔으며, 이는 Anthropic의 최신 안전 프로토콜을 언급한 것입니다. Fable 5는 AI가 유해하거나 제한된 콘텐츠를 생성하는 것을 방지하도록 설계되었습니다.
- 연구원은 안전장치를 우회하는 데 사용된 구체적인 방법을 공개하지 않았습니다.
- Anthropic은 아직 이러한 주장에 응답하지 않았습니다.
- 이번 사건은 AI 정렬 및 콘텐츠 필터링의 지속적인 과제를 부각시킵니다.
'해방자 플리니'는 AI 연구계에서 안전 시스템의 한계를 시험하는 것으로 유명합니다. 이러한 주장의 신뢰성은 Anthropic이나 독립 연구자들의 추가 분석이 있을 때까지 확인되지 않은 상태입니다.