Investigador de IA afirma eludir las salvaguardias de Fable 5 de Anthropic
Un investigador conocido como Pliny the Liberator dice haber encontrado vulnerabilidades en el nuevo sistema de seguridad de IA de Anthropic.

Un investigador de inteligencia artificial que utiliza el seudónimo "Pliny the Liberator" afirma haber eludido las salvaguardias del sistema de seguridad Fable 5 recién lanzado por Anthropic.
Afirmación y contexto
En un comunicado, Pliny the Liberator dijo que han estado "encontrando astutamente los agujeros en la valla que la policía del pensamiento pasó por alto", en referencia a los últimos protocolos de seguridad de Anthropic. Fable 5 está diseñado para evitar que la IA genere contenido dañino o restringido.
- El investigador no ha revelado los métodos específicos utilizados para eludir las salvaguardias.
- Anthropic aún no ha respondido a las afirmaciones.
- Este incidente resalta los desafíos continuos en la alineación de la IA y el filtrado de contenido.
Pliny the Liberator es conocido en los círculos de investigación de IA por probar los límites de los sistemas de seguridad. La fiabilidad de estas afirmaciones sigue sin verificarse a la espera de un análisis adicional por parte de Anthropic o investigadores independientes.