La IA Puede Ser Entrenada Para el Mal Ocultando Sus Intensiones: Anthropic

jueves 18 de enero, 2024No hay comentarios

Si un modelo de lenguaje «con puerta trasera» puede engañarte una vez, es más probable que pueda engañarte en el futuro, manteniendo ocultos sus verdaderos motivos.

Comentarios

Aún no hay comentarios. ¿Por qué no comienzas el debate?

Comentarios

Deja un comentarioCancelar respuesta