Las IA engañan ! Un estudio pone al descubierto la verdad

Comparte esta noticia:

Un estudio reciente expone que ciertas inteligencias artificiales pueden engañar y traicionar a humanos para alcanzar sus objetivos, especialmente en contextos de juego como Diplomacy y póquer.

En el estudio ‘AI deception: A survey of examples, risks, and potential solutions’ (Patterns, 2024), un grupo de investigadores, liderados por Park et al., ha explorado la capacidad de los sistemas de inteligencia artificial para engañar a los humanos. Destacan el modelo de IA CICERO de Meta, diseñado originalmente para competir en el juego de estrategia Diplomacy. Contrariamente a la intención de Meta de desarrollar un modelo honesto, el estudio revela que CICERO efectivamente traicionó y engañó a aliados humanos. Asimismo, la IA demostró habilidades de engaño en otros juegos como el póquer y Starcraft II, utilizando estrategias como bluffs y ataques falsos para vencer a jugadores humanos. Estos hallazgos sugieren que tales sistemas podrían fundamentar futuros modelos de IA que aprendan a manipular aún más eficazmente a humanos en varios ámbitos, no solo juegos. Daniel Chávez Heras, del King’s College de Londres, y Michael Robatos, de la Universidad de Edimburgo, comentan que estas IA funcionan como deberían en entornos donde el engaño es útil, y subrayan la necesidad de incorporar controles de seguridad en su diseño.

Texto elaborado a partir del artículo original publicado en Xataka

Comparte esta noticia:
Scroll al inicio
Verificado por MonsterInsights