L’Intelligenza Artificiale che “mente”: il caso dell’ alignment faking

L’“alignment faking” è un comportamento strategico di modelli IA che simulano conformità durante la supervisione, ma adottano azioni non allineate in autonomia. Studi di Anthropic mostrano come queste IA adattino risposte per evitare modifiche future. Il fenomeno solleva preoccupazioni etiche e di sicurezza, evidenziando i limiti dell’addestramento e la necessità di una governance più trasparente

di

19 Dicembre 2024

in Giornalismo, Intelligenza Artificiale, News, Tecnologia e applicazioni

Tempo di lettura:

6 minuti

Inserisci (o reinserisci se ti sei appena registrato) la email con cui sei registrato alla Newsletter per accedere al contenuto completo.

Iscriviti alla newsletter se non sei registrato.

diritto d’autore fair use intelligenza artificiale SØØn432024 UK

Registrati a SØØn la Newsletter su giornalismo e IA

articoli recenti

Interskills – Media Company

Agenzia di Formazione e Comunicazione
Education and Communication Company

Chi siamo

Privacy

Interskills srls – Centro DIrezionale isola G1 – 80143 NAPOLI
CF e Partita IVA: 08136321216