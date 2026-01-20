Uno studio della Anthropic mostra la capacità dell’Intelligenza artificiale di riflettere su se stessa, grazie al concept injection

L’introspezione, ossia la capacità di esaminare e riflettere sui propri pensieri, sentimenti e stati mentali, è una prerogativa finora riconosciuta esclusivamente agli esseri umani. Con l’avvento di LLM (Large Language Model) sempre più potenti e sofisticati, però, ci si è iniziati a chiedere se anche ChatGPT & co. sono in grado, almeno in parte, di fare qualcosa del genere.

La risposta a tale domanda, oltre ad aiutarci a capire meglio cosa sono e come funzionano questi sistemi, ha anche delle importanti implicazioni pratiche: se i modelli di Intelligenza Artificiale (IA) riescono a comunicare in maniera accurata i loro meccanismi interni, ciò può consentirci di comprendere come ragionano e correggere eventuali problemi comportamentali, migliorandone quindi trasparenza e affidabilità.

L’intelligenza artificiale capace di riflettere su se stessa

Ecco quindi che un ricercatore della Anthropic, i creatori dell’LLM Claude (dei cui exploit in qualità di negoziante ho di recente scritto qui), ha pensato di indagare sulla faccenda in maniera scientifica, ottenendo risultati sorprendenti: gli ultimi modelli della serie mostrano un certo livello di consapevolezza introspettiva e di controllo sui propri stati interni.

