Recenti simulazioni dimostrano l’efficacia di MaxDiff RL, che guida sistemi fisici lasciandoli interagire liberamente con l’ambiente
Sebbene oggigiorno l’Intelligenza Artificiale (IA) si stia rapidamente diffondendo nella forma dei cosiddetti Large Language Model (LLM), come il famoso GPT o il suo rivale Gemini, lo stesso non si può dire per i robot intelligenti.
Il problema è che gli algoritmi usati per addestrare gli LLM, basati su enormi quantità di dati attentamente selezionati da esseri umani, non funzionano altrettanto bene quando l’IA è incorporata in sistemi fisici.
Ciò è vero per due motivi principali:
- I sistemi virtuali possono sfruttare il fatto di trovarsi in un mondo dove le leggi della fisica non si applicano;
- Per gli LLM un singolo fallimento non ha grosse conseguenze, mentre per un robot può essere catastrofico.
Ora però un gruppo di ingegneri meccanici della Northwestern University (USA) ha sviluppato un algoritmo di IA che sembra drasticamente migliorare le prestazioni e la sicurezza dei robot…facendoli agire in maniera casuale.
La libertà di apprendere con MaxDiff RL
Tale algoritmo, chiamato Maximum Diffusion Reinforcement Learning (MaxDiff RL), si basa infatti sul concetto di incoraggiare i robot a esplorare liberamente l’ambiente circostante, in modo da sperimentare una serie di situazioni diverse.
Questa “casualità prestabilita” consente un’acquisizione di dati sull’ambiente esterno di maggiore qualità, il che ha portato a un apprendimento più rapido ed efficiente, con prestazioni e affidabilità superiori.
A questo punto bisogna dire che i test finora sono stati effettuati solo con simulazioni al computer, in cui ai robot virtuali viene richiesto di eseguire una serie di compiti standard; in ogni caso, quelli guidati da MaxDiff RL si sono dimostrati non solo più veloci nell’imparare, ma anche più consistenti e sicuri nello svolgimento dei compiti assegnati.
La cosa più impressionante, però, è che spesso tali robot sono stati in grado di eseguire correttamente un compito al primo tentativo, perfino quando non erano stati specificamente addestrati allo scopo.
Capacità di generalizzare e possibili applicazioni
In questa capacità di generalizzare giace, infatti, il punto di forza dell’algoritmo sviluppato da Thomas A. Berrueta, Allison Pinosky e Todd D. Murphey: per applicazioni reali, dove non ci si può permettere di applicare un lento metodo di apprendimento per tentativi ed errori, si tratta indubbiamente di un enorme vantaggio.
Le possibili applicazioni sono numerose: dalla guida automatica ai droni per la consegna, passando per l’assistenza domestica e l’automazione: MaxDiff RL può infatti essere usato sia per robot mobili che stazionari.
In definitiva, i ricercatori sperano che il loro algoritmo possa contribuire a risolvere problemi basilari che al momento frenano il campo della robotica, spianando la strada per una capacità di prendere decisioni in maniera rapida, autonoma e affidabile da parte dei robot.
Non resta che attendere i primi test reali, ma le premesse affinché a breve i riflettori vengano finalmente puntati anche su sistemi fisici guidati dall’IA sembrano rosee.
(Originariamente pubblicato su Storie Semplici. Il titolo dell’autore potrebbe essere modificato dalla redazione)