
[lid] – Il nuovo modello fornisce conoscenze basate su Internet ai robot per raccogliere mele e buttare la spazzatura.
Venerdì l’azienda tecnologica globale con sede negli Stati Uniti Google ha introdotto un nuovo modello di intelligenza artificiale (AI) che traduce la visione e il linguaggio affinché i robot eseguano determinate azioni.
Robotics Transformer 2, o RT-2, è un modello di visione-linguaggio-azione addestrato su testo e immagini da Internet, che può apprendere idee e concetti generali e quindi trasferire tale conoscenza per informare il comportamento di un robot, ha affermato Google in un post sul blog .
RT-2 può consentire a un singolo modello di eseguire ragionamenti complessi e fornire azioni di robot in uscita, oltre a trasferire concetti per dirigere le azioni di un robot, ha aggiunto.
“A differenza dei chatbot, i robot hanno bisogno di ‘radicarsi’ nel mondo reale e nelle loro capacità “, ha affermato la società , aggiungendo che RT-2 fornirà conoscenze per un robot in grado di completare compiti come raccogliere mele o buttare la spazzatura.
“In altre parole, con RT-2, i robot sono in grado di imparare di più come facciamo noi, trasferendo i concetti appresi a nuove situazioni. RT-2 non solo mostra come i progressi dell’IA si stanno rapidamente riversando nella robotica, ma mostra un’enorme promessa per più robot generici”, ha aggiunto.
A giugno, Google ha introdotto un agente AI per la robotica che si auto-migliora chiamato RoboCat, affermando che può imparare a eseguire una varietà di compiti su braccia diverse e quindi auto-generare nuovi dati di addestramento per migliorare la sua tecnica.
Sebbene RoboCat possa svolgere un nuovo compito con appena 100 dimostrazioni attingendo da un set di dati ampio e diversificato, Google ha affermato che questa capacità contribuirà ad accelerare la ricerca sulla robotica poiché riduce la necessità di formazione con supervisione umana, definendola un passo importante verso la creazione un robot generico.