Saját mesterét verte meg a hibákból tanuló teniszrobot

A történet klasszikus, már-már közhelyes: a tanítvány túlszárnyalja mesterét. Csak ebben az esetben a tanítvány egy humanoid robot, aki olyan szinten sajátította el a teniszezést, hogy rövid úton elverte saját fejlesztőjét. A LATENT névre keresztelt projekt keretében a kutatók nem patikamérlegen kimért, profi sportolói adatsorokból tanították meg mozogni a gépet, hanem “tökéletlen”, zajos emberi mozgásmintákból. Az eredmény? Egy robot, amely mostanra magabiztosan hozza a többütéses labdameneteket.

A Tsinghua Egyetem és a Galbot Inc. kutatói a robotika egyik legkeményebb dióját próbálták feltörni: hogyan tanítsunk meg komplex, dinamikus mozgásokat anélkül, hogy tűpontos “használati utasítást” adnánk a gép kezébe. A rendszerük egy úgynevezett “latent action space”-t (rejtett akcióműveleti teret) hoz létre töredékes, korántsem hibátlan emberi mozdulatokból. A titkos összetevő egy magas szintű AI-irányelv, amely digitális edzőként funkcionál: folyamatosan korrigálja és összefésüli ezeket a nyers, kezdetleges készségeket, hogy a robot végül sikeresen juttassa vissza a labdát a háló felett. A teljes tanulási folyamatot szimulált környezetben csiszolták tökéletesre, mielőtt az úgynevezett “sim-to-real” transzferrel átültették volna a tudást egy valódi Unitree G1 humanoid robotba.

A LATENT rendszer négy szakaszból álló folyamatát bemutató ábra: Motion Tracker előtanítás, Online desztilláció, Magas szintű irányelv-tanulás és Sim-to-Real transzfer.

A puding próbája az evés – a teniszé pedig a ponttábla. A projekt vezetője, Zhikai Zhang szerint a tanulási görbe elképesztően meredek volt. „A valós tesztelés első napján a robot még egyetlen adogatásomat sem tudta visszaadni” – mesélte Zhang. „A projekt utolsó napjára viszont már esélyem sem volt ellene.” Aki szeretne elmerülni a technikai részletekben, vagy esetleg saját tenisz-terminátort nevelne otthon, a csapat minden adatot és kódot elérhetővé tett. Hyperlink: Projekt oldal és Hyperlink: GitHub repó.

Miért nagy szám ez?

Ez a történet nem csak arról szól, hogy kaptunk egy fáradhatatlan edzőpartnert a magányos teniszprofi mellé. A LATENT igazi áttörése a “koszos”, tökéletlen adatokból való tanulás képessége. A legtöbb robotikai tanításhoz jelenleg kínosan precízen összeállított adatsorokra van szükség, amiknek az előállítása méregdrága és időigényes. Azzal, hogy a rendszer megtanulta kijavítani és kombinálni a hibás példákat, drasztikusan felgyorsulhat az a folyamat, ahogy a robotokat komplex, való világbeli feladatokra képezzük ki. Ez egy hatalmas lépés az olyan gépek felé, amelyek képesek a “terepen” – legyen az egy raktár vagy egy katasztrófa sújtotta övezet – menet közben, tökéletes demonstrációk nélkül is tanulni.