Az NVIDIA legújabb húzása egyszerre váltott ki lelkesedést és némi egzisztenciális szorongást a robotikai közösségben: nyílt forráskódúvá tették a SONIC-ot. Ez az az alapmodell, aminek az a nem titkolt célja, hogy a humanoid robotok végre ne csak előre programozott, látványos akrobatatmutatványokra legyenek képesek. Ahogy Yuke Zhu, az NVIDIA kutatója fogalmazott, az iparágnak el kell mozdulnia az öncélú agilitástól, és „a generalista humanoidokat valódi munkára kell fogni”. Emésszük ezt egy kicsit: valódi munka.
A SONIC (ami a Supersizing mOtion tracking for Natural humanoId Control rövidítése) egy olyan „viselkedési alapmodell” (Behavior Foundation Model), amely valós idejű, teljes testes mozgásgenerálásra képes. A tanításához egy elképesztő, több mint 100 millió képkockából álló mozgásrögzítési (MoCap) adatbázist használtak – ez több mint 700 órányi futást, ugrálást és mászást jelent. Ennek köszönhetően a robotok alapvető szinten értik meg a természetes mozgást, anélkül, hogy minden egyes feladathoz unalmas és bonyolult jutalmazási rendszereket kellene programozni. A rendszer támogatja a távvezérlést (teleoperation) és a látás-nyelv-akció (VLA) modellekből származó következtetéseket is, így egyetlen egységes irányítási elvvel vezérelhető a gép.
Úgy tűnik, ez nem csak elméleti okoskodás. Egy bétatesztelő arról számolt be, hogy mindössze néhány óra alatt sikerült élesítenie a rendszert, a teljesítményét pedig „kiemelkedőnek” nevezte. Egy olyan iparágban, ahol a vezérlők finomhangolása eddig hónapokig tartó küzdelmet jelentett, a pár órás telepítési idő nem kevesebb, mint kész csoda.
Miért akkora szám ez?
A humanoid robotika évek óta egyfajta „demó-csapdában” vergődik: látványos, de törékeny ügyességi mutatványokat villantanak, amik a gyakorlatban szinte használhatatlanok. Azzal, hogy az NVIDIA ingyenessé és hozzáférhetővé tett egy ilyen erős, általános célú vezérlőt, gyakorlatilag alapértelmezetté és bárki számára elérhetővé teszi a humanoid mozgás alapjait. Ezzel drasztikusan lecsökken a belépési küszöb a startupok és kutatók számára, akik így végre a magasabb szintű logikára és a konkrét feladatvégrehajtásra koncentrálhatnak ahelyett, hogy újra és újra feltalálnák a spanyolviaszt. Ez egy stratégiai lépés, amely szorosan kötődik az NVIDIA nagyszabású Project GR00T (Generalist Robot 00 Technology) programjához, melynek célja egy szabványosított szoftver- és AI-platform létrehozása a következő generációs robotok számára. A lájkvadász szaltók korszaka talán végleg leáldozott, hogy átadja a helyét a sokkal unalmasabb – de végtelenül hasznosabb – korszaknak: amikor a robot végre tényleg elmosogat helyettünk.













