A szimulációra tervezés butítja a robotokat?

A humanoid robotika nagypályás világában filozófiai háború készülődik. Az egyik oldalon az olyan MI-titánok állnak, mint az NVIDIA, akik a „szimulációra tervezés” (Design for Simulation – DFS) elvét hirdetik. Ez az elképzelés lényegében azt mondja ki, hogy a hardvert eleve úgy kell megépíteni, hogy az MI könnyen betanítható legyen a virtuális térben. A másik oldalon viszont egy veterán robotikus nemes egyszerűséggel „S.T.U.P.P.I.D.”-nak nevezte ezt az egész megközelítést.

A vád Dr. Scott Waltertől származik, aki negyven évnyi tapasztalattal a háta mögött, két robotszimulációs cég társalapítójaként pontosan tudja, miről beszél. Walter éles kritikájában kifejti: óriási hiba és veszélyes, visszafelé mutató trend, ha hagyjuk, hogy a szimuláció korlátai diktálják a hardver kialakítását. Az alkalomra egy frappáns angol mozaikszót is alkotott: S.T.U.P.P.I.D., azaz Simulation Throttled Underperforming Product Integration Design (szimuláció által gúzsba kötött, alulteljesítő termékintegrációs tervezés).

Ez egy egyenesen Dr. Jim Fannek, az NVIDIA vezető kutatójának címzett hadüzenet. Fan korábban amellett érvelt, hogy a modern megerősítéses tanulás (Reinforcement Learning – RL) skálázásához a hardvert és a szimulációt közösen kell megtervezni. „Ha a robotodat nem lehet jól szimulálni, keresztet vethetsz az RL-nek” – jelentette ki Fan, ezzel a szimulációt a tervezési folyamat abszolút prioritásává emelve.

Walter szerint viszont ez tipikusan az az eset, amikor a gombhoz varrjuk a kabátot. Konkrét példákat is hoz: a Unitree Robotics például az új H2-es humanoidjánál állítólag leegyszerűsítette a bokaízületet. Míg a G1-es modellnél egy mechanikailag fejlettebb párhuzamos megoldást alkalmaztak, az újnál áttértek a soros elrendezésre, mert az „RL-barátabb”. De említhetnénk a komplex, inas-meghajtású kezek kerülését vagy az okosmotorok teljesítményének visszafogását is, csak hogy lineárisabb, a szimulátor számára emészthetőbb választ adjanak. Walter szerint a mérnökök annyira rettegnek a „sim2real” szakadéktól (a szimuláció és a valóság közötti különbségtől), hogy inkább a valóságot hajlítják a szimulációhoz, ahelyett, hogy a szimulációt fejlesztenék a komplexebb, ütőképesebb valóság leképezésére.

Miért fontos ez?

Ez nem csupán egy akadémiai szőrszálhasogatás; a robotika mérnöki tudományának lelke a tét. Ha a „szimuláció mindenek felett” megközelítés győz, azzal azt kockáztatja az iparág, hogy egy olyan robotgenerációt hozunk létre, amelyet ugyan könnyebb betanítani, de a fizikai világban alapvetően gyengébb képességű, kevésbé hatékony és sérülékenyebb lesz. Ez a szoftveres modellezés kényelmét részesíti előnyben a gép tényleges teljesítményével szemben.

Walter kritikája egyfajta harci felhívás a mérnököknek: tessék fejleszteni a szimulációs eszközöket, ahelyett, hogy „lebutítanák” a hardvert a jelenlegi szoftveres korlátokhoz. Ahogy ő fogalmazott: „Nem azért tervezünk hidakat, hogy a statikai elemző szoftverek kedvében járjunk.” A végső cél ugyanis az, hogy jobb robotokat építsünk, nem pedig olyanokat, amik csak az Isaac Simben mutatnak jól. A legjobb konstrukciók mindig abból születnek, ha azt kérdezzük: mire van szüksége a robotnak? Nem pedig abból, hogy mit bír el a szimulátor.