Egy olyan fejlesztés, amelynek hallatán a svéd bútortervezőknek valószínűleg idegesen rángatózik a szemöldöke, a kutatók bemutatták a RoboHorizon-t, egy új AI keretrendszert, amely jelentősen növeli a robotok képességét komplex, többlépcsős feladatok elvégzésére. A rendszer okosan egy nagy nyelvi modellt (LLM) használ afféle projektmenedzserként, amely a homályos utasításokat végrehajtható részfeladatokra bontja, és sűrű jutalmazási struktúrát generál, hogy a robot a pályán maradjon. Ez az új Recognize-Sense-Plan-Act (RSPA) folyamat drámai, 29,23%-os javulást eredményezett a hosszú távú feladatok sikerrátájában.
A hosszú távú robotika alapvető problémája, hogy a feladatok gyakran ritka jutalmakat adnak; egy robot csak tucatnyi komplex lépés után tudja meg, hogy sikeres volt, ami megnehezíti a helyes cselekvések azonosítását. A RoboHorizon ezt úgy oldja meg, hogy egy LLM részletes ellenőrzőlistát hoz létre minden egyes lépéshez tartozó jutalmakkal. Ez párosul egy “kulcskép-felderítési” módszerrel, amely segít a robotnak vizuális rendszerét a feladat legkritikusabb pillanataira összpontosítani, például abban a pillanatban, amikor egy megfogó érintkezik egy tárggyal. Ez a robotoknál az, mintha végre nem terelődnének el, és tényleg elolvasnák a használati utasítást.

Sehol sem volt ez nyilvánvalóbb, mint a FurnitureBench benchmarkon, amely egy sor IKEA-ihletésű szerelési feladatból áll, melyeket kifejezetten arra terveztek, hogy még a legedzettebb autonóm rendszereket is az őrületbe kergessék. Ez a teszt hosszú távú tervezést, precíz manipulációt és a különböző alkatrészek helyes összekapcsolásának képességét igényli – olyan kihívásokat, amelyek sok jelenlegi modellt megakadályoznak. A RoboHorizon sikere itt jelentős lépést jelent az olyan robotok felé, amelyek képesek kezelni azokat a komplex, valós összeszerelési feladatokat, amelyek eddig kizárólag és fájdalmasan az emberiség – különösen a hétvégi barkácsolók – kiváltságai voltak.

Miért fontos ez?
Ez a kutatás egy alapvető akadályt hárít el a valóban hasznos, általános célú robotok létrehozása előtt. Az LLM-ek absztrakt tervezési képességeinek és a robot világmodell fizikai végrehajtásának integrálásával a RoboHorizon egy tervrajzot kínál olyan gépekhez, amelyek megbízhatóan képesek elvégezni a komplex feladatokat. Ahelyett, hogy csak egyedi, ismétlődő cselekvésekre korlátozódnának, ez a megközelítés megnyitja az utat olyan robotok előtt, amelyek képesek több fázisú munkákat tervezni, adaptálni és végrehajtani gyárakban, laboratóriumokban vagy akár otthonokban is, egy óriási lépéssel közelebb hozva a kompetens robotasszisztens álmát a valósághoz.