Hogyan tanítjuk a robotokat a virtuális Mátrixban? 1X forradalmi megoldása
Vajon hogyan tanítasz meg egy több millió dolláros humanoid robotot, hogy ne tévessze össze a macskádat egy porcsomóval? Vagy hogyan tanulhat meg kinyitni egy makacs befőttesüveget anélkül, hogy letépné a konyhaszekrény ajtaját? Eltölthetnél egy életet azzal, hogy hagyod a való világban gyakorolni, miközben komikus (és drága) bakigyűjteményt halmoz fel.
Vagy, ha te vagy az 1X robotikai vállalat, egyszerűen építesz egy Mátrixot a robotjaidnak.
Az 1X ma mutatta be az 1X World Modelt (1XWM), egy forradalmi mesterséges intelligenciát, amely hídként szolgál az atomok és a bitek világa között. Ez egy rendkívül élethű szimulátor, amely képes megjósolni a jövőt, lehetővé téve NEO humanoid robotjaik számára, hogy gyakoroljanak, hibázzanak és tanuljanak egy digitális játszótéren, mielőtt valaha is belépnének az otthonodba.
Ez nem csupán egy újabb videójáték-motor. Ez egy jövőbelátó kristálygömb a robotika számára, amely megoldást kínál az egyik legnagyobb akadályra a valóban autonóm androidok létrehozásában.
A probléma: a valóság kínzó tesztpálya
Az 1X végső célja a NEO robotok telepítése a legkaotikusabb környezetbe, amit csak el lehet képzelni: az otthonainkba. Olyan helyekre, ahol az autókulcsok rejtélyesen teleportálnak, a bútorok egy szeszélyes ötlettől vezérelve átrendeződnek, és az a bizonyos Tupperware fedél már 2019 óta eltűnt.
Fizikailag lehetetlen a robot programozását (vagy “irányelvét”) minden lehetséges forgatókönyvre tesztelni. Nem lehet egymillió különböző, zsúfolt konyhát makettezni. Ahogy az 1X fogalmaz, “minden egyes irányelv fizikai értékelése… több élethossznyi időt venne igénybe.”
1XWM: digitális kristálygömb robotok számára
Az 1X World Model a megoldás. Vesz egy valós kiindulópontot – egy szoba néhány videoképkockáját – majd megjósolja, mi történik a következő pillanatban a robot specifikus cselekvései alapján.
És itt van a döntő különbség a tipikus “szövegből videó” AI-hoz képest: az 1XWM cselekvés-vezérelhető. Nem adsz neki homályos utasítást, mint például “tisztítsd meg a pultot”. Ehelyett betáplálod a robot pontos, alacsony szintű mozgáspályáját – ízületeinek precíz szögeit, karjának sebességét, fogásának erejét. A modell ezután szimulálja a következményeket, egészen a fizikai részletekig, mint például egy törlőkendő felületen való mozgása vagy egy ajtó zsanérjain való lengése.
Az eredmények lenyűgözőek. A modell képes több, különböző jövőt generálni ugyanabból a kiindulópontból, bemutatva, mi történik, ha a NEO megragad egy bögrét, vagy mondjuk, képzeletbeli gitáron játszik. Ez lehetővé teszi az 1X számára, hogy millió kísérletet futtasson töredéknyi idő alatt, stressztesztelve a mesterséges intelligenciát anélkül, hogy egyetlen tárgyat is elmozdítanának a való világban.
A Mátrix szakzsargonjának leegyszerűsítése: gyors útmutató
Úgy érzed, mintha épp most vetted volna be a piros pirulát? Bontsuk le a kulcsfogalmakat.
Mi az a “Világmodell”? Gondolj rá, mint egy AI belső képzeletére. Ez a világ működésének szimulációja, amely lehetővé teszi az AI számára, hogy megjósolja, “mi történik ezután”, ha végrehajt egy bizonyos cselekvést. Ez a különbség a próba-szerencse alapú tanulás és a következmények előzetes átgondolása között.
Mi az a “Robot Irányelv”? Egyszerűen fogalmazva, ez a robot agya vagy döntéshozatali stratégiája. Komplex szabályrendszer, amely megmondja a robotnak, milyen cselekvést hajtson végre annak alapján, amit lát, hall és érzékel. A Világmodellt használják annak gyors értékelésére, melyik “irányelv” a legjobb.
Mit jelent a “Cselekvés-vezérelhető”? Azt jelenti, hogy a szimulációt a robot pontos, precíz mozdulatai irányítják, nem általános szöveges parancs. Ez létfontosságú a fizika realisztikus szimulálásához. A modellnek tudnia kell, hogy a robot próbálja-e tolni vagy húzni az ajtót.
Mi az a “Propriocepció”? Ez a robot saját testének érzékelése. Tudja, hol vannak a végtagjai, hogyan állnak az ízületei, és hogyan mozog a térben anélkül, hogy “látnia” kellene magát. Ez a mi emberi tapintás- és egyensúlyérzékünk, csak robotokra adaptálva. Az 1X megállapította, hogy a propriocepciót használó irányelvek jelentősen jobban teljesítenek.
Mik azok a “Kontrafaktuálisok”? Ezek “mi lenne, ha” forgatókönyvek. A Világmodell képes egy olyan helyzetet venni, ahol egy robot kudarcot vallott a való világban, és szimulálni, hogy mi történt volna, ha más cselekvést hajtott volna végre. Olyan, mintha időgépe lenne a robot képzéséhez.
A virtuális gyakorlástól a valós intelligenciáig
Tehát, tényleg jobb robotot eredményez mindez a digitális ábrándozás? Az 1X szerint a válasz határozottan igen.
Magas korreláció van a Világmodell előrejelzései és a valós eredmények között. Amikor a szimulátor azt jósolta, hogy az AI egyik verziója jobb lesz egy feladatban, mint a másik, a valós értékelések igazolták. Ez az azonnali visszacsatolási hurok forradalmi, lehetővé téve számukra:
- A legjobb agyak kiválasztását: Gyorsan kiválaszthatják a legjobban teljesítő AI modellt egy képzési futamból, hosszadalmas fizikai tesztek nélkül.
- Tanulást a hibákból: Valós kudarcok adatkészleteit gyűjthetik, és a modell segítségével felfedezhetik, mit kellett volna másként tennie a robotnak.
- Skálázható tanulást: Minél több adatot lát a modell, annál okosabbá válik. Még a tudást is átviheti egyik feladatról a másikra—ha jobban kezeli a polcot, jobban megérti a játékgépet is.
Természetesen nem tökéletes. Az 1X átlátható a korlátait illetően. A modell jelenleg küzd olyan tárgyakkal való interakciók szimulálásával, amelyeket korábban sosem látott. De ahogy a képzési adatok mennyisége növekszik, ez a “képzeleti hiány” várhatóan csökkenni fog.
A jövő szintetikus
Az 1X végcélja monumentális. Úgy vélik, egy kellően fejlett Világmodell olyan szintetikus adatokat generálhatna, amelyek megkülönböztethetetlenek a valós adatoktól.
Amikor ez megtörténik, az adathiány palacknyaka, amely évtizedekig kínozta a robotikát, eltűnhet. Többé nem kell éveket tölteni adatgyűjtéssel; korlátlan, tökéletesen testreszabott képzési forgatókönyveket generálhatsz a modellen belül.
Ahogy az 1X csapata állítja, “Az adatok és értékelések az autonómia megoldásának sarokkövei, és az 1XWM egységes utat biztosít mindkét kihívás kezeléséhez.”
Ez egy merész vízió: olyan jövő, ahol az androidokat nem csak a valós világban képzik, hanem egy saját digitális világukban is—egy Mátrixban, amely felkészíti őket a miénkre. És mint mindig, a RoboHorizon Magazin itt lesz, hogy beszámoljon arról, hogyan válik ez a szimulált jövő a valóságunkká.