A valóban rátermett humanoid robotok megalkotásáért folyó verseny gyorsan átalakul egy hardvercentrikus kérdésből egy sokkal alapvetőbb filozófiai dilemmává: mégis hogyan tanítsunk meg egy gépet a világra? Az egyik sarokban olyan cégek állnak, mint a Sunday, akik egy valóságos emberi tanárseregre fogadtak. A másik oldalon pedig techóriások, mint a Tesla és az Nvidia abban reménykednek, hogy robotjaik szimplán YouTube-videók nézésével is okosodhatnak. Ez a stratégiai megosztottság határozza meg az egész iparágat, és az égvilágon senki sem tudja a tuti receptet.
A Sunday teljes mellszélességgel kiáll az utánzásos tanulás mellett, 500 „memóriafejlesztőt” szerel fel speciális kesztyűkkel, hogy aprólékosan rögzítsenek kiváló minőségű adatokat minden elképzelhető feladathoz. A cég szerint ezzel a módszerrel egy-két hetente képesek új feladatot betanítani és kiértékelni, létrehozva ezzel, amit ők a „világ leggyorsabban tanuló robotjának” neveznek. Ez egy gyakorlatias, már-már kézműves megközelítés az adatgyűjtéshez, ahol a hangsúly a minőségen van, nem pedig a puszta mennyiségen.

Ez az emberközpontú modell sem egységes, vannak variációk. A norvég 1X Technologies szintén emberi irányítást alkalmaz, de kesztyűk és gondosan összeállított tréningek helyett a 1X Neo: Itt az AI komornyikod, de van ára robotjait egyenesen valós környezetbe küldi, hogy távvezérléssel tanuljanak. Ez kevésbé egy osztályterem, sokkal inkább egy éles, munka közbeni gyakornoki program. Eközben a Figure fizikai „Neura Gym”-eket, azaz strukturált környezeteket hoz létre, ahol robotjai specifikus feladatokon edzhetnek, néha olyan cégekkel partnerségben, mint a BMW.
Aztán ott van a „csak nézz videókat” tábor. A Tesla hangosan hangoztatja célját, miszerint az Optimus robotnak szimplán az emberek videókon történő megfigyelésével kellene feladatokat tanulnia. Az Nvidia pedig, a Az NVIDIA robotoknak épít mátrixot a Cosmos-szal platformjával, szintén a szimulációra és hatalmas, internetes léptékű videóadatokra támaszkodik, hogy betanítsa robotikai alapmodelljeit. Ez a módszer elképesztő skálázhatóságot ígér – hiszen több órányi „hogyan csináld” videó kering az interneten, mint amennyit bármely memóriafejlesztő csapat valaha is előállíthatna –, de komoly gondjai vannak a kontextussal, a megtestesüléssel és a strukturálatlan adatok puszta zajával.
Miért fontos ez?
A képzési módszertanban mutatkozó szakadás jelenti az egyetlen legnagyobb akadályt egy valóban általános célú robot megalkotásában. A vita lényege egy klasszikus minőség kontra mennyiség probléma, amit a fizikai interakciók összetettsége még tovább súlyosbít.
Vajon a gondosan összeállított, kiváló minőségű adathalmaz az emberi demonstrátoroktól – mint amilyet a Sunday AI: Robotoknak Kézi Chore-tanítás épít – a kulcs a megbízható feladatvégzéshez? Vagy az internetes adatok puszta, kaotikus mennyisége biztosít majd végső soron egy robusztusabb és skálázhatóbb utat az intelligenciához, ahogy a Tesla és az Nvidia hiszi? Az a cég, amelyik megoldja ezt a skálázható tanulási rejtélyt, nem csupán egy jobb robotot épít; valószínűleg az elkövetkező évtized mesterséges intelligencia és automatizálási trendjeit is meghatározza majd.






