Deze robot met kunstmatige intelligentie blijft doorgaan, zelfs als je hem met een kettingzaag aanvalt

Een robot met vier poten die blijft kruipen, zelfs nadat alle vier zijn poten met een kettingzaag zijn afgehakt, is voor de meeste mensen een ware nachtmerrie.
Voor Deepak Pathak, medeoprichter en CEO van de startup Skild AI, is de dystopische prestatie van aanpassing een bemoedigend teken van een nieuwe, meer algemene vorm van robotische intelligentie.
"Dit is iets wat we een omni-lichaamsbrein noemen," vertelt Pathak. Zijn startup ontwikkelde het generalistische algoritme voor kunstmatige intelligentie om een belangrijke uitdaging in de voortschrijdende robotica aan te pakken: "Elke robot, elke taak, één brein. Het is absurd algemeen."
Veel onderzoekers zijn van mening dat de AI-modellen die worden gebruikt om robots te besturen, een enorme sprong voorwaarts kunnen maken, vergelijkbaar met de modellen die taalmodellen en chatbots hebben voortgebracht, als er voldoende trainingsgegevens kunnen worden verzameld.
De door AI aangestuurde robot kan zich aanpassen aan nieuwe, extreme omstandigheden, zoals het verlies van ledematen.
Bestaande methoden voor het trainen van robotische AI-modellen, zoals het laten leren van algoritmes om een bepaald systeem te besturen via teleoperaties of simulatie, genereren niet genoeg gegevens, zegt Pathak.
Skilds aanpak is om één enkel algoritme te laten leren een groot aantal verschillende fysieke robots te besturen voor een breed scala aan taken. Na verloop van tijd resulteert dit in een model dat het bedrijf Skild Brain noemt, met een algemener vermogen om zich aan te passen aan verschillende fysieke vormen – inclusief vormen die het nog nooit eerder heeft gezien. De onderzoekers creëerden een kleinere versie van het model, genaamd LocoFormer, voor een academische publicatie waarin hun aanpak wordt beschreven.
Het model is ook ontworpen om zich snel aan te passen aan een nieuwe situatie, zoals een ontbrekend been of verraderlijk nieuw terrein, en om uit te zoeken hoe het geleerde kan worden toegepast op de nieuwe situatie. Pathak vergelijkt de aanpak met de manier waarop grote taalmodellen bijzonder uitdagende problemen kunnen aanpakken door het model op te splitsen en de overwegingen terug te koppelen naar hun eigen context – een aanpak die bekend staat als in-context learning.
Andere bedrijven, waaronder het Toyota Research Institute en een concurrerende startup genaamd Physical Intelligence , zijn ook druk bezig met de ontwikkeling van meer algemeen bruikbare robot-AI-modellen. Skild is echter een uitzondering in de manier waarop het modellen bouwt die generaliseerbaar zijn voor zoveel verschillende soorten hardware.
LocoFormer wordt getraind met grootschalige RL op verschillende procedureel gegenereerde robots met agressieve domeinrandomisatie.
Met dank aan SkildIn een experiment trainde het Skild-team hun algoritme om een groot aantal lopende robots van verschillende vormen te besturen. Toen het algoritme vervolgens werd toegepast op echte twee- en viervoetige robots – systemen die niet in de trainingsdata waren opgenomen – was het in staat hun bewegingen te besturen en ze te laten rondlopen.
Op een gegeven moment ontdekte het team dat een viervoetige robot die het omnibody-brein van het bedrijf bestuurt, zich snel aanpast wanneer hij op zijn achterpoten wordt geplaatst. Omdat hij de grond onder zijn achterpoten voelt, bestuurt het algoritme de robothond alsof het een mensachtige is, door hem op zijn achterpoten te laten rondlopen.
LocoFormer leert continu door middel van online ervaring. Het beleid kan leren van de valpartijen in de beginfase van de proef om de controlestrategieën in latere proeven te verbeteren.
Met dank aan SkildHet generalistische algoritme kon zich ook aanpassen aan extreme veranderingen in de vorm van een robot, bijvoorbeeld wanneer zijn benen aan elkaar werden vastgebonden, afgesneden of aangepast om langer te worden. Het team probeerde ook twee motoren van een viervoeterrobot met wielen én benen uit te schakelen. De robot kon zich aanpassen door op twee wielen te balanceren, net als een onstabiele fiets.
Bij grote verstoringen, zoals morfologische veranderingen, motorische storingen of gewichtsveranderingen, kan LocoFormer dergelijke representaties opnieuw opbouwen om online aanpassing te bereiken.
Met dank aan SkildSkild test dezelfde aanpak voor robotmanipulatie. Het bedrijf trainde Skild Brain op een reeks gesimuleerde robotarmen en ontdekte dat het resulterende model onbekende hardware kon aansturen en zich kon aanpassen aan plotselinge veranderingen in de omgeving, zoals een afname van de lichtsterkte. De startup werkt al samen met een aantal bedrijven die robotarmen gebruiken, zegt Pathak. In 2024 haalde het bedrijf $ 300 miljoen op in een investeringsronde die de waarde van het bedrijf op $ 1,5 miljard bracht.
Pathak zegt dat de resultaten voor sommigen misschien griezelig lijken, maar voor hem tonen ze de vonken van een soort fysieke superintelligentie voor robots. "Persoonlijk vind ik het zo spannend, man," zegt hij.
Wat vind je van Skilds multigetalenteerde robotbrein? Stuur een e-mail naar [email protected] om het me te laten weten.
Dit is een editie van Will Knights AI Lab-nieuwsbrief . Lees hier eerdere nieuwsbrieven.
wired