Rewolucja w sztucznej inteligencji: Genie 3 potrafi tworzyć wirtualne światy

Genie 3 , wciąż w fazie badań i niedostępne publicznie, łączy w sobie możliwości swoich poprzedników, Genie 2, i modelu do produkcji wideo, Veo 3. Nowy model sztucznej inteligencji może tworzyć interaktywne środowiska 3D trwające minuty z prędkością 24 klatek na sekundę i rozdzielczością 720p. To znaczący krok naprzód w porównaniu z 10-20-sekundowymi scenami, które Genie 2 mógł generować.
Najbardziej uderzającym aspektem tego modelu jest jego zdolność do przywoływania obrazów wygenerowanych wcześniej przez Genie 3 i na ich podstawie logicznego decydowania o przebiegu zdarzeń. Firma podkreśla, że ta spójność nie jest sztucznie kodowana; model uczy się sam. „Nie trenowaliśmy tego modelu tak, aby naśladował rzeczywisty świat i podejmował decyzje zgodnie z prawami fizyki” – mówi Shlomi Fruchter, badacz z DeepMind . „Nauczył się tej spójności sam”.
Genie 3 może zmieniać sceny na podstawie poleceń użytkownika. Na przykład, gdy postać sterowana sztuczną inteligencją w środku magazynu otrzymuje polecenie takie jak „podejdź do zielonej śmieciarki” lub „podejdź do czerwonego wózka widłowego”, Genie 3 tworzy otoczenie, a postać podejmuje działanie w tym świecie. Według testów DeepMind, zadania te zostały pomyślnie wykonane.
Genie 3 ma jednak swoje ograniczenia. Na przykład zaobserwowano, że śnieg nie reagował realistycznie w scenie, w której narciarz zjeżdżał w dół. Co więcej, model ten wciąż nie jest w stanie symulować złożonych interakcji wielu niezależnych postaci, a symulacje ograniczone do kilku minut nie wystarczają na godziny treningu.
Eksperci twierdzą jednak, że technologia ta przybliża sztuczną inteligencję o krok do naśladowania zachowań typowych dla człowieka, takich jak planowanie, eksploracja otoczenia, poruszanie się w nieznanym i doskonalenie się poprzez doświadczenie.
milliyet