Aplikacije i dodaci
Softver i razvojni alati
Softver
Računalstvo, telefonija
Trikovi i savjeti
02.02.2026 10:00

Podijelite s drugima:

Udio

Što je Googleov novi alat za korisničko sučelje, Project Genie?

Zamislite svijet u kojem granica između vaše mašte i digitalne stvarnosti praktički ne postoji.
Fotografija: Blizanci
Fotografija: Blizanci

Svijet u kojem skica nacrtana na komadu papira ili jednostavna fotografija šume iza vaše kuće trenutno postaje interaktivna videoigra koju zapravo možete igrati. Ovo nije san ljubitelja znanstvene fantastike iz 1990-ih, već stvarnost koju gradi Googleov istraživački laboratorij DeepMind. Njihovo najnovije postignuće, nazvano Project Genie (Generativno interaktivno okruženje), najavljuje kraj ere kada je stvaranje digitalnih svjetova bilo ograničeno na programere i dizajnere s dugogodišnjim iskustvom.

Trenutno je Project Genie dostupan samo pretplatnicima Google AI Ultra u SAD-u, za koji korisnici plaćaju nešto više od 250 dolara mjesečno.

Što je uopće Projekt Genie?

Genie je prvi svjetski "generativni interaktivni model svijeta". Dok smo se u posljednje dvije godine navikli na chatbotove poput ChatGPT-a koji generiraju tekst i alate poput Midjourneyja koji stvaraju slike, Genie ide korak dalje. Ne stvara samo statički sadržaj, već žive, responzivne prostore.

Genie je model umjetne inteligencije koji je obučen na više od 200.000 sati videa 2D platformskih igara s interneta. Ključna razlika između ovog modela i drugih je u tome što se Genie obučavao bez ikakvih dodatnih informacija o tome koje su tipke pritisnute ili kako su se likovi kretali. Samostalno je otkrivao koji su dijelovi slike "igrivi", što se događa ako se lik pomakne ulijevo i kako gravitacija utječe na objekte u virtualnom svijetu.

To znači da Genie nije samo generator videa. Moglo bi se reći da je to game engine pokretan umjetnom inteligencijom. Kada mu date sliku, on ne samo da predviđa sljedeći skup kadrova u videu, već i razumije logiku prostora te vam omogućuje ulazak i kontrolu tog prostora.

Google DeepMind je izvorno pokrenuo Genie 3 u kolovozu prošle godine kao istraživačku pretpremijeru, a sada - pet mjeseci kasnije - s njegovom dostupnošću putem Project Genie, traži širi raspon povratnih informacija korisnika, a istovremeno ubrzava razvoj još snažnijih modela svijeta. Konkurencija u ovom području raste. Fei-Fei Li je krajem prošle godine izdala prvi komercijalni proizvod, Marble, sa svojim World Labsom, startup Runway također je nedavno pokrenuo svoj model svijeta, a bivši vodeći znanstvenik Mete Yann LeCun također cilja na razvoj takvih modela sa svojim startupom AMI Labs.

Kako Genie funkcionira?

Istraživači u DeepMindu koristili su ono što nazivaju "Modelom latentne akcije". Većina modela generiranja videa jednostavno pogađa kakav će biti sljedeći kadar na temelju prethodnih. Genie ide dublje.

Kada model gleda videoigru, pita se: „Koja je nevidljiva radnja uzrokovala ovu promjenu na ekranu?“ S vremenom je naučio prepoznavati obrasce kretanja. Iako nikada nije vidio kontroler ili kod igre, razumio je koncepte skakanja, hodanja i interakcije. Danas, kada korisnik pritisne tipku na tipkovnici, Genie generira sljedeći kadar svijeta u stvarnom vremenu koji odgovara toj određenoj radnji.

Njegova sposobnost stvaranja iz jedne slike je nevjerojatna. Možete mu pokazati stvarnu fotografiju, umjetničku sliku ili čak dječji crtež. Genie će te vizualne informacije transformirati u okruženje igre s dosljednom fizikom. Ako postoji ponor u crtežu, model će shvatiti da lik ne bi trebao hodati po zraku. Ako postoji prepreka, lik će se sudariti s njom.

Nažalost, nemamo pristup novom alatu korisničkog sučelja, ali smo pronašli informacije o tome kako se taj novi alat korisničkog sučelja koristi.

Prvo, korisnik napiše verbalni opis željenog okruženja i lika (ili prenese svoju početnu sliku) u odgovarajuća polja unutar web aplikacije. To može biti, na primjer, „gusta tropska prašuma s drevnim ruševinama, junak je istraživač koji hoda po visećem mostu“. Google AI zatim koristi model Nano Banana Pro za stvaranje pregleda slike svijeta iz opisa. Korisnik može dodatno poboljšati ovu sliku (dodati ili ukloniti elemente, promijeniti određeni detalj kako bi bolje odgovarao viziji svijeta koju želi). Istovremeno, može odabrati perspektivu pogleda (iz prvog ili trećeg lica).

Nakon što je nacrt zadovoljavajući, korisnik klikne na Create (Stvori), a Project Genie generira cijelu interaktivnu scenu u nekoliko trenutaka, smještajući korisnika u taj svijet. Okruženje se pojavljuje na zaslonu zajedno s osnovnim kontrolama. Kretanje se vrši standardnim tipkama (W, A, S, D za pomicanje, razmaknica za skok/podizanje, tipke sa strelicama za rotiranje prikaza), slično računalnim igrama. Ključna značajka Geniea je da svijet nije u potpunosti nacrtan unaprijed, već se dinamički gradi u hodu. To znači da kako se lik kreće, umjetna inteligencija stvara nove dijelove krajolika, događaje i objekte ispred igrača.

Svijet se trenutno prikazuje u 720p rezoluciji pri 24 sličice u sekundi.

Svaki svijet ili generirano iskustvo vremenski je ograničeno na 60 sekundi. Nakon jedne minute sesija završava, što je i očekivano, budući da se radi o računalno intenzivnom zadatku. Nakon završetka, korisnik ima nekoliko mogućnosti: može spremiti videozapis svog istraživanja, ponoviti eksperiment ili započeti potpuno novi svijet s novim opisom.

Osim stvaranja od nule, korisnici mogu isprobati i gotove ili tuđe svjetove. Project Genie omogućuje miješanje svjetova. Galerija nudi izbor primjera svjetova koje možete preuzeti i zatim modificirati po vlastitom ukusu.

Iako je impresivno gledati kako umjetna inteligencija stvara svjetove od nule, već smo spomenuli neka od ograničenja. Osim niže rezolucije i vremenskog ograničenja, korisnici kažu da je interakcija između lika i svijeta oko njega vrlo osnovna. Brzina odziva je također lošija nego što smo navikli u današnjim igrama. Ukratko, vrlo zanimljiv alat, ali simptomi razvojne faze su primjetni.

Google naglašava da se Project Genie razvija u skladu s načelima odgovornog razvoja. Zloupotreba je zabranjena. Ugrađeni su sigurnosni filteri kako bi se spriječilo da korisnici generiraju štetan, ilegalni ili neprikladan sadržaj.

Zašto je ovo važno za budućnost umjetne inteligencije?

Možda se pitate treba li nam doista još jedan AI alat, posebno za stvaranje videoigara. Odgovor je da Genie nije samo alat za igre. Neki stručnjaci smatraju da su ovi modeli svijeta vrlo važni ako želimo postići opću umjetnu inteligenciju (AGI).

Da bi umjetna inteligencija istinski razumjela ljudski svijet, ne može učiti samo iz teksta. Mora razumjeti uzrok i posljedicu. Ako umjetna inteligencija zna da će čaša pasti na pod i razbiti se ako se gurne sa stola, to je oblik inteligencije koji nadilazi puko spajanje riječi u rečenice. Modeli poput Geniea podučavaju umjetnu inteligenciju fizici, prostornoj orijentaciji i logici djelovanja u stvarnom svijetu.

To ima ogromne implikacije za robotiku. Umjesto da učimo robote hodati u skupim i opasnim stvarnim okruženjima, možemo ih trenirati u beskrajnim simulacijama generiranim umjetnom inteligencijom koje su vizualno i fizički identične stvarnosti. Ako robot može naučiti kretati se kroz tisuće različitih svjetova duha, bit će puno bolje pripremljen za ulazak u vašu kuhinju.

Uskoro kod nas?

Google zasad pažljivo prati uvođenje novog alata. Pristup dobivaju samo najvatreniji Ultra pretplatnici u SAD-u, dok ostali mogu samo diviti se snimkama i čekati širu dostupnost. Tvrtka kaže da planira postupno učiniti dostupnim većem broju korisnika i u više regija kako tehnologija bude sazrijevala.


Zanima vas više o ovoj temi?
Google Google Gemini umjetna inteligencija


Što drugi čitaju?

_okvir('