Je li DeepSeek AI model o kojem priča cijeli svijet zaista toliko dobar?
DeepSeek je trenutno najbolj “vroča roba” med UI modeli in trenutno zaseda sam vrh Applove AppStore trgovine v ZDA in Veliki Britaniji. Gre za popolnoma brezplačni UI model kitajskega startup podjetja DeepSeek, ki si želi umetno inteligenco približati širši množici. Kako? Z brezplačno verzijo konkurenta OpenAI-jevaga ChatGPT o1 modela.
Nove aplikacije korisničkog sučelja pojavljuju se u App Storeu gotovo svaki dan, a oko lansiranja novog modela često se podiže velika buka jer ljudi traže sljedeću ChatGPT alternativu. Bilo da ste obožavatelj softvera OpenAI ili radije koristite Google Gemini, postoji UI alat za svakoga, a DeepSeek želi biti sljedeća ikona na vašem početnom zaslonu.
Web stranica Tech Radar odlučila je testirati modele DeepSeek V3 i DeeThink R1 te ih usporediti s ChatGPT 4o i o1. Glavni cilj usporedbe bio je utvrditi jesu li postovi korisnika online opravdani i predstavlja li DeepSeek doista prijetnju američkim AI modelima koji su do sada vladali na tržištu generativne umjetne inteligencije.
Prvo osnove
U testu je Tech Radar želio dobiti potpuni uvid u sve što DeepThink nudi u usporedbi s ChatGPT-om, pa se činilo fer koristiti AI chatbot na isti način na koji bi se AI koristio u svakodnevnom životu.
ChatGPT o4 i DeepSeek V3 započeli su traženjem od oba modela da naprave dnevni raspored s nekim informacijama o tome kada se korisnik budi, rutini psa i kratkim pregledom posla. Oba modela su stvorila sjajne rasporede koje korisnik zapravo može koristiti svaki dan. Međutim, značajka memorije ChatGPT učinila je raspored koherentnijim.
Na početku je važno istaknuti da DeepSeek može zapamtiti samo informacije iz istog chata i ne može pristupiti informacijama iz prethodnih chatova kako bi mu pomogao odgovoriti.
Objasni mi to kao da imam 5 godina.
Potom je Tech Radar oba modela pitao o doigravanju vrlo popularne NFL lige. Tražili su sažetak od 200 riječi koncepta NFL playoffa. Oba modela pružila su izvrsne informacije koje su omogućile potpuno razumijevanje načina na koji sustav funkcionira i puta koji tim mora proći da bi došao do Super Bowla.
ChatGPT se odlučio za odlomak od 200 riječi, dok je DeepSeek podijelio informacije u točke. Primijetili su da je ChatGPT pružio više konteksta o tome kako timovi dobivaju pozivnicu za posebnu ligu, ali razlika između rezultata je prilično mala i jedan će vam se svidjeti više nego drugi isključivo na temelju osobnih preferencija.
Rješavanje problema
Nakon što su obradili osnove, došli su do glavnog pitanja, odnosno ispunjava li DeepThink R1 očekivanja. Korisnici na internetu pišu da je besplatni model DeepThink R1 jednako dobar kao i ChatGPT o1, koji je dostupan besplatno u ograničenoj mjeri, ali zahtijeva pretplatu za puni pristup.
Kako bi testirali sposobnost razmišljanja chatbota, tražili su neke od najtežih izazova koje su mogli pronaći. Ostali su šokirani određenim rezultatima:
Pitanje 1: Pronađite riječ koja nedostaje: Apple, Red, Coal
Za test su odlučili izbjeći pitanja s višestrukim izborom i umjesto toga su samo upisali pitanje i pritisnuli enter.
ChatGPT o1 je za odgovor porabil 1 minuto in 29 sekund ter našel povezave med besedami in pravljico Sneguljčica. Model se je odločil odgovoriti na podlagi tega citata: “usne su joj bile crvene poput krvi, kosa crna poput ugljena, a koža bijela poput snijega.” Na podlagi tega citata je o1 kot odgovor manjkajoče besede izbral Sneg. Čeprav je bil miselni proces modela o1, to ni bil odgovor, ki so ga iskali.
DeepThink R1 je, međutim, trebalo 1 minutu i 14 sekundi da odgovori i uspio je pogoditi točnu riječ: Black. Jabuka je crvena; Ugljen je crn. U najmanju ruku impresivno.
Pitanje 2: 1. Dovršite niz: 1, 2, 4, 8, ? 2. Dovršite niz: kuća, Saturn, pas, hamburger, ?
Dok je prvi niz vrlo jednostavan, drugi je nemoguć (to su samo četiri nasumične riječi). Mogu li ChatGPT o1 ili DeepThink R1 uočiti zamku?
Niti ne. Oba modela sta poskušala najti odgovor in podala povsem drugačnega. DeepThink R1 je odgovoril z “rumena”, ker je menil, da so besede povezane z njihovo barvo (bela hiša, rumeni Saturn, rjavi pes, rumeni burger). ChatGPT o1 je na drugi strani odgovoril z “avto”, ker se mu je zdelo zaporedje skoraj nemogoče, vendar se je odločil ponuditi odgovore na podlagi “pristopa klasične uganke”. Pristop, ki ga je izbral, je bil povezovanje vsakega predmeta v večjo kategorijo, ki ji pripada (hiša = zgradba, Saturn = planet, pes = žival, burger = hrana in avto = vozilo).
U konačnici, oba su modela bila pogrešna i niti jedan nije odgovorio na način koji bi jasno naveo da postoji previše varijabli da bi se dao precizan odgovor.
DeepSeek protiv ChatGPT-a?
Tech Radar je testirao oba modela na razne načine, a sad se postavlja pitanje koji je bolji? Na temelju odgovora koje su dobili tijekom testiranja, DeepThink R1 izvrstan je besplatni model zaključivanja zbog kojeg biste se mogli zapitati isplati li se platiti za pristup o1. DeepSeek je dostupan samo online, u iOS App Store i Play Store, a vjerojatno će uslijediti i samostalna aplikacija za Mac ili iPad.
Tech Radar se odlučio držati ChatGPT-a, uglavnom zato što se uvelike oslanjaju na značajku sjećanja, koja omogućuje chatbotu da referencira prethodne razgovore. ChatGPT također ima koristi od samostalne aplikacije za Mac i iPad uređaje, kao i mogućnosti stvaranja slika s jednim od najboljih generatora slika umjetne inteligencije, DALL-E.
DeepSeek je baziran isključivo na tekstu i nema multimodalne mogućnosti, ali s obzirom da je ovo tek početak njegovog puta, vrlo je ozbiljan konkurent na polju UI modela i o njemu ćemo sigurno još puno čuti.