Domov Računalništvo, telefonija OpenAI pokazal, kje umetna inteligenca že prehiteva človeške strokovnjake

Računalništvo, telefonija

28.09.2025 07:49

Deli z drugimi:

OpenAI pokazal, kje umetna inteligenca že prehiteva človeške strokovnjake

OpenAI je razkril nov merilnik uspešnosti UI modelov, imenovan GDPval. S tem meri, kako dobro se njihovi modeli umetne inteligence odrežejo v primerjavi s človeškimi strokovnjaki v različnih panogah.

Kaj je GDPval?

GDPval temelji na devetih panogah, ki največ prispevajo k ameriškemu BDP-ju, med njimi zdravstvo, finance, proizvodnja in javna uprava. Znotraj teh področij je test zajel 44 poklicev, od programerjev do medicinskih sester in novinarjev. Prva različica, GDPval-v0, deluje tako, da izkušeni strokovnjaki primerjajo UI poročila s poročili ljudi in izberejo boljše.

Rezultati testiranj

GPT-5-high (nadgrajena različica GPT-5) je bil ocenjen kot boljši ali enakovreden industrijskim strokovnjakom v 40,6 % primerov.
Claude Opus 4.1 (Anthropic) je bil ocenjen kot boljši ali enakovreden v 49 % primerov. OpenAI meni, da je k temu pripomogla sposobnost modela za ustvarjanje privlačnih grafik, ne nujno vsebina.
Za primerjavo: GPT-4o, izdan pred približno 15 meseci, je dosegel le 13,7 %.

Omejitve testiranja

OpenAI priznava, da trenutna različica GDPval zajema le omejen nabor nalog – predvsem pripravo raziskovalnih poročil. Večina poklicev pa vključuje veliko več kot le pisanje poročil. Zato načrtujejo prihodnje različice, ki bodo bolj robustne, z več panogami in interaktivnimi delovnimi procesi.

Pomen za prihodnost dela

Kljub omejitvam je napredek očiten. Dr. Aaron Chatterji, glavni ekonomist pri OpenAI meni, da lahko strokovnjaki zdaj s pomočjo UI modelov nekatere naloge prepustijo tem in se osredotočijo na opravila z večjo dodano vrednostjo. Tejal Patwardhan iz OpenAI dodaja, da je napredek v zadnjih 15 mesecih spodbuden in da pričakuje nadaljnjo rast zmogljivosti.

Silicijeva dolina ima že vrsto preizkusov (npr. AIME 2025 za matematične probleme in GPQA Diamond za znanstvena vprašanja na doktorski ravni). Toda številni modeli so na teh testih že blizu zgornje meje. GDPval se zato lahko razvije v pomembno orodje za merjenje dejanske uporabnosti umetna inteligence v gospodarstvu. Za zdaj pa bo moral OpenAI pripraviti še obsežnejše različice, preden bo lahko samozavestno trdil, da UI resnično presega človeške strokovnjake.

Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Prijavi napako v članku

Vas zanima več iz te teme?

umetna inteligenca

Sorodne novice

Mistral z 830 milijoni evrov pospešuje gradnjo UI ...

Dreame na Bledu: Prihodnost pametnega doma s sesalnikom ...

Sony ne sprejema več naročil za SD kartice

Novi Vivo X300 Ultra je najboljše darilo za fotografe

QNAP myQNAPcloud One prinaša prilagodljivost, ki so ...

Telekom Slovenije v Cityparku odprl prvi prodajni center ...

Kaj berejo drugi?

Katera grafična kartica je najboljša izbira za vrhunsko prenosno igranje v 2026?

Nova drzna prevara na Amazonu

Kultna Commodore nostalgija v moderni gaming miški

Menjava ljubljanske megle za kanarsko sonce: Je “workation” prihodnost dela?

Apple dokončno upokojil Mac Pro

Energetika vstopa v obdobje nepredvidljivosti: ključ so lastni viri energije in hitrejše odločitve

Izpostavljeno

Ne ugibajte, raje preverite, kako zanesljiva je vaša ...

Odlične RPG igre, ko boste končali Clair Obscur: ...

Kakšno nadzorno kamero izbrati? Odvisno, za kaj jo ...

Popolna zaščita za mala in srednje velika podjetja

Ali bomo za vstop na splet kmalu potrebovali biometrični ...

Najbolj brano

Google zaostruje pravila: brez GTIN ni več vidnosti

Prvi Neuralinkov pacient po 100 dneh presegel vse meje

Foto: Sam Kriegman/Northwestern University

Umetna inteligenca ustvarila neuničljivega robota

Zaposlitveni oglasi

Vodja projektov implementacije Odoo (M/Ž) – proizvodnja in skladiščno poslovanje

Več

Odoo razvijalec M/Ž (Python, SQL, JavaScript)

Več

Najnovejši mali oglasi

70,00 €

Škofja Loka

Dark Rock Pro TR4 procesorski hladilnik

50,00 €

Idrija

NOV REDMI A5

450,00 €

Vojnik

ASUS Prime Rx 9060xt 16Gb OC

Silikonski ovitek Apple Iphone 7/8/SE(2020)/SE(2022)

5,00 €

Maribor

Silikonski ovitek Apple Iphone 7/8/SE(2020)/SE(2022)

19,00 €

Ljubljana

TP-LINK usmerjevalnik

250,00 €

Ajdovščina

Google Pixel 8 128GB

Dogodki

Apr

Mednarodni logistični kongres

Apr

Dnevi slovenske informatike 2026

Vsi dogodki

Dražbe / Licitacije Prikaži vse

Trenutna cena 90,⁰⁰€

Kavni aparat ILLY X7.1 Iperespresso (črn) – IZKLICNA CENA 1 €!

Trenutna cena 100,⁰⁰€

Skiro RollJet City + šolska torba D-bag (motiv Math) – IZKLICNA CENA 1 €!

Izklicna cena 1,⁰⁰€

Pisarniški stol Ergos PREMIUM – IZKLICNA CENA 1 €!

Izklicna cena 1,⁰⁰€

Klimatska naprava SAMSUNG WindFree™ Avant 2,5kW – IZKLICNA CENA 1 €!

Partnerji Računalniških novic Prikaži vse

TELEKOM SLOVENIJE d.d.

Cigaletova ulica 15, 1000 Ljubljana, Tel: 01 234 10 00

V skladu s svetovni trendi skupaj s hčerinskimi družbami doma in v tujini deluje kot enovita gospodarska Skupina Telekom Slovenije. Fiksno-mobilna konvergenca je imperativ časa. ... Več

J-LAB d.o.o.

Šaleška cesta 20a, 3320 Velenje, Tel: 040 757 323

Vizija podjetja J-Lab je zadovoljiti stranke v skladu s sloganom - hitro, učinkovito in cenovno ugodno, ob tem pa so potrpežljivi in zanesljivi, na voljo ves dan, vse dni v tednu. Klik ... Več

Zlati partner

SI SPLET d.o.o.

Ukmarjeva ulica 4, 1000 Ljubljana, Tel: 01 428 94 66

O podjetju Si splet V podjetju Si splet d. o. o. od leta 2001 tržimo varnostne rešitve na področju informacijskih tehnologij. V letu 2003 smo pridobili ekskluzivno partnerstvo ... Več

Zlati partner