De nieuwe versie van ChatGPT stelt teleur en maakt een einde aan de droom van de beloofde supermenselijke AI.

Alsof het Steve Jobs was die in 2007 de iPhone aankondigde, presenteerde Sam Altman gisteren zijn nieuwe oogappel: GPT-5, de nieuwste update van ChatGPT . Grofweg is het een slimmere, snellere en meer rationele versie dan zijn voorgangers. Maar dat is nou net waar het om draait. Dit is niet de kunstmatige algemene intelligentie (AGI) die Altman nastreeft, en het is ook niet eens superieur aan bijvoorbeeld de beste programmeur ter wereld.
Dit was een teleurstelling voor alle AI-experts die, in afwachting van de aankondigingen van vorige week, zagen hoe Altman hype creëerde door dingen als een Death Star te tweeten, wat impliceerde dat GPT-5 alle andere AI-systemen op de markt zou "vernietigen". Dit bleek echter niet het geval, en het deed ook denken aan het fiasco rond de lancering van Apple Intelligence , vergeleken met de beloftes die tijdens de WWDC 2024 in de aankondiging werden gedaan.
Matt Shumer, AI-expert en eigenaar van OthersideAI, had een paar weken geleden toegang tot GPT-5 en legt aan ABC uit dat het weliswaar het beste model tot nu toe is, maar dat "je veel moeite moet doen om er het maximale uit te halen". De gemiddelde gebruiker is hier op dit moment niet toe in staat en zal dus niet veel verschil merken met de GPT-4.5 die hij tot nu toe gebruikte.
"GPT-5 is zeer detailgericht en gericht op het beste presteren in lange contexten, omdat het daar minder domme fouten maakt. We hebben ontdekt dat het de ideale, zo niet de beste, AI is voor programmeren", merkt Shumer op. Altman merkte tijdens de presentatie van het nieuwe model zelfs op dat het de "perfecte assistent voor een programmeur" was.

In de SWE-bench Verified benchmark, die zich richt op echte GitHub-taken, behaalt GPT-5 een slagingspercentage van 74,9% bij de eerste poging. Geen enkel alternatief heeft dit niveau ooit bereikt. Volgens het bedrijf onder leiding van Sam Altman presteert het beter dan Claude Opus 4.1 (74,5%) en Gemini 2.5 Pro (59,6%). Het kan websites vanaf nul bouwen met slechts een paar instructies, applicaties ontwerpen, interactieve games spelen of code debuggen in grote repositories zonder aan precisie in te boeten. Het voert niet alleen uit, het legt ook uit wat het doet en waarom.
Aan de andere kant is GPT-5 niet alleen van binnenuit verbeterd: het verandert ook de manier waarop we ermee omgaan. Met de komst van ChatGPT zijn er vier nieuwe persoonlijkheden: Cynic, Robot, Listener en Nerd. Elk reageert met zijn eigen stijl en past de toon, houding en aanpak aan zonder instructies. Je kunt ook de kleur van de chat met de AI aanpassen, hoewel deze optie alleen beschikbaar is voor gebruikers met een betaald account. Alles wijst erop dat de relatie van OpenAI met Jony Ive, voormalig Apple-ontwerper, de nieuwe functies van GPT-5 heeft beïnvloed.
Het lijkt er echter op dat GPT-o3 de beste optie blijft voor wetenschappelijk onderzoek, terwijl GPT-4.5 het ideale model is om te schrijven. Het goede nieuws is dat GPT-5 sinds gisteren gratis beschikbaar is voor alle ChatGPT-gebruikers. Gratis gebruikers krijgen toegang tot zowel GPT-5 als een snellere, maar minder nauwkeurige versie, GPT-5 mini. Dit is de eerste keer dat een geavanceerd redeneermodel zonder abonnement beschikbaar is.
Hoewel er redenen zijn om enthousiast te zijn over GPT-5 (het model laat de versie-indeling achterwege en wordt één enkel model dat in realtime beslist of redeneren of snelheid prioriteit krijgt), is de sprong niet zoals beloofd. Twee van de eerste testers van het nieuwe model vertelden Reuters dat ze ook onder de indruk waren van het vermogen om wetenschappelijke en wiskundige problemen te programmeren en op te lossen, maar ze geloven dat de sprong van GPT-4 naar GPT-5 niet zo groot is als die van GPT-3 naar GPT-4. "Het is verre van dat idee van bijna-menselijke intelligentie waar sommigen binnen en buiten OpenAI al jaren op zinspelen", benadrukken ze. Bij ABC hebben we een paar tests uitgevoerd, en zoals experts aangeven, hapert het bij heel basale vragen, zoals of GPT-5 al bestaat of wat het vijfde woord in het antwoord is.

De ontwikkeling van GPT-5 was ook niet eenvoudig. Altman erkende publiekelijk dat de lancering enkele maanden moest worden uitgesteld omdat ze niet alle componenten van het model konden integreren. Hij zei ook dat ze ervoor wilden zorgen dat ze voldoende capaciteit hadden voor de verwachte "ongekende" vraag. Maar er zat meer achter die vertragingen. Enerzijds kampte OpenAI met een dataprobleem: er zijn niet langer veel nieuwe, grote en schone bronnen om dit soort modellen te trainen.
Ilya Sutskever, voormalig hoofdwetenschapper van het bedrijf, legde het als volgt uit: "We kunnen schalen in kracht, maar niet in data." Een ander probleem was dat "trainingsruns" voor grote modellen gevoeliger zijn voor hardwarematige storingen vanwege de complexiteit van het systeem. Bovendien weten onderzoekers de uiteindelijke prestaties van de modellen mogelijk pas aan het einde van de run, wat maanden kan duren.
ABC.es