De nieuwe versie van ChatGPT stelt teleur en maakt een einde aan de droom van de beloofde supermenselijke AI.

Alsof het Steve Jobs was die in 2007 de iPhone aankondigde, presenteerde Sam Altman gisteren zijn nieuwe oogappel: GPT-5, de nieuwste update van ChatGPT . Grofweg is het een slimmere, snellere en meer rationele versie dan zijn voorgangers. Maar dat is nou net waar het om draait. Dit is niet de kunstmatige algemene intelligentie (AGI) die Altman nastreeft, en het is ook niet eens superieur aan bijvoorbeeld de beste programmeur ter wereld.

Dit was een teleurstelling voor alle AI-experts die, in afwachting van de aankondigingen van vorige week, zagen hoe Altman hype creëerde door dingen als een Death Star te tweeten, wat impliceerde dat GPT-5 alle andere AI-systemen op de markt zou "vernietigen". Dit bleek echter niet het geval, en het deed ook denken aan het fiasco rond de lancering van Apple Intelligence , vergeleken met de beloftes die tijdens de WWDC 2024 in de aankondiging werden gedaan.

Matt Shumer, AI-expert en eigenaar van OthersideAI, had een paar weken geleden toegang tot GPT-5 en legt aan ABC uit dat het weliswaar het beste model tot nu toe is, maar dat "je veel moeite moet doen om er het maximale uit te halen". De gemiddelde gebruiker is hier op dit moment niet toe in staat en zal dus niet veel verschil merken met de GPT-4.5 die hij tot nu toe gebruikte.

De beste assistent voor een programmeur

"GPT-5 is zeer detailgericht en gericht op het beste presteren in lange contexten, omdat het daar minder domme fouten maakt. We hebben ontdekt dat het de ideale, zo niet de beste, AI is voor programmeren", merkt Shumer op. Altman merkte tijdens de presentatie van het nieuwe model zelfs op dat het de "perfecte assistent voor een programmeur" was.

Volgens het bedrijf behaalt GPT-5 een succespercentage van 74,9% bij de eerste poging. Openai

In de SWE-bench Verified benchmark, die zich richt op echte GitHub-taken, behaalt GPT-5 een slagingspercentage van 74,9% bij de eerste poging. Geen enkel alternatief heeft dit niveau ooit bereikt. Volgens het bedrijf onder leiding van Sam Altman presteert het beter dan Claude Opus 4.1 (74,5%) en Gemini 2.5 Pro (59,6%). Het kan websites vanaf nul bouwen met slechts een paar instructies, applicaties ontwerpen, interactieve games spelen of code debuggen in grote repositories zonder aan precisie in te boeten. Het voert niet alleen uit, het legt ook uit wat het doet en waarom.

Beïnvloed door voormalig Apple-ontwerper

Aan de andere kant is GPT-5 niet alleen van binnenuit verbeterd: het verandert ook de manier waarop we ermee omgaan. Met de komst van ChatGPT zijn er vier nieuwe persoonlijkheden: Cynic, Robot, Listener en Nerd. Elk reageert met zijn eigen stijl en past de toon, houding en aanpak aan zonder instructies. Je kunt ook de kleur van de chat met de AI aanpassen, hoewel deze optie alleen beschikbaar is voor gebruikers met een betaald account. Alles wijst erop dat de relatie van OpenAI met Jony Ive, voormalig Apple-ontwerper, de nieuwe functies van GPT-5 heeft beïnvloed.

Het lijkt er echter op dat GPT-o3 de beste optie blijft voor wetenschappelijk onderzoek, terwijl GPT-4.5 het ideale model is om te schrijven. Het goede nieuws is dat GPT-5 sinds gisteren gratis beschikbaar is voor alle ChatGPT-gebruikers. Gratis gebruikers krijgen toegang tot zowel GPT-5 als een snellere, maar minder nauwkeurige versie, GPT-5 mini. Dit is de eerste keer dat een geavanceerd redeneermodel zonder abonnement beschikbaar is.

Afhankelijk van het apparaat en meer dan 12 uur na de release, weet ChatGPT nog steeds niet dat GPT-5 bestaat. abc

Een stap vooruit, maar geen enorme sprong

Hoewel er redenen zijn om enthousiast te zijn over GPT-5 (het model laat de versie-indeling achterwege en wordt één enkel model dat in realtime beslist of redeneren of snelheid prioriteit krijgt), is de sprong niet zoals beloofd. Twee van de eerste testers van het nieuwe model vertelden Reuters dat ze ook onder de indruk waren van het vermogen om wetenschappelijke en wiskundige problemen te programmeren en op te lossen, maar ze geloven dat de sprong van GPT-4 naar GPT-5 niet zo groot is als die van GPT-3 naar GPT-4. "Het is verre van dat idee van bijna-menselijke intelligentie waar sommigen binnen en buiten OpenAI al jaren op zinspelen", benadrukken ze. Bij ABC hebben we een paar tests uitgevoerd, en zoals experts aangeven, hapert het bij heel basale vragen, zoals of GPT-5 al bestaat of wat het vijfde woord in het antwoord is.

ChatGPT schiet nog steeds tekort op de meest basale punten, die van cruciaal belang zijn voor de gemiddelde AI-gebruiker. abc

De ontwikkeling van GPT-5 was ook niet eenvoudig. Altman erkende publiekelijk dat de lancering enkele maanden moest worden uitgesteld omdat ze niet alle componenten van het model konden integreren. Hij zei ook dat ze ervoor wilden zorgen dat ze voldoende capaciteit hadden voor de verwachte "ongekende" vraag. Maar er zat meer achter die vertragingen. Enerzijds kampte OpenAI met een dataprobleem: er zijn niet langer veel nieuwe, grote en schone bronnen om dit soort modellen te trainen.

Ilya Sutskever, voormalig hoofdwetenschapper van het bedrijf, legde het als volgt uit: "We kunnen schalen in kracht, maar niet in data." Een ander probleem was dat "trainingsruns" voor grote modellen gevoeliger zijn voor hardwarematige storingen vanwege de complexiteit van het systeem. Bovendien weten onderzoekers de uiteindelijke prestaties van de modellen mogelijk pas aan het einde van de run, wat maanden kan duren.

ABC.es

De nieuwe versie van ChatGPT stelt teleur en maakt een einde aan de droom van de beloofde supermenselijke AI.

Vergelijkbaar nieuws

Ze pleiten voor de integratie van AI en drones in de landbouw om de toekomst van voedsel veilig te stellen.

Huawei lanceert de Pura 80 Ultra in Colombia, een smartphone die bioscoopkwaliteit belooft.

De Steurmaan is er op 9 augustus: de ultieme truc om de maan met je telefoon te fotograferen en er net zo uit te laten zien als wat je ziet.

De nieuwe versie van ChatGPT stelt teleur en maakt een einde aan de droom van de beloofde supermenselijke AI.

Capacity neemt Catalaans bedrijf Verbio Technologies over na het afronden van een financiering van 79 miljoen euro