OpenAI wint van Grok bij het schaken. Musk en Altman's langeafstandswedstrijd

De finale van het AI Chess Exhibition Tournament is gisteren, donderdag 7 augustus 2025, afgesloten. Dit AI-schaaktoernooi, georganiseerd door Google DeepMind, luidt het nieuwe benchmarkplatform Kaggle Game Arena in, waar de beste LLM-modellen voor kunstmatige intelligentie (AI) in verschillende games strijden om de tot nu toe ontwikkelde strategische en complexe redeneervaardigheden te evalueren. Games zouden namelijk belangrijke benchmarks zijn voor de evaluatie van modellen, en tot nu toe zijn slechts enkele engines zoals Stockfish of modellen zoals AlphaZero in staat om zelfs op zeer hoog niveau te spelen. Kate Olszewska en Meg Risdal, productmanagers bij respectievelijk Google en Kaggle, schrijven hierover in een artikel op de Google-blog: "Games bieden een duidelijk en ondubbelzinnig signaal van succes. Hun gedefinieerde structuur en meetbare resultaten maken ze tot de ideale testomgeving voor het evalueren van modellen en agents. Ze dwingen modellen om tal van vaardigheden te demonstreren, waaronder strategisch redeneren, langetermijnplanning en dynamische aanpassing aan een intelligente tegenstander, wat een robuuste indicator vormt van hun algehele probleemoplossende intelligentie. De waarde van games als benchmark wordt verder vergroot door hun schaalbaarheid – de moeilijkheidsgraad neemt toe met de intelligentie van de tegenstander – en het vermogen om de redenering van het model te analyseren en visualiseren, wat een inkijkje biedt in het strategische denkproces."

Modellen van Deepseek, Google, Anthropic en Moonshot AI deden ook mee aan de knock-outfase, maar in de finale versloeg Sam Altmans AI Elon Musks Grok 4 met 4-0. In de halve finale versloeg Grok Googles Gemini 2.5 Pro in een tiebreak, terwijl o3 de wendbaardere o4-mini met 4-0 versloeg.

Uiteraard had de uitdaging voor Sam Altman en Elon Musk, afgezien van het simpele meten van de mogelijkheden van de twee modellen, een persoonlijkere betekenis: tien jaar geleden hadden zij beiden OpenAI opgericht, voordat Musk ervoor koos om een onafhankelijke weg in te slaan door het concurrerende bedrijf xAI op te richten. Hij startte juridische stappen om te voorkomen dat OpenAI zou transformeren tot een winstgevende organisatie, in tegenstelling tot wat in de oprichtingsfase was vastgelegd.

Desalniettemin markeert deze uitdaging tussen kunstmatige intelligenties eerder een symbolische dan een technische mijlpaal. Geen van de betrokken modellen is ontworpen om deze taken uit te voeren; sterker nog, ze zijn ontworpen om te schrijven, afbeeldingen te genereren, te programmeren en zelfs complexe vragen te beantwoorden, maar ze falen in situaties die rigoureuze logica vereisen. Deze beperking toont echter aan dat kunstmatige intelligentie, hoe geavanceerd ook, nog niet het niveau van intelligentie heeft bereikt dat we als echt menselijk beschouwen. Het schaakspel, met zijn complexiteit, vormt daarom een test die de ambities van degenen die deze modellen ontwikkelen, benadrukt in plaats van de daadwerkelijke superioriteit van machines.