Terug naar updates
TaalmodellenWorkflow27 mei 2026

Van ChatGPT tot GPT-5.5: hoe OpenAI zijn modellen elk jaar zelfstandiger maakte

Van ChatGPT en GPT-4 tot GPT-5.5: zo verschoof OpenAI in drie jaar van slimme chatbot naar modellen die redeneren, tools gebruiken en steeds meer werk zelfstandig uitvoeren.

Harm Schreuder

Harm Schreuder

Studio Spacebar

OpenAI is in een paar jaar tijd veranderd van een onderzoekslab met indrukwekkende demo's in het bedrijf dat het ritme van de AI-markt mee bepaalt. Wie alleen naar de hype kijkt, mist echter het interessantere verhaal: bijna iedere grote modelrelease verschoof de grens van wat een AI-systeem praktisch kon doen.

Eerst ging het om beter praten. Daarna om betrouwbaarder redeneren. Vervolgens om beeld, audio en live interactie. En inmiddels draait het steeds meer om modellen die niet alleen antwoorden geven, maar ook tools gebruiken, stappen plannen en werk over meerdere handelingen kunnen afmaken.

Dit is de korte geschiedenis van OpenAI tot en met 27 mei 2026, met de focus op de releases die echt iets veranderden en op wat er per generatie beter werd.

2015 tot 2022: van onderzoekslab naar het ChatGPT-moment

OpenAI werd in 2015 opgericht als AI-onderzoekslab. Jarenlang draaide het verhaal vooral om onderzoek, schaalvergroting en het trainen van steeds grotere taalmodellen. Voor het grote publiek kwam de echte doorbraak pas op 30 november 2022, toen OpenAI ChatGPT lanceerde.

Dat product draaide op een model uit de GPT-3.5-serie. Technisch was dat niet het eerste sterke taalmodel van OpenAI, maar wel het moment waarop de interface het verschil maakte. ChatGPT maakte van een model een gesprekspartner: gebruikers konden doorvragen, corrigeren, itereren en in gewone taal samenwerken met AI.

Wat er toen verbeterde:

  • AI werd bruikbaar voor miljoenen niet-technische gebruikers.
  • Instructies volgen werd veel natuurlijker dan bij eerdere generaties.
  • De waarde verschoof van losse prompt-output naar een doorlopend gesprek.

De beperkingen waren tegelijk duidelijk zichtbaar. ChatGPT hallucineerde regelmatig, was vaak te stellig, verloor context en moest nog sterk gestuurd worden. Maar de richting was gezet: OpenAI liet zien dat de toekomst van AI niet alleen in het model zat, maar ook in de manier waarop mensen ermee werken.

2023: GPT-4 maakte AI serieuzer

Op 14 maart 2023 volgde GPT-4, voor veel bedrijven het moment waarop generatieve AI van curiositeit naar serieuze infrastructuur verschoof. OpenAI presenteerde GPT-4 als multimodaal, met beeldinput naast tekst, en claimde tegelijk stevige vooruitgang in veiligheid en betrouwbaarheid.

Volgens OpenAI was GPT-4 in interne evaluaties 82 procent minder geneigd om verboden verzoeken te beantwoorden dan GPT-3.5, en 40 procent vaker feitelijk correct. Dat klinkt als een klein detail, maar het was precies de verbetering die nodig was om AI geloofwaardiger te maken voor kenniswerk, softwareontwikkeling en educatie.

Later dat jaar, op 6 november 2023, volgde GPT-4 Turbo tijdens DevDay. Die release was minder spectaculair voor het brede publiek, maar strategisch erg belangrijk. GPT-4 Turbo bracht:

  • een contextvenster van 128.000 tokens
  • lagere API-prijzen
  • betere praktische inzet voor assistants en tools
  • een duidelijker route richting AI in apps, workflows en productiesystemen

De sprong van 2023 was dus niet alleen "slimmer", maar vooral: bruikbaarder, goedkoper en langer geconcentreerd.

2024: GPT-4o maakte OpenAI echt multimodaal

Op 13 mei 2024 kwam een nieuwe omslag met GPT-4o. De "o" stond voor "omni", en dat was geen marketingdetail. GPT-4o was OpenAI's eerste grote model dat tekst, beeld en audio veel directer samenbracht.

Het belangrijkst was niet alleen dat GPT-4o meerdere modaliteiten aankon, maar dat het die modaliteiten in één model dichter bij elkaar bracht. Voor spraak betekende dat een veel natuurlijkere interactie. OpenAI meldde dat GPT-4o op audio-inputs kon reageren in 232 milliseconden en gemiddeld rond 320 milliseconden, dicht bij menselijke gesprekssnelheid. Vergeleken met eerdere Voice Mode-opzetten, waarin meerdere modellen achter elkaar werkten, voelde dat als een fundamentele kwaliteitsstap.

Daarnaast stelde OpenAI dat GPT-4o:

  • GPT-4 Turbo evenaarde op tekst en code
  • duidelijk beter was in niet-Engelse tekst
  • sterker werd in beeld- en audiobegrip
  • 50 procent goedkoper was in de API

Die combinatie was cruciaal. GPT-4o was niet alleen beter, maar ook efficiënter. Daarmee werd multimodale AI iets dat niet exclusief voor demo's of premiumgebruik hoefde te blijven.

Een paar maanden later, op 18 juli 2024, verscheen GPT-4o mini. Dat was misschien niet de meest glamoureuze release, maar wel een belangrijke. OpenAI positioneerde het model als zijn meest kostenefficiënte kleine model. Het moest de rol van GPT-3.5 in veel toepassingen overnemen: sneller, goedkoper en nog steeds verrassend capabel.

Wat GPT-4o mini toevoegde:

  • veel lagere kosten dan eerdere frontier-modellen
  • sterke prestaties voor alledaagse taken en lichte agents
  • betere multimodale basis dan GPT-3.5 Turbo
  • een duidelijke democratisering van bruikbare AI

2024 was daarmee het jaar waarin OpenAI liet zien dat "multimodaal" niet alleen een onderzoekswoord was, maar een productrichting.

2024: met o1 begon de redenerende lijn

De volgende grote stap kwam op 12 september 2024 met OpenAI o1-preview. Daarmee begon OpenAI openlijk een tweede lijn naast de klassieke GPT-familie: modellen die meer tijd nemen om te redeneren voordat ze antwoorden.

De winst zat hier niet in vlotter praten of mooier formuleren, maar in moeilijkere problemen. OpenAI positioneerde o1 voor wetenschap, wiskunde en code. In de eigen communicatie was het verschil met GPT-4o scherp: op een kwalificatie-examen voor de Internationale Wiskunde Olympiade zou GPT-4o 13 procent halen, terwijl het reasoning-model op 83 procent uitkwam.

Belangrijker dan die ene benchmark was de strategische boodschap: OpenAI maakte duidelijk dat de race niet meer alleen draaide om grotere taalmodellen, maar ook om hoe lang en hoe goed een model intern kan nadenken.

Daarmee ontstonden twee sporen:

  • de GPT-lijn voor algemene, snelle, natuurlijke interactie
  • de o-lijn voor moeilijkere, meerstaps redenering

Die splitsing zou later weer samenkomen, maar in 2024 werd ze voor het eerst echt zichtbaar.

2025: OpenAI stapelde verbeteringen sneller op elkaar

Als 2024 het jaar van de nieuwe richtingen was, dan was 2025 het jaar waarin OpenAI die richtingen agressief uitbouwde.

GPT-4.5: natuurlijker en menselijker samenwerken

Op 27 februari 2025 kwam GPT-4.5 als research preview. OpenAI noemde het zijn grootste en beste GPT-model voor chat tot dan toe. De kern van de verbetering zat niet primair in "hard reasoning", maar in pretraining, wereldkennis, nuance en samenwerking.

OpenAI benadrukte bij GPT-4.5:

  • bredere kennis
  • beter begrip van gebruikersintentie
  • natuurlijkere gesprekken
  • meer creatieve en esthetische intuïtie
  • minder hallucinaties

GPT-4.5 was vooral belangrijk omdat het liet zien dat OpenAI de klassieke GPT-lijn nog niet had opgegeven. Niet iedere stap hoefde een redeneermodel te zijn; soms zat de winst juist in een model dat prettiger, socialer en intuïtiever werkte.

o3-mini, o3 en o4-mini: reasoning werd sneller en praktischer

Op 31 januari 2025 verscheen o3-mini, OpenAI's kleine reasoning-model. De belofte was duidelijk: prestaties in STEM en code die richting o1 gingen, maar dan sneller en goedkoper. OpenAI meldde bovendien dat o3-mini de eerste kleine reasoning-release was met features zoals function calling en Structured Outputs, waardoor het direct inzetbaar werd in productie.

Daarna volgde op 16 april 2025 de grotere stap met o3 en o4-mini. Hier schoof OpenAI door van "kan redeneren" naar "kan redeneren én tools gebruiken". Volgens OpenAI konden deze modellen voor het eerst agentisch alle tools binnen ChatGPT combineren, van webzoeken en Python tot bestandsanalyse en beeldgeneratie.

Wat daar wezenlijk verbeterde:

  • redeneermodellen werden beter in echte workflows, niet alleen benchmarks
  • beeld werd onderdeel van de denkstappen, niet alleen van de input
  • toolgebruik werd strategischer: wanneer zoek je, wanneer reken je, wanneer programmeer je?
  • de modellen konden complexere taken in meerdere stappen afronden

Dit was het moment waarop OpenAI's roadmap zichtbaar schoof van chatbot naar werkuitvoerder.

GPT-4.1: beter in code, instructies en lang contextgebruik

Slechts twee dagen eerder, op 14 april 2025, lanceerde OpenAI ook GPT-4.1, plus mini- en nano-varianten. Die release draaide minder om spektakel en meer om precisie. OpenAI zei dat GPT-4.1 op vrijwel alle fronten beter presteerde dan GPT-4o en GPT-4o mini, met speciale winst op:

  • coding
  • instruction following
  • long context

Het model kreeg een contextvenster van 1 miljoen tokens, een enorme sprong ten opzichte van eerdere standaardmodellen. OpenAI meldde ook duidelijke benchmarkwinsten, waaronder 54,6 procent op SWE-bench Verified en een forse stijging op instructievolging.

GPT-4.1 voelde daarmee als een model voor ontwikkelaars en teams die minder wilden imponeren met demo's en meer wilden opleveren in dagelijkse productie.

GPT-5: de twee lijnen kwamen samen

Op 7 augustus 2025 presenteerde OpenAI GPT-5. Dat was misschien wel de belangrijkste modelrelease sinds GPT-4, omdat hier de eerdere splitsing tussen snelle GPT-modellen en tragere reasoning-modellen weer deels werd samengebracht.

OpenAI omschreef GPT-5 als een unified system: een slim model, een diepere reasoning-variant en een router die beslist wanneer snel antwoorden genoeg is en wanneer langer nadenken beter werkt.

Daarmee werd een oud gebruiksprobleem opgelost. Tot dan moesten gebruikers steeds vaker kiezen tussen modellen: snel of slim, goedkoop of grondig, prettig of analytisch. GPT-5 probeerde die modelkeuze te abstraheren.

Wat GPT-5 verbeterde:

  • hogere algemene intelligentie over code, schrijven, analyse en visueel begrip
  • ingebouwde "thinking" in plaats van een harde scheiding tussen productmodi
  • betere stuurbaarheid
  • sterkere prestaties in agentische en coderingsscenario's

In de praktijk was GPT-5 minder een los model dan een nieuw productidee: één AI-systeem dat zelf weet wanneer het harder moet denken.

GPT-5.1: sneller en beter afgestemd op bouwen

Op 13 november 2025 volgde GPT-5.1. Deze release was duidelijk gericht op ontwikkelaars. OpenAI beschreef GPT-5.1 als sneller en token-efficiënter op eenvoudige taken, zonder de frontier-prestaties te verliezen op moeilijk werk.

Extra belangrijk: OpenAI koppelde GPT-5.1 aan nieuwe bouwstenen voor agentische software, waaronder apply_patch voor betrouwbaarder code-edits en shell tooling voor lokale acties. Daarmee werd nog duidelijker dat OpenAI niet alleen modellen wilde verkopen, maar complete werkagenten.

2026 tot nu toe: GPT-5.5 draait om werk echt afmaken

De meest recente grote stap is GPT-5.5, aangekondigd op 23 april 2026. Als je de eerdere jaren samenvat als een ontwikkeling van chat naar multimodaliteit naar reasoning, dan is GPT-5.5 de stap naar volhoudend uitvoeren.

OpenAI positioneert GPT-5.5 als zijn slimste en intuïtiefste model tot nu toe, met sterke winst in:

  • agentic coding
  • computer use
  • kenniswerk
  • vroege wetenschappelijke research

De kern van GPT-5.5 is niet alleen dat het slimmer is, maar dat het meer werk zelf kan dragen. OpenAI schrijft dat het model sneller begrijpt wat je probeert te doen, plannen kan maken, tools kan gebruiken, eigen werk kan controleren en door ambiguïteit heen kan blijven werken.

Dat is een ander soort verbetering dan bij de eerste ChatGPT-generatie. Toen ging het om verrassend goede antwoorden. Nu gaat het om langere taakbogen: een model dat niet instort zodra een opdracht rommelig, meerdelig of afhankelijk van tools wordt.

Ook technisch is het beeld interessant. OpenAI claimt dat GPT-5.5 op meerdere agentische en professionele evaluaties beter scoort dan GPT-5.4, terwijl het tegelijk op ongeveer dezelfde latency blijft draaien. Met andere woorden: de winst zit niet alleen in brute intelligentie, maar ook in efficiëntere inzet van die intelligentie.

Wat er in vier jaar echt veranderde

Als je alle releases naast elkaar legt, zie je dat OpenAI's vooruitgang niet uit één rechte lijn bestaat. Het bedrijf verbeterde zijn modellen langs meerdere assen tegelijk.

1. Van tekstmachine naar multimodaal systeem

Bij ChatGPT en GPT-4 draaide het vooral om taal. Met GPT-4o werd OpenAI serieus multimodaal: tekst, beeld en audio kwamen dichter bij elkaar. Daardoor veranderde niet alleen wat het model kon begrijpen, maar ook hoe natuurlijk de interactie werd.

2. Van antwoorden naar redeneren

Met o1, o3 en o4-mini schoof de focus van vloeiende output naar moeilijkere probleemoplossing. OpenAI bouwde modellen die expliciet beter werden in meerstaps denken, STEM-vraagstukken en complexe code.

3. Van losse prompts naar context op schaal

GPT-4 Turbo en later GPT-4.1 maakten lange context praktisch relevant. Vooral het contextvenster van 1 miljoen tokens in GPT-4.1 liet zien dat OpenAI niet alleen slimmer wilde antwoorden, maar ook grotere dossiers, codebases en documentstromen in één sessie wilde verwerken.

4. Van chatbot naar agent

De grootste verschuiving is misschien deze: de modellen van OpenAI zijn steeds minder alleen gesprekspartners en steeds meer uitvoerders. Toolgebruik, planning, iteratie, browsing, code draaien en werk controleren zijn geen randfuncties meer, maar het hart van de productstrategie.

De bredere geschiedenis van OpenAI in één zin

De geschiedenis van OpenAI tot nu toe is niet simpelweg het verhaal van steeds sterkere taalmodellen. Het is het verhaal van een bedrijf dat in hoog tempo AI heeft verschoven van praten over werk naar steeds meer werk daadwerkelijk doen.

ChatGPT maakte AI toegankelijk. GPT-4 maakte het serieus. GPT-4o maakte het multimodaal. o1 en o3 maakten redeneren centraal. GPT-5 bracht die lijnen weer samen. En GPT-5.5 laat zien waar OpenAI nu heen wil: modellen die minder op een chatbot lijken en meer op een digitale collega die context begrijpt, tools gebruikt en taken afmaakt.

De vraag voor de rest van 2026 is daarom niet meer alleen welk model het slimst klinkt. De echte vraag is welk model het betrouwbaarst zelfstandig kan werken. Precies daar lijkt OpenAI zijn volgende hoofdstuk te schrijven.