Waarom GEO geen SEO-tool met een AI-jasje is

Sanne de Boer · Juni 2026 · 11 min lezen

AI-visibility

In het kort

GEO is geen SEO 2.0: generatieve modellen zijn probabilistisch, dus een vaste positie bestaat niet.
Eenmalig meten is gokken; alleen herhaalde runs met een onzekerheidsmarge zeggen iets betrouwbaars.
Denk in entiteiten, associaties en reputatie, niet in trefwoorden en rankings.

Steeds meer marketeers stellen dezelfde vraag: hoe kom ik in de antwoorden van ChatGPT, Claude, Gemini en Perplexity terecht? Het is een logische vraag, want steeds vaker begint een aankoop niet bij een zoekbalk maar bij een gesprek met een assistent, op precies het moment dat de klant zijn keuze bepaalt.

Het antwoord dat ze meestal krijgen is in de kern een bestaande aanpak: een dashboard met scores, een lijst trefwoorden, een rapportcijfer voor de 'AI-zichtbaarheid'. In werkelijkheid is dat een SEO-rapportage toegepast op een AI-omgeving, en die toepassing klopt inhoudelijk niet.

Generative Engine Optimization is geen doorontwikkeling van klassieke zoekmachineoptimalisatie. Het werkt op een fundamenteel andere techniek, het meet iets anders en het vraagt om andere keuzes over waar je je geld in stopt. Wie GEO als SEO 2.0 behandelt, optimaliseert op basis van aannames die niet kloppen.

In dit artikel leg ik uit waarom de onderliggende natuur van generatieve modellen elke aanname uit het SEO-tijdperk onderuithaalt, en hoe je GEO wel serieus en statistisch onderbouwd aanpakt.

Deterministisch versus probabilistisch

Klassieke SEO leeft in een deterministische wereld. Google draait op een ranking-algoritme dat, gegeven dezelfde input en dezelfde index, in principe dezelfde uitkomst geeft. Zoek je vandaag op een term, dan staat een pagina op positie vier. Morgen waarschijnlijk weer.

Die stabiliteit is de hele basis van SEO: je meet een positie, je verandert iets, je meet opnieuw of de positie omhoog ging. Oorzaak en gevolg zijn netjes te volgen. Je kunt een wijziging doorvoeren en een week later met een hoge mate van zekerheid vaststellen dat die wijziging het verschil maakte.

Generatieve modellen werken niet zo. Een LLM voorspelt het volgende token uit een kansverdeling. Bij elke run wordt er uit die verdeling getrokken, vaak met een temperatuur die bewust variatie toelaat. Stel dezelfde vraag tien keer en je krijgt tien net iets andere antwoorden, soms met andere merken, andere volgorde, andere framing.

Er is geen vaste positie vier. Er is alleen een kans dat jouw merk genoemd wordt, en die kans verschilt per run, per model en per moment. Wie dat probeert te meten met de logica van een ranking-tracker, meet ruis en noemt het signaal.

Deterministisch

Klassieke SEO / Google

Dezelfde vraag

1 uitkomst · P = 1.00 · vast

Probabilistisch

AI Search / LLM

Dezelfde vraag

Run 1

Run 2

Run 3

N uitkomsten · P ~ verdeling · variabel

Er is geen vaste positie vier. Er is alleen een kans dat jouw merk genoemd wordt.

Waarom een eenmalige meting niets zegt

Hier struikelt de meerderheid van de GEO-tools. Ze stellen je vraag een keer, kijken of je genoemd wordt, en zetten daar een vinkje of een kruisje bij. Maar een enkele trekking uit een kansverdeling vertelt je niets betrouwbaars over de verdeling zelf.

Word je in run een niet genoemd, betekent dat niets als je in negen van de tien runs wel verschijnt. En andersom: word je een keer prominent genoemd, dan is dat geen bewijs dat je merk stevig verankerd zit. Het kan toeval zijn, een gelukkige trekking die de volgende keer net zo makkelijk uitblijft.

Eenmalig meten in een probabilistische omgeving is als de kwaliteit van een dobbelsteen beoordelen door hem een keer te gooien. Gooi je een zes, dan weet je nog steeds niet of de dobbelsteen eerlijk is. Je hebt herhaling nodig voordat je iets mag concluderen.

Correlatie verward met causaliteit

Een tweede, hardnekkiger fout is dat veel GEO-aanbieders patronen in antwoorden verwarren met oorzaken. Ze scrapen duizenden AI-antwoorden, tellen welke kenmerken vaak voorkomen bij genoemde merken, en presenteren dat als een recept.

Vergelijk het met iemand die de ingredienten van tienduizend supermarktproducten telt en triomfantelijk concludeert: gebruik water en tarwe, want dat zit in bijna alles. Klopt als observatie, maar het is geen recept voor een goed product. Dat water en tarwe vaak voorkomen, maakt ze niet de reden waarom iets verkoopt.

Zo werkt het ook met GEO-correlaties. Omdat genoemde merken vaak een Wikipedia-pagina hebben, vaak gestructureerde data gebruiken of vaak in lijstjes staan, betekent niet dat die kenmerken jou erin krijgen. Het kan net zo goed een gevolg zijn van autoriteit die je via een heel andere weg hebt opgebouwd, waarbij de Wikipedia-pagina een symptoom is en niet de motor.

Een aanbeveling die niet onderscheidt tussen wat samenhangt en wat veroorzaakt, stuurt je naar bezig zijn in plaats van naar resultaat. Je vinkt netjes alle kenmerken af en verbaast je dat er niets beweegt.

Een correlatie zonder oorzaak stuurt je naar bezig zijn in plaats van naar resultaat.

Modelgeheugen versus live retrieval

Voordat je iets optimaliseert, moet je weten waar het antwoord vandaan komt. Daar zitten grofweg twee bronnen. De eerste is het modelgeheugen: kennis die tijdens de training in de gewichten is vastgelegd. Als ChatGPT zonder te zoeken een merk noemt, put het uit wat het tijdens training over de wereld heeft geleerd.

De tweede is live retrieval: het model haalt op dat moment actuele bronnen op, bijvoorbeeld zoals Perplexity standaard doet of ChatGPT met browsen aan. Hetzelfde model kan dus de ene keer uit zijn geheugen putten en de andere keer een verse pagina ophalen, afhankelijk van de vraag en de instellingen.

Dit onderscheid bepaalt je hele strategie. Zit je vooral in het modelgeheugen, dan investeer je in reputatie en in brede, consistente aanwezigheid op het web over een lange periode, want het geheugen volgt trager en weegt herhaalde signalen. Een nieuwe perspublicatie van vandaag zit pas in een toekomstige trainingsronde.

Draait het om live retrieval, dan investeer je in vindbare, goed gestructureerde en actuele content, zoals een feed die specifiek is ingericht op AI-antwoorden, die op het moment van de vraag opgehaald kan worden. Hier telt een verse, goed leesbare pagina vandaag al mee.

Wie deze twee door elkaar haalt, optimaliseert content terwijl het probleem reputatie is, of andersom. Een GEO-tool die niet vertelt welke bron jouw situatie domineert, laat de belangrijkste vraag onbeantwoord.

Entiteiten en associaties, geen rankings

SEO denkt in trefwoorden en posities. GEO denkt in entiteiten en associaties. Een LLM heeft geen ranglijst van pagina's voor een zoekterm. Het heeft een web van concepten, merken, mensen en onderwerpen, en associaties daartussen.

De vraag is niet 'sta ik op positie drie voor dit trefwoord', maar 'wanneer iemand vraagt naar oplossingen in mijn categorie, hoort mijn merk dan tot de entiteiten die het model met die categorie associeert'. Een entiteit is een ding dat het model als een herkenbaar concept met eigenschappen behandelt: jouw bedrijf, jouw product, een persoon, een methode.

Stel je verkoopt projectmanagementsoftware voor de bouw. Dan wil je niet zozeer scoren op het trefwoord 'projectsoftware', maar wil je dat het model jouw merk als entiteit stevig koppelt aan het concept 'planning in de bouw'. Die koppeling is wat maakt dat je opduikt als iemand vraagt om tips voor bouwplanning, ook zonder dat je merknaam in de vraag staat.

Sterke, consistente associaties tussen jouw entiteit en de relevante onderwerpen zijn wat je in antwoorden brengt. Dat bouw je niet met keyword-dichtheid, maar met heldere, herhaalde, eenduidige informatie over wie je bent en waar je voor staat, gepubliceerd op plekken die het model meeneemt. Welke eigen data je daarbij publiceert, bepaalt in grote mate of een model je later aanhaalt.

Reputatie meten, niet alleen zichtbaarheid

Zichtbaarheid, het kale feit of je genoemd wordt, is maar de helft. Minstens zo belangrijk is hoe je genoemd wordt. Word je geframed als de premium keuze of als de goedkope optie? Als specialist of als generalist?

En in welk competitief landschap verschijn je: naast welke concurrenten word je gezet, en wie verschijnt er in jouw plaats wanneer jij wegvalt? Een merk dat in dertig procent van de antwoorden genoemd wordt maar consequent als duurder alternatief, heeft een ander probleem dan een merk dat zelden genoemd wordt maar altijd lovend.

De eerste moet werken aan framing, de tweede aan bereik. Dezelfde score, een totaal andere actie. Wie alleen telt of de naam valt, ziet dat verschil niet en pakt het verkeerde probleem aan.

SEO had geen woordenschat voor dit soort reputatiemeting, want een blauwe link heeft geen toon. Een AI-antwoord wel. Goede GEO-meting leest dus niet alleen of je naam valt, maar de sentimenten, de rol en het gezelschap waarin die naam valt.

Mini-kader: de drie reputatievragen

Stel bij elke meting drie vragen. Een: word ik genoemd, en hoe vaak over veel runs. Twee: hoe word ik geframed, in welke toon en in welke rol. Drie: wie staat er naast me of in mijn plaats.

Pas als je deze drie samen bekijkt, weet je of je een zichtbaarheidsprobleem, een reputatieprobleem of een concurrentieprobleem hebt. Ze vragen alle drie om een ander soort werk: meer aanwezigheid, andere framing, of een scherpere positionering tegenover een specifieke concurrent.

Statistisch onderbouwd meten

Omdat GEO probabilistisch is, hoort de meting statistisch te zijn. Dat betekent: stel dezelfde vraag niet een keer maar veel keren, bijvoorbeeld dertig of meer runs, eventueel verspreid over modellen en momenten.

Tel hoe vaak je genoemd wordt en bereken een betrouwbaarheidsinterval rond dat percentage. Een 95-procent betrouwbaarheidsinterval vertelt je binnen welke bandbreedte het echte noemingspercentage waarschijnlijk ligt.

Word je in 18 van de 30 runs genoemd, dan is je geschatte aandeel zestig procent, maar met een interval dat eerlijk laat zien hoeveel onzekerheid daar nog in zit. Bij dertig runs is dat interval vrij breed; pas bij honderd runs trekt het strak genoeg om er een budget op te durven zetten.

Doe je hetzelfde voor een concurrent, dan kun je pas zinnig zeggen of het verschil tussen jullie echt is of binnen de ruis valt. Scoor jij zestig procent en zij vijfenvijftig, maar overlappen de intervallen ruim, dan is dat verschil voorlopig betekenisloos.

Wat overblijft zonder die herhaling en die marge is geen betrouwbare meting, maar een losse waarneming die ten onrechte als representatief wordt behandeld. Een GEO-rapport zonder herhaling en zonder onzekerheidsmarge is een mening met een grafiek eromheen.

Score met bandbreedte

Robust · 240 runs78

74–82

Minimal · 18 runs78

58–94

Zelfde score, andere zekerheid.

Een GEO-rapport zonder herhaling en zonder onzekerheidsmarge is een mening met een grafiek eromheen.

Mini-kader: betrouwbaarheidslabels

Niet elke meting verdient hetzelfde vertrouwen. Werk daarom met labels op basis van het aantal runs en de breedte van het interval.

Robust: genoeg runs, smal interval, je mag erop sturen. Adequate: redelijk onderbouwd, bruikbaar als richting maar nog niet als hard feit. Minimal: te weinig data, alleen een indicatie, geen besluit op baseren.

Door elk getal een label te geven, voorkom je dat een toevallige uitschieter een dure beslissing aanstuurt. Een minimal-getal mag een hypothese voeden, nooit een factuur.

Robust

Tientallen tot honderden runs, lage variantie. Hier baseer je strategie op.

Adequate

Voldoende voor richting, niet rotsvast. Bruikbaar voor hypothesevorming.

Minimal

Te weinig signaal. Apart gerapporteerd, niet als advies verkocht.

Aanbevelingen, geen datadump

Het laatste verschil zit in wat je met de meting doet. Veel tools leveren een datadump: tientallen queries, honderden noemingen, kleurige grafieken, en dan mag jij het uitzoeken. Maar data zonder interpretatie is geen advies.

De waarde zit in de vertaalslag. Bijvoorbeeld: je wordt zelden genoemd bij categorievragen omdat het model je entiteit niet sterk met de categorie associeert, dus investeer in consistente categorie-aanwezigheid op gezaghebbende bronnen. Of: je wordt genoemd maar consequent als budgetoptie, terwijl je premium bent, dus je reputatieprobleem zit in framing, niet in zichtbaarheid.

Een concrete aanbeveling benoemt het probleem, de waarschijnlijke oorzaak en de eerste stap. Een datadump benoemt alleen dat er iets is, en laat de moeilijkste denkstap aan jou over op het drukste moment van je week.

Vraag bij elke GEO-tool dus dezelfde vraag: krijg ik straks tien dingen om te doen, of duizend dingen om te bekijken.

Een praktisch stappenplan

Begin klein en gericht. Stap een: bepaal de tien tot twintig vragen die jouw ideale klant echt aan een AI-assistent zou stellen, in hun woorden, niet in trefwoorden. Denk aan 'welke tool helpt me mijn bouwproject te plannen', niet aan 'bouwplanning software'.

Stap twee: draai elke vraag herhaald, over meerdere modellen, en leg vast hoe vaak je genoemd wordt en hoe je geframed wordt. Stap drie: bepaal per situatie of je hoofdzakelijk in modelgeheugen of in live retrieval speelt, want dat kiest je hoofdrichting.

Stap vier: kies een, hooguit twee, problemen om eerst aan te pakken, op basis van betrouwbaarheidslabel en zakelijke impact. Liever een robuust gemeten probleem dat geld raakt dan een spannende uitschieter die op drie runs leunt.

Stap vijf: voer de verandering door, wacht een redelijke periode, en meet opnieuw met dezelfde methode zodat je appels met appels vergelijkt. Verander je halverwege je vragenlijst of je aantal runs, dan vergelijk je niets meer.

GEO is een cyclus van herhaald meten en gericht ingrijpen, geen eenmalige optimalisatie.

Veelgemaakte fouten

Tot slot de valkuilen die ik telkens terugzie. Een enkele meting als waarheid behandelen, terwijl je herhaling nodig hebt. Correlaties uit scrape-onderzoek als recept overnemen zonder te vragen of ze ook de oorzaak zijn.

Content optimaliseren terwijl je probleem reputatie is, of andersom, omdat je het verschil tussen geheugen en retrieval niet hebt bepaald. Alleen tellen of je genoemd wordt en negeren hoe en naast wie. En de duurste: dezelfde keyword-gerichte SEO-aanpak loslaten op een probabilistisch systeem en je verbazen dat de resultaten niet stabiel zijn.

GEO beloont wie de andere natuur van het medium serieus neemt: meet als een statisticus, denk in entiteiten en reputatie, en handel op aanbevelingen in plaats van op een dashboard vol ruis.

Doe je dat, dan richt je je optimalisatie op de manier waarop mensen vandaag daadwerkelijk naar antwoorden zoeken, in plaats van op de aannames van het klassieke zoekmachinemodel.

Kernpunten

Meet als een statisticus: herhaal elke vraag over veel runs en rapporteer een onzekerheidsmarge in plaats van een enkele uitkomst.
Bepaal eerst of je in modelgeheugen of live retrieval speelt, want dat kiest je hoofdrichting tussen reputatie en content.
Denk in entiteiten en associaties: koppel je merk consistent aan de onderwerpen van je categorie, niet aan losse trefwoorden.
Beoordeel niet alleen of je genoemd wordt, maar ook hoe en naast wie, en handel op concrete aanbevelingen in plaats van op een datadump.

Deel

Geschreven door

Sanne de Boer

AI-visibility & GEO

Houdt zich bezig met hoe merken zichtbaar worden in AI-antwoorden, en bouwt aan de meetmethodiek erachter.

Benieuwd wat dit voor jou betekent?

In een korte demo laten we het zien in jouw situatie.

Vraag een demo aan