Terug naar blogAI-visibility

Eigen data bepaalt of AI jou aanhaalt

Sanne de Boer · Juli 2026 · 11 min lezen

AI-visibility

In het kort

  • In een overaanbod aan content die overal hetzelfde zegt, is je eigen data het enige wat een AI niet kan verzinnen en een concurrent niet kan kopiëren.
  • Originele data is de sterkste voorspeller van information gain, en de lat ligt laag: de meeste pagina's zijn middelmatig op originaliteit.
  • Eigen data alleen is niet genoeg. Wie de data het duidelijkst structureert voor extractie, wint de aanhaling.

Iedereen die iets over vindbaarheid leest, hoort dezelfde raad: maak goede content. Het probleem is dat 'goede content' inmiddels overal staat. Een AI maakt in seconden een net, correct en compleet artikel over vrijwel elk onderwerp, en dat doet iedereen dan ook. Het gevolg is een overaanbod aan teksten die allemaal ongeveer hetzelfde zeggen. Is jouw pagina daar één van, dan val je niet op en sla een AI die een antwoord samenstelt je gewoon over.

Er is één ding dat je content wél laat opvallen, en dat een AI niet zelf kan verzinnen: je eigen data. In dit artikel leg ik uit waarom originele, eigen data de sterkste troef is geworden in het tijdperk van AI-zoekresultaten, hoe dat samenhangt met gevonden worden op het beslismoment van de klant, en hoe je die data zo brengt dat een AI jou aanhaalt en niet iemand anders.

Information gain: wat je toevoegt bovenop de rest

Er is een vakterm voor waar dit om draait: information gain. Dat is de mate waarin een pagina iets toevoegt bovenop alle andere pagina's die al over hetzelfde onderwerp ranken. Niet hoe goed je de stof samenvat, maar hoeveel nieuws je brengt dat de andere bronnen in hun cohort niet hebben. Een AI die bronnen selecteert, weegt precies dat: voegt deze pagina iets toe, of herhaalt hij alleen wat er al staat.

Een tekst die herkauwt wat overal te lezen is, heeft een lage information gain. Een tekst met een uniek getal, een eigen bevinding of een concrete vergelijking die nergens anders staat, scoort hoog. Analyses van goed presterende zoekresultaten laten zien dat originele data sterker samenhangt met een hoge information-gain-score dan vrijwel elk ander paginakenmerk, sterker zelfs dan de lengte van de tekst. Pagina's met veel unieke datapunten scoren stelselmatig hoger dan pagina's met nauwelijks eigen cijfers, en dat loopt trapsgewijs op met elk datapunt dat je toevoegt. Logisch ook: eigen data is per definitie iets wat een AI niet zelf kan produceren en wat een concurrent niet kan kopiëren.

Eigen data is per definitie iets wat een AI niet kan verzinnen en een concurrent niet kan kopiëren.

Het goede nieuws: de lat ligt laag

Het klinkt misschien alsof je een onderzoeksafdeling nodig hebt om mee te doen. Dat is niet zo. Het opvallende aan de huidige situatie is dat de meeste pagina's middelmatig zijn op originaliteit. Echt originele pagina's zijn een minderheid, en de best zichtbare resultaten in klassieke zoekresultaten bevatten vaak maar een handjevol unieke datapunten.

De lat om eruit te springen ligt dus verrassend laag. Publiceer een pagina met meer echte, eigen cijfers, bevindingen of antwoorden dan gangbaar is, en je onderscheidt je meteen van het gemiddelde. Je hoeft geen baanbrekend onderzoek te doen, je hoeft alleen concreter en origineler te zijn dan het grijze midden, en dat midden is groot.

Elk bedrijf zit op data zonder het te publiceren

De denkfout is dat je 'onderzoek' moet doen. In werkelijkheid produceert elk bedrijf voortdurend data die het nooit naar buiten brengt. Hoeveel uur je klanten besparen ten opzichte van hun vorige aanpak. Wat een bepaalde keuze gemiddeld oplevert. Hoe vaak een probleem voorkomt dat jij oplost. Welke aanpak in de praktijk het beste werkt, gebaseerd op wat je zelf ziet bij je klanten.

Dat is allemaal eigen data. Het ligt in je administratie, in je ervaring, in je klantgesprekken. De kunst is niet om het te verzamelen, want je hebt het al, maar om het naar boven te halen en er content van te maken die niemand anders kan schrijven omdat niemand anders die cijfers heeft.

Eigen data is nodig, maar niet genoeg

Hier zit een belangrijke kanttekening. Zelfs als jij de bron bent van een uniek cijfer, betekent dat niet automatisch dat jij de aanhaling krijgt. Een AI haalt niet per se de partij aan die de data heeft verzameld, maar de pagina die de data het duidelijkst en best leesbaar presenteert. Een andere site die jouw bevinding overneemt en netter opschrijft, kan de aanhaling binnenhalen die eigenlijk jouw werk verdiende.

Dat is niet altijd eerlijk verdeeld, maar het is wel de praktijk waarmee je rekening moet houden. Eigen data is een voorwaarde om mee te tellen, maar hoe je die data structureert bepaalt wie de aanhaling uiteindelijk krijgt. En op dat punt maken de meeste bedrijven een fout: ze verstoppen hun beste cijfer diep in een verhaal, onderaan een lange pagina, na een lange aanloop, precies waar een AI niet leest.

Extractie-structuur: zo brengt je data dat een AI het oppikt

Het bezit van de data is een voorwaarde, de extractie-structuur is wat de doorslag geeft. Daarmee bedoel ik: hoe eenvoudig kan een AI de kern uit je pagina isoleren. Een AI verwerkt een pagina namelijk niet zoals een mens die de tekst van begin tot eind doorleest, maar doorzoekt de tekst gericht op de kern en negeert de rest, precies de reden waarom GEO wezenlijk anders werkt dan klassieke SEO. Aanhalingen concentreren zich sterk in het bovenste deel van de pagina: het overgrote deel komt uit de eerste secties, en de kans op aanhaling neemt snel af naarmate content dieper in een lang stuk staat. De allereerste regels zijn vaak navigatie en inleidende ruis die de AI overslaat, dus het gedeelte direct daaronder weegt het zwaarst mee.

Daar pas je je structuur op aan. Begin met je belangrijkste cijfer, vlak na de titel: getal, vergelijking, betekenis, in het eerste scherm. Definieer dat cijfer direct, in één zin over wat het meet en over welke groep het gaat. Maak de methode zichtbaar in een kort, apart blok, want een navolgbaar cijfer is betrouwbaar genoeg om aan te halen. Zet je bevindingen vooraan, sterkste eerst, en sla de spanningsboog over. De structuur waarbij de clou aan het eind komt werkt voor menselijke lezers, maar werkt tegen je bij een AI.

Het bezit van de data is een voorwaarde. De extractie-structuur bepaalt wie de aanhaling krijgt.

Waar een AI je pagina het hardst leest

Top 10-20%
Midden
Onderkant
Aanhalingen zakken naar beneden als een ski-ramp. Zet je sterkste cijfer bovenaan.

Entity-richness: waarom getallen en datums winnen

Naast de structuur telt entity-richness: de dichtheid aan concrete, benoembare entiteiten in je tekst. Van alle entiteitstypen voorspellen juist getallen en datums de kans op aanhaling het sterkst, samen met benoemde methodes en vergelijkingen. Een pagina die dicht is aan specifieke entiteiten, een precieze statistiek, een genoemde aanpak, een concrete vergelijking, is voor een AI grijpbaar en verifieerbaar.

Vaag, algemeen advies dat elk hulpmiddel ook kan geven is risicovol. Concrete, eigen feiten zijn gegrond. Combineer dat met een gebalanceerde toon, waarin je je eigen data ook nuanceert in plaats van alleen ophemelt, zodat je content zowel grijpbaar als betrouwbaar overkomt.

Query fan-out: beantwoord ook de vragen eromheen

Nog een kans die de meeste pagina's laten liggen, en meteen een van de belangrijkste mechanismen om te begrijpen: query fan-out. Een AI beantwoordt een vraag niet één op één, maar waaiert uit naar een reeks aangrenzende vragen die logisch bij het onderwerp horen, en stelt zijn antwoord samen uit de bronnen die die deelvragen het beste dekken. Rond bijna elke zoekvraag hangen zulke verwante vragen die nergens fatsoenlijk beantwoord worden: een kans die de meeste partijen simpelweg laten liggen.

Een pagina die niet alleen de hoofdvraag beantwoordt, maar ook de logische vervolgvragen eromheen, vangt meer van die fan-out op en wordt daardoor vaker aangehaald. Eén grondige, evergreen pagina die tien of meer verwante zoekintenties dekt, zoals je nastreeft bij het opbouwen van topical authority met contentclusters, is in aanhaalbereik meer waard dan tien losse pagina's die elk maar één intentie behandelen. De opbrengst van zo'n complete pagina is bovendien front-loaded: hij bouwt zijn aanhaalbereik over de tijd op, en een klein deel van dit soort pagina's vangt een onevenredig groot deel van alle aanhalingen. Slim toegepast betekent dit dat je je belangrijkste prompts over de hele klantreis in kaart brengt, van probleem naar oriëntatie, vergelijking, validatie en keuze, en die vragen op de pagina beantwoordt met kennis die alleen jouw merk kan leveren.

Hoe ik dit aanpak

Ik behandel eigen data als wat het is: je sterkste troef voor vindbaarheid. Ik help naar boven halen welke cijfers en bevindingen jouw bedrijf al produceert zonder ze te publiceren, en verwerk die in content die zo gestructureerd is dat een AI ze oppikt: sterkste cijfer bovenaan, helder gedefinieerd, met de methode zichtbaar, bevindingen vooraan, en de vragen eromheen meegenomen.

Het opsporen van aangrenzende vragen, het meten van hoe je content wordt aangehaald en het optimaliseren van de structuur loopt geautomatiseerd en doorlopend. Welke data de moeite waard is om te publiceren en hoe je verhaal klopt, bewaak ik zelf. Jij levert wat alleen jij hebt, je eigen kennis en cijfers, en krijgt content terug die opvalt omdat niemand anders hem kan schrijven.

Kernpunten

  • Originele, eigen data is de sterkste voorspeller van information gain: het onderscheidt je van het overaanbod aan content dat overal hetzelfde zegt.
  • De lat ligt laag omdat de meeste pagina's middelmatig zijn; elk bedrijf zit al op publiceerbare data zonder het te weten.
  • Structureer voor extractie: sterkste cijfer bovenaan, gedefinieerd, met methode, bevindingen vooraan, geen spanningsboog.
  • Verhoog entity-richness (getallen, datums, benoemde vergelijkingen) en vang query fan-out op door ook de aangrenzende vragen te beantwoorden.
Deel

Geschreven door

Sanne de Boer

AI-visibility & GEO

Houdt zich bezig met hoe merken zichtbaar worden in AI-antwoorden, en bouwt aan de meetmethodiek erachter.

Benieuwd wat dit voor jou betekent?

In een korte demo laten we het zien in jouw situatie.