Wie ben ik volgens big data?

Wat weten bedrijven in Nederland van mij als ze in hun big data gaan grasduinen? En hoeveel is die informatie waard? Verslaggever Michael Persson gaat op zoek naar zijn 'digitale ik' en komt tot een verrassende ontdekking.

DOOR MICHAEL PERSSON

Dit ben jij, zegt verkoopdirecteur Jan Louwris terwijl hij een foto van een buurt in Amsterdam op het scherm tovert. Er staan gekleurde vlaggetjes op de huizen. 'Oranje, een D12. Binnenstedelijke Single. Hoge opleiding, appartement, onder de 40, een nee/nee-sticker op de deur. Klopt het een beetje?'

We zitten in een zaaltje in een kantoorgebouw in Den Haag (Porsche op de parkeerplaats, champagne bij de lunch in een zaaltje verderop), het Nederlandse hoofdkantoor van de Brits-Amerikaanse gigant Experian. Dit bedrijf bezit data van alle 7,3 miljoen Nederlandse huishoudens. Aan de hand van dertig variabelen uit achttien bronnen zijn die huishoudens in categorieën 'gesegmenteerd'. En zo beland je dus in D12.

Het is een klassieke vorm van profilering. Maar nu het 'big data' heet, voelt elk bedrijf dat veel data heeft zich geroepen om zich ook op die markt te begeven - zie ING, met zijn betalingsgegevens. Iedereen ziet ineens gouden bergen in de wereld van de gerichte advertenties, van gedragsgestuurde aanbiedingen, van de hot leads en miljoenen consumentenprofielen. Het is een sector met een omzet van 1,3 miljard euro per jaar in Nederland, omgerekend ruim 80 euro per persoon.

Tegelijkertijd loert overal de schending van de privacy, of de vrees daarvoor, en de ophef daarover. ING moest zijn plannen om betalingsgegevens te verhandelen schielijk terugtrekken (en beperkt zich nu tot data voor eigen gebruik). Hoe moeten bedrijven laveren tussen geld verdienen en privacy? Hoe werkt die sector nou eigenlijk? En hoeveel ben ik waard, in de vorm van big data?

***

Wat Experian doet zou je klassieke data-analyse kunnen noemen: uit miljoenen gegevens heeft Experian profielen samengesteld die zij aan bedrijven kunnen verkopen. Oorspronkelijk bedoeld om de goede folders in de goede brievenbussen te stoppen: een brochure voor een tuincentrum moet je niet bij flatbewoners afleveren. Wie daarin slaagt krijgt een hogere 'conversie', het percentage mensen dat na zo'n benaderpoging daadwerkelijk een aankoop doet. 'Als je het goed doet, gaat je rendement met 20 tot 30 procent omhoog', zegt Louwris. 'Dan gaat de conversie van tien op de duizend naar twaalf of dertien op de duizend. Voor ons is dat een groot verschil.'

Experian doet dit al jaren. De laatste tijd zitten dit soort directmarketingbedrijven in lastiger vaarwater, door de concurrentie van internet. Nu proberen ze de gegevens die ze hebben ook te slijten aan internetbedrijven, om op die manier online- en offline-informatie te combineren voor nog betere profielen.

Alleen: dat mag zomaar niet.

'Je mag in Nederland, in tegenstelling tot de VS, niet het IP-adres van de computer combineren met de fysieke naam- en adresgegevens van de gebruiker', zegt Louwris.

Het is een hardnekkig misverstand, constateert Arjan van den Akker, directeur van Experian in Nederland, dat bedrijven alles van iedereen weten. 'Dat koppelen van gegevens is gewoon niet toegestaan. In die zin is big data in Nederland een mythe. Big data is als seks onder tieners, zei iemand onlangs: ze praten er allemaal over, maar niemand doet het. De enige die de data wel mag koppelen, is de overheid. Ik vulde laatst mijn aangifteformulier in - het is ongelooflijk wat ze van je weten.'

Ook het profileren is nog heel grof: Experian komt tot vijftig types. Die diagnose D12 gaat eerder op voor de onderbuurvrouw. Wat wel degelijk klopt: 'Ze gaan graag naar het filmhuis. Ze houden van een dagje Artis en ook van vakanties in het buitenland: van Italië tot Zuid-Afrika. Qua producten en voeding hebben veel Binnenstedelijke Singles interesse in fairtrade, biologisch en vleesvervangende maaltijden.'

'We zouden dit veel scherper kunnen beschrijven, want we hebben data op huishoudniveau', zegt Louwris. 'Maar dat valt niet binnen de wetgeving.' Wel zit er meer detail aan te komen: Experian werkt aan een segmentatie op individueel niveau. 'Dan kunnen we achter elke voordeur de personen omschrijven die er wonen. We hebben nu ongeveer driekwart van Nederland in kaart gebracht.'

Maar alles weten van iedereen? 'Nee dus. Wij doen aan kansvergroting.'

***

Toch worden er wel degelijk koppelingen gelegd. Dat gebeurt bij een andere spin in het dataweb, de firma Communicatie Data Diensten Nederland (CDDN), met als slogan: 'Kijk... zo ken ik je weer!' Vierhonderd bedrijven in Nederland hebben een lijntje lopen naar Nieuw-Vennep, waar het hoofdkantoor zit. 'Vroeger was het motto: kennis is macht', zegt directeur Martijn de Boer. 'Nu is het: kennis delen is kracht.'

De Boer en zijn partner zijn de bedenkers van de Consumenten Basis Administratie, de commerciële tegenhanger van de Gemeentelijke Basis Administratie van de overheid. Bij hem kunnen bedrijven kijken of naam- en adresgegevens van klanten nog kloppen, door ze te vergelijken met de data van andere aangesloten bedrijven. Op deze manier kunnen de klanten van CDDN naam, adres, telefoonnummer en geboortedatum van 12,2 miljoen volwassen Nederlanders (98 procent) valideren.

Wie bij een internetwinkel om wat voor reden dan ook een valse naam (maar wel het juiste adres) opgeeft, wordt op deze manier gevonden - CDDN beheert een funnyname-tabel met de rare namen die mensen gebruiken. 'Je wilt als bedrijf die rommel niet in je bestand', zegt De Boer. 'Als het aan ons ligt, krijgt niemand post geadresseerd aan Donald Duck.'

Privacy staat bij hem bovenaan, zegt De Boer. 'Ik ben ook consument. Zelf ben ik gestopt met Facebook, en daar probeer ik mijn kinderen ook voor te behoeden. Alles wat je achterlaat, is vroeg of laat ergens in de spelonken van Google terug te vinden. Dat wil ik tot een minimum beperken.'

Zijn eigen activiteiten zijn anders. 'Bedrijven hebben een wettelijk plicht om hun klantenbestand op peil te houden. Die bestanden zijn onder-hevig aan data-erosie: elk jaar raakt een kwart van die bestanden vervuild, omdat mensen verhuizen of overlijden, of omdat er iets anders verandert. Wij helpen ze de kwaliteit op peil te houden. Bedrijven krijgen de gegevens alleen als ze ze zelf ook hebben.'

Maar naast de basisadministratie levert CDDN ook een ander product, CompLead. Daarin zitten niet alleen de adresgegevens, maar ook welstand, hobby, gezinssamenstelling. Die gegevens zijn te huur, met CDDN als tussenpersoon. Zo levert het bedrijf WIJ Special Media (bedenker van de Blije Doos, een gratis pakket cadeautjes voor zwangere vrouwen), het aantal en de leeftijd van de kinderen in een gezin, voor een paar dubbeltjes. Een telefoonnummer kost 7,5 cent. 'Bedrijven die daarnaar op zoek zijn, hoeven dus niet met al die partijen om de tafel om die gegevens te krijgen', zegt De Boer. 'Alleen bij ons langskomen, is voldoende. De data komen daardoor niet overal terecht.'

Dat verhandelen is toegestaan: consumenten hebben er via een 'opt-in' voor gekozen dat die gegevens mogen worden doorverkocht. Een handige manier om aan gegevens te komen zijn prijsvragen of gratis producten: om mee te dingen moet je van alles invullen.

'Het valt mee', zegt De Boer, die even heeft gekeken naar de naam- en adresgegevens van de verslaggever. 'Ik kom je alleen tegen bij Experian en Reader's Digest. Kennelijk let je op op wat je invult.'

Is big data noodzakelijk?, vraagt De Boer zich retorisch af. 'Er wordt soms wel overdreven interessant gedaan over al het onlinegedrag. Kijk, die man heeft een plant gekocht, en een schep, en een boek over groente kweken - die zal wel een tuin hebben. Terwijl je die conclusie al dertig jaar kunt trekken als je in het kadaster kijkt. We weten al heel veel met de kennis die we hebben.'

***

Toch kan dat wel degelijk beter, vinden de adepten van de onlinegedragsmarketing, de gerichte advertenties aan internetgebruikers. 'In de basis is big data niets nieuws, maar we gaan er wel op een heel andere manier mee om', zegt Bob Nieme van het bedrijf Adversitement, dat vanuit Uden de nieuwe wereld verkent. 'Het zijn de drie v's: velocity, variety en volume van de data nemen toe. Dat vraagt om veel efficiëntere techniek dan vroeger. Niet achteraf zoeken in massa's opgeslagen data, maar realtime zoeken wat relevant is.'

Digitale advertenties zijn een kwestie van milliseconden. Wie ergens naar een vliegreis of schoenen heeft gezocht, krijgt meteen daarna op een nieuwssite aanbiedingen van hotels in de bewuste stad of schoenen die daarop lijken. Via een geautomatiseerd veilingsysteem kunnen adverteerders op die plek, bij die gebruiker bieden - gestuurd door cookies die het internetgedrag van de gebruiker verraden. Nieme heeft met de TU Eindhoven software bedacht om parallel zo veel mogelijk variabelen te verwerken om de juiste advertenties bij de juiste persoon te krijgen - hoe sneller hoe beter, want anders is een andere adverteerder je misschien voor, op die ene plek bij die ene persoon.

Vroeger werd deze re-targeting vooral aan Google overgelaten - de meester in het genre, met zijn zoekopdrachten en Gmail-berichten als belangrijkste input. Maar steeds meer bedrijven proberen er een plek te veroveren. In Nederland is Adatus de leidende speler, met bijna 11 miljoen profielen van gebruikers, die via gelieerde bedrijven elke maand 30 miljoen 'gedragsgegevens' verstrekken, bijvoorbeeld via webwinkels of prijsvergelijkers. Een adverteerder kan plekken kopen op de computer van iemand die een BMW heeft gezocht - en zo met gerichte advertenties een vijf keer zo hoge kans op conversie scoren als bij een ongerichte advertentie. Hoe dichter zo'n persoon bij een aankoop zit, hoe meer zo'n advertentieplek kost: van 15 cent tot misschien 120 euro voor duizend gebruikers.

'Kenmerk van zulke data is dat ze maar heel kort bruikbaar zijn', zegt Nieme. 'Je moet iemand niet weken gaan achtervolgen met hotels in Berlijn - die heeft hij allang geboekt. Dat is alleen maar irritant.'

In die zin is het nog vrij primitief, die 'gedragsgerelateerde' marketing. Het gedrag blijft beperkt tot het zichtbare koopgedrag. Het is vluchtig en grof. Voorlopig nemen adverteerders daar genoegen mee. (Overigens kun je aan dit soort dataverzamelende activiteiten ontkomen door je 'uit te schrijven' op de website youronlinechoices.eu).

Maar het wordt verfijnder, denkt Joris van Heukelom van IAB Nederland, de brancheorganisatie van digitale adverteerders. 'Hoe specifieker je de voorkeuren van een consument kent, hoe beter je hem kunt benaderen', zegt hij. Steeds vaker proberen advertentienetwerken daarom andere informatie mee te nemen, voor zover die aan een IP-adres te koppelen zijn. Ook inloggegevens, zoals een leeftijdscategorie, zijn bruikbaar. 'Zolang die informatie niet herleidbaar is tot een individu, zie ik dit als vooruitgang voor adverteerder en consument.'

Al is er gevaar van misbruik, erkent hij. Dat Mac-gebruikers meer voor een hotel moeten betalen dan pc-gebruikers, zoals in Amerika gebeurt, vindt Van Heukelom te ver gaan.

Uiteindelijk verwacht hij dat burgers zelf controle zullen nemen over hun privacy. 'Een deel van de bevolking zal meer over zichzelf willen prijsgeven als daar iets tegenover staat. Daar kun je toestemming voor geven, zoals met de betalingsgegevens van de ING. Maar je kunt je er ook actief mee bemoeien. Wat is er mis mee als ik zeg dat ik van plan ben over een half jaar een auto te gaan kopen? Zo'n koopintentie is een paar honderd euro waard. Die zullen veel mensen zelf willen verzilveren.'

undefined

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2023 DPG Media B.V. - alle rechten voorbehouden