COC-voorzitter Tanja Ineke in EenVandaag: 'Je moet er niet aan denken dat dit in handen valt van een regering als Tsjetsjenië of Iran.'
COC-voorzitter Tanja Ineke in EenVandaag: 'Je moet er niet aan denken dat dit in handen valt van een regering als Tsjetsjenië of Iran.' © Thinkstock

Computer kan aan een foto zien of iemand homo of hetero is - klopt dit wel?

Berichten verspreiden zich vaak razendsnel, of ze nu kloppen of niet. Wij proberen de zin van de onzin te scheiden. Vandaag: kunstmatige intelligentie kan aan de hand van een foto iemands geaardheid vaststellen.

Van wie komt de claim?

Het al direct controversiële onderzoek van de Stanford Universiteit vond zijn primeur in het Britse actualiteitenblad The Economist, onder de genuanceerde kop 'Vooruitgang in kunstmatige intelligentie wordt gebruikt om tekenen van seksualiteit te herkennen'. Andere media pikten het bericht rap op, voorzien van smeuïger teksten als 'Can a computer tell if you're GAY?' (Daily Mail) en 'Kunstmatige intelligentie weet of je homo of hetero bent' (RTL Nieuws).

Kritiek kwam ook snel. LHBTI-organisatie GLAAD noemde het onderzoek 'junk science', en bovendien gevaarlijk. Wat als zulke technologie wordt ingezet om homo's te discrimineren, of erger, te vervolgen? 'Doodeng', zei ook COC-voorzitter Tanja Ineke in EenVandaag. 'Je moet er niet aan denken dat dit in handen valt van een regering als Tsjetsjenië of Iran.'

Dat is dan ook precies de waarschuwing die Stanfordonderzoekers Yilun Wang en Michael Kosinski met hun 'gaydar' wilden afgeven, schrijven ze in een uitgebreide toelichting. 'De kernboodschap is dat nu al bestaande en alom gebruikte technologieën een risico vormen voor de privacy van LHBTI-individuen. We zijn echt ontsteld door onze resultaten.'

Maar is dat reëel? Is seksuele geaardheid echt zo gemakkelijk door een computer van je gezicht af te lezen?

Klopt het?

Het gaat hier om mensen die open zijn over hun seksualiteit, zelfs actief en publiekelijk op zoek zijn naar een partner

Op het eerste oog: dat moet kunnen. Omdat homo's al in de baarmoeder aan een iets andere hormooncocktail worden blootgesteld, hebben ze gemiddeld genomen wat andere gelaatstrekken, is de achterliggende (en overigens breed gesteunde) gedachte. Homoseksualiteit geeft mannen wat feminienere, en vrouwen wat mannelijkere trekken.

Dus leerden Wang en Kosinski bestaande software die onregelmatigheden te herkennen. Op basis van één portretfoto kon de computer na training homo's van hetero's onderscheiden met een nauwkeurigheid van 81 procent bij mannen en 71 procent bij vrouwen. Met vijf foto's van dezelfde persoon steeg dat naar 91 en 83 procent. Menselijke beoordelaars waren er met 61 en 54 procent een stuk minder goed in.

Maar haken en ogen zijn er ook. Allereerst de gebruikte fotoset. Wang en Kosinski trokken hun foto's, van in totaal 14.776 personen van tussen de 25 en de 36 jaar oud, van een Amerikaanse datingsite. Afgezien nog van het feit dat ze tussenliggende seksuele voorkeuren en identiteiten niet meenamen, is dat niet bepaald een representatieve groep. Het gaat hier immers om mensen - overigens allemaal blank - die open zijn over hun seksualiteit, en zelfs actief en publiekelijk op zoek zijn naar een partner.

Op basis van gelaatstrekken alleen slaagde de computer er nog maar 75 procent en 63 procent in

De verschillen waar de computer op aansloeg, zaten dan ook voor een groot deel in de 'extra's', ontdekten Wang en Kosinski bij nadere analyse. Lesbiennes glimlachen minder, hadden minder make-up en minder decolleté en droegen vaker een pet; homomannen hadden minder vaak een pet op en minder vaak een snor of baard. Op basis van gelaatstrekken alleen slaagde de computer er nog maar 75 procent (bij mannen) en 63 procent van de keren (bij vrouwen) in om homo en hetero uit elkaar te halen. Ook toen de onderzoekers hun test herhaalden met 918 profielfoto's van Facebook, bleef de computer op die score steken.

Tekst gaat verder onder de afbeelding.

Een kans van twee op drie dat de computer het verkeerd heeft

Er is bovendien een verraderlijke statistische valkuil. De software van Wang en Kosinski werkt door steeds één homo en één hetero met elkaar te vergelijken. Maar dat is iets heel anders dan in een bevolking de homo's eruit pikken. In de echte wereld zal de test al snel onzinnige resultaten geven, doordat er verhoudingsgewijs zo weinig homo's zijn.

Dat zit zo. Neem mannen: Wang en Kosinski's programma zit 75 procent van de keren goed in het uit elkaar houden van homo- en heteromannen - en ziet dus een op de vier keer een homo ten onrechte aan voor hetero, en omgekeerd.

Vervolgens nemen we duizend mannen, en gaan we op zoek naar de homo's. Dat moeten er zo'n 65 zijn: in de algemene bevolking is 6 à 7 procent homo. Van de 65 homo's zal de test er 57 herkennen als homo (de helft van 25 procent missers is 12,5 procent x 65 = 8 homo's die worden gemist).

Maar dan de 935 hetero's. Daar zal de test 117 keer ten onrechte iemand het predicaat 'homo' geven (12,5 procent x 935). De 'gaydar' zal dus in totaal 174 keer de uitslag 'homo' geven, terwijl er maar 57 echte homo's bij zitten: een kans van twee op drie dat de computer het verkeerd heeft. Dat maakt de 'gaydar' in feite onbruikbaar voor het opsporen van homo's.

Hoe harder de test op zoek gaat naar homo's, des te minder precies hij wordt

Helemaal onderaan hun artikel erkennen Wang en Kosinski dat ook: '91 procent nauwkeurigheid betekent niet dat 91 procent van de homomannen in een populatie kan worden herkend'. Maar, zo verweren ze zich, als de computer zich richt op de homo's die er het meest als homo's uitzien, worden de resultaten betrouwbaarder. 'Als je van duizend mannen de tien mannen neemt met de hoogste kans om homo te zijn, zouden negen daarvan ook echt homo zijn', rekenen ze voor.

De onnauwkeurigheid van de gaydar maakt de waarschuwing van Wang en Kosinski er niet minder reëel om. Het is dus inderdaad doenlijk om software te maken die seksuele geaardheid afleest aan het gezicht - al zal hij buitengewoon veel fouten maken. Hoe harder de test op zoek gaat naar homo's, des te minder precies hij wordt, signaleren Wang en Kosinski bovendien. 'Als je het net wijder uitwerpt, 'vang' je meer homoseksuelen, maar zal je ook meer hetero's als homo labellen', schrijft Kosinski desgevraagd in een e-mail.

Ze hebben niks nieuws gedaan, de methode bestaat al

Theo Gevers, hoogleraar Computer Vision aan de UvA

'Het is belangrijk dat mensen zich hiervan bewust zijn', vindt ook Theo Gevers, hoogleraar Computer Vision aan de UvA. 'Ze hebben niks nieuws gedaan, de methode bestaat al. Mijn team had dit in twee weken kunnen doen als we de data zouden hebben.' Intussen worden de modellen steeds beter, zegt Gevers, en zijn foto's en persoonlijke informatie makkelijk in groten getale op internet te vinden. 'Qua technologie staan we nog aan de vooravond.'

Dat vindt Kosinski ook. 'De precieze nauwkeurigheid is niet cruciaal: wij gebruikten heel simpele middelen en foto's in een lage resolutie', schrijft hij per mail. 'De partijen die dit soort technieken inzetten - denk aan vliegvelden en politiekorpsen - hebben veel betere software en apparatuur.'

Eindoordeel

Dat een computer op basis van een foto kan zien of een willekeurig persoon homo of hetero is, zoals veel nieuwsmedia kopten, is veel te kort door de bocht. Alleen al omdat de computer zoveel hetero's ten onrechte aanziet voor homo, dat de echte homo's er haast bij in het niet vallen. Maar het laat wel zien wat er in potentie mogelijk is.

Met dank aan Casper Albers (Rijksuniversiteit Groningen), Joost Broekens (TU Delft), Pepijn van Erp (Stichting Skepsis), Marco Wiering (Rijksuniversiteit Groningen).