
De AI-wervingstool die seksistisch werd — en wat het me leerde over het bouwen van eerlijke AI
Een paar maanden geleden zat ik tegenover een CHRO bij een middelgroot techbedrijf die me met oprechte trots vertelde dat ze de "vooringenomenheid hadden opgelost" in hun wervingspijplijn. Ze hadden een AI-aangedreven screeningtool gekocht. Die ontleedde cv's, rangschikte kandidaten en verkortte hun time-to-fill met 40%.
Ik stelde één vraag: "Wat voorspelt de tool?"
Stilte. Toen: "Wat bedoel je? Hij voorspelt wie je moet aannemen."
"Nee," zei ik. "Hij voorspelt wie je zou hebben aangenomen. Gebaseerd op een decennium aan data waarin je engineeringteam voor 84% uit mannen bestond."
De kleur trok weg uit zijn gezicht. Hij had een bedrag met zes cijfers uitgegeven aan een tool die precies de vooringenomenheid automatiseerde waarvan hij dacht dat hij die aan het elimineren was.
Dit gesprek blijft me achtervolgen omdat het geen randgeval is. Het is de norm. De hele eerste generatie AI-wervingstools — en ik bedoel de overweldigende meerderheid van wat er op dit moment op de markt is — is gebouwd op een premisse die zo fundamenteel gebrekkig is dat het lachwekkend zou zijn als de gevolgen niet de bestaansmiddelen van mensen waren. Deze tools gebruiken voorspellende AI getraind op historische wervingsdata. Ze leren wie er werd aangenomen in het verleden. En vervolgens repliceren ze dat patroon op grote schaal, met meedogenloze efficiëntie, en strippen ze het enige weg dat ons had kunnen redden: de incidentele menselijke recruiter die naar een niet voor de hand liggende kandidaat keek en dacht: weet je wat, laten we het erop wagen.
Bij Veriprajna bouwen we AI-wervingssystemen anders op. We gebruiken causale AI — niet om te voorspellen wie er aangenomen zou zijn, maar om te voorspellen wie er daadwerkelijk goed zal presteren. En vervolgens onderwerpen we die voorspelling aan een stresstest door een vraag te stellen die de meeste AI-systemen niet eens kunnen ontleden: Als deze kandidaat uit een andere demografische groep kwam, zou ons antwoord dan veranderen?
Als dat zo is, faalt het model. We gaan terug en repareren het.
Dit is het verhaal van waarom dat onderscheid belangrijker is dan al het andere dat er op dit moment in HR-technologie gebeurt.
"Culture fit" is gewoon homofilie met betere marketing
Voordat ik op de technologie inga, moet ik het over het menselijke probleem hebben — want het AI-probleem is daar een uitvloeisel van.
Er is een begrip in de sociologie dat homofilie heet: de neiging van mensen om om te gaan met, zich te binden met en de voorkeur te geven aan anderen die op henzelf lijken. Het is een van de meest robuust gedocumenteerde fenomenen in de sociale wetenschap. En het is de onzichtbare motor achter de meeste wervingsbeslissingen ter wereld.
Homofilie is waarom een wervingsmanager die rugby speelde onbewust de kandidaat die rugby noemt hoger inschaalt. Het is waarom "culture fit" — die heilige, onaantastbare frase in het vocabulaire van elke recruiter — bijna altijd neerkomt op "deze persoon doet me aan mezelf denken." Onderzoekers in Berkeley ontdekten dat interviewers routinematig "communicatievaardigheden" verwarren met "praat zoals ik." Een kandidaat uit een andere sociaaleconomische achtergrond die een ander taalregister gebruikt, krijgt punten in mindering voor "gebrek aan verfijning." De inhoud van hun antwoorden dringt nauwelijks door.
Ik herinner me een verhitte discussie met een senior adviseur vroeg in het bestaan van Veriprajna. Hij hield vol dat culture fit een legitiem wervingscriterium was — dat teams cohesie, gedeelde waarden en een gemeenschappelijke taal nodig hebben. Ik was het niet oneens met het principe. Ik was het oneens met de uitvoering. Want wanneer onderzoekers daadwerkelijk bestuderen wat er gebeurt in organisaties die optimaliseren voor "culture fit," vinden ze iets verontrustends: die organisaties vervallen in wat netwerkwetenschappers homofilie-vallen noemen. Zodra de vertegenwoordiging van minderheden onder ongeveer 25% zakt, neemt de meerderheid de meerderheid aan, en zet de demografische samenstelling zich vast. Innovatie stagneert. Groepsdenken neemt het over. De organisatie wordt een spiegelpaleis.
"Culture fit" klinkt als een wervingscriterium. In de praktijk is het een mechanisme om het bestaande team te klonen — en dat strategie noemen.
De oplossing is niet om het concept van culturele afstemming af te schaffen. Het is om te verschuiven van "culture fit" naar "culture add" — mensen aannemen die aannames uitdagen in plaats van bevestigen. Maar die verschuiving vereist iets wat de meeste menselijke recruiters niet betrouwbaar kunnen: de potentiële bijdrage van een kandidaat evalueren terwijl ze werkelijk blind zijn voor hun demografische signalen.
Wat ons bij de blinde auditie brengt.
Wat orkesten in de jaren zeventig ontdekten
In de jaren zeventig waren grote Amerikaanse symfonieorkesten overweldigend mannelijk. De heersende opvatting was dat vrouwen de "longkracht" of het "temperament" voor bepaalde instrumenten misten. Toen begonnen orkesten kandidaten achter een scherm te plaatsen. Juryleden konden de muziek horen — de werkelijke causale drijfveer van de prestatie — maar konden de muzikant niet zien.
Het aannemen van vrouwen schoot omhoog.
Het scherm veranderde niets aan de kwaliteit van de muziek. Het veranderde de kwaliteit van het luisteren. Het dwong beoordelaars om te reageren op het signaal (geluid) in plaats van op de ruis (uiterlijk).
Deze analogie werd fundamenteel voor hoe ik denk over wat we bouwen. In het digitale tijdperk kun je niet elke sollicitant achter een fysiek scherm plaatsen. Maar je kunt AI bouwen die functioneert als een wiskundig scherm — een die de causale drijfveren van werkprestaties evalueert terwijl het aantoonbaar blind is voor beschermde kenmerken zoals geslacht, ras of leeftijd.
Het probleem is dat standaard-AI het tegenovergestelde doet. Het fungeert als een transparant raam. Elke vooringenomenheid in de historische data stroomt er recht doorheen.
Waarom bestrafte de AI van Amazon het woord "women's"?
Het meest bekende waarschuwende verhaal in AI-werving is Amazons interne wervingstool, in 2018 geschrapt. Het systeem was getraind op een decennium aan cv's die bij het bedrijf waren ingediend. Omdat de techsector sterk mannelijk overhelt, weerspiegelden de trainingsdata die scheefheid.
De AI, die precies deed waarvoor hij was ontworpen — patronen vinden die "aangenomen worden" voorspellen — leerde dat mannelijk gecodeerde signalen correleerden met wervingssucces. Hij bestrafte cv's met het woord "women's," zoals in "women's chess club captain." Hij waardeerde afgestudeerden van twee vrouwencolleges lager. Niemand heeft hem geprogrammeerd om seksistisch te zijn. Hij ontdekte simpelweg dat man zijn een sterke voorspeller was van aangenomen worden bij Amazon, en hij optimaliseerde voor dat patroon.
Trouw zijn aan het verleden betekent oneerlijk zijn tegenover de toekomst. Als "nauwkeurigheid" betekent dat je de menselijke beslissing voorspelt, dan is een "goede" AI noodzakelijkerwijs een bevooroordeelde.
Dit is de kernfout van imitatieleren — AI trainen om menselijke recruiters na te bootsen. Als de recruiters bevooroordeeld waren (en vanwege homofilie waren ze dat), wordt de AI wat ik ben gaan noemen een "biascapsule." Het kristalliseert een decennium aan vooroordelen en past het op machinesnelheid toe op elke nieuwe sollicitant.
Amazon had tenminste de integriteit om het project stop te zetten. De meeste bedrijven die soortgelijke tools gebruiken, weten niet eens dat ze het probleem hebben.
En GPT dan? De valkuil van de LLM-wrapper
Nadat het Amazon-verhaal naar buiten kwam, nam ik aan dat de sector zou bijsturen. In plaats daarvan produceerde de generatieve-AI-boom iets dat aantoonbaar erger is: een stortvloed aan "AI-aangedreven" wervingstools die dunne interfaces zijn — wrappers — gebouwd bovenop general-purpose grote taalmodellen zoals GPT-4 of Claude.
Ik ben de tel kwijt van het aantal investeerders en potentiële partners die me hebben verteld: "Gebruik gewoon GPT. Fine-tune het op wat wervingsdata. Breng het uit." Elke keer heb ik dezelfde reactie: weet je waarop GPT is getraind?
Het open internet. De som van alle menselijke tekst — inclusief de vooroordelen, stereotypen en vooringenomenheden. Onderzoekers van de University of Washington ontdekten dat wanneer LLM's cv's screenen, namen die met blanke mensen worden geassocieerd 85% van de tijd de voorkeur krijgen, zelfs wanneer de kwalificaties identiek zijn. In sommige testiteraties werden namen van zwarte mannen nooit als eerste gerangschikt. Het model associeert bepaalde namen met "competentie" op basis van statistische patronen in zijn trainingsdata. Een wrapper kan dat niet eenvoudig uitschakelen, omdat de vooringenomenheid verweven is in het fundamentele taalbegrip van het model.
En dan hebben we het nog niet eens over hallucinaties. LLM's zijn probabilistische tekstgeneratoren, geen logica-engines. Ze kunnen vaardigheden verzinnen die een kandidaat niet heeft, of vaardigheden missen die ze wel hebben, omdat het model optimaliseert voor plausibel klinkende tekst, niet voor feitelijke juistheid. In een compliancecontext — waar een afgewezen kandidaat een rechtszaak kan aanspannen — is "de AI hallucineerde dat u een vereiste certificering miste" geen houdbare juridische verdediging.
Dan is er nog het blackboxprobleem. Vraag een wrapper waarom die Kandidaat A boven Kandidaat B rangschikte, en het kan een zelfverzekerd klinkende uitleg genereren. Maar die uitleg is een achteraf-rationalisatie, geen causale verantwoording van de beslissing. Onder NYC Local Law 144 en de EU AI Act is die ondoorzichtigheid steeds vaker niet-conform.
Ik schreef over dit probleem — en onze aanpak om het op te lossen — in de interactieve versie van ons onderzoek.
De verkeerde vraag versus de juiste vraag

Hier is de kern van alles.
Standaard-wervings-AI vraagt: "Zal deze persoon, gebaseerd op de geschiedenis, worden aangenomen?"
Wij vragen: "Zal deze persoon goed presteren?"
Die klinken vergelijkbaar. Ze liggen werelden uit elkaar.
De eerste vraag traint op de beslissing van de recruiter — een beslissing die is besmet door homofilie, affiniteitsbias en patroonherkenning op de demografie van het bestaande team. De tweede vraag traint op bedrijfsuitkomsten: behoud na 18 maanden, het behalen van KPI's, prestatiebeoordelingen, verbetering van de teamoutput.
Wanneer je traint op uitkomsten in plaats van op beslissingen, gebeurt er iets opmerkelijks. Als diverse kandidaten historisch gezien goed presteerden maar zelden werden aangenomen — wat precies is wat de data in veel organisaties laat zien — leert een op uitkomsten gebaseerd model om ze te waarderen. Een op imitatie gebaseerd model leert om ze te negeren.
Dit is geen subtiel onderscheid. Het is het verschil tussen het automatiseren van het verleden en het ontwerpen van de toekomst.
Hoe maak je een AI aantoonbaar eerlijk?

Oké. Dus we trainen op uitkomsten in plaats van op beslissingen. Dat is noodzakelijk maar niet voldoende. Want zelfs uitkomstdata kan sporen van structurele vooringenomenheid bevatten — als diverse werknemers minder middelen, slechtere opdrachten of minder mentorschap kregen, kunnen hun uitkomsten kunstmatig zijn onderdrukt.
Dit is waar we overstappen van voorspellende AI naar causale AI, en specifiek naar een raamwerk genaamd contrafeitelijke eerlijkheid.
Het idee, geworteld in Judea Pearls "Ladder van Causaliteit," is bedrieglijk eenvoudig. Standaard machine learning opereert op niveau 1 van Pearls ladder: associatie. Het ziet patronen. "Mensen met eigenschap X hebben de neiging uitkomst Y te krijgen." Nuttig, maar blind voor het verschil tussen correlatie en causaliteit.
Causale AI opereert op niveau 3: contrafeitelijkheden. Het kan alternatieve realiteiten voorstellen. "Als deze kandidaat man was geweest in plaats van vrouw, met al het andere constant gehouden, zou de voorspelling van het model dan veranderen?"
Als het antwoord ja is, is het model oneerlijk. Punt uit.
We implementeren dit met behulp van Structurele Causale Modellen — transparante grafieken die oorzaak-en-gevolgrelaties tussen variabelen in kaart brengen. In tegenstelling tot black-box neurale netwerken laat een SCM ons precies zien welke paden inputs met outputs verbinden, en waarom.
Hier is een concreet voorbeeld dat mijn team op een avond laat wakker hield. We waren een model aan het bouwen en merkten dat "postcode" een sterke voorspeller van behoud was. Logisch — lange woon-werkverkeertijden putten mensen uit. Maar postcode correleert ook met ras in de meeste Amerikaanse steden. Een standaardmodel zou postcode zonder onderscheid gebruiken, waarmee het effectief op basis van ras discrimineert terwijl het lijkt een "neutrale" variabele te gebruiken.
Ons SCM brengt beide paden in kaart:
- Legitiem pad: Postcode → Woon-werkverkeertijd → Behoud
- Schijnpad: Postcode → Demografie → Historische vooringenomenheid
We blokkeren wiskundig het tweede pad terwijl we het eerste behouden. Het model mag postcode gebruiken alleen voor zover het woon-werkverkeertijd voorspelt. Als het postcode begint te gebruiken om ras af te leiden, treedt de straf in werking.
De vraag is niet of je AI beschermde kenmerken rechtstreeks gebruikt. De vraag is of het proxy's gebruikt die die kenmerken via de achterdeur weer naar binnen smokkelen.
Het model trainen om zijn eigen vooroordeel af te leren

Hoe dwingen we dit daadwerkelijk af tijdens de training? Via een techniek genaamd adversarieel debiasen — in wezen een eerlijkheidsstraf die in het leerproces van het model is ingebakken.
Tijdens de training optimaliseert het model tegelijkertijd voor twee concurrerende doelstellingen. Ten eerste: de nauwkeurigheid maximaliseren bij het voorspellen van werkprestaties. Ten tweede: het vermogen minimaliseren om de beschermde kenmerken van de kandidaat (ras, geslacht, leeftijd) te voorspellen uit de interne representatie van het model.
We introduceren een "adversair" — een secundair model met als enige taak te proberen de demografie van de kandidaat te raden op basis van de outputs van het hoofdmodel. Als het hoofdmodel begint te leunen op proxy-kenmerken zoals "lacrosse" (een proxy voor sociaaleconomische status, die correleert met ras) of bepaalde universiteitsnamen, merkt de adversair dat hij nu gemakkelijker demografie kan raden. Dit veroorzaakt een straf, waardoor de kosten van de huidige toestand van het hoofdmodel toenemen.
Om het totale verlies te minimaliseren, wordt het model gedwongen kenmerken te vinden die prestaties voorspellen zonder demografie te onthullen. Vaardigheden. Ervaring. Objectieve testscores. De werkelijke causale drijfveren.
Ik leg dit soms uit met een stomme analogie waar mijn team een hekel aan heeft: het is als een hond trainen om een krant te halen. Als de hond de krant haalt maar hem verscheurt, geen beloning. Uiteindelijk leert de hond te halen zonder te verscheuren. Ons model leert te voorspellen zonder te discrimineren.
Vóór de uitrol voeren we duizenden contrafeitelijke simulaties uit. We nemen het cv van een echte kandidaat, genereren een "synthetische tweeling" met een andere naam en andere voornaamwoorden maar identieke vaardigheden en ervaring, en voeren beide door het model. Als de scores uiteenlopen, zakt het model voor de audit. We itereren totdat ze convergeren. Voor de volledige technische uiteenzetting van dit proces, zie ons onderzoekspaper.
Waarom doet dit alles er juridisch toe?
Omdat de regelgevingsmuren zich sluiten, en de meeste bedrijven zijn er niet klaar voor.
NYC Local Law 144, van kracht sinds 2023, verbiedt het gebruik van geautomatiseerde wervingstools tenzij deze in het afgelopen jaar een onafhankelijke bias-audit hebben ondergaan. De wet schrijft de berekening van impactratio's voor — waarbij selectiepercentages tussen demografische groepen worden vergeleken. Veel black-box-leveranciers zakken voor deze audits omdat ze niet kunnen bepalen hoe hun modellen verschillende kenmerken wegen. Ze proberen halsoverkop de vooringenomenheid achteraf te lappen, wat is als proberen een cake te ontbakken.
De EU AI Act gaat verder en classificeert wervings-AI als "hoog risico" — dezelfde regelgevingscategorie als medische hulpmiddelen. Dit legt strikte eisen op rond datagovernance, menselijk toezicht en aantoonbare afwezigheid van vooringenomenheid. Wrapper-oplossingen die data verwerken via API's van derden staan hier voor een existentieel probleem: de data verlaat je infrastructuur, het model is ondoorzichtig, en je kunt compliance niet garanderen.
Onze modellen zijn door hun ontwerp audit-klaar. Omdat de eerlijkheidsstraf tijdens de training wiskundig strenger is dan wat de wet vereist, is compliance een natuurlijk bijproduct, geen bijzaak achteraf. En omdat de causale grafiek transparant is, kunnen we een auditor — of een rechtbank — precies laten zien welke factoren een gegeven beslissing hebben aangedreven, en bewijzen dat beschermde kenmerken nul gewicht hadden.
Mensen vragen me soms of al deze eerlijkheidsengineering ten koste gaat van de prestaties. Het is het meest voorkomende bezwaar dat ik hoor, meestal verwoord als: "Is er niet een afweging tussen eerlijkheid en nauwkeurigheid?"
Die is er niet. Of preciezer: er is een afweging tussen eerlijkheid en de illusie van nauwkeurigheid. Een model dat "nauwkeurig" is in het voorspellen van bevooroordeelde menselijke beslissingen is niet daadwerkelijk nauwkeurig in het voorspellen van werkprestaties. Het is nauwkeurig in het voorspellen van vooroordelen. Wanneer je de vooringenomenheid wegstript en op echte uitkomsten traint, verlies je geen voorspellende kracht — je richt die op wat er werkelijk toe doet.
Het Moneyball-principe toegepast op werving
In één casestudy over personeelsverloop onthulde causale inferentie dat "gebrek aan trainingsmogelijkheden" — niet salaris — de werkelijke drijfveer van verloop was. Het bedrijf greep in met trainingsprogramma's in plaats van generieke loonsverhogingen, en verminderde het verloop met 23,9% tegen een fractie van de kosten. Dat is de kracht van het vragen naar waarom in plaats van alleen wat.
Bedrijven zoals Unilever en Hilton die overstapten naar datagedreven, op uitkomsten gebaseerde wervingsmodellen rapporteerden een verkorting van de time-to-hire met wel 90% terwijl ze tegelijkertijd de diversiteit vergrootten. Eerlijkheid en efficiëntie staan niet op gespannen voet. Het zijn gecorreleerde uitkomsten van een systeem dat werkelijk de juiste dingen meet.
Ik zie dit als het Moneyball-principe toegepast op HR. Traditionele recruiters overwaarderen afkomst — Ivy League-diploma's, gerenommeerde werkgevers — op dezelfde manier waarop honkbalscouts vroeger het slaggemiddelde overwaardeerden. Causale AI vindt het equivalent van on-base percentage: de ondergewaardeerde signalen die daadwerkelijk winnende uitkomsten voorspellen. Door de vooringenomenheid van "culture fit" te verwijderen, vergroot je de talentenpool met toppresteerders die elk ander bedrijf systematisch over het hoofd ziet.
Eerlijkheid is geen belasting op prestaties. Het is hoe prestaties eruitzien wanneer je afkomst niet langer verwart met potentieel.
Het deel waarin ik toegeef wat moeilijk is
Ik zou liegen als ik zei dat dit gemakkelijk te bouwen was, of gemakkelijk te verkopen.
De technologie is moeilijk. Causale modellen vereisen domeinexpertise om te construeren — je moet de werkelijke causale structuur van werkprestaties in een bepaalde rol begrijpen, en niet zomaar data op een algoritme afvuren. Die structuur verkeerd hebben betekent dat je legitieme paden blokkeert of schijnpaden openlaat. We hebben interne debatten gehad die dagen duurden over de vraag of een bepaalde variabele een legitieme voorspeller of een proxy was. Er is geen kortere weg. Je moet nadenken.
De verkoopcyclus is ook moeilijk. Wervingsmanagers vertrouwen op hun onderbuikgevoel. Ze geloven dat ze goede mensenkenners zijn. Iemand vertellen dat hun "instinct" eigenlijk patroonherkenning is op hun eigen demografische profiel maakt je niet populair op etentjes. We hebben geleerd om de technologie niet te positioneren als een beschuldiging maar als een beslissingsondersteunend hulpmiddel — een "biascheck" analoog aan een spellingcontrole. Het schrijft het boek niet voor je. Het zorgt ervoor dat je geen vermijdbare fouten maakt.
En datagereedheid is een reële uitdaging. Causale AI heeft robuuste data nodig, en minderheidsgroepen zijn vaak ondervertegenwoordigd in historische datasets. We pakken dit aan met synthetische datageneratie — door GANs te gebruiken om privacyveilige datapunten te creëren die de statistische eigenschappen van ondervertegenwoordigde groepen nabootsen, zodat het model genoeg voorbeelden heeft om eerlijke beslissingsgrenzen voor iedereen te leren.
Dit alles is niet zo eenvoudig als een API-aanroep naar GPT verpakken en een product uitbrengen. Maar de eenvoudige versie werkt niet. Die faalt gewoon in stilte, op grote schaal, op manieren die de levens van echte mensen schaden.
Het scherm, niet de spiegel
De eerste generatie AI in werving was een spiegel. Het weerkaatste onze vooroordelen terug naar ons, vergroot door automatisering, en we noemden het intelligentie.
De volgende generatie moet een scherm zijn — zoals dat in die orkestaudities. Geen hulpmiddel dat naar kandidaten kijkt en demografie ziet. Een hulpmiddel dat naar de muziek luistert.
We zijn er als sector nog niet. De markt wordt nog steeds gedomineerd door tools die optimaliseren voor de verkeerde doelstelling, gebouwd op modellen die zichzelf niet kunnen verklaren, verkocht aan bedrijven die niet weten welke vragen ze moeten stellen. Maar de regelgevingsomgeving verschuift. Het bewijs stapelt zich op. En de organisaties die dit als eerste doorgronden, krijgen toegang tot een talentenpool die hun concurrenten algoritmisch uitsluiten.
Ik ben Veriprajna niet begonnen omdat ik dacht dat eerlijkheid een nice-to-have was. Ik ben het begonnen omdat ik naar de data keek en me realiseerde dat vooringenomenheid niet alleen een ethisch falen is — het is een voorspellingsfalen. Elke keer dat een model een gekwalificeerde kandidaat afwijst vanwege een naam of een postcode of een hobby die correleert met de "verkeerde" demografie, maakt het een verkeerde voorspelling. Het laat prestaties liggen. Het kiest comfort boven nauwkeurigheid.
De vraag is niet of AI werving zal transformeren. De vraag is of we het zullen gebruiken om onze beste instincten op te schalen of onze slechtste.
Ik weet voor welke kant ik bouw.