Een conceptuele tweedeling die de kernspanning van het artikel toont — een foto van een echt beschadigde auto versus een door AI 'verbeterde' smetteloze versie, die het waarheidsprobleem in verzekerings-AI verbeeldt.
Artificial IntelligenceInsuranceComputer Vision

Een AI "repareerde" een vernielde auto en wees de claim af. Toen wist ik dat de verzekeringssector een probleem had.

Ashutosh SinghalAshutosh Singhal18 februari 202612 min

Ik staarde naar twee foto's van dezelfde auto.

De eerste was genomen door een polishouder na een kop-staartbotsing. Verkreukeld metaal, verf tot op het kale staal geschraapt, een bumper die eruitzag alsof hij als verkeersdrempel was gebruikt. De tweede foto — zogenaamd dezelfde auto, verwerkt via de glimmende nieuwe AI-tool van de verzekeraar — toonde een smetteloze achterkant. Vloeiende lijnen, perfecte lak, geen krasje. De geautomatiseerde claimengine keek naar dat tweede beeld en deed precies wat je zou verwachten: hij wees de claim af. Nul zichtbare schade.

De polishouder, staand op de eigen oprit naast een auto die overduidelijk een vernielde bumper had, klaagde aan wegens kwade trouw. En de verzekeraar bleef achter met een stuk digitaal vervalst bewijsmateriaal dat de fysieke realiteit tegensprak.

Dit is het "Smetteloze Bumper"-incident, en toen ik de details voor het eerst las, voelde ik een mengeling van afschuw en genoegdoening. Afschuw omdat een AI in feite bewijsvernietiging had gepleegd — het wijzigen van een juridisch document op een manier die een echt mens schaadde. Genoegdoening omdat dit precies de faalwijze was waar mijn team en ik al maanden voor waarschuwden, de reden waarom we Veriprajna gebouwd hebben zoals we dat deden.

De verzekeringssector heeft geen AI-probleem. Ze heeft een waarheidsprobleem. En de tools die de meeste verzekeraars zich haastig eigen maken, maken het alleen maar erger.

De Nacht Dat de Deuk Verdween

Laat me uitleggen wat er in die bumperzaak werkelijk gebeurde, want het technische mechanisme is van belang.

De verzekeraar had een generatieve AI-tool in hun mobiele claim-app geïntegreerd. Het gestelde doel was onschuldig genoeg: de kwaliteit van door klanten geüploade foto's "verbeteren" zodat schade-experts de schade duidelijker konden zien. Betere belichting, scherpere details, dat soort dingen.

Maar dit is wat generatieve beeldmodellen werkelijk doen. Ze worden getraind op miljarden beelden om te leren hoe dingen er zouden moeten uitzien. In het wiskundige universum van het model — de latente ruimte — wordt een "auto" overweldigend gerepresenteerd als een glad, symmetrisch object met ononderbroken oppervlakken. Zo zien auto's er op de overgrote meerderheid van de foto's op internet uit.

Dus toen dit model een deuk tegenkwam, zag het geen schade. Het zag ruis. Een statistische afwijking. Een afwijking van het verwachte patroon van "auto." En het deed waarvoor het ontworpen was: het verwijderde de ruis. Het model gebruikte een proces genaamd inpainting om het verkreukelde metaal digitaal terug te strijken tot een perfect spatbord, pixel voor pixel.

Een deuk lijkt voor een diffusiemodel op ruis. Het model verwijdert die. In de kunst is dat een pluspunt. In verzekeringen is het de geautomatiseerde vernietiging van bewijsmateriaal.

Dit was geen bug. Het model werkte precies zoals ontworpen. Dat is het deel dat me 's nachts wakker houdt.

Waarom Blijft Generatieve AI Dit Verkeerd Doen?

Een vergelijkend diagram dat laat zien hoe generatieve AI (semantische plausibiliteit) versus forensische computer vision (fysieke meting) dezelfde foto van een beschadigde auto verwerkt, en dat uitlegt waarom generatieve modellen falen bij schadetaxatie.

Ik herinner me een gesprek met een potentiële investeerder in het begin — misschien zes maanden nadat we met de bouw van Veriprajna waren begonnen. Hij kwam net van een demo van een andere InsurTech-startup, een die GPT-4 Vision gebruikte om voertuigschade van foto's te classificeren. "Waarom zetten jullie niet gewoon een schil om GPT?" vroeg hij. "Het is sneller. Het is goedkoper. De demo zag er geweldig uit."

Ik haalde twee beelden op mijn laptop tevoorschijn. Eén was een echte foto van hagelschade op een zwarte sedan — kleine putjes onzichtbaar voor het ongeoefende oog, maar die duidelijk de weerspiegelingen op de motorkap vervormden. Het andere was een deepfake die ik in ongeveer vier minuten had gegenereerd met een consumententool voor beelden: een smetteloze auto met een digitaal geschilderde barst over de voorruit.

Ik vroeg hem: "Welke heeft echte schade?"

Hij wees naar de deepfake.

Dat is het probleem. Generatieve AI-modellen — degene die op dit moment de overgrote meerderheid van de "AI-claims"-startups aandrijven — werken op basis van semantische plausibiliteit, niet forensische realiteit. Ze zijn getraind om te begrijpen hoe dingen eruitzien, niet wat dingen zijn. Een model dat briljant is in het genereren van fotorealistische beelden van auto's, is door precies datzelfde mechanisme slecht in het bepalen of schade op een foto echt, synthetisch of digitaal gewist is.

En de bedrijven die op deze modellen voortbouwen? De meeste zijn wat de sector wrappers noemt — dunne interfacelagen bovenop andermans API. Ze bezitten het model niet. Ze hebben geen controle over de trainingsdata. Ze kunnen niet uitleggen waarom een beslissing genomen is. Als OpenAI morgen hun modelgewichten bijwerkt om meer "esthetisch aangenaam" te zijn, zou de schadetaxatietool van een wrapper met meer enthousiasme auto's kunnen gaan repareren, en het InsurTech-bedrijf zou niet eens weten dat het gebeurde.

De verzekeraar behoudt ondertussen 100% van de aansprakelijkheid.

Ik heb over dit afhankelijkheidsprobleem uitgebreider geschreven in de interactieve versie van ons onderzoek, maar de korte versie is: als je niet het brein bezit dat beslissingen neemt over jouw claims, heb je geen controle over jouw risico.

Wat Gebeurt Er Als Fraudeurs Dezelfde Tools Krijgen?

Hier is de wending die dit nog erger maakt.

Terwijl verzekeraars per ongeluk AI gebruiken om schade te verwijderen, gebruiken fraudeurs dezelfde technologie om die te fabriceren. De toegangsdrempel voor verzekeringsfraude is in wezen ingestort.

Iemand kan nu een volledig intact voertuig fotograferen, een consumententool voor beeldgeneratie openen en die opdragen om "een verpletterde voorbumper toe te voegen" of "brandschade te simuleren." Moderne inpainting verwerkt belichting, schaduwen en weerspiegelingen met angstaanjagend realisme. Een standaard AI-beeldclassificatie — het soort dat de meeste verzekeraars gebruiken — kijkt naar die deepfake en bevestigt: ja, dit is een verpletterde auto. Het faalt omdat het de inhoud beoordeelt, niet de structurele vingerafdruk van hoe het beeld gegenereerd is.

Het wordt duisterder. Criminele netwerken gebruiken generatieve AI om synthetische identiteiten te creëren — hyperrealistische gezichten van mensen die niet bestaan, valse rijbewijzen, verzonnen medische dossiers. Deze digitale spoken kopen polissen, betalen enkele maanden premie om legitimiteit op te bouwen, en dienen dan catastrofale claims in. Bij levensverzekeringen door AI gegenereerde overlijdensberichten en lijkschouwersrapporten. Bij zorgverzekeringen röntgenfoto's die breuken tonen die nooit gebeurd zijn.

En de traditionele verdedigingsmiddelen falen. Door AI gegenereerde beelden hebben vaak gewiste of gesynthetiseerde metadata. Menselijke beoordelaars? Onderzoek toont aan dat ze nauwelijks beter presteren dan een muntworp bij het detecteren van hoogwaardige deepfakes.

Dezelfde technologie die een verzekeraar een foto laat "verbeteren", laat een fraudeur er een fabriceren. En de meeste AI-tools op de markt kunnen het verschil niet zien.

Dit is de wapenwedloop waar niemand in InsurTech eerlijk over wil praten.

Het Vergrootglas, Niet het Penseel

Een architectuurdiagram met drie lagen dat de forensische analysepijplijn van Veriprajna toont — semantische segmentatie, monoculaire diepteschatting en analyse van speculaire weerspiegeling — met wat elke laag detecteert.

Er was een specifiek moment waarop de filosofie achter Veriprajna voor mij kristalliseerde. Mijn team en ik waren aan het discussiëren — echt aan het discussiëren, met stemverheffing — over onze technische aanpak.

Een van onze engineers wilde een groot vision-language-model verfijnen voor schadeclassificatie. Het zou sneller te bouwen zijn geweest, makkelijker om te demonstreren, en eerlijk gezegd zou het indrukwekkender hebben geleken voor investeerders. "De markt wil generatief," zei hij. "Daar zit het geld."

Ik haalde de zaak van de Smetteloze Bumper op het scherm van de vergaderzaal tevoorschijn. "Dit is waar generatief je brengt," zei ik. "Een rechtszaak en een vervalst document."

Het werd stil in de zaal. Toen zei onze hoofdonderzoeker computer vision — die jaren in industriële inspectie had gewerkt voordat hij bij ons kwam — iets wat ik nooit ben vergeten: "Een schade-expert heeft geen penseel nodig. Hij heeft een vergrootglas nodig."

Dat werd ons ontwerpprincipe. Wij genereren niets. Wij wijzigen geen enkele pixel. Wij meten.

Onze architectuur heeft drie lagen, en elke laag behandelt het beeld als bewijsmateriaal, niet als grondstof:

Semantische segmentatie identificeert schade op pixelniveau. Niet "deze auto is beschadigd" — dat is nutteloos. Onze modellen classificeren elke afzonderlijke pixel: deze pixel is onbeschadigde lak, deze pixel is een kras, deze pixel is een deuk, deze pixel is roest. De output is een nauwkeurig masker over het oorspronkelijke, onaangeraakte beeld. Omdat we de fysieke afmetingen van specifieke auto-onderdelen kennen — een bumper van een Toyota Camry uit 2024 is 180 cm breed — kunnen we de exacte oppervlakte van de schade in vierkante centimeters berekenen. Dat getal gaat rechtstreeks in reparatieschattingssoftware.

Monoculaire diepteschatting lost het probleem op dat de bumperzaak fataal werd: het begrijpen van 3D-geometrie uit een platte foto. Door te trainen op enorme datasets van autogeometrieën met LiDAR-grondwaarheid, leren onze modellen hoe de kromming van een wielkast eruit zou moeten zien, wat de vlakheid van een deurpaneel betekent. Een deuk verschijnt als een zinkgat op de dieptekaart. We berekenen gradiënten — een steile gradiënt betekent een scherpe vouw die waarschijnlijk paneelvervanging nodig heeft; een flauwe gradiënt betekent een zachte deuk die te repareren is met uitdeuken zonder spuiten. We kunnen het verplaatste volume metaal schatten. Geen gok. Een meting.

Analyse van speculaire weerspiegeling is de laag waar ik het meest trots op ben, omdat die opvangt wat al het andere mist. Moderne auto's zijn glimmend. Hun oppervlakken werken als spiegels. Een deuk op een glanzend zwarte auto verandert misschien helemaal niets aan de kleur van de pixels — maar hij vervormt de weerspiegeling. Rechte lijnen in de omgeving (horizonten, elektriciteitskabels, gebouwranden) zouden bij weerspiegeling de carrosseriekromming van de auto moeten volgen. Een deuk werkt als een lachspiegel, waardoor die lijnen knijpen, kolken of breken. We hebben onze modellen getraind om de laklkeur los te koppelen van de weerspiegelingspatronen en de normaalvectorkaart van het oppervlak te reconstrueren — een 3D-vector die de hoek van het oppervlak bij elke pixel weergeeft. Dit detecteert hagelschade die onzichtbaar is voor het blote oog, structurele kromtrekking ver van de inslagplek, en zelfs eerdere reparaties waar schuursporen de speculariteit van de blanke lak verstoren.

Voor de volledige technische uiteenzetting van alle drie de lagen, zie ons onderzoeksrapport.

Waarom Kunnen Verzekeraars Hun AI-beslissingen Niet Gewoon Uitleggen?

Een vergelijking naast elkaar van wat een generatief AI-systeem versus een forensisch AI-systeem kan produceren wanneer een toezichthouder of rechtbank een verklaring voor een claimbeslissing eist.

Dit is de vraag die toezichthouders nu luidkeels stellen, en de meeste verzekeraars hebben er geen goed antwoord op.

De NAIC — de National Association of Insurance Commissioners — heeft een Model Bulletin uitgevaardigd dat het nalevingslandschap fundamenteel veranderde. Het legt de verantwoordelijkheid voor AI-uitkomsten volledig bij de verzekeraar, zelfs wanneer de AI een tool van derden is. Je kunt je niet verschuilen achter het wrapper-excuus. Als het model van jouw leverancier hallucineert of discrimineert, ben jij aansprakelijk. Het bulletin schrijft schriftelijke governanceprogramma's voor, due diligence op de dataherkomst en modelarchitectuur van leveranciers, en — cruciaal — de mogelijkheid om elke door AI aangestuurde beslissing aan een polishouder uit te leggen.

Probeer maar eens een claimafwijzing uit te leggen die door een generatief model is aangestuurd. "De probabilistische verdeling van het model gaf de voorkeur aan een gladde bumper" gaat een rechtszaal niet overleven.

Vergelijk dat nu met wat ons systeem produceert: "De claim is verwerkt op basis van de detectie van schade aan het achterste linker zijpaneel. Het systeem identificeerde een kras met een lengte van 14 cm en een deuk met een oppervlakte van 45 cm², gevalideerd door dieptekaartanalyse." Dat is empirisch verifieerbaar. Dat is toelaatbaar.

De EU AI-verordening gaat verder. AI die wordt gebruikt voor verzekeringsrisicobeoordeling waarbij natuurlijke personen betrokken zijn, wordt geclassificeerd als hoog-risico, wat verplichte datagovernance, automatische gebeurtenislogging en eisen aan menselijk toezicht in werking stelt. Onze maskeroverlay-technologie — waarbij de schade-expert de oorspronkelijke foto ziet met een in-/uitschakelbare analyselaag — is specifiek hiervoor ontworpen. We vervangen de mens niet. We versterken hem. Hij blijft de beslisser, wat een cruciale veilige haven is onder de verordening.

En dan is er nog bewijsvernietiging. In het Amerikaanse rechtssysteem kan het wijzigen van bewijsmateriaal dat relevant is voor een gerechtelijke procedure — zelfs onbedoeld — leiden tot sancties, nadelige gevolgtrekkingsinstructies (waarbij de jury wordt verteld aan te nemen dat het verloren bewijs schadelijk voor je was), of een kort geding-vonnis. Wanneer een generatieve AI-tool synthetische pixels introduceert in een claimfoto, is dat technisch gezien een wijziging. Als het origineel is overschreven, is dat bewijsvernietiging.

Wij hashen elk oorspronkelijk beeld met SHA-256 op het moment dat het binnenkomt. Onze AI leest de beeldbuffer maar schrijft er nooit naar. Alle analyse — maskers, dieptekaarten, rapporten — wordt opgeslagen als afzonderlijke sidecar-bestanden die aan de oorspronkelijke hash zijn gekoppeld. Elke toegang wordt gelogd. Het bewijs blijft smetteloos.

Als jouw AI niet kan bewijzen dat hij het bewijs niet heeft gewijzigd, heb je de zaak al verloren voordat die begint.

De Wapenwedloop Waar Niemand Zich Op Voorbereidde

Mensen vragen me soms of deterministische computer vision "genoeg" is — of we niet te conservatief zijn door te weigeren generatieve modellen te gebruiken.

Ik denk dat ze de verkeerde vraag stellen.

De juiste vraag is: wat gebeurt er als jouw claimsysteem geen onderscheid kan maken tussen een echte foto en een synthetische? Wat gebeurt er als de deepfake van een fraudeur jouw AI-classificatie met hogere zekerheid passeert dan een legitieme claim? Wat gebeurt er als jouw "verbeterings"-tool stilletjes bewijsmateriaal fabriceert in een zaak die voor een federale rechtbank belandt?

Dat zijn geen hypothesen. Ze gebeuren nu. En de verzekeraars die generatieve modellen voor algemene doeleinden als hun eerste verdedigingslinie gebruiken, brengen een penseel naar een forensisch onderzoek.

Onze modellen zijn deterministisch. Je kunt geen prompt-injectie uitvoeren op een netwerk voor semantische segmentatie. Je kunt een diepteschattingsmodel niet zoetsappig overhalen om een deuk te negeren. Deze systemen werken op basis van gradiënten in pixelintensiteit en textuuranalyse — ze extraheren kenmerken uit de fysieke eigenschappen van licht dat op een camerasensor valt. Er is geen instructievolgend mechanisme om te misbruiken.

Dat is geen conservatisme. Dat is engineering voor een wereld waarin de tegenstander toegang heeft tot dezelfde generatieve tools als jij.

Het Scherm van de Schade-expert

Ik wil eindigen met een beeld — geen foto, maar een schets van hoe ik denk dat de toekomst eruitziet.

Een schade-expert opent zijn dashboard. Hij ziet geen "gerepareerde" auto. Hij ziet niet de beste gok van een AI over hoe de auto er vóór het ongeval uit had kunnen zien. Hij ziet de daadwerkelijke foto, genomen door de polishouder, met een in-/uitschakelbaar schademasker dat precies laat zien waar de AI krassen, deuken en roest heeft gedetecteerd. Hij ziet een diepte-heatmap die onthult dat de deuk op het achterste zijpaneel 12 mm diep is met een steile gradiënt — scherpe vouw, waarschijnlijk vervanging nodig. Hij ziet de weerspiegelingsanalyse die subtiele kromtrekking markeert op zeven centimeter van de inslagplek die geen menselijk oog zou opmerken.

Hij ziet een audittraject dat elke bevinding uitlegt. En hij neemt de beslissing.

De AI heeft niet beslist. Hij heeft belicht. Het bewijs is niet gewijzigd. Het is onthuld.

Dat is het verschil tussen een systeem dat plausibele ficties creëert en een systeem dat ongemakkelijke waarheden meet. De verzekeringssector is gebouwd op het principe dat je betaalt voor wat er werkelijk is gebeurd — niet voor wat een model denkt dat waarschijnlijk is gebeurd. Elke pixel in een claimfoto is een stuk bewijsmateriaal. Op het moment dat je een AI er ook maar één van laat veranderen, heb je het domein van de waarheid verlaten en het domein van de waarschijnlijkheid betreden.

En waarschijnlijkheid is, in een rechtszaal, gewoon een ander woord voor gerede twijfel.

Related Research

Also Published On