Una composizione concettuale divisa che mostra la tensione centrale dell'articolo — la foto di un'auto realmente danneggiata contro una versione immacolata "migliorata" dall'IA, a rappresentare il problema di verità nell'IA assicurativa.
Artificial IntelligenceInsuranceComputer Vision

Un'IA ha "riparato" un'auto distrutta e ha respinto il sinistro. È lì che ho capito che il settore aveva un problema.

Ashutosh SinghalAshutosh Singhal18 febbraio 202612 min

Fissavo due foto della stessa auto.

La prima era stata scattata da un assicurato dopo un tamponamento. Metallo accartocciato, vernice raschiata fino all'acciaio nudo, un paraurti che sembrava essere stato usato come dosso rallentatore. La seconda foto — presumibilmente lo stesso veicolo, elaborata dal nuovo e scintillante strumento di IA dell'assicuratore — mostrava un posteriore immacolato. Linee lisce, vernice perfetta, nemmeno un graffio. Il motore automatico per la gestione dei sinistri ha guardato quella seconda immagine e ha fatto esattamente ciò che ci si aspetterebbe: ha respinto il sinistro. Zero danni visibili.

L'assicurato, in piedi nel proprio vialetto accanto a un'auto che molto evidentemente aveva un paraurti distrutto, ha fatto causa per malafede. E l'assicuratore si è ritrovato in mano una prova fabbricata digitalmente che contraddiceva la realtà fisica.

Questo è l'incidente del "Paraurti Immacolato", e quando ho letto i dettagli per la prima volta, ho provato un misto di orrore e rivincita. Orrore perché un'IA aveva di fatto commesso una distruzione di prove — alterando un documento legale in un modo che ha danneggiato una persona reale. Rivincita perché questa era esattamente la modalità di fallimento contro cui io e il mio team mettevamo in guardia da mesi, il motivo per cui abbiamo costruito Veriprajna nel modo in cui l'abbiamo fatto.

Il settore assicurativo non ha un problema di IA. Ha un problema di verità. E gli strumenti che la maggior parte delle compagnie si affretta ad adottare lo stanno peggiorando.

La notte in cui l'ammaccatura è scomparsa

Lasciate che vi spieghi cosa è successo davvero in quel caso del paraurti, perché il meccanismo tecnico è importante.

L'assicuratore aveva integrato uno strumento di IA generativa nella propria app mobile per i sinistri. L'obiettivo dichiarato era abbastanza innocente: "migliorare" la qualità delle foto caricate dai clienti così che i periti potessero vedere i danni più chiaramente. Illuminazione migliore, dettagli più nitidi, cose di questo tipo.

Ma ecco cosa fanno realmente i modelli generativi di immagini. Vengono addestrati su miliardi di immagini per imparare quale aspetto le cose dovrebbero avere. Nell'universo matematico del modello — il suo spazio latente — un'"auto" è rappresentata in modo schiacciante come un oggetto liscio e simmetrico con superfici integre. È così che appaiono le auto nella stragrande maggioranza delle foto su internet.

Quindi, quando questo modello ha incontrato un'ammaccatura, non ha visto un danno. Ha visto rumore. Un'anomalia statistica. Una deviazione dallo schema atteso di "auto". E ha fatto ciò per cui era stato progettato: ha rimosso il rumore. Il modello ha usato un processo chiamato inpainting per lisciare digitalmente il metallo accartocciato riportandolo a un parafango perfetto, pixel dopo pixel.

Un'ammaccatura, per un modello di diffusione, sembra rumore. Il modello la rimuove. Nell'arte, è una funzionalità. Nelle assicurazioni, è la distruzione automatizzata delle prove.

Non era un bug. Il modello ha funzionato esattamente come progettato. È questa la parte che mi tiene sveglio la notte.

Perché l'IA generativa continua a sbagliare su questo?

Un diagramma comparativo che mostra come l'IA generativa (plausibilità semantica) e la visione artificiale forense (misurazione fisica) elaborano la stessa foto di un'auto danneggiata, spiegando perché i modelli generativi falliscono nella valutazione dei danni.

Ricordo una conversazione con un potenziale investitore agli inizi — forse sei mesi dopo aver iniziato a costruire Veriprajna. Veniva appena dalla demo di un'altra startup InsurTech, una che usava GPT-4 Vision per classificare i danni ai veicoli dalle foto. "Perché non fate semplicemente un wrapper attorno a GPT?" mi chiese. "È più veloce. È più economico. La demo sembrava fantastica."

Ho aperto due immagini sul mio portatile. Una era una foto reale di danni da grandine su una berlina nera — minuscole fossette invisibili all'occhio inesperto, ma che deformavano chiaramente i riflessi sul cofano. L'altra era un deepfake che avevo generato in circa quattro minuti usando uno strumento per immagini di livello consumer: un'auto immacolata con una crepa dipinta digitalmente sul parabrezza.

Gli ho chiesto: "Quale delle due ha un danno reale?"

Ha indicato il deepfake.

Ecco il problema. I modelli di IA generativa — quelli che alimentano la stragrande maggioranza delle startup di "sinistri gestiti con l'IA" in questo momento — operano sulla base della plausibilità semantica, non della realtà forense. Sono addestrati a capire che aspetto hanno le cose, non cosa le cose sono. Un modello che è brillante nel generare immagini fotorealistiche di automobili è, per lo stesso identico meccanismo, pessimo nel determinare se il danno in una foto sia reale, sintetico o sia stato cancellato digitalmente.

E le aziende che costruiscono sopra questi modelli? La maggior parte di esse è ciò che il settore chiama wrapper — sottili livelli di interfaccia sopra l'API di qualcun altro. Non possiedono il modello. Non controllano i dati di addestramento. Non sanno spiegare perché una decisione sia stata presa. Se domani OpenAI aggiornasse i pesi del proprio modello per renderlo più "esteticamente gradevole", lo strumento di valutazione dei danni di un wrapper potrebbe iniziare a riparare le auto con maggiore entusiasmo, e l'azienda InsurTech non saprebbe nemmeno che è successo.

L'assicuratore, nel frattempo, mantiene il 100% della responsabilità.

Ho scritto in modo più approfondito di questo problema di dipendenza nella versione interattiva della nostra ricerca, ma la versione breve è: se non possiedi il cervello che prende le decisioni sui tuoi sinistri, non controlli il tuo rischio.

Cosa succede quando i truffatori ottengono gli stessi strumenti?

Ecco il colpo di scena che rende tutto ancora peggiore.

Mentre gli assicuratori usano accidentalmente l'IA per eliminare il danno, i truffatori usano la stessa tecnologia per fabbricare il danno. La barriera d'ingresso per la frode assicurativa è sostanzialmente crollata.

Oggi qualcuno può fotografare un veicolo perfettamente intatto, aprire uno strumento di generazione di immagini di livello consumer e dargli l'istruzione di "aggiungere un paraurti anteriore distrutto" o "simulare danni da incendio". L'inpainting moderno gestisce luci, ombre e riflessi con un realismo terrificante. Un classificatore di immagini IA standard — del tipo che usa la maggior parte delle compagnie — guarderà quel deepfake e confermerà: sì, questa è un'auto distrutta. Fallisce perché valuta il contenuto, non l'impronta strutturale di come l'immagine è stata generata.

La situazione si fa più cupa. Le organizzazioni criminali usano l'IA generativa per creare identità sintetiche — volti iper-realistici di persone che non esistono, patenti di guida false, cartelle cliniche fabbricate. Questi fantasmi digitali acquistano polizze, pagano i premi per qualche mese per costruire legittimità, poi presentano sinistri catastrofici. Nelle assicurazioni sulla vita, necrologi e referti del medico legale generati dall'IA. Nelle assicurazioni sanitarie, radiografie che mostrano fratture mai avvenute.

E le difese tradizionali stanno fallendo. Le immagini generate dall'IA hanno spesso metadati ripuliti o sintetizzati. I revisori umani? La ricerca dimostra che se la cavano appena meglio del lancio di una moneta nel rilevare deepfake di alta qualità.

La stessa tecnologia che permette a un assicuratore di "migliorare" una foto permette a un truffatore di fabbricarne una. E la maggior parte degli strumenti di IA sul mercato non sa distinguere la differenza.

Questa è la corsa agli armamenti di cui nessuno nell'InsurTech vuole parlare onestamente.

La lente d'ingrandimento, non il pennello

Un diagramma dell'architettura a tre livelli che mostra la pipeline di analisi forense di Veriprajna — segmentazione semantica, stima monoculare della profondità e analisi della riflessione speculare — con ciò che ciascun livello rileva.

C'è stato un momento preciso in cui la filosofia dietro Veriprajna si è cristallizzata per me. Io e il mio team stavamo discutendo — discutendo davvero, a voce alta — del nostro approccio tecnico.

Uno dei nostri ingegneri voleva mettere a punto un grande modello visione-linguaggio per la classificazione dei danni. Sarebbe stato più veloce da costruire, più facile da mostrare in demo e, francamente, sarebbe apparso più impressionante agli investitori. "Il mercato vuole il generativo", disse. "È lì che ci sono i finanziamenti."

Ho aperto il caso del Paraurti Immacolato sullo schermo della sala riunioni. "Ecco dove ti porta il generativo", dissi. "Una causa legale e un documento fabbricato."

La sala piombò nel silenzio. Poi il nostro principale ricercatore di visione artificiale — che aveva trascorso anni nell'ispezione industriale prima di unirsi a noi — disse una cosa che non ho mai dimenticato: "Un perito non ha bisogno di un pennello. Ha bisogno di una lente d'ingrandimento."

Questo è diventato il nostro principio di progettazione. Non generiamo nulla. Non modifichiamo un singolo pixel. Noi misuriamo.

La nostra architettura ha tre livelli, e ciascuno tratta l'immagine come una prova, non come materia prima:

La segmentazione semantica identifica il danno a livello di pixel. Non "quest'auto è danneggiata" — questo è inutile. I nostri modelli classificano ogni singolo pixel: questo pixel è vernice non danneggiata, questo pixel è un graffio, questo pixel è un'ammaccatura, questo pixel è ruggine. Il risultato è una maschera precisa sovrapposta all'immagine originale, non toccata. Poiché conosciamo le dimensioni fisiche di specifiche parti dell'auto — il paraurti di una Toyota Camry del 2024 è largo 180 cm — possiamo calcolare l'esatta area del danno in centimetri quadrati. Quel numero confluisce direttamente nel software di stima delle riparazioni.

La stima monoculare della profondità risolve il problema che ha affossato il caso del paraurti: comprendere la geometria 3D da una foto piatta. Addestrando i nostri modelli su enormi dataset di geometrie di auto con ground truth LiDAR, essi imparano quale aspetto dovrebbe avere la curvatura di un passaruota, cosa significa la planarità di un pannello portiera. Un'ammaccatura appare come una voragine nella mappa di profondità. Calcoliamo i gradienti — un gradiente ripido indica una piega netta che probabilmente richiede la sostituzione del pannello; un gradiente dolce indica un'ammaccatura leggera riparabile con il ripristino senza verniciatura. Possiamo stimare il volume di metallo spostato. Non un'ipotesi. Una misurazione.

L'analisi della riflessione speculare è il livello di cui sono più orgoglioso, perché coglie ciò che tutto il resto si lascia sfuggire. Le auto moderne sono lucide. Le loro superfici funzionano come specchi. Un'ammaccatura su un'auto nera lucida potrebbe non cambiare affatto il colore dei pixel — ma deforma il riflesso. Le linee rette nell'ambiente (orizzonti, linee elettriche, bordi degli edifici) dovrebbero seguire la curvatura della carrozzeria dell'auto quando vengono riflesse. Un'ammaccatura agisce come lo specchio deformante di un luna park, facendo restringere, vorticare o spezzare quelle linee. Abbiamo addestrato i nostri modelli a separare il colore della vernice dagli schemi di riflessione e a ricostruire la mappa delle normali di superficie — un vettore 3D che rappresenta l'angolo della superficie a ogni pixel. Questo rileva danni da grandine invisibili a occhio nudo, deformazioni strutturali lontane dal punto d'impatto e persino riparazioni precedenti dove i segni di levigatura alterano la specularità del trasparente.

Per l'analisi tecnica completa di tutti e tre i livelli, consulta il nostro documento di ricerca.

Perché gli assicuratori non possono semplicemente spiegare le decisioni della loro IA?

Un confronto affiancato di ciò che un sistema di IA generativa e un sistema di IA forense possono produrre quando un regolatore o un tribunale richiede una spiegazione per una decisione su un sinistro.

Questa è la domanda che i regolatori si stanno ponendo ora, ad alta voce, e la maggior parte delle compagnie non ha una buona risposta.

La NAIC — la National Association of Insurance Commissioners — ha emesso un Model Bulletin che ha cambiato radicalmente il panorama della conformità. Pone la responsabilità dei risultati dell'IA direttamente sull'assicuratore, anche quando l'IA è uno strumento di terze parti. Non ci si può nascondere dietro la scusa del wrapper. Se il modello del tuo fornitore ha allucinazioni o discrimina, tu sei responsabile. Il bollettino impone programmi di governance scritti, due diligence sulla provenienza dei dati del fornitore e sull'architettura del modello e — cosa fondamentale — la capacità di spiegare qualsiasi decisione guidata dall'IA a un assicurato.

Prova a spiegare un rifiuto di sinistro basato su un modello generativo. "La distribuzione probabilistica del modello ha preferito un paraurti liscio" non sopravvivrà in un'aula di tribunale.

Ora confrontalo con ciò che produce il nostro sistema: "Il sinistro è stato elaborato sulla base del rilevamento di un danno sul pannello posteriore sinistro. Il sistema ha identificato un graffio lungo 14 cm e un'ammaccatura con una superficie di 45 cm², convalidati dall'analisi della mappa di profondità." Questo è verificabile empiricamente. Questo è ammissibile.

L'EU AI Act si spinge oltre. L'IA usata per la valutazione del rischio assicurativo che coinvolge persone fisiche è classificata come ad alto rischio, il che fa scattare obblighi di governance dei dati, registrazione automatica degli eventi e requisiti di supervisione umana. La nostra tecnologia di sovrapposizione della maschera — in cui il perito vede la foto originale con un livello di analisi attivabile — è progettata specificamente per questo. Non sostituiamo l'essere umano. Lo potenziamo. Rimane lui a prendere le decisioni, il che costituisce un porto sicuro fondamentale ai sensi del regolamento.

E poi c'è la distruzione delle prove. Nel sistema giuridico statunitense, alterare prove rilevanti per un procedimento legale — anche involontariamente — può comportare sanzioni, istruzioni di inferenza sfavorevole (in cui alla giuria viene detto di presumere che la prova perduta fosse a te dannosa) o un giudizio sommario. Quando uno strumento di IA generativa introduce pixel sintetici in una foto di un sinistro, questo è tecnicamente un'alterazione. Se l'originale è stato sovrascritto, questa è distruzione delle prove.

Applichiamo un hash SHA-256 a ogni immagine originale nell'istante in cui arriva. La nostra IA legge il buffer dell'immagine ma non vi scrive mai. Tutte le analisi — maschere, mappe di profondità, report — vengono salvate come file sidecar separati collegati all'hash originale. Ogni accesso viene registrato. La prova resta immacolata.

Se la tua IA non può dimostrare di non aver alterato le prove, hai già perso la causa prima che inizi.

La corsa agli armamenti a cui nessuno si è preparato

A volte mi chiedono se la visione artificiale deterministica sia "sufficiente" — se non stiamo essendo troppo conservatori rifiutando di usare i modelli generativi.

Penso che stiano ponendo la domanda sbagliata.

La domanda giusta è: cosa succede quando il tuo sistema di gestione dei sinistri non riesce a distinguere tra una foto reale e una sintetica? Cosa succede quando il deepfake di un truffatore supera il tuo classificatore IA con una confidenza più alta di un sinistro legittimo? Cosa succede quando il tuo strumento di "miglioramento" fabbrica silenziosamente prove in un caso che finisce davanti a un tribunale federale?

Non sono ipotesi. Stanno accadendo ora. E le compagnie che usano modelli generativi generici come prima linea di difesa si presentano con un pennello a un'indagine forense.

I nostri modelli sono deterministici. Non si può fare prompt-injection su una rete di segmentazione semantica. Non si può convincere con le lusinghe un modello di stima della profondità a ignorare un'ammaccatura. Questi sistemi operano su gradienti di intensità dei pixel e analisi della texture — estraggono caratteristiche dalle proprietà fisiche della luce che colpisce il sensore di una fotocamera. Non c'è alcun meccanismo di esecuzione di istruzioni da sfruttare.

Questo non è conservatorismo. Questa è ingegneria per un mondo in cui l'avversario ha accesso agli stessi strumenti generativi che hai tu.

Lo schermo del perito

Voglio concludere con un'immagine — non una foto, ma un quadro di come penso sarà il futuro.

Un perito apre la propria dashboard. Non vede un'auto "riparata". Non vede la migliore ipotesi di un'IA su come poteva apparire l'auto prima dell'incidente. Vede la foto reale, scattata dall'assicurato, con una maschera dei danni attivabile che mostra esattamente dove l'IA ha rilevato graffi, ammaccature e ruggine. Vede una mappa termica di profondità che rivela che l'ammaccatura sul pannello posteriore è profonda 12 mm con un gradiente ripido — piega netta, probabilmente da sostituire. Vede l'analisi della riflessione che segnala una sottile deformazione a tre pollici dal punto d'impatto che nessun occhio umano coglierebbe.

Vede una pista di controllo che spiega ogni riscontro. E prende la decisione.

L'IA non ha deciso. Ha illuminato. La prova non è stata alterata. È stata rivelata.

Questa è la differenza tra un sistema che crea finzioni plausibili e uno che misura verità scomode. Il settore assicurativo è stato costruito sul principio che si paga per ciò che è realmente accaduto — non per ciò che un modello ritiene sia probabilmente accaduto. Ogni pixel in una foto di un sinistro è una prova. Nel momento in cui lasci che un'IA ne modifichi anche solo uno, hai lasciato il dominio della verità e sei entrato nel dominio della probabilità.

E la probabilità, in un'aula di tribunale, è solo un altro modo per dire ragionevole dubbio.

Related Research

Also Published On