一張概念式對比圖:投保人拍的真實受損車輛照片,與經 AI「強化」後完好無損的版本並置,呈現保險 AI 的真相問題。
Artificial IntelligenceInsuranceComputer Vision

AI「修好」了一輛被撞爛的車,還駁回了理賠——那一刻我才知道保險業出了大問題

Ashutosh SinghalAshutosh Singhal2026年2月18日12 min

我盯著同一輛車的兩張照片看。

第一張是投保人在一起追撞事故後拍的。凹陷的金屬、被刮到露出裸鋼的漆面,還有一個看起來像被當成減速丘輾過的保險桿。第二張照片——據說是同一輛車,經過保險公司光鮮亮麗的全新 AI 工具處理後——呈現出一個完好無損的車尾。線條平順、漆面完美、連一道刮痕都沒有。這套自動理賠引擎看著第二張影像,做出了你意料之中的事:它駁回了理賠。零可見損傷。

那位投保人就站在自家車道上,旁邊停著一輛保險桿明顯被撞爛的車,於是他以惡意違約為由提起訴訟。而保險公司手上握著的,是一份與物理現實相矛盾、經數位捏造的證據。

這就是所謂的「完美保險桿」事件,當我第一次讀到細節時,內心交雜著驚駭與印證感。驚駭,是因為一套 AI 實質上犯下了證據湮滅——以傷害真實個人的方式竄改了法律紀錄。印證感,是因為這正是我和團隊警告了好幾個月的失效模式,也是我們以那樣的方式打造 VeriPrajna 的原因。

保險業並不是有 AI 問題。它有的是真相問題。而大多數保險公司正急著採用的工具,只會讓情況變得更糟。

凹痕消失的那一夜

讓我說明那樁保險桿案例究竟發生了什麼事,因為技術機制很重要。

那家保險公司在他們的行動理賠 App 中整合了一套生成式 AI 工具。宣稱的目標聽起來夠無害:「強化」客戶上傳照片的品質,好讓理賠員能更清楚地看見損傷。更好的光線、更銳利的細節,諸如此類。

但生成式影像模型實際上做的是這件事。它們用數十億張影像訓練,學習事物應該長什麼樣子。在模型的數學宇宙裡——它的潛在空間裡——一輛「車」壓倒性地被表徵為一個表面完整、平滑、對稱的物體。因為在網路上絕大多數照片裡,車就是長那樣。

所以當這套模型遇到一處凹痕時,它看到的不是損傷。它看到的是雜訊。一個統計上的異常。一種偏離「車」預期樣態的偏差。於是它做了它被設計去做的事:把雜訊移除。這套模型用一種叫做修復填補(inpainting)的程序,逐個像素地把凹陷的金屬數位地撫平成一片完美的葉子板。

對一套擴散模型而言,一處凹痕看起來就像雜訊。模型把它移除。在藝術裡,那是個功能。在保險裡,那是對證據的自動化湮滅。

這不是一個臭蟲。這套模型完全按照設計運作。那正是讓我夜不能寐的部分。

為什麼生成式 AI 一再把這件事搞錯?

一張對比示意圖,展示生成式 AI(語意合理性)與鑑識電腦視覺(物理量測)如何處理同一張受損車輛照片,說明生成式模型為何在損傷評估上失效。

我記得早期——也許是打造 VeriPrajna 大約六個月時——與一位潛在投資人的對話。他剛看完另一家保險科技新創的展示,那家公司正用 GPT-4 Vision 從照片分類車輛損傷。「你們為什麼不乾脆包一層 GPT 就好?」他問。「更快。更便宜。展示看起來很棒。」

我在筆電上打開兩張影像。一張是一輛黑色轎車上冰雹損傷的真實照片——微小的凹坑,未受訓練的眼睛根本看不見,卻明顯扭曲了引擎蓋上的反光。另一張是我用一款消費級影像工具花大約四分鐘生成的深偽影像:一輛完好無損的車,擋風玻璃上被數位繪製了一道裂痕。

我問他:「哪一張有真實損傷?」

他指向那張深偽影像。

這就是問題所在。生成式 AI 模型——此刻驅動絕大多數「AI 理賠」新創的那些模型——運作的基礎是語意合理性,而非鑑識現實。它們被訓練去理解事物看起來像什麼,而非事物本質什麼。一套擅長生成逼真汽車影像的模型,正是憑著同一套機制,在判斷照片中的損傷是真實、合成、還是被數位抹除這件事上,糟糕透頂。

而那些在這些模型之上進行開發的公司呢?他們大多屬於業界所稱的套殼(wrappers)——覆蓋在別人 API 之上的薄薄一層介面。他們不擁有模型。他們無法掌控訓練資料。他們解釋不了某個決策為何做出。如果 OpenAI 明天更新模型權重,讓輸出更「賞心悅目」,一款套殼的損傷評估工具或許就會開始更加賣力地「修好」車子,而那家保險科技公司甚至不會知道這件事發生過。

與此同時,保險公司則承擔了 100% 的責任。

我在我們研究的互動版本中更深入地寫過這個依賴問題,但精簡版是:如果你不擁有那顆對你的理賠做出決策的大腦,你就控制不了自己的風險。

當詐欺者拿到同樣的工具時會發生什麼事?

接下來這個轉折,讓情況變得更加糟糕。

當保險公司無意間用 AI 去刪除損傷時,詐欺者卻正用同樣的技術去製造損傷。保險詐欺的進入門檻已經實質崩塌。

現在有人可以拍下一輛完好無缺的車,打開一款消費級影像生成工具,然後下指令要它「加上一個被撞爛的前保險桿」或「模擬火燒損傷」。現代的修復填補技術以令人膽寒的擬真度處理光線、陰影與反光。一套標準的 AI 影像分類器——大多數保險公司用的那種——看著那張深偽影像便會確認:沒錯,這是一輛被撞爛的車。它之所以失效,是因為它評估的是內容,而非影像是如何被生成的那道結構指紋。

情況還會更黑暗。犯罪集團正利用生成式 AI 來製造合成身分——不存在之人的超逼真臉孔、假駕照、捏造的病歷。這些數位幽靈購買保單,繳幾個月保費以建立正當性,然後提出災難性的理賠。在壽險領域,是 AI 生成的訃聞與驗屍報告。在健康保險領域,是顯示從未發生過骨折的 X 光片。

而傳統的防線正在失守。AI 生成的影像往往帶有被清除或被合成的中繼資料。人工審查者呢?研究顯示,在偵測高品質深偽時,他們的表現只比擲硬幣稍微好一點點。

讓保險公司得以「強化」一張照片的同一項技術,也讓詐欺者得以捏造一張。而市面上大多數的 AI 工具,分辨不出兩者的差別。

這就是保險科技界沒有人願意誠實面對的軍備競賽。

放大鏡,而非畫筆

一張三層架構示意圖,展示 VeriPrajna 的鑑識分析流程——語意分割、單目深度估計、與鏡面反射分析——並標示每一層各自偵測什麼。

有一個明確的時刻,VeriPrajna 背後的哲學在我心中凝結成形。我和團隊正在爭論——是真的在爭論,聲音都拉高了——關於我們的技術路線。

我們其中一位工程師想要微調一套大型視覺語言模型來做損傷分類。那樣打造起來會更快、更容易展示,而且坦白說,對投資人來說也會看起來更亮眼。「市場要的是生成式,」他說。「資金都在那裡。」

我在會議室螢幕上打開了「完美保險桿」案例。「這就是生成式會把你帶去的地方,」我說。「一場官司,加上一份被捏造的紀錄。」

整個房間安靜了下來。接著,我們的首席電腦視覺研究員——他在加入我們之前,在工業檢測領域待了好幾年——說了一句我永遠忘不了的話:「理賠員不需要一支畫筆。他們需要的是一面放大鏡。」

那句話成了我們的設計原則。我們不生成任何東西。我們不修改任何一個像素。我們量測

我們的架構有三層,而每一層都把影像當作證據,而非原始素材:

語意分割在像素層級辨識損傷。不是「這輛車受損了」——那毫無用處。我們的模型把每一個單獨像素分類:這個像素是未受損的漆面、這個像素是刮痕、這個像素是凹痕、這個像素是鏽蝕。輸出是一張精準的遮罩,疊加在原始、未經觸碰的影像之上。因為我們知道特定車件的物理尺寸——一輛 2024 年 Toyota Camry 的保險桿寬 180 公分——我們就能計算出損傷的確切平方公分面積。那個數字直接餵入維修估價軟體。

單目深度估計解決了那樁保險桿案例致命的問題:從一張平面照片理解 3D 幾何。透過在具有 LiDAR 真值的大量車輛幾何資料集上訓練,我們的模型學會了輪拱的曲率應該長什麼樣、車門板的平整意味著什麼。一處凹痕在深度圖上會顯現為一個下陷坑洞。我們計算梯度——陡峭的梯度意味著一道銳利的摺痕,很可能需要更換板件;平緩的梯度意味著一處柔和的凹痕,可用免鈑金凹痕修復處理。我們能估算被位移金屬的體積。不是猜測。是量測。

鏡面反射分析是我最引以為傲的一層,因為它捕捉到其他一切都漏掉的東西。現代車子很亮。它們的表面就像鏡子。一輛亮黑色車上的凹痕,也許完全不會改變像素的顏色——但它會扭曲反光。環境中的直線(地平線、電線、建築物邊緣)在被反射時,應該順著車體的曲率延伸。一處凹痕的作用就像遊樂園的哈哈鏡,讓那些線條收縮、旋轉或斷裂。我們訓練模型將漆面顏色與反射圖樣解耦,並重建表面法線圖——一組 3D 向量,代表每個像素處表面的角度。這能偵測到肉眼看不見的冰雹損傷、遠離撞擊點的結構挫曲,甚至是先前的維修——那裡打磨痕跡破壞了透明漆層的鏡面反射特性。

要看這三層全部的完整技術拆解,請參閱我們的研究論文

保險公司為什麼就不能解釋他們的 AI 決策?

一張並排對比,展示當監管機關或法院要求對理賠決策提出解釋時,生成式 AI 系統與鑑識 AI 系統各自能產出什麼。

這正是監管機關如今高聲提出的問題,而大多數保險公司都答不上一個好答案。

NAIC——美國全國保險監理官協會——發布了一份《示範公告》,從根本上改變了合規版圖。它把 AI 結果的責任明明白白地置於保險公司身上,即使那套 AI 是第三方工具也一樣。你不能躲在套殼這個藉口後面。如果你供應商的模型產生幻覺或歧視,就是承擔責任的一方。該公告要求書面治理計畫、對供應商資料來源與模型架構的盡職調查,以及——關鍵地——向投保人解釋任何由 AI 驅動之決策的能力。

試試看去解釋一件由生成式模型驅動的理賠駁回。「模型的機率分佈偏好一個平滑的保險桿」這種說法,是撐不過法庭的。

現在拿它跟我們系統產出的東西比一比:「本理賠是基於偵測到左後四分之一板件上的損傷而處理。系統辨識出一道長 14 公分的刮痕,以及一處表面積 45 平方公分的凹痕,並經深度圖分析驗證。」那是可以實證檢驗的。那是可以被法庭採納的。

歐盟《AI 法案》走得更遠。用於涉及自然人之保險風險評估的 AI 被歸類為高風險,這會觸發強制性的資料治理、自動事件記錄,以及人為監督要求。我們的遮罩疊加技術——理賠員看到的是原始照片,搭配一層可切換的分析圖層——正是為此而特別設計。我們不取代人類。我們增強他們。他們始終是決策者,而這在該法案下是一項關鍵的安全港。

然後還有證據湮滅問題。在美國法律體系中,竄改與法律程序相關的證據——即便是無意的——都可能導致制裁、不利推定指示(即陪審團被告知須假定遺失的證據對你不利),或即決判決。當一套生成式 AI 工具把合成像素引入一張理賠照片時,那在技術上就是竄改。如果原始檔被覆寫,那就是證據湮滅。

每一張原始影像一抵達,我們就立刻用 SHA-256 進行雜湊。我們的 AI 讀取影像緩衝區,卻從不對它寫入。所有分析——遮罩、深度圖、報告——都以獨立的旁附檔案儲存,並連結到原始的雜湊值。每一次存取都會被記錄。證據保持完好無損。

如果你的 AI 無法證明它沒有竄改證據,那麼案子還沒開打,你就已經輸了。

沒有人準備好的軍備競賽

有時人們會問我,決定式電腦視覺是否「足夠」——問我們拒絕使用生成式模型,是不是太過保守。

我認為他們問錯了問題。

真正該問的問題是:當你的理賠系統無法區分一張真實照片與一張合成照片時,會發生什麼事?當一名詐欺者的深偽影像以比正當理賠更高的信心分數通過你的 AI 分類器時,會發生什麼事?當你那套「強化」工具在一件最終鬧上聯邦法院的案子裡,悄悄捏造了證據時,又會發生什麼事?

那些不是假設。它們正在發生。而那些把通用型生成式模型當作第一道防線的保險公司,等於是帶著一支畫筆去做鑑識調查。

我們的模型是決定式的。你無法對一個語意分割網路進行提示注入。你無法花言巧語地哄一個深度估計模型去忽略一處凹痕。這些系統運作的基礎是像素強度梯度與紋理分析——它們從光線打到相機感測器的物理特性中萃取特徵。根本沒有可供利用的指令遵循機制。

那不是保守。那是為一個對手能取得與你相同生成式工具的世界所做的工程設計。

理賠員的螢幕

我想以一個畫面作結——不是一張照片,而是一幅我心中所認為的未來樣貌。

一名理賠員打開他的儀表板。他看到的不是一輛「修好」的車。他看到的不是 AI 對這輛車事故前可能長什麼樣子的最佳猜測。他看到的是投保人拍攝的真實照片,搭配一層可切換的損傷遮罩,精準顯示 AI 在哪裡偵測到刮痕、凹痕與鏽蝕。他看到一張深度熱圖,揭示後四分之一板件上的凹痕深 12 毫米、帶有陡峭梯度——銳利摺痕,很可能需要更換。他看到反射分析標記出距撞擊點三英吋處、任何人類眼睛都捕捉不到的細微挫曲。

他看到一份稽核軌跡,解釋每一項發現。然後由他來做決定。

AI 沒有做決定。它照亮了現場。證據沒有被竄改。它被揭示了出來。

那就是一套創造貌似合理之虛構的系統,與一套量測不合時宜之真相的系統,兩者之間的差別。保險業奠基於一項原則:你為實際發生過的事情付費——而不是為某個模型認為大概發生過的事情付費。理賠照片裡的每一個像素都是一件證據。你一旦讓 AI 改動了其中哪怕一個,你就已經離開了真相的領域,踏進了機率的領域。

而在法庭上,機率不過是「合理懷疑」的另一種說法罷了。

Related Research

Also Published On