記事の核心にある対立を象徴するコンセプト画像。実際に損傷した車の写真と、AIによって「補正」され傷ひとつなくなった車の写真を並べ、保険AIにおける真実の問題を表している。
Artificial IntelligenceInsuranceComputer Vision

AIが事故車を「修復」して保険金請求を却下した——そのとき、私は業界の問題を確信した

Ashutosh SinghalAshutosh Singhal2026年2月18日12 min

私は同じ車の2枚の写真をじっと見つめていた。

1枚目は、追突事故のあとに契約者が撮影したものだ。ぐしゃぐしゃにつぶれた金属、地の鋼が見えるまで削れた塗装、まるでスピードバンプ代わりに使われたかのようなバンパー。2枚目は——同じ車両のはずで、保険会社の真新しいAIツールで処理されたもの——傷ひとつない後部を映していた。滑らかなライン、完璧な塗装、かすり傷ひとつない。自動化された保険金請求エンジンはその2枚目の画像を見て、まさに予想どおりのことをした。請求を却下したのだ。目に見える損傷はゼロ、というわけである。

誰が見てもバンパーが破壊された車の隣、自宅の私道に立っていた契約者は、不誠実な対応(バッドフェイス)を理由に訴訟を起こした。そして保険会社の手元に残されたのは、物理的な現実と矛盾する、デジタルに捏造された証拠だった。

これが「傷ひとつないバンパー(Pristine Bumper)」事件だ。詳細を初めて読んだとき、私は恐怖と「やはりそうか」という思いが入り混じった感覚を覚えた。恐怖を感じたのは、AIが事実上、証拠の毀損(スポリエーション)——現実の人間に損害を与える形で法的記録を改変すること——を犯していたからだ。「やはりそうか」と思ったのは、これがまさに、私とチームが何か月も警告し続けてきた失敗モードそのものであり、私たちがVeriprajnaをああした形で築いた理由だったからである。

保険業界が抱えているのは、AIの問題ではない。抱えているのは真実の問題だ。そして、大半の保険会社が急いで導入しようとしているツールは、その問題をさらに悪化させている。

へこみが消えた夜

あのバンパーの一件で実際に何が起きたのかを説明しよう。技術的な仕組みが重要だからだ。

その保険会社は、モバイルの保険金請求アプリに生成AIツールを組み込んでいた。掲げられた目的は、いたって無害なものだった。査定担当者が損傷をより明確に確認できるよう、顧客がアップロードした写真の品質を「強化」する、というものだ。照明をよくし、細部を鮮明にする、その類いのことである。

しかし、生成画像モデルが実際に行っているのはこういうことだ。それらは数十億枚の画像で訓練され、物事が本来どう見えるべきかを学ぶ。モデルの数学的な宇宙——その潜在空間——において、「車」は圧倒的に、滑らかで対称的な、途切れのない表面を持つ物体として表現されている。それが、インターネット上の大多数の写真における車の姿だからだ。

だから、このモデルがへこみに遭遇したとき、それを損傷とは見なさなかった。ノイズと見なしたのだ。統計的な異常値。「車」という予想されるパターンからの逸脱。そしてモデルは、設計されたとおりのことを行った。ノイズを取り除いたのである。モデルはインペインティングと呼ばれるプロセスを使い、ぐしゃぐしゃになった金属を、ピクセル単位で完璧なフェンダーへとデジタル的に滑らかに整え直した。

拡散モデルにとって、へこみはノイズのように見える。モデルはそれを取り除く。アートの世界では、それは長所だ。しかし保険の世界では、それは証拠の自動的な毀損(スポリエーション)にほかならない。

これはバグではなかった。モデルは設計どおりに、まさに正確に動作した。まさにその点こそ、私を夜も眠らせないのだ。

なぜ生成AIは、これを繰り返し間違えるのか?

生成AI(意味的な妥当性)とフォレンジック・コンピュータビジョン(物理的な測定)が、同じ損傷した車の写真をどのように処理するかを対比した比較図。生成モデルが損傷評価に失敗する理由を説明している。

初期の頃、ある見込み投資家と交わした会話を覚えている——Veriprajnaを立ち上げてから半年ほど経った頃だ。彼はちょうど、別のInsurTechスタートアップのデモを見てきたばかりだった。写真から車両の損傷を分類するのにGPT-4 Visionを使っている会社だ。「なぜ君たちはGPTをラップするだけにしないんだ?」と彼は尋ねた。「その方が速い。安い。デモも素晴らしかった」

私はノートパソコンに2枚の画像を表示した。1枚は、黒いセダンに生じた雹(ひょう)の損傷の実際の写真だ——素人目には見えない小さなくぼみだが、ボンネットに映る反射を明らかに歪ませていた。もう1枚は、消費者向けの画像ツールを使って私が4分ほどで生成したディープフェイクだ。傷ひとつない車に、フロントガラスを横切るひび割れをデジタルで描き込んだものである。

私は彼に尋ねた。「本物の損傷があるのはどっちだ?」

彼はディープフェイクの方を指さした。

そこに問題がある。生成AIモデル——いま「AIによる保険金請求」スタートアップの大多数を動かしているもの——が拠り所にしているのは、意味的な妥当性であって、フォレンジックな現実ではない。それらは、物事がどう見えるかを理解するよう訓練されているのであって、物事が何であるかを理解するよう訓練されているわけではない。車のフォトリアルな画像を生成することに長けたモデルは、まさに同じ仕組みゆえに、写真の中の損傷が本物なのか、合成なのか、あるいはデジタルに消されたものなのかを判定することがまるで不得手なのだ。

では、こうしたモデルの上に構築している企業はどうか?その大半は、業界で言うところのラッパー——他人のAPIの上にかぶせた薄いインターフェース層——だ。彼らはモデルを所有していない。訓練データを管理していない。なぜある判断が下されたのかを説明できない。もしOpenAIが明日、より「美的に心地よい」ものにしようとモデルの重みを更新すれば、ラッパーの損傷評価ツールは、いっそう熱心に車を「修理」し始めるかもしれない。しかもそのInsurTech企業は、それが起きたことにすら気づかないだろう。

その一方で、保険会社は責任の100%を負い続ける。

この依存の問題については、私たちの研究のインタラクティブ版でさらに詳しく書いたが、手短に言えばこうだ。自社の保険金請求について判断を下す「頭脳」を自ら所有していないのなら、そのリスクを自らコントロールすることはできない。

詐欺師が同じツールを手にしたら、何が起きるのか?

事態をさらに悪化させる、ひとひねりがある。

保険会社が誤ってAIを使って削除しているのは損傷であり、その一方で、詐欺師は同じ技術を使ってそれを捏造している。保険詐欺への参入障壁は、事実上崩壊してしまった。

いまや誰でも、完全に無傷の車両を撮影し、消費者向けの画像生成ツールを開いて、「潰れたフロントバンパーを追加して」あるいは「火災の損傷をシミュレートして」と指示することができる。現代のインペインティングは、照明も影も反射も、身の毛もよだつほどのリアルさで処理してのける。標準的なAI画像分類器——大半の保険会社が使っている類いのもの——は、そのディープフェイクを見て、こう断言するだろう。そう、これは潰れた車だ、と。それが失敗するのは、画像がどのように生成されたかという構造的な指紋ではなく、内容を評価しているからだ。

話はさらに暗くなる。犯罪組織は、生成AIを使って合成された身元(シンセティック・アイデンティティ)——実在しない人物の超リアルな顔、偽造運転免許証、捏造された医療記録——を作り出している。こうしたデジタルの亡霊は保険に加入し、正当性を築くために数か月間だけ保険料を支払い、その後、破滅的なほど巨額の保険金を請求する。生命保険では、AIが生成した死亡記事や検死報告書。健康保険では、実際には起きていない骨折を映したレントゲン写真だ。

そして、従来の防御策は機能しなくなっている。AIが生成した画像は、メタデータが消去されていたり、合成されていたりすることが多い。人間のレビュアーはどうか?研究によれば、質の高いディープフェイクの検出において、彼らの成績はコイン投げをわずかに上回る程度でしかない。

保険会社が写真を「強化」できるようにするのと同じ技術が、詐欺師に写真を捏造させる。そして市場に出回っているAIツールの大半は、その違いを見分けることができない。

これは、InsurTech業界の誰もが正直に語りたがらない軍拡競争なのだ。

絵筆ではなく、虫眼鏡を

Veriprajnaのフォレンジック解析パイプライン——セマンティックセグメンテーション、単眼深度推定、鏡面反射解析——を、各レイヤーが何を検出するかとともに示した3層アーキテクチャ図。

Veriprajnaの根底にある哲学が、私の中で結晶化した、はっきりとした瞬間があった。私とチームは、技術的アプローチをめぐって議論していた——声を荒らげ、本気で言い争っていたのだ。

エンジニアの一人は、損傷分類のために大規模な視覚言語モデルをファインチューニングしたがっていた。その方が構築は速く、デモも容易で、率直に言えば、投資家にはより印象的に映っただろう。「市場が求めているのは生成だ」と彼は言った。「資金が集まるのはそこだよ」

私は会議室のスクリーンに「傷ひとつないバンパー」事件を映し出した。「生成に頼ると、行き着く先はこれだ」と私は言った。「訴訟と、捏造された記録さ」

室内は静まり返った。それから、私たちのコンピュータビジョン主任研究者——入社前に工業検査の分野で長年を過ごした人物——が、私が決して忘れられない一言を口にした。「査定担当者に絵筆は要らない。必要なのは虫眼鏡だ」

それが私たちの設計原則になった。私たちは何も生成しない。1ピクセルたりとも改変しない。私たちは測定する

私たちのアーキテクチャは3つのレイヤーから成り、そのそれぞれが、画像を素材ではなく証拠として扱う。

セマンティックセグメンテーションは、ピクセルレベルで損傷を特定する。「この車は損傷している」ではない——それでは役に立たない。私たちのモデルは、一つひとつのピクセルを分類する。このピクセルは無傷の塗装、このピクセルは擦り傷、このピクセルはへこみ、このピクセルは錆、というように。出力されるのは、元の、手を加えていない画像の上に重ねられた精密なマスクだ。特定の車種部品の物理的寸法がわかっているため——2024年式トヨタ・カムリのバンパーは幅180cm——損傷の面積を正確な平方センチメートル単位で算出できる。その数値は、修理見積もりソフトウェアに直接入力される。

単眼深度推定は、あのバンパー事件を破綻させた問題——平面的な写真から3D形状を理解すること——を解決する。LiDARの正解データを伴う膨大な車体形状のデータセットで訓練することで、私たちのモデルは、ホイールアーチの曲率が本来どう見えるべきか、ドアパネルの平坦さが何を意味するのかを学習する。へこみは、深度マップ上で陥没穴として現れる。私たちは勾配を計算する——急な勾配は、おそらくパネル交換が必要な鋭い折れを意味し、緩やかな勾配は、塗装レスデントリペア(PDR)で修復可能な柔らかいへこみを意味する。私たちは、押しのけられた金属の体積を推定できる。当て推量ではない。測定だ。

鏡面反射解析は、私が最も誇りに思っているレイヤーだ。ほかのすべてが見落とすものを捉えるからである。現代の車は光沢がある。その表面は鏡のように働く。光沢のある黒い車のへこみは、ピクセルの色をまったく変えないかもしれない——だが、反射を歪める。環境の中の直線(地平線、電線、建物の輪郭)は、反射されるとき、車体の曲面に沿うはずだ。へこみは、遊園地の変形鏡(ファンハウス・ミラー)のように働き、それらの線をつまませ、渦巻かせ、あるいは断ち切る。私たちはモデルを、塗装の色を反射パターンから切り離し、サーフェスノーマルマップ——ピクセルごとの表面の角度を表す3Dベクトル——を再構築するよう訓練した。これにより、肉眼では見えない雹の損傷、衝突地点から遠く離れた構造的な座屈、さらには研磨の跡がクリアコートの鏡面性を乱している過去の修理跡までもが検出される。

3つのレイヤーすべての完全な技術的解説については、私たちの研究論文をご覧いただきたい。

なぜ保険会社は、自社のAIの判断を説明できないのか?

規制当局や裁判所が保険金請求の判断に対する説明を求めたとき、生成AIシステムとフォレンジックAIシステムがそれぞれ何を提示できるかを並べて比較したもの。

これこそ、いま規制当局が声高に投げかけている問いであり、大半の保険会社は、それに対する適切な答えを持ち合わせていない。

NAIC——全米保険監督官協会(National Association of Insurance Commissioners)——は、コンプライアンスの状況を根本から変えるモデル・ブレティン(模範通達)を発行した。それは、AIがサードパーティのツールである場合でさえ、AIの結果に対する責任を、まっすぐに保険会社に負わせる。「ラッパーだから」という言い訳の陰に隠れることはできない。もしベンダーのモデルがハルシネーションを起こしたり、差別をしたりすれば、あなたこそが責任を負う。この通達は、文書化されたガバナンス・プログラム、ベンダーのデータ来歴(データリネージ)とモデルアーキテクチャに関するデューデリジェンス、そして——決定的に重要なこととして——AIによるあらゆる判断を契約者に説明できる能力を義務付けている。

生成モデルによって下された保険金請求の却下を、説明してみるといい。「モデルの確率分布が、滑らかなバンパーを好んだのです」では、法廷で通用するはずがない。

では、それを私たちのシステムが生成するものと比べてみてほしい。「本請求は、左後部クォーターパネルに検出された損傷にもとづいて処理されました。システムは、長さ14cmの擦り傷と、表面積45cm²のへこみを特定し、これは深度マップ解析によって検証されています」。これは経験的に検証可能だ。これは証拠として採用できる。

EU AI法は、さらに踏み込んでいる。自然人が関わる保険リスク評価に用いられるAIは、高リスクと分類され、それによってデータガバナンス、自動的なイベントログ記録、そして人間による監督が義務付けられる。私たちのマスクオーバーレイ技術——査定担当者が、切り替え可能な解析レイヤーとともに元の写真を見られるようにするもの——は、まさにこのために設計されている。私たちは人間を置き換えない。人間を拡張するのだ。人間は依然として意思決定者であり続ける。これは同法における決定的に重要なセーフハーバー(免責の避難所)となる。

そして、証拠の毀損(スポリエーション)の問題がある。米国の法制度では、法的手続きに関係する証拠を——たとえ意図せずとも——改変すれば、制裁、不利益推認の指示(失われた証拠は自らに不利なものだったと陪審に前提させるもの)、あるいは略式判決につながりうる。生成AIツールが保険金請求の写真に合成ピクセルを持ち込むこと、それは技術的には改変にあたる。もし元のデータが上書きされていたなら、それは証拠の毀損だ。

私たちは、すべての元画像が届いたその瞬間に、SHA-256でハッシュ化する。私たちのAIは画像バッファを読み取るが、決してそこに書き込まない。すべての解析——マスク、深度マップ、レポート——は、元のハッシュに紐づけられた別個のサイドカーファイルとして保存される。あらゆるアクセスが記録される。証拠は、手つかずのまま保たれるのだ。

もしあなたのAIが、証拠を改変していないと証明できないのなら、あなたは訴訟が始まる前から、すでに負けているのだ。

誰も備えていなかった軍拡競争

決定論的なコンピュータビジョンで「十分」なのか——生成モデルの使用を拒むことで、私たちは保守的すぎるのではないか——と、人から尋ねられることがある。

私は、彼らが間違った問いを立てていると思う。

正しい問いはこうだ。あなたの保険金請求システムが、本物の写真と合成された写真を区別できなくなったら、何が起きるのか?詐欺師のディープフェイクが、正当な請求よりも高い確信度であなたのAI分類器を通過してしまったら、何が起きるのか?あなたの「強化」ツールが、最終的に連邦裁判所に持ち込まれる事案で、ひそかに証拠を捏造していたら、何が起きるのか?

これらは仮定の話ではない。いま現に起きていることだ。そして、汎用の生成モデルを第一の防衛線として使っている保険会社は、フォレンジック調査の場に絵筆を持ち込んでいるようなものである。

私たちのモデルは決定論的だ。セマンティックセグメンテーションのネットワークにプロンプトインジェクションを仕掛けることはできない。深度推定モデルを言いくるめて、へこみを無視させることもできない。これらのシステムは、ピクセルの輝度勾配とテクスチャ解析にもとづいて動作する——カメラセンサーに当たる光の物理的性質から特徴を抽出しているのだ。悪用できるような、命令に従う仕組みは存在しない。

これは保守主義ではない。敵が、あなたと同じ生成ツールを手にしている世界を前提とした、エンジニアリングなのだ。

査定担当者の画面

最後に、ひとつのイメージで締めくくりたい——写真ではなく、私が思い描く未来の姿だ。

査定担当者が、自分のダッシュボードを開く。そこに映るのは「修理された」車ではない。事故前の車がどう見えていたかについての、AIの当てずっぽうの推測でもない。映るのは、契約者が撮影した実際の写真であり、AIが擦り傷、へこみ、錆をどこで検出したのかを正確に示す、切り替え可能な損傷マスクが重ねられている。深度ヒートマップには、後部クォーターパネルのへこみが、急な勾配を伴う深さ12mmであること——鋭い折れであり、おそらく交換が必要であること——が示されている。反射解析は、衝突地点から3インチ離れた、どんな人間の目も捉えられないであろう微細な座屈を、警告として浮かび上がらせている。

そして、すべての所見を説明する監査証跡(オーディットトレイル)が示される。そのうえで、判断を下すのは彼ら自身だ。

AIは決定を下したのではない。照らし出したのだ。証拠は改変されたのではない。明らかにされたのだ。

それこそが、もっともらしい虚構を作り出すシステムと、都合の悪い真実を測定するシステムとの違いだ。保険業界は、実際に起きたことに対して支払うのであって、モデルがおそらく起きただろうと考えることに対して支払うのではない、という原則の上に築かれてきた。保険金請求の写真の一つひとつのピクセルは、証拠の一片である。AIにそのうちのたった一つでも変えさせた瞬間、あなたは真実の領域を離れ、確率の領域へと足を踏み入れてしまうのだ。

そして法廷において確率とは、「合理的な疑い」の別名にほかならない。

Related Research

Also Published On