
בינה מלאכותית "תיקנה" מכונית הרוסה ודחתה את התביעה. אז הבנתי שלתעשייה יש בעיה.
בהיתי בשתי תמונות של אותה מכונית.
הראשונה צולמה על ידי מבוטח לאחר תאונת פגיעה מאחור. מתכת מעוכה, צבע שנשחק עד הפלדה החשופה, פגוש שנראה כאילו שימש כפס האטה. התמונה השנייה — לכאורה אותו רכב, שעובד דרך כלי הבינה המלאכותית החדש והמבריק של המבטח — הראתה חלק אחורי ללא רבב. קווים חלקים, צבע מושלם, ולו שריטה אחת. מנוע התביעות האוטומטי הביט בתמונה השנייה ועשה בדיוק את מה שהייתם מצפים: הוא דחה את התביעה. אפס נזק גלוי.
המבוטח, שעמד בשביל הגישה לביתו לצד מכונית שברור לחלוטין שהיה לה פגוש הרוס, תבע בגין חוסר תום לב. והמבטח נותר אוחז בראיה מפוברקת דיגיטלית שסתרה את המציאות הפיזית.
זהו אירוע "הפגוש ללא רבב", וכשקראתי לראשונה את הפרטים, חשתי תערובת של זוועה והצדקה. זוועה משום שבינה מלאכותית ביצעה הלכה למעשה השחתת ראיות — שינוי של רשומה משפטית באופן שפגע באדם אמיתי. הצדקה משום שזה היה בדיוק אופן הכשל שעליו הצוות שלי ואני התרענו במשך חודשים, הסיבה שבנינו את VeriPrajna כפי שבנינו.
לתעשיית הביטוח אין בעיה של בינה מלאכותית. יש לה בעיית אמת. והכלים שרוב המבטחים ממהרים לאמץ רק מחמירים אותה.
הלילה שבו הפגם נעלם
תנו לי להסביר מה באמת קרה במקרה הפגוש הזה, כי המנגנון הטכני חשוב.
המבטח שילב כלי בינה מלאכותית גנרטיבית באפליקציית התביעות הניידת שלו. המטרה המוצהרת הייתה תמימה למדי: "לשפר" את איכות התמונות שהעלו הלקוחות כדי שהשמאים יוכלו לראות את הנזק בבירור רב יותר. תאורה טובה יותר, פרטים חדים יותר, דברים מסוג זה.
אבל הנה מה שמודלים גנרטיביים של תמונות עושים בפועל. הם מאומנים על מיליארדי תמונות כדי ללמוד איך דברים אמורים להיראות. ביקום המתמטי של המודל — המרחב הסמוי שלו — "מכונית" מיוצגת ברובה המכריע כעצם חלק וסימטרי בעל משטחים בלתי-שבורים. כך נראות מכוניות ברוב המכריע של התמונות באינטרנט.
אז כשהמודל הזה נתקל בפגם, הוא לא ראה נזק. הוא ראה רעש. חריגה סטטיסטית. סטייה מהתבנית הצפויה של "מכונית". והוא עשה את מה שתוכנן לעשות: הוא הסיר את הרעש. המודל השתמש בתהליך הנקרא inpainting כדי להחליק דיגיטלית את המתכת המעוכה בחזרה לכנף מושלמת, פיקסל אחר פיקסל.
פגם, עבור מודל דיפוזיה, נראה כמו רעש. המודל מסיר אותו. באמנות, זו תכונה. בביטוח, זו השחתה אוטומטית של ראיות.
זה לא היה באג. המודל עבד בדיוק כפי שתוכנן. זה החלק שמדיר שינה מעיניי.
למה בינה מלאכותית גנרטיבית ממשיכה לטעות בזה?

אני זוכר שיחה עם משקיע פוטנציאלי בשלב מוקדם — אולי חצי שנה לתוך בניית VeriPrajna. הוא בדיוק הגיע מהדגמה של סטארט-אפ InsurTech אחר, כזה שהשתמש ב-GPT-4 Vision כדי לסווג נזק לרכב מתוך תמונות. "למה אתם לא פשוט עוטפים את GPT?" הוא שאל. "זה מהיר יותר. זה זול יותר. ההדגמה נראתה נהדר."
פתחתי שתי תמונות במחשב הנייד שלי. אחת הייתה תמונה אמיתית של נזק ברד על סדאן שחור — גומות זעירות בלתי נראות לעין לא מיומנת, אך מעוותות בבירור את ההשתקפויות על מכסה המנוע. השנייה הייתה זיוף עמוק (deepfake) שיצרתי בערך בארבע דקות באמצעות כלי תמונות צרכני: מכונית ללא רבב עם סדק צבוע דיגיטלית לרוחב השמשה הקדמית.
שאלתי אותו: "לאיזו מהן יש נזק אמיתי?"
הוא הצביע על הזיוף העמוק.
זו הבעיה. מודלים של בינה מלאכותית גנרטיבית — אלה שמניעים את הרוב המכריע של סטארט-אפים של "תביעות AI" כרגע — פועלים על בסיס סבירות סמנטית, לא מציאות פורנזית. הם מאומנים להבין איך דברים נראים, לא מה דברים הם. מודל שמבריק ביצירת תמונות פוטוריאליסטיות של מכוניות הוא, מעצם אותו מנגנון בדיוק, גרוע בקביעה האם נזק בתמונה הוא אמיתי, סינתטי, או נמחק דיגיטלית.
והחברות הבונות על גבי המודלים האלה? רובן הן מה שהתעשייה מכנה עוטפות (wrappers) — שכבות ממשק דקות מעל ה-API של מישהו אחר. הן לא מחזיקות במודל. הן לא שולטות בנתוני האימון. הן לא יכולות להסביר מדוע התקבלה החלטה. אם OpenAI תעדכן מחר את משקלי המודל שלה כדי שיהיו "נעימים יותר אסתטית", כלי הערכת הנזק של עוטפת עשוי להתחיל לתקן מכוניות בהתלהבות רבה יותר, וחברת ה-InsurTech אפילו לא תדע שזה קרה.
המבטח, בינתיים, נושא ב-100% מהאחריות.
כתבתי על בעיית התלות הזו בהרחבה בגרסה האינטראקטיבית של המחקר שלנו, אבל בקצרה: אם אינך מחזיק במוח שמקבל את ההחלטות על התביעות שלך, אינך שולט בסיכון שלך.
מה קורה כשרמאים משיגים את אותם כלים?
הנה התפנית שמחמירה את המצב עוד יותר.
בעוד שמבטחים משתמשים בבינה מלאכותית בטעות כדי למחוק נזק, רמאים משתמשים באותה טכנולוגיה כדי לייצר אותו. מחסום הכניסה להונאת ביטוח קרס למעשה.
מישהו יכול כעת לצלם רכב שלם לחלוטין, לפתוח כלי צרכני ליצירת תמונות, ולהורות לו "להוסיף פגוש קדמי מרוסק" או "לדמות נזק אש". Inpainting מודרני מטפל בתאורה, בצללים ובהשתקפויות בריאליזם מפחיד. מסווג תמונות AI סטנדרטי — מהסוג שרוב המבטחים משתמשים בו — יביט בזיוף העמוק הזה ויאשר: כן, זו מכונית מרוסקת. הוא נכשל משום שהוא מעריך תוכן, לא את טביעת האצבע המבנית של האופן שבו התמונה נוצרה.
זה הופך אפל יותר. כנופיות פשע משתמשות בבינה מלאכותית גנרטיבית כדי ליצור זהויות סינתטיות — פנים היפר-ריאליסטיות של אנשים שאינם קיימים, רישיונות נהיגה מזויפים, רשומות רפואיות מפוברקות. רוחות הרפאים הדיגיטליות האלה רוכשות פוליסות, משלמות פרמיות במשך כמה חודשים כדי לבנות לגיטימציה, ואז מגישות תביעות קטסטרופליות. בביטוח חיים, הודעות אבל ודוחות חוקר מוות שנוצרו על ידי AI. בביטוח בריאות, צילומי רנטגן המראים שברים שמעולם לא קרו.
וההגנות המסורתיות נכשלות. לתמונות שנוצרו על ידי AI יש לעיתים קרובות מטא-דאטה שנמחקה או סונתזה. מבקרים אנושיים? מחקרים מראים שהם מבצעים בקושי טוב יותר מהטלת מטבע בזיהוי זיופים עמוקים באיכות גבוהה.
אותה טכנולוגיה שמאפשרת למבטח "לשפר" תמונה מאפשרת לרמאי לפברק אחת. ורוב כלי ה-AI בשוק אינם יכולים להבחין בהבדל.
זהו מרוץ החימוש שאף אחד ב-InsurTech לא רוצה לדבר עליו בכנות.
זכוכית המגדלת, לא מכחול הצבע

היה רגע מסוים שבו הפילוסופיה שמאחורי VeriPrajna התגבשה עבורי. הצוות שלי ואני התווכחנו — התווכחנו באמת, בקולות מורמים — על הגישה הטכנית שלנו.
אחד המהנדסים שלנו רצה לכוונן מודל שפה-ראייה גדול לסיווג נזק. זה היה מהיר יותר לבנייה, קל יותר להדגמה, ובכנות, זה היה נראה מרשים יותר למשקיעים. "השוק רוצה גנרטיבי," הוא אמר. "שם נמצא המימון."
פתחתי את מקרה הפגוש ללא רבב על מסך חדר הישיבות. "לכאן גנרטיבי מוביל אותך," אמרתי. "תביעה משפטית ורשומה מפוברקת."
בחדר השתררה דממה. אז חוקר הראייה הממוחשבת הראשי שלנו — שבילה שנים בבדיקות תעשייתיות לפני שהצטרף אלינו — אמר משהו שמעולם לא שכחתי: "שמאי לא צריך מכחול. הוא צריך זכוכית מגדלת."
זה הפך לעקרון העיצוב שלנו. אנחנו לא מייצרים כלום. אנחנו לא משנים אף פיקסל בודד. אנחנו מודדים.
לארכיטקטורה שלנו יש שלוש שכבות, וכל אחת מהן מתייחסת לתמונה כראיה, לא כחומר גלם:
סגמנטציה סמנטית מזהה נזק ברמת הפיקסל. לא "המכונית הזו פגועה" — זה חסר תועלת. המודלים שלנו מסווגים כל פיקסל בודד: הפיקסל הזה הוא צבע לא פגוע, הפיקסל הזה הוא שריטה, הפיקסל הזה הוא פגם, הפיקסל הזה הוא חלודה. הפלט הוא מסכה מדויקת המונחת על התמונה המקורית, שלא נגעו בה. משום שאנחנו יודעים את המידות הפיזיות של חלקי רכב ספציפיים — פגוש של טויוטה קאמרי 2024 הוא ברוחב 180 ס"מ — אנחנו יכולים לחשב את שטח הנזק המדויק בסנטימטרים רבועים. המספר הזה מוזן ישירות לתוכנת אומדן תיקונים.
אמידת עומק מונוקולרית פותרת את הבעיה שהרגה את מקרה הפגוש: הבנת גאומטריה תלת-ממדית מתוך תמונה שטוחה. באמצעות אימון על מערכי נתונים עצומים של גאומטריות רכב עם אמת קרקע של LiDAR, המודלים שלנו לומדים איך צריכה להיראות עקמומיות של קשת גלגל, מה משמעות השטיחות של פאנל דלת. פגם מופיע כבולען במפת העומק. אנחנו מחשבים גרדיאנטים — גרדיאנט תלול משמעו קמט חד שכנראה זקוק להחלפת פאנל; גרדיאנט רדוד משמעו פגם רך שניתן לתקנו בתיקון פגמים ללא צבע. אנחנו יכולים לאמוד את נפח המתכת שנעקר. לא ניחוש. מדידה.
ניתוח החזר ספקולרי הוא השכבה שאני הכי גאה בה, משום שהוא תופס את מה שכל השאר מפספסים. מכוניות מודרניות מבריקות. משטחיהן פועלים כמראות. פגם על מכונית שחורה מבריקה עשוי לא לשנות כלל את צבע הפיקסלים — אבל הוא מעוות את ההשתקפות. קווים ישרים בסביבה (קווי אופק, קווי חשמל, קצוות של מבנים) אמורים לעקוב אחר עקמומיות גוף הרכב כשהם משתקפים. פגם פועל כמו מראה עקומה, וגורם לקווים האלה להצטבט, להסתחרר או להישבר. אימנו את המודלים שלנו להפריד בין צבע הצבע לבין דפוסי ההשתקפות ולשחזר את מפת הנורמלים של המשטח — וקטור תלת-ממדי המייצג את זווית המשטח בכל פיקסל. זה מזהה נזק ברד בלתי נראה לעין בלתי מזוינת, קריסה מבנית הרחק מנקודת הפגיעה, ואפילו תיקונים קודמים שבהם סימני ליטוש משבשים את הספקולריות של שכבת השקוף.
לפירוט הטכני המלא של כל שלוש השכבות, ראו מאמר המחקר שלנו.
מדוע מבטחים אינם יכולים פשוט להסביר את החלטות ה-AI שלהם?

זו השאלה שרגולטורים שואלים כעת, בקול רם, ולרוב המבטחים אין תשובה טובה.
ה-NAIC — האיגוד הלאומי של נציבי הביטוח — פרסם עלון מודל ששינה מהיסוד את נוף הציות. הוא מטיל את האחריות לתוצאות ה-AI ישירות על המבטח, גם כאשר ה-AI הוא כלי של צד שלישי. אינך יכול להסתתר מאחורי תירוץ העוטפת. אם המודל של הספק שלך יוצר הזיות או מפלה, אתה אחראי. העלון מחייב תוכניות ממשל כתובות, בדיקת נאותות על ייחוס נתוני הספק וארכיטקטורת המודל, ו — באופן קריטי — היכולת להסביר כל החלטה המונעת על ידי AI למבוטח.
נסו להסביר דחיית תביעה המונעת על ידי מודל גנרטיבי. "ההתפלגות ההסתברותית של המודל העדיפה פגוש חלק" לא תשרוד באולם בית משפט.
עכשיו השוו זאת למה שהמערכת שלנו מפיקה: "התביעה עובדה על בסיס זיהוי נזק בפאנל הרבע האחורי-שמאלי. המערכת זיהתה שריטה באורך 14 ס"מ ופגם בשטח פני של 45 ס"מ², שאומתו באמצעות ניתוח מפת עומק." זה ניתן לאימות אמפירי. זה קביל.
חוק ה-AI של האיחוד האירופי הולך רחוק יותר. בינה מלאכותית המשמשת להערכת סיכוני ביטוח הנוגעת לבני אדם מסווגת כסיכון גבוה, מה שמפעיל דרישות חובה של ממשל נתונים, רישום אירועים אוטומטי, ופיקוח אנושי. טכנולוגיית מסכת ההנחה שלנו — שבה השמאי רואה את התמונה המקורית עם שכבת ניתוח הניתנת להחלפה — תוכננה במיוחד לשם כך. אנחנו לא מחליפים את האדם. אנחנו מרחיבים אותו. הוא נותר מקבל ההחלטות, שהוא נמל מבטחים קריטי תחת החוק.
ואז יש את השחתת הראיות. במערכת המשפט האמריקאית, שינוי ראיות הרלוונטיות להליך משפטי — אפילו בשוגג — עלול לגרום לסנקציות, להוראות היסק שלילי (שבהן חבר המושבעים מתבקש להניח שהראיה שאבדה הייתה מזיקה לך), או לפסק דין מקוצר. כאשר כלי בינה מלאכותית גנרטיבית מכניס פיקסלים סינתטיים לתמונת תביעה, זה טכנית שינוי. אם המקור נדרס, זו השחתת ראיות.
אנחנו מבצעים גיבוב (hash) לכל תמונה מקורית באמצעות SHA-256 ברגע שהיא מגיעה. ה-AI שלנו קורא את חוצץ התמונה אך לעולם אינו כותב אליו. כל הניתוח — מסכות, מפות עומק, דוחות — נשמר כקבצי לוואי נפרדים המקושרים לגיבוב המקורי. כל גישה נרשמת. הראיה נותרת ללא רבב.
אם ה-AI שלך אינו יכול להוכיח שהוא לא שינה את הראיה, כבר הפסדת את התיק לפני שהוא מתחיל.
מרוץ החימוש שאיש לא התכונן אליו
אנשים שואלים אותי לפעמים האם ראייה ממוחשבת דטרמיניסטית היא "מספיקה" — האם אנחנו שמרנים מדי בכך שאנו מסרבים להשתמש במודלים גנרטיביים.
אני חושב שהם שואלים את השאלה הלא נכונה.
השאלה הנכונה היא: מה קורה כשמערכת התביעות שלך אינה יכולה להבחין בין תמונה אמיתית לסינתטית? מה קורה כשזיוף עמוק של רמאי עובר את מסווג ה-AI שלך בביטחון גבוה יותר מתביעה לגיטימית? מה קורה כשכלי ה"שיפור" שלך מפברק בשקט ראיות בתיק שמגיע בסופו של דבר לבית משפט פדרלי?
אלה אינם היפותטיים. הם קורים עכשיו. והמבטחים המשתמשים במודלים גנרטיביים כלליים כקו ההגנה הראשון שלהם מביאים מכחול לחקירה פורנזית.
המודלים שלנו דטרמיניסטיים. אינך יכול לבצע הזרקת הנחיה (prompt-injection) לרשת סגמנטציה סמנטית. אינך יכול לפתות במילים מודל אמידת עומק להתעלם מפגם. מערכות אלה פועלות על גרדיאנטים של עוצמת פיקסלים וניתוח מרקם — הן מחלצות מאפיינים מהתכונות הפיזיות של אור הפוגע בחיישן מצלמה. אין מנגנון של ציות להוראות לנצל.
זו אינה שמרנות. זו הנדסה עבור עולם שבו ליריב יש גישה לאותם כלים גנרטיביים שיש לך.
מסך השמאי
אני רוצה לסיים בתמונה — לא צילום, אלא תמונה של איך אני חושב שהעתיד נראה.
שמאי פותח את לוח המחוונים שלו. הוא לא רואה מכונית "מתוקנת". הוא לא רואה את הניחוש הטוב ביותר של AI לגבי איך המכונית אולי נראתה לפני התאונה. הוא רואה את התמונה האמיתית, שצולמה על ידי המבוטח, עם מסכת נזק הניתנת להחלפה המראה בדיוק היכן ה-AI זיהה שריטות, פגמים וחלודה. הוא רואה מפת חום של עומק החושפת שהפגם על פאנל הרבע האחורי הוא בעומק 12 מ"מ עם גרדיאנט תלול — קמט חד, כנראה זקוק להחלפה. הוא רואה את ניתוח ההשתקפות מסמן קריסה עדינה במרחק שלושה אינצ'ים מנקודת הפגיעה שאף עין אנושית לא הייתה קולטת.
הוא רואה מסלול ביקורת המסביר כל ממצא. והוא מקבל את ההחלטה.
ה-AI לא החליט. הוא האיר. הראיה לא שונתה. היא נחשפה.
זהו ההבדל בין מערכת שיוצרת בדיות סבירות לבין כזו שמודדת אמיתות לא נוחות. תעשיית הביטוח נבנתה על העיקרון שאתה משלם על מה שבאמת קרה — לא על מה שמודל חושב שכנראה קרה. כל פיקסל בתמונת תביעה הוא ראיה. ברגע שאתה מאפשר ל-AI לשנות אפילו אחד מהם, עזבת את תחום האמת ונכנסת לתחום ההסתברות.
והסתברות, באולם בית משפט, היא רק מילה נוספת לספק סביר.