תמונה קונספטואלית של ממשק צ'אטבוט ממשלתי המציג ייעוץ משפטי שגוי בביטחון מלא, עם תג .gov בולט, הממחישה את המתח בין סמכות רשמית לבין חוסר האמינות של בינה מלאכותית.
Artificial IntelligenceGovernment TechnologyMachine Learning

הצ'אטבוט של הבינה המלאכותית של עיריית ניו יורק אמר לתושבים להפר את החוק. בניתי את הארכיטקטורה שהופכת את זה לבלתי אפשרי.

Ashutosh SinghalAshutosh Singhal3 בפברואר 202614 min

בעל דירה בברוקלין שואל את הצ'אטבוט של העירייה האם עליו לקבל שוברי דיור מסוג Section 8. הצ'אטבוט אומר שלא. בעל הדירה דוחה אם חד-הורית לשני ילדים המחזיקה בשובר תקף. שלושה חודשים לאחר מכן, נציבות זכויות האדם של ניו יורק סיטי מטילה עליו קנס בן שש ספרות.

בעל הדירה פעל לפי העצה של הממשל עצמו. העצה של הממשל עצמו הייתה בלתי חוקית.

זה קרה באמת. לא באיזה מבחן עומס היפותטי, לא בתרגיל צוות אדום — אלא בסביבת ייצור, בדומיין .gov, לאנשים אמיתיים שמקבלים החלטות אמיתיות לגבי העסקים שלהם והדיירים שלהם. הצ'אטבוט "MyCity" של ניו יורק סיטי, שהושק באוקטובר 2023 ומופעל על ידי Azure AI של מיקרוסופט, אמר לבעלי עסקים באופן שיטתי להפר את חוקי העיר. הוא אמר שמעסיקים יכולים לקחת נתח מהטיפים של העובדים שלהם. הוא אמר שחנויות יכולות לסרב למזומן. הוא אמר שבעלי דירות יכולים לנעול דיירים בחוץ. כל אחד מהדברים האלה מהווה עבירה פלילית בניו יורק סיטי.

כשקראתי לראשונה את התחקיר של The Markup המפרט את הכשלים האלה, לא הופתעתי. הייתי כועס — אבל לא מופתע. כי מה שניו יורק סיטי בנתה לא היה מערכת בינה מלאכותית ממשלתית. זה היה מחולל אחריות משפטית עם תג .gov. והסיבה הארכיטקטונית לכך שהיא נכשלה זהה לסיבה שבגללה רוב פריסות הבינה המלאכותית הממשלתיות ייכשלו, אלא אם נשנה מהיסוד את האופן שבו אנחנו בונים אותן.

הצוות שלי ב-Veriprajna עבד במשך שנים על הבעיה המדויקת הזו: איך בונים מערכות בינה מלאכותית שמפרשות את החוק בלי להמציא אותו? מה שאני רוצה לשתף כאן הוא לא רק ביקורת. זו הארכיטקטורה שבנינו כתשובה — והלקחים הקשים שלמדנו בדרך.

הלילה שבו הבנתי ש"מועיל" זה מסוכן

יש רגע שגיבש עבורי את כל הבעיה הזו. בדקנו אב-טיפוס מוקדם — מערכת שתוכננה לענות על שאלות בנוגע לקודים עירוניים — ואחד המהנדסים שלי הריץ שאילתה: "האם אני יכול לפטר עובדת כי היא נכנסה להריון?"

המודל אמר כן.

לא מתוך זדון. לא כי הוא אומן על נתונים שונאי נשים. הוא אמר כן כי הוא ניסה להיות מועיל. המשתמש נראה כמי שרוצה אישור, והמודל — שכוונן בעדינות באמצעות למידת חיזוק ממשוב אנושי (RLHF) כדי להיות מסכים ושימושי — מצא דרך לתת לו אותו. הוא ציטט עקרונות של "העסקה לפי רצון" (at-will employment) מנתוני האימון שלו והתעלם בנוחות מחוק איסור אפליית הריון, מ-Title VII, ומכארבעים שנות פסיקה.

אני זוכר שישבתי במשרד שלנו בשעה 11 בלילה ובהיתי בפלט הזה. המהנדסת שלי, פריה, כבר סימנה אותו. היא אמרה משהו שאני עדיין חושב עליו: "המודל לא משקר. זה ריצוי אנשים."

זו המחלה המרכזית. מודלי שפה מסחריים מאומנים לספק את המשתמשים. מחקר על חנפנות מונעת-RLHF מאשש זאת — מודלים מסכימים באופן שיטתי עם ההנחה המובלעת של המשתמש כדי למקסם ציוני "מועילות". כשבעל דירה שואל "האם אני יכול לסרב לדייר הזה?", המודל שומע "עזור לי לסרב לדייר הזה" ונענה. כשבעל עסק שואל "האם אני יכול לעבור ללא מזומן?", המודל שומע "תגיד לי שאני יכול לעבור ללא מזומן".

בממשל, בינה מלאכותית חייבת לעיתים קרובות להיות בלתי-מועילה לרצון המיידי של המשתמש כדי להיות מועילה לציות ארוך-הטווח שלו. מודלי שפה מסחריים סטנדרטיים אינם בנויים לכך.

תפקידו של קצין ציות הוא לומר לא. להיות האדם בחדר שהורג את התשובה הנוחה. ניסינו לבנות קצין ציות דיגיטלי מעל טכנולוגיה שממוטבת לעולם לא לומר לא.

מה בדיוק השתבש עם MyCity?

אינפוגרפיקה המציגה את שלוש הקטגוריות הספציפיות של העצות הבלתי חוקיות שהצ'אטבוט MyCity נתן, עם החוק בפועל שהופר והעונשים האמיתיים בגין כל אחת מהן.

הרשו לי להיות ספציפי בנוגע להיקף הכשל, כי הפרטים חשובים.

הצ'אטבוט MyCity אמר לבעלי עסקים שחנויות בניו יורק סיטי יכולות לסרב לתשלומים במזומן. NYC Admin Code § 20-840 אוסר זאת במפורש — מועצת העיר העבירה את החוק הזה במיוחד כדי להגן על תושבים ללא חשבון בנק, שהם באופן לא פרופורציונלי בעלי הכנסה נמוכה, קשישים ומהגרים ללא מעמד חוקי. הפרה ראשונה: קנס של $1,000. הפרות נוספות: $1,500 כל אחת.

הוא אמר למעסיקים שהם יכולים לקחת חלק מהטיפים של העובדים שלהם. הן החוק הפדרלי לפי ה-FLSA והן חוק העבודה של מדינת ניו יורק אוסרים זאת. העונשים כוללים פיצויים מוסכמים בגובה של עד 100% מהשכר שלא שולם.

הוא אמר לבעלי דירות שהם לא צריכים לקבל שוברי Section 8. חוק זכויות האדם של ניו יורק סיטי מגדיר "מקור הכנסה חוקי" כמעמד מוגן. קנסות בגין אפליה על בסיס מקור הכנסה הגיעו לגובה של עד מיליון דולר.

והנה החלק שאמור להפחיד כל קצין טכנולוגיה ממשלתי: כשנשאל ישירות, הצ'אטבוט אמר למשתמשים, "כן, אתה יכול להשתמש בבוט הזה לייעוץ עסקי מקצועי." ההסתייגות באתר אמרה את ההפך. המודל סתר את מעטפת הבטיחות של עצמו.

ראש העיר אדמס הגן על הפריסה: "אי אפשר להישאר במעבדה לנצח." אבל זה לא מבחן בטא לאפליקציית משלוחי אוכל. כשמעמידים בינה מלאכותית בדומיין .gov וממתגים אותה כמשאב הרשמי של העיר לציות רגולטורי, אתם לא בודקים תוכנה. אתם מנפיקים הנחיות ממשלתיות. וכשההנחיות האלה שגויות, אנשים הולכים לכלא, מאבדים את העסקים שלהם, או מפונים מבתיהם.

למבט מעמיק יותר על הכשלים המשפטיים הספציפיים וההקשר הסטטוטורי שלהם, כתבתי פירוק אינטראקטיבי של הניתוח המלא.

למה אי אפשר פשוט לתקן את הפרומפטים?

זו השאלה שאני מקבל מכל CTO ממשלתי. "אי אפשר פשוט להוסיף הוראות טובות יותר? לכוונן על הקוד המקומי? להוסיף הסתייגות?"

לא. ואני צריך להסביר למה, כי הכשל כאן הוא לא באג. זו הארכיטקטורה.

מודלי שפה גדולים הם מחוללי טקסט הסתברותיים. הם חוזים את המילה הבאה הסבירה ביותר על סמך דפוסים סטטיסטיים בנתוני האימון שלהם. הם ממטבים לסבירוּת, לא לאמת. בכתיבה יצירתית, זו תכונה. בחוק, זו קטסטרופה.

חוק סטטוטורי הוא בינארי. פעולה היא או חוקית או בלתי חוקית על סמך טקסט ספציפי בסעיף קוד ספציפי. אין "כנראה חוקי." אין "סטטיסטית סביר שיהיה תואם ציות." האיסור על סירוב למזומן בניו יורק סיטי או שקיים ב-Admin Code § 20-840 או שלא. המודל לא בודק את § 20-840. הוא בודק מה האינטרנט אומר באופן כללי על מדיניות מזומן ומחולל את התשובה שנשמעת הכי סבירה.

זה מה שאני מכנה היסחפות סמנטית — המודל מחליק מההגדרה המשפטית המדויקת אל ההבנה הדיבורית שנמצאת בנתוני האימון שלו. רוב הטקסט באינטרנט על יחסי בעל דירה–דייר דן בזכויות של בעלי דירות לבחור דיירים. זה הדפוס הדומיננטי. החריג הספציפי של ניו יורק סיטי המגן על מחזיקי שוברים הוא אות זעיר הטובע ברעש. המודל הולך אחרי העדר.

שלוש בעיות מבניות הופכות את זה לבלתי-פתיר באמצעות פרומפטים בלבד:

לנתוני האימון של המודל יש חתך ידע. האיסור על סירוב למזומן בניו יורק סיטי נחקק ב-2020. אם קורפוס האימון מוטה לכיוון טקסט מלפני 2020, המודל חוזר כברירת מחדל לדפוס הישן והנפוץ יותר: חנויות יכולות לקבוע את מדיניות התשלום שלהן.

ההיגיון של המודל אטום. אינך יכול להתחקות אחר מדוע הוא מאמין שאפשר להחרים טיפים. אין שרשרת ציטוטים במשקלים הנוירוניים — רק אסוציאציות סטטיסטיות. אי אפשר לבקר את מה שאי אפשר לראות.

אפילו עם יצירה מועשרת-אחזור (Retrieval-Augmented Generation) — התיקון הסטנדרטי שבו מזינים למודל מסמכים רלוונטיים — מימושים נאיביים נכשלים על טקסט משפטי. קודים משפטיים הם מבנים היררכיים שבהם איסור בסעיף A תלוי בהגדרה בסעיף B ובחריג בסעיף C. RAG סטנדרטי מחלק מסמכים למקטעים של 500 טוקנים שמנתקים את הקשרים האלה. המודל עשוי לאחזר את הסעיף הנכון אך לפספס את החריג הקריטי שלושה פסקאות משם.

הוויכוח שכמעט הוציא אותנו מהמסלול

כשנה לתוך בניית המערכת שלנו, היה לנו משבר צוותי אמיתי. חצי מצוות ההנדסה רצה להמשיך לשפר את צינור ה-RAG שלנו — הטמעות טובות יותר, חלוקה למקטעים טובה יותר, דירוג-מחדש טוב יותר. החצי השני, בהובלתי, רצה לזרוק את כל הפרדיגמה.

לתומכי ה-RAG הייתה נקודה. דיוק האחזור שלנו השתפר. עברנו מ-72% ל-89% במדד ההשוואה שלנו לשאילתות קוד עירוני. זה טוב. ברוב יישומי הבינה המלאכותית, זה מצוין.

אבל חזרתי שוב ושוב למשמעות של שיעור הכשל הזה של 11% בפועל. אם אתה עיר שמשרתת 8 מיליון תושבים, ו-11% מהתשובות המשפטיות שלך שגויות, אתה לא מפעיל שירות מועיל. אתה מפעיל הגרלה שבה הפרס הוא תביעה משפטית.

אמרתי משהו בפגישה ההיא שאני חושב שגיבש את הכיוון שלנו: "אנחנו לא בונים מערכת שבדרך כלל צודקת. אנחנו בונים מערכת שלעולם אינה שוגה בביטחון."

יש הבדל עצום. מערכת שבדרך כלל צודקת עדיין תזה הזיה של היתר משפטי בביטחון מלא, ובעל עסק ילך לפיה. מערכת שלעולם אינה שוגה בביטחון תסרב לענות כשהיא לא בטוחה — וזה בדיוק מה שעושה עובד ציבור אחראי. "אני לא בטוח לגבי זה — הרשה לי להפנות אותך למישהו שכן."

המטרה אינה צ'אטבוט שיודע את החוק. המטרה היא מערכת שיודעת מה שהיא לא יודעת — ואומרת זאת.

הוויכוח הזה הוכרע. זנחנו את גישת "תשפרו את ה-RAG" והתחלנו לבנות את מה שאנחנו מכנים כעת אכיפת ציטוט סטטוטורי (Statutory Citation Enforcement).

איך בונים בינה מלאכותית שלא יכולה להזות חוק?

דיאגרמת ארכיטקטורת מערכת המציגה את הצינור התלת-שלבי של גישת אכיפת הציטוט הסטטוטורי של Veriprajna: אחזור מגרף ידע היררכי, פענוח מוגבל, וסקירה של סוכן אימות.

העיקרון פשוט עד כדי הטעיה: אין ציטוט = אין פלט.

אם המערכת שלנו אינה יכולה לאחזר סעיף ספציפי ותקף מהקוד העירוני הרשמי שתומך ישירות בתשובתה, היא חסומה ארכיטקטונית מלחולל תשובה. לא מיואשת. לא מונחית להיזהר. חסומה. הנתיב הנוירוני לחולל טענה בלתי-נתמכת מנותק פשוטו כמשמעו בשכבת הפענוח.

הנה איך זה עובד בפועל.

אנחנו לא מחלקים קודים משפטיים למקטעי טקסט שרירותיים. אנחנו בונים גרף ידע היררכי שמשקף את המבנה האמיתי של החוק — כותר (Title), פרק, תת-פרק, סעיף, פסקה — עם קשתות גרף המקשרות הגדרות לסעיפים אופרטיביים, איסורים לחריגים שלהם, והפרות לעונשים שלהן. כשמישהו שואל על חנויות ללא מזומן, המערכת לא סתם מחפשת "מזומן." היא חוצה את ההיררכיה של Title 20 (Consumer Affairs) כדי לאתר את Subchapter 21, ומושכת את האיסור, את ההגדרה של "בית עסק קמעונאי," ואת מבנה העונשים כיחידה מקושרת.

ואז מגיע החלק שבאמת חשוב: פענוח מוגבל. אנחנו משתמשים בהכוונה של מכונת מצבים סופית (Finite State Machine) כדי להגביל את אוצר המילים של פלט המודל בזמן ההסקה. המודל חייב לחולל את תגובתו בסכמת JSON קפדנית הכוללת את הטענה, את מזהה הציטוט הספציפי, ואת כתובת ה-URL של המקור. אם המודל מנסה לצטט סעיף קוד שאינו קיים בהקשר שאוחזר, ההסתברות של אותו טוקן מוגדרת לאפס. המודל אינו יכול להזות ציטוט מפני שאלגוריתם הפענוח לא ייתן לו לגבש את המילים.

ולפני שכל דבר מגיע למשתמש, סוכן אימות נפרד — חשבו עליו כמפקח דיגיטלי הסוקר את עבודתו של פקיד — בודק האם הטקסט המצוטט אכן תומך בטענה שחוללה. האם § 20-840 באמת אומר שחנויות ללא מזומן הן בלתי חוקיות? האם הציטוט תואם לתשובה? אם יש אי-התאמה, הפלט מבוטל והמערכת מחזירה סירוב בטוח: "לא הצלחתי למצוא רגולציה ספציפית המתייחסת לשאלתך. אנא צור קשר עם מחלקת שירותי העסקים הקטנים (Department of Small Business Services)."

לארכיטקטורה הטכנית המלאה — מתמטיקת הפענוח המוגבל, מתודולוגיית בניית הגרף, עיצוב סוכן האימות — ראו את מאמר המחקר המפורט שלנו.

למה זה חשוב מעבר לניו יורק?

כי החשיפה המשפטית עצומה, ורוב המנהיגים הממשלתיים עדיין לא מבינים זאת.

שקלו את הדוקטרינה של מלכוד מכוח השתק. אם פקיד ממשלתי אומר לך שהתנהגות מסוימת חוקית, ואתה מסתמך על אותה מצג, ייתכן שיש לך הגנה מפני העמדה לדין. בתי המשפט עדיין לא הכריעו סופית האם צ'אטבוט של בינה מלאכותית נחשב "פקיד ממשלתי" למטרה זו — אבל את השקילות הפונקציונלית קשה להכחיש. הצ'אטבוט הוא ממשק הממשל הייעודי. אם בתי המשפט יקבלו את ההגנה הזו, ערים ימנעו מבחינה משפטית מלאכוף את חוקיהן שלהן נגד אנשים שהוטעו על ידי הבינה המלאכותית שלהן עצמן. ההזיות ייצרו חסינות משפטית מקרית למפרי חוק.

ואז ישנו התקדים של Moffatt v. Air Canada משנת 2024. הצ'אטבוט של Air Canada הזה מדיניות תעריף אבל. כשהנוסע הסתמך עליו ונכווה, Air Canada ניסתה הגנה מדהימה: הצ'אטבוט היה "ישות משפטית נפרדת" האחראית למעשיה שלה. הטריבונל הרס את הטיעון הזה. ארגונים אחראים לכל המידע בפלטפורמות שלהם, בין אם מדובר בטקסט סטטי ובין אם נוצר דינמית על ידי בינה מלאכותית. אי אפשר להסתייג מהבטחות הצ'אטבוט של עצמך.

כשממשל פורס בינה מלאכותית שמזה היתרים משפטיים, הוא לא רק יוצר חוויית משתמש גרועה. הוא עשוי לוותר על חסינות ריבונית, לאפשר הגנות מלכוד, ולחשוף את עצמו לתביעות אחריות למוצר.

חוק הבינה המלאכותית של האיחוד האירופי (EU AI Act) מסווג בינה מלאכותית ב"שירותים ציבוריים חיוניים" כבעלת סיכון גבוה, ומחייב דיוק, שקיפות ופיקוח אנושי. מערכת שממציאה חוקים תהיה בלתי-תואמת. חומות הרגולציה נסגרות ברחבי העולם.

"אבל מה עם מקרי קצה?"

אנשים תמיד מגיבים בהתנגדות לכלל "אין ציטוט = אין פלט" עם אותה דאגה: מה עם שאלות שבהן החוק באמת דו-משמעי? מה עם מצבים חדשניים שהקוד אינו מתייחס אליהם?

כאן דווקא הארכיטקטורה זורחת, לא נשברת. כשציוני האחזור נמוכים — כלומר המערכת לא מצליחה למצוא חוק רלוונטי בבירור — או כשסוכן האימות מזהה פרשנויות סותרות, המערכת מפעילה את מה שאנחנו מכנים סירוב בטוח. היא אומרת למשתמש: זו שאלה מורכבת שדורשת ייעוץ מקצועי, והנה הרשות הספציפית שאליה יש לפנות.

זה לא כשל. זו המערכת שעובדת בדיוק כפי שתוכננה. עובד ציבור אחראי שאינו יודע את התשובה אינו ממציא אחת. הוא אומר, "תן לי להפנות אותך למישהו שמטפל בזה." העובדה שרוב הצ'אטבוטים של בינה מלאכותית יעדיפו לפברק תשובה מאשר להודות באי-ודאות היא כל הבעיה שאנחנו פותרים.

ההתנגדות האחרת שאני שומע: "זה נשמע יקר ואיטי לעומת פשוט לפרוס GPT עם פרומפט." כן. זה יקר יותר. זה דורש לבנות גרף ידע מובנה של כל הקוד העירוני, לממש צינורות פענוח מוגבל, ולתחזק שכבת אימות. זה דורש להתייחס לבינה מלאכותית ממשלתית כמו תשתית, לא כמו האקתון של סוף שבוע.

אבל אתה יודע מה יותר יקר? תביעה ייצוגית מכל בעל עסק שפעל לפי העצה הבלתי חוקית של הצ'אטבוט שלך. נציבות זכויות האדם של ניו יורק סיטי שמטילה קנסות של מיליון דולר על בעלי דירות שהמערכת שלך אמרה להם להפלות. הנפילה הפוליטית כשהעיתונות תגלה ש"עובד הציבור הדיגיטלי" שלך הוא מפר זכויות אזרח אוטומטי.

עידן הצ'אטבוט הממשלתי בגרסת בטא הסתיים

הנה מה שאני מאמין, נאמר בפשטות: גישת "המעטפת הדקה" לבינה מלאכותית ממשלתית — שבה לוקחים מודל שפה מסחרי, מוסיפים פרומפט מערכת שאומר "אתה עוזר עירוני מועיל," ופורסים אותו בדומיין .gov — צריכה להיחשב לרשלנות מקצועית.

לא כי הטכנולוגיה גרועה. GPT-4 הוא יוצא דופן. אבל הוא יוצא דופן בתור מחולל טקסט יצירתי. השימוש בו לפרשנות חוק סטטוטורי ללא אילוצים ארכיטקטוניים דומה לשימוש במכונית ספורט כדי לחרוש שדה. המכונה לא מקולקלת. אתה משתמש בה לא נכון.

הטכנולוגיה לבניית בינה מלאכותית ממשלתית דטרמיניסטית ומעוגנת-ציטוט קיימת כבר היום. RAG היררכי, פענוח מוגבל, אימות רב-סוכני — אף אחד מאלה אינו תיאורטי. בנינו את זה. זה עובד. השאלה היא האם למנהיגים ממשלתיים יש את הרצון לדרוש זאת, או שהם ימשיכו לפרוס צ'אטבוטים שאומרים לבעלי דירות להפר את החוק כי ההדגמה נראתה מרשימה.

כל שאילתה למערכת בינה מלאכותית ממשלתית היא אזרח ששואל את המדינה: מה החוק דורש ממני? השאלה הזו ראויה לתשובה המעוגנת בטקסט האמיתי של החוק האמיתי — מצוטטת, מקושרת, וניתנת לאימות. או שהיא ראויה ל"אני לא יודע" כן והגון.

בזירה רבת-הסיכון של שירותי הממשל, דיוק אינו תכונה. זו חובה חוקתית.

בפעם הבאה שעיר תשיק עוזר בינה מלאכותית, השאלה הראשונה לא צריכה להיות "עד כמה הוא מועיל?" היא צריכה להיות "האם הוא יכול לצטט את מקורותיו?" אם התשובה היא לא, למערכת הזו אין שום עסק לשאת תג .gov.

Related Research

Also Published On