
Southwest Airlines איבדה את העקבות של הטייסים של עצמה. אז הבנתי שצ'אטבוטים לא יצילו את הלוגיסטיקה.
שיחת הטלפון ששינתה את האופן שבו אני חושב על בינה מלאכותית לא הגיעה מלקוח או ממשקיע. היא הגיעה מחבר — טייס — שבילה את חג המולד של 2022 בשינה על רצפת שדה התעופה הבינלאומי של דנוור.
הוא לא נתקע בגלל מזג האוויר. הסופה חלפה. הוא נתקע כי חברת Southwest Airlines פשוט איבדה את העקבות של המקום שבו הוא נמצא. מערכת שיבוץ הצוותים של החברה — אופטימייזר מדור קודם בשם SkySolver — חישבה תוכניות התאוששות על בסיס מיקומי צוותים שהיו מיושנים בשעות. היא ייצרה לוחות זמנים עבור חברת תעופה מדומה. חברי התקשר לקו החם של השיבוץ והמתין על הקו במשך שמונה שעות. עד שמישהו ענה, לוח הזמנים שהם זה עתה חישבו כבר היה שגוי שוב.
באותו שבוע, Southwest ביטלה מעל 16,900 טיסות. שני מיליון נוסעים נתקעו. החברה הפסידה יותר ממיליארד דולר. והנה החלק שרדף אותי: כל מוביל אמריקאי גדול אחר התמודד עם אותה סופה, אותם מסלולים קפואים, אותם מחסורי כוח אדם. United, Delta, American — כולם התאוששו תוך 48 שעות. Southwest הידרדרה במורד הספירלה במשך שבוע שלם.
חזרתי שוב ושוב לשאלה אחת: מדוע התוכנה של חברת תעופה אחת קרסה בעוד האחרות התכופפו והתאוששו? התשובה, כפי שגיליתי, לא נגעה כלל למזג האוויר אלא לחלוטין לאופן שבו בנינו את המוחות החישוביים של מבצעים מורכבים בשלושים השנים האחרונות. ההבנה הזו היא שהובילה אותי לבנות את Veriprajna — ולכתוב את מאמר המחקר הזה המניח את מלוא הטיעון הטכני.
אבל הגרסה המקוצרת היא זו: מיטבנו את הלוגיסטיקה לשם יעילות בעולם שכבר אינו מתגמל יעילות. בנינו מערכות שמוצאות את התשובה הזולה ביותר לשאלה ידועה, בעוד שמה שאנחנו באמת צריכים הן מערכות שמוצאות תשובה שרידה לשאלה לא ידועה.
הטופולוגיה שהרגה את חג המולד

כדי להבין מדוע Southwest נשברה, צריך להבין מושג מתורת הגרפים — ואני מבטיח שהוא מעניין יותר משהוא נשמע.
Delta, United ו-American מפעילות רכזת-וחישורים רשתות. הטיסות מתפזרות החוצה מרכזות מרכזיות כמו אטלנטה או ניוארק. אם סופה פוגעת בצפון-מזרח, מוביל מסוג רכזת-וחישורים יכול "לחסום" את הנזק — לבטל את כל הטיסות לניוארק לבוקר אחד, לאפס את תת-הגרף, ולחדש. הצוותים והמטוסים חוזרים דרך הרכזת בתדירות גבוהה, ויוצרים נקודות התאוששות טבעיות.
Southwest הייתה חלוצה של מודל שונה: נקודה-לנקודה. מטוס והצוות שלו טסים בשרשרת ליניארית — מבולטימור לדנוור לסן דייגו לפיניקס לסקרמנטו. מבריק מבחינה כלכלית. אתם סוחטים יותר שעות טיסה מכל מטוס. אבל מתמטית? זה מגדל קלפים. עיכוב ברגל הראשונה לא רק משפיע על החזרה — הוא מתגלגל במורד כל השרשרת. הצוות שאמור לטוס מסן דייגו לפיניקס תקוע בדנוור. המטוס שממתין להם בסן דייגו נתקע.
במונחי תורת הגרפים, הקוטר של גרף התלויות ברשת נקודה-לנקודה גדול בהרבה מאשר ברכזת-וחישורים. רדיוס הפגיעה של שיבוש בודד אינו מוכל.
אני זוכר את הלילה שבו מיפיתי זאת לראשונה על לוח מחיק במשרד שלנו. הצוות שלי ואני התווכחנו האם כשל Southwest היה בעיה תוכנתית או בעיה של תכנון הרשת. אחד המהנדסים שלי, מתוסכל מהתעקשותי שזה גם וגם, שלף את נתוני הטיסות בפועל והחל לצייר את שרשראות התלות. צפינו במפל מתפרש על פני המפה. עיכוב בבולטימור התגלגל לדנוור, ששבר חיבור לסן דייגו, שהותיר תקוע צוות שהיה אמור לטוס לפיניקס, ש…
"זו לא שרשרת," הוא אמר. "זה שבר."
הוא צדק. והשבר היה בלתי נראה עבור התוכנה שהייתה אמורה לתקן אותו.
מדוע SkySolver נחנק?
SkySolver בנוי על אותם יסודות מתמטיים המניעים את רוב מיטוב הלוגיסטיקה: תכנון לינארי בשלמים מעורבים (Mixed-Integer Linear Programming) וטכניקה בשם יצירת עמודות (Column Generation). אלה סוסי העבודה של חקר ביצועים (Operations Research), התחום ששולט באופן שבו אנו מזיזים אטומים ברחבי העולם מאז שנות ה-1950.
כך זה עובד בשפה פשוטה: המערכת מצלמת תמונת מצב של העולם — היכן נמצא כל איש צוות, מה מצבו של כל מטוס — מקפיאה את הזמן, ומחשבת את הדרך הזולה ביותר מתמטית לכסות את כל הטיסות. עבור חברת תעופה גדולה עם 4,000 טיסות יומיות, מספר הצירופים האפשריים של צוות-לטיסה הוא אינסופי למעשה. יצירת עמודות מטפלת בכך על ידי ייצור איטרטיבי של צירופים "מבטיחים" וצמצום החיפוש.
זה אלגנטי. זה עוצמתי. ויש בו הנחה קטלנית אחת שאפויה בתוך ה-DNA שלו: העולם עומד דומם בזמן שהוא חושב.
במהלך פעולה רגילה, מחזור פתרון של 30 עד 60 דקות הוא בסדר גמור. אך במהלך ההתמוטטות, מצב הרשת של Southwest השתנה כל כמה דקות. הצוותים לא יכלו לדווח על מיקומם כי קווי הטלפון היו עמוסים מדי. הנתונים שהזינו את SkySolver היו מיושנים בשעות. המערכת מיטבה עולם שכבר לא היה קיים.
כאשר קצב השיבוש עולה על מהירות המידע, המיטוב אינו מתדרדר בהדרגה. הוא קורס.
זה מה שאני מכנה פער המיטוב-ביצוע — אי-ההתאמה הקטלנית בין המהירות שבה פותר יכול לחשב לבין המהירות שבה המציאות נעה. וזה אינו ייחודי לחברות תעופה. ראיתי את אותה תבנית כשל בלוגיסטיקת נמלים, בניתוב מסילות, ובשרשראות אספקה בייצור. המתמטיקה זהה. השבירות זהה.
הרגע שבו הפסקתי להאמין בצ'אטבוטים ללוגיסטיקה
כחצי שנה לאחר משבר Southwest, ישבתי בפגישה עם משקיע שאמר לי, בביטחון מלא, "פשוט תשתמש ב-GPT. כוונן אותו על נתוני שיבוץ. הבעיה נפתרה."
ניסיתי להסביר מדוע זה לא יעבוד. הוא קטע אותי: "אבל הוא יכול להסיק. ראיתי אותו פותר בעיות מתמטיקה."
אותה שיחה גיבשה משהו שהתקשיתי לנסח. כל התעשייה כולה עשתה טעות קטגוריה — ערבוב בין השטף הלשוני של מודלי שפה גדולים (Large Language Models) לבין ההיסק התפעולי הנדרש לניהול מערכות מורכבות. ספקים הציפו את השוק ב"AI Copilots" ששמו ממשק צ'אט מעל פותרים מדור קודם. משבץ שואל, "איך אנחנו משחזרים את לוח הזמנים של דנוור?" וה-LLM מתרגם זאת לקריאת API אל אותו אופטימייזר שבור שמתחת.
זו שכבת צבע חדשה על מנוע תפוס.
הנה הבעיה היסודית: LLMs הם מנועים הסתברותיים שנועדו לחזות את הטוקן הבא ברצף. הם מחקים את הצורה של ההיסק מבלי להחזיק במודל עולם. במונחי מדע קוגניטיבי, הם מנועי System 1 עצומים — התאמת תבניות מהירה ואינטואיטיבית. מיטוב לוגיסטיקה הוא משימת System 2 — אימות איטי, מכוון ושלב-אחר-שלב של אילוצים.
ובעיית האילוצים היא המקום שבו זה נעשה מסוכן. בכתיבה יצירתית, דיוק של 99% הוא מצוין. בשיבוץ צוותים, דיוק של 99% הוא בלתי חוקי. אם LLM מייצר לוח זמנים שמשבץ טייס עם 7 שעות ו-59 דקות מנוחה לטיסה הדורשת 8 שעות, כל לוח הזמנים פסול. LLMs אינם מטפלים באופן טבעי באופי הבינארי הנוקשה של אילוצי היתכנות. הם מעדיפים קוהרנטיות לשונית על פני נכונות לוגית.
צ'אטבוט שיכול להסביר לוח זמנים אינו זהה לסוכן שיכול לתקן אותו.
מדדי ביצוע על בעיות קומבינטוריות כמו בעיית הסוכן הנוסע (Traveling Salesman Problem) מאשרים זאת בקנה מידה. ככל שמספר הצמתים גדל, LLMs "מבקרים" בערים פעמיים, מדלגים על אחרות לחלוטין, ומאבדים מעקב אחר המצב לאורך רצפים ארוכים. הם אינם יכולים לדמות עתידים מסתעפים או לחזור אחורה. הם עיוורים לאפקט הפרפר — למציאות שבה החלטת שיבוץ קטנה עכשיו יכולה לגרום לאסון שלושה ימים לאחר מכן.
מה שבאמת עובד: ללמד בינה מלאכותית לחשוב בגרפים
אז אם פותרים מדור קודם איטיים מדי ו-LLMs בלתי אמינים מדי, מה בונים?
זו השאלה שהצוות שלי ואני בילינו שנים במענה עליה, והארכיטקטורה שאליה הגענו בנויה על למידת חיזוק גרפית (Graph Reinforcement Learning) — מיזוג של רשתות עצביות גרפיות (Graph Neural Networks) (כדי להבין את טופולוגיית הרשת) ולמידת חיזוק (Reinforcement Learning) (כדי ללמוד מדיניות החלטות דינמית). עברנו מחישוב לוח זמנים ללמידה של איך לשבץ.
התובנה שפתחה את הכול הייתה פשוטה באופן מטעה: רשתות לוגיסטיקה אינן גיליונות אלקטרוניים. הן גרפים. שדות תעופה הם צמתים. טיסות הן קשתות. מחסנים הם צמתים. משאיות הן קשתות. ארכיטקטורות למידת מכונה מסורתיות — מהסוג שתוכנן לתמונות או לטקסט — מתקשות עם המבנה היחסי הזה. רשתות עצביות גרפיות הן הארכיטקטורה הטבעית עבורו.
אנו משתמשים ברשתות קשב גרפיות (Graph Attention Networks) כדי לקודד את מצב רשת הלוגיסטיקה כולה. כל ישות — טייס, מטוס, שדה תעופה — הופכת לצומת עם הטמעה רב-ממדית שלוכדת גם תכונות סטטיות (סוג המטוס, כישורי הצוות) וגם מצב דינמי (עיכוב נוכחי, סטטוס תחזוקה, עייפות מצטברת). החיבורים ביניהם נושאים מידע על משך הטיסה, סיכון מזג האוויר, ושיבוצי הצוות.
הקסם הוא במה שמכונה העברת הודעות. כאשר סופת שלגים סוגרת את דנוור, ה-GNN מעדכן את ההטמעה של דנוור. העדכון הזה זורם לאורך כל קשת מחוברת — כל טיסה נכנסת, כל שיבוץ צוות. טייס בבולטימור המתכונן לטוס לדנוור מקבל "אות סיכון" בהטמעה שלו עוד לפני שהוא ממריא. המערכת רואה את הקישוריות. היא מבינה את רדיוס הפגיעה. סוג כזה של מודעות טופולוגית הוא בלתי אפשרי בייצוגי הנתונים השטוחים והטבלאיים שמערכות מדור קודם משתמשות בהם.
מעל שכבת התפיסה הגרפית הזו, אנו מריצים סוכני למידת חיזוק (Reinforcement Learning). סוכן RL מתבונן במצב, מבצע פעולה (החלפת צוות, ביטול טיסה, עיכוב המראה, העברת צוות בטיסת סרק למיקום חדש), ומקבל תגמול. לאורך מיליוני איטרציות אימון, הוא לומד מדיניות שממקסמת תוצאות ארוכות-טווח.
הביטוי הזה — ארוך-טווח — הוא הכול. היוריסטיקה עשויה לומר: "אל תבטל את הטיסה הזו, היא מפסידה הכנסות." סוכן ה-RL שלנו לומד: "אם לא אבטל את הטיסה הזו, הצוות ייתקע בדנוור, ואאבד עשר טיסות מחר. בטל אותה עכשיו." הוא לומד הקרבה אסטרטגית לשם הישרדות מערכתית.
כיצד מאמנים בינה מלאכותית לאסונות שעדיין לא קרו?
ברור שאי אפשר לאמן סוכן למידת חיזוק על חברת תעופה חיה. ניסוי וטעייה בעולם האמיתי עולה מיליונים ויוצר סיכוני בטיחות. כאן נכנס לתמונה התאום הדיגיטלי (Digital Twin) — ואיני מתכוון ללוח מחוונים עם הדמיה תלת-ממדית של שדה תעופה.
התאומים הדיגיטליים שלנו הם מנועי מעברי-מצב. אנו מדגמנים כל מטוס עם מחזורי תחזוקה ייחודיים למספר הזנב, כל שער, כל איש צוות עם מוני עייפות פרטניים ומצבי חוזה. אנו ממחשבים את ספר החוקים — FAA Part 117, חוזי איגוד, מדריכי תחזוקה. כל מעבר מצב נבדק מול כללים אלה.
ואז אנו מזריקים כאוס.
אנו משתמשים במחוללים סטוכסטיים כדי לדמות 10,000 שנות פעילות בשבוע. אנו יוצרים סופות-על, השבתות מכניות מסיביות, שביתות עבודה. אנו מתחילים את הסוכנים בימים קלים — מזג אוויר שטוף שמש, לוחות זמנים דלילים — ומעלים בהדרגה את רמת הקושי, מכניסים כשלים מדורגים שיגרמו להתמוטטות Southwest להיראות כמו אי-נוחות קלה.
אני זוכר את הפעם הראשונה שהרצנו את משבר Southwest של דצמבר 2022 דרך הסימולטור שלנו. בנינו פרוקסי של הפותר מדור קודם כדי להשוות מולו. הפותר מדור קודם עשה בדיוק את מה ש-SkySolver עשה — הוא נחנק מהשהיית הנתונים, מיטב עבור המצב השגוי, וייצר את אותו בלגן סבוך של צוותים תקועים. זמן התאוששות: שבעה ימים מדומים.
סוכן ה-GRL שלנו עשה משהו שאיש מאיתנו לא ציפה לו. הוא זיהה את תבנית השבר נקודה-לנקודה שהתהוותה בדנוור שעות לפני המפל המלא. ואז הוא ביצע את מה שאנו מכנים כעת אסטרטגיית חומת-אש מקדימה — הוא ביטל 20% מהטיסות לדנוור מוקדם, לכד את השיבוש מקומית, והעביר צוותים בטיסת סרק לפיניקס כדי ליצור בסיס תפעולי משני.
רשת החוף המזרחי נותרה תפעולית ב-95%. סך הביטולים ירד ב-66%. ההתמוטטות הוכלה לכדי שיבוש אזורי.
המהנדס שלי — אותו אחד שצייר את השבר על הלוח המחיק — פשוט בהה במסך. "הוא הקריב את דנוור כדי להציל את הרשת," הוא אמר. "שום משבץ אנושי לא היה מעז לעשות זאת בשש בבוקר ב-22 בדצמבר."
הוא צדק. וזו הנקודה. הסוכן "חי דרך" אלפי משברים בסימולציה. הוא חקר את קצוות מרחב המצבים שבהם פותרים מדור קודם קורסים, ולמד כיצד נראית הישרדות. עבור הפירוק הטכני המלא של הארכיטקטורה — הטמעות ה-GAT, לולאת האימון PPO, מיסוך הפעולות — פרסמתי את המחקר המלא.
מה לגבי בעיית הקופסה השחורה?

אנשים תמיד מתנגדים כאן, ובצדק. "אתה אומר לי למסור את השליטה בפעילות של חברת תעופה לרשת עצבית? איך אני יודע שהיא לא תהזה לוח זמנים בלתי חוקי?"
זו ההתנגדות החשובה ביותר בבינה מלאכותית קריטית-לבטיחות, וכל מי שמבטל אותה אינו רציני. הנה כיצד אנו פותרים אותה.
לעולם איננו נותנים לרשת העצבית להוציא את ההחלטה הסופית ישירות. אנו משתמשים במה שאנו מכנים ארכיטקטורת כריך — בהשראת מסגרת NICE לתכנון בשלמים מונחה-למידת-חיזוק. השכבה הנוירונית (סוכן ה-GRL שלנו) מנתחת את המצב המורכב והרועש ומציעה התפלגות הסתברות על פני פעולות. אז שכבה סימבולית דטרמיניסטית — מנוע אילוצים שמקודד כל כלל נוקשה בפעילות — מיישמת מסכה. אם הרשת העצבית מציעה פעולה שמפרה תקנה (טייס חורג משעות תפקיד, מטוס טס עם פריט תחזוקה פתוח), השכבה הסימבולית מגדירה את ההסתברות של אותה פעולה לאפס.
המערכת אינה יכולה לבצע פעולה בלתי חוקית. לא "כנראה שלא." אינה יכולה.
זה נותן לנו משהו יוצא דופן: את האופטימליות של מדיניות AI נלמדת יחד עם ערבויות הבטיחות של לוגיקה פורמלית. וזה פותר את הבעיה החישובית גם מהכיוון השני. במקום שהפותר מדור קודם יחפש מיליארד אפשרויות, הרשת העצבית גוזמת את העץ עד לעשרת הענפים המבטיחים ביותר. הפותר צריך רק לאמת ולכוונן את מעט האפשרויות הללו. זמן החישוב יורד משעות לשניות.
זה לא רק על חברות תעופה
התמוטטות Southwest היא הדוגמה הדרמטית ביותר, אך השבירות שהיא חשפה היא אוניברסלית. אנו מתאימים את אותה ארכיטקטורת GRL + תאום דיגיטלי לנמלי ים ולרשתות מסילה.
בנמלים, כלי שיט מעוכב מפספס את משבצת הרציף שלו, מנופים מוקצים מחדש, ומשאיות שתוכננו לאיסוף מכולות ממתינות בתור במשך שעות. אנו פורסים agentic AI שבו "סוכן עוגן" מנהל משא ומתן עם "סוכן טרמינל" בזמן אמת, מחליק את השיאים והשפלים של עומס השערים ככל שהשיבושים מתפתחים.
במסילות, שבהן צווארי בקבוק של מסילה יחידה משמעם שהחלטת "מפגש-חלוף" שגויה אחת יכולה לשתק רכבות מאות מיילים משם, סוכני ה-GRL שלנו עולים על משבצים אנושיים ועל כללים היוריסטיים ב-15-20% בהפחתת עיכובים. הם מבצעים מהלכים לא-אינטואיטיביים — עצירת רכבת משא מוקדם כדי לפנות נתיב לרכבת אקספרס 50 מייל במעלה הזרם — שאף מערכת מבוססת-כללים לא הייתה שוקלת.
התבנית תמיד זהה: רשת מורכבת, אילוצים קשיחים, שיבושים מדורגים, וחלון החלטה הנמדד בדקות. פותרים מדור קודם אינם מסוגלים לעמוד בקצב. LLMs אינם יכולים להסיק לגביו. למידת חיזוק גרפית כן יכולה.
ה-ROI האמיתי אינו יעילות — אלא הישרדות
ההתמוטטות בת השבוע של Southwest עלתה 1.2 מיליארד דולר. אירוע בודד זה מחק שנים של רווחי יעילות מהפעלת רשת נקודה-לנקודה רזה. תעלת סואץ חסומה עולה לכלכלה העולמית מיליארדים ליום. סיכון הזנב — האירוע הקטסטרופלי, "פעם בעשור", שכעת נראה שקורה מדי שנה — כבר אינו הערת שוליים במרשם הסיכונים. לאורך אופק של עשר שנים, הוא מניע העלות הדומיננטי.
הסוכנים שלנו מספקים 2-5% חיסכון בעלויות תפעוליות במהלך פעילות רגילה באמצעות ניהול חכם יותר של חוצצים והפחתת שעות נוספות של צוות. זה תנאי בסיסי. הערך האמיתי הוא במה שלא קורה: ההתמוטטות שמוכלת לכדי שיבוש אזורי, המפל שנחסם בחומת-אש לפני שהוא מגיע לחוף המזרחי, השבוע של מיליארד הדולר שלעולם אינו מתממש.
יעילות היא אסטרטגיה לעולם יציב. אנחנו כבר לא חיים בעולם יציב.
עידן המתמטיקה הסטטית תם
פתחתי מסה זו בטייס הישן על רצפת שדה התעופה הבינלאומי של דנוור. הוא עדיין טס עבור Southwest. מאז הם השקיעו רבות בשדרוג המערכות שלהם. אך הבעיה העמוקה יותר — ההסתמכות בכל התעשייה על פותרים דטרמיניסטיים שנבנו לעולם של שיבושים צפויים — נותרה במידה רבה ללא מענה.
המרוץ אל בינה מלאכותית יוצרת (Generative AI) כמושיעה של הלוגיסטיקה מדאיג אותי יותר מהמערכות מדור קודם. לפחות האנשים שהפעילו את SkySolver הכירו את מגבלותיו. האנשים שפורסים עטיפות LLM מעל אופטימייזרים שבורים לרוב אינם מכירים. הם רואים טקסט שוטף וטועים לחשוב שהוא היסק תפעולי. הם רואים צ'אטבוט שיכול להסביר לוח זמנים ומניחים שהוא יכול לתקן אותו.
בניית Veriprajna לימדה אותי שהחלק הקשה ביותר בעבודה הזו אינו המתמטיקה — אלא הטיעון. לשכנע תעשייה שהכלים שבהם בטחה במשך עשורים בעלי תקרה מבנית. שהדבר החדש והנוצץ (Generative AI) מכוון לבעיה הלא נכונה. שהפתרון האמיתי דורש לחשוב מחדש על לוגיסטיקה כגרף, על שיבוש כאות למידה, ועל חוסן כמשהו שמתאמנים לקראתו — לא משהו שמקווים לו.
עתיד הלוגיסטיקה אינו שייך למערכות שמוצאות את התוכנית הזולה ביותר לעולם ידוע. הוא שייך למערכות שמוצאות תוכנית שרידה לעולם לא ידוע. זה לא 'אולי'. זה מה שאנחנו בונים.