ויזואל מרהיב של ארכיון עיתון ההופך לגרף ידע זוהר ומובנה — המייצג את התזה המרכזית של המאמר בדבר הפיכת עיתונאות סטטית למודיעין שיחתי.

Artificial IntelligenceMediaTechnology

כתבת החדשות היא שוט סוסים — והארכיון שלכם הוא מכרה זהב

Ashutosh Singhal 8 בפברואר 202613 min

ישבתי מול המנהל הדיגיטלי של עיתון ותיק — כזה שבוודאי קראתם — כשהוא פתח גרף במחשב הנייד שלו והפנה אותו לכיווני. תנועה אורגנית, חודש אחר חודש, לאורך שמונה־עשר החודשים האחרונים. זה נראה כאילו מישהו דחף סלע ענק מעל צוק.

"אנחנו עושים הכול נכון," הוא אמר. "יותר כתבות, SEO טוב יותר, טעינת עמודים מהירה יותר. ואנחנו מפסידים."

הוא לא טעה לגבי הביצוע. הוא טעה לגבי המשחק. המשחק השתנה תחתיו בזמן שהוא ביצע אופטימיזציה עבור המשחק הישן. והשיחה הזו — שהתרחשה מעל קפה פושר בחדר ישיבות עם נוף לחניון — היא הסיבה שביליתי את החודשים הבאים בבניית משהו שאני מאמין שיגדיר מחדש כיצד חברות מדיה שורדות.

הרעיון המרכזי פשוט, כמעט עד כאב: חברות מדיה צריכות להפסיק למכור כתבות ולהתחיל למכור תשובות. פיד החדשות מת. הארכיון חי. והטכנולוגיה שתגשר על הפער הזה — שתהפוך חמישים שנות עיתונאות למנוע מודיעין שיחתי — כבר קיימת. אנחנו רק צריכים לבנות אותה נכון.

כתבתי צלילה עמוקה ואינטראקטיבית על כל התזה הזו אם אתם רוצים את התמונה המלאה. אבל תנו לי לספר לכם את הסיפור של איך הגענו לכאן, כי המספרים לבדם לא לוכדים את הסחרחורת של לצפות ביסודות של תעשייה שלמה נסדקים.

למה אף אחד כבר לא לוחץ?

אינפוגרפיקה המציגה את הנתונים המרכזיים על קריסת התנועה שצוטטו בכתבה — שיעורי חיפוש ללא קליק, ירידות בתנועת המפרסמים, והשפעת AI Overview — כדי שהקוראים יוכלו לקלוט את היקף המשבר במבט חטוף.

הנה העובדה שמדירה שינה ממנהלי מדיה: ‏60% מחיפושי Google מסתיימים כיום ללא ולו קליק אחד לאתר כלשהו. במובייל, מדובר ב־77%. Google הפכה ליעד, לא לשער הכניסה. מנוע החיפוש שבנה את כלכלת הפרסום הדיגיטלי הפך בשקט למתחרה הגדול ביותר שלה.

והיקף הנזק מזעזע. במחצית הראשונה של 2025, המפרסם החציוני חווה ירידה של 10% בתנועה בהשוואה לשנה קודמת. אבל "חציוני" מסתיר את הטבח. CNN צנחה בין 27% ל־38%. Forbes ו־Business Insider נפלו בכמעט 50%. HubSpot — חברה שלמעשה המציאה את שיווק התוכן המודרני — איבדה 70-80% מהתנועה האורגנית שלה.

האשם הוא AI Overviews. כאשר סיכום ה־AI של Google מופיע בראש תוצאות החיפוש — מה שקורה כיום עבור כ־13% מהשאילתות — שיעורי ההקלקה לקישורים אורגניים קורסים בכ־47%. ה־AI קורא את הכתבות כדי שהמשתמש לא יצטרך.

אני זוכר את הצוות שלי ואותי בוהים במספרים האלה במהלך פגישת עבודה בשעת ערב מאוחרת. מישהו אמר, "אז המפרסמים יוצרים את התוכן, ה־AI של Google אוכל אותו, והמשתמש אף פעם לא מבקר באתר?" זה בדיוק נכון. וזה רק מחמיר.

מנוע החיפוש כבר אינו מפנה תנועה. הוא מתחרה על תשומת הלב.

התנועה לפלטפורמות AI גנרטיביות — ChatGPT, Perplexity, Claude — גדלה פי 165 מהר יותר מהתנועה לחיפוש המסורתי. משתמשים שואלים שאלות ארוכות ומורכבות יותר. חיפושים בני חמש מילים או יותר גדלים פי 1.5 מהר יותר משאילתות מילות מפתח קצרות. אנשים לא רוצים עשרה קישורים כחולים. הם רוצים תשובה טובה אחת.

הכתבה היא שריד עבר (ואני אומר זאת באהבה)

אני צריך להיזהר כאן כי אני באמת אוהב עיתונאות ארוכה. אני קורא אותה כל הזמן. אבל אני גם חייב להיות כן לגבי מהו פורמט הכתבה למעשה: מכל שנועד להפצה מודפסת.

חשבו על זה. הדפסתם סיפור בן 800 מילים בעיתון כי לא יכולתם להדפיס 800 תשובות נפרדות. הפצה פיזית הייתה יקרה וספורדית, אז ארזתם מידע לתוך נרטיבים. זה היה הגיוני לחלוטין ב־1975. זה היה הגיוני למדי ב־2005, כשהכתבה היגרה לרשת אבל התנהגות הקריאה נשארה בערך אותו דבר.

זה כמעט חסר כל היגיון ב־2025.

משתמש שמחפש "מהי עמדת ראש העיר בנושא דיור?" לא רוצה כתבת עומק בת 1,000 מילים על ההיסטוריה של ייעוד הקרקעות בעיר. הוא רוצה את עמדת ראש העיר בנושא דיור. המודל המסורתי מכריח אותו לעבור מסלול מכשולים: חיפוש ← קליק ← גלילה ← סריקה ← קריאה ← חילוץ. כל שלב הוא חיכוך. כל שלב הוא הזדמנות לאבד אותו.

התווכחתי על זה עם חברה עיתונאית שהתנגדה בתוקף. "אתה מצמצם עיתונאות לעובדות," היא אמרה. "סיפורים חשובים. הקשר חשוב. נרטיב חשוב." היא צודקת לחלוטין — עבור מאמרי דעה, תחקירים, פרופילים, כתבות עומק. אלה צורות אמנות. אבל הרוב המכריע של מה שממלא פיד חדשות אינו אמנות. זהו מידע כלוא בתוך פורמט לא יעיל. והמשתמשים מצביעים בהתנהגותם: הם מעדיפים לשאול AI מאשר לחצות את זה בקושי.

מה אם הארכיון אינו בית קברות?

כאן השיחה עם אותו מנהל דיגיטלי עברה ממדכאת לחשמלית.

שאלתי אותו כמה כתבות יש בארכיון שלהם. הוא עצר. "כנראה... כמה מיליונים? חוזרים אחורה עד שנות השבעים?" הוא אמר זאת כאילו זו התחייבות — עלות שרתים, כאב ראש של תחזוקה.

אמרתי לו שזה הנכס היקר ביותר שהחברה שלו מחזיקה. יקר יותר מהמותג. יקר יותר מרשימת המנויים. כי אותם מיליוני כתבות, המשתרעות על פני חמישה עשורים של פוליטיקה מקומית, עסקים, פשיעה, תרבות — זה מאגר נתונים שאף חברת AI עלי אדמות לא יכולה לשכפל ללא רשותו.

הבעיה אינה הנתונים. הבעיה היא שהם נעולים בתוך גושי טקסט לא מובנים המנותקים זה מזה. כתבה A מזכירה שאדם X עובד בחברה Y. כתבה B, שפורסמה שלוש שנים מאוחר יותר, מזכירה שחברה Y מעורבת בשערורייה Z. אף כתבה בודדת אינה מקשרת את אדם X לשערורייה Z. אבל הקשר קיים — קבור לרוחב הארכיון, בלתי נראה לכל שורת חיפוש, ממתין שמישהו יתפור אותו יחד.

מפרסמים שרואים במוצר שלהם אך ורק "כתבות" מייצרים שוטי סוסים בעידן המכונית.

התפירה הזו היא מה שאנחנו בונים ב־Veriprajna. לא צ'טבוטים. לא מעטפות GPT. מנועי מודיעין.

שאלת ראש העיר ששינתה הכול

הרשו לי להמחיש זאת. דמיינו משתמש — חוקר מדיניות מקומי, אזרח מודאג, עיתונאי בכלי תקשורת מתחרה — שרוצה להבין כיצד עמדת ראש העיר בנושא דיור התפתחה מאז 2010.

במודל הישן, הם מחפשים באתר העיתון "עמדת ראש העיר דיור." הם מקבלים חמישים תוצאות. הם פותחים את הכתבה מ־2010: "ראש העיר מתנגד לבנייה לגובה." הם פותחים את הכתבה מ־2015: "ראש העיר מרכך את עמדתו על רקע משבר בר־השגה." הם פותחים את הכתבה מ־2022: "ראש העיר מוביל את הצעת החוק Build Now." הם מסנתזים בראשם את ההתפתחות. זה לוקח ארבעים וחמש דקות אם הם מהירים.

במודל שאנחנו בונים, הם מקלידים את השאלה. המערכת מפרקת אותה לתת־שאילתות זמניות. היא חוצה גרף ידע — לא רק מחפשת מילות מפתח, אלא עוקבת אחר היחסים בין ישות ראש העיר לבין ישות פיתוח הדיור על פני קשתות מתויגות זמן. היא מוצאת את השינוי בעמדה משלילית (2010) לניטרלית (2015) לחיובית (2022). היא מייצרת נרטיב עם ציטוטים המקשרים לכתבות המקוריות. היא מציגה המחשה של ציר זמן.

עשר שניות.

זה לא צ'טבוט. זה מוצר מודיעין. וזה סוג הדבר שאנשי מקצוע — לוביסטים, אנליסטים, עורכי דין, אסטרטגים תאגידיים — היו משלמים עליו כסף רציני.

למה אי אפשר פשוט לזרוק GPT על ארכיון?

הלוואי שהיה אפשר. זה היה מקל על עבודתי בהרבה.

ניסינו את הגישה הנאיבית בשלב מוקדם. לקחת כתבות, לחתוך אותן לגושים בני 500 מילים, להטמיע אותן כווקטורים, לבצע חיפוש דמיון, להזין את התוצאות ל־LLM. זה מה שרוב היישומים של "צ'טבוט AI" עושים. ולחיפוש עובדה בודדת פשוט בתיעוד סטטי, זה עובד בסדר.

עבור ארכיוני חדשות, זה נכשל בדרכים עדינות ומסוכנות.

היא מאבדת את החוט. חלוקה לגושים שוברת קשתות נרטיביות. גוש הדן בפסק דין מופרד מהגוש המתאר את הפשע. המערכת פשוט לא מסוגלת לעקוב אחר סיפור שנפרש על פני כתבות מרובות לאורך שנים מרובות.

היא עיוורת לזמן. דמיון וקטורי לא יודע איזו שנה זו. כתבה מ־2010 שאומרת "שוק הדיור קורס" זהה סמנטית לכתבה מ־2024 שאומרת את אותו דבר. המערכת מבלבלת מציאות ישנה עם מציאות עכשווית. היא לא יכולה להבחין בין מה שהיה נכון לבין מה שהוא נכון.

היא לא יכולה לחבר נקודות. אם אדם X ושערורייה Z אף פעם לא מופיעים באותה כתבה, אחזור נאיבי לעולם לא ימצא את הקשר — גם אם חברה Y מקשרת ביניהם. למערכת חסר מה שחוקרים מכנים "היסק רב־קפיצות".

היא ממציאה כדי למלא פערים. כאשר האחזור מפספס הקשר רלוונטי, ה־LLM לא אומר "אני לא יודע." הוא ממציא. הוא מזייף ציטוטים. הוא יוצר אירועים שמעולם לא קרו. בעיתונאות, זה לא דיווח על באג. זו תביעה משפטית.

למדנו את כל זה בדרך הקשה. היה מבחן ספציפי — לא אנקוב בשם הפרסום — שבו המערכת הנאיבית ייחסה בביטחון ציטוט לפוליטיקאי שמעולם לא אמר דבר שאפילו מרחוק דומה לכך. הציטוט נשמע סביר. הוא היה עקבי מבחינה דקדוקית עם האופן שבו הפוליטיקאי דיבר. הוא היה מפוברק לחלוטין. זה היה הרגע שבו ידעתי שאנחנו זקוקים לארכיטקטורה שונה מן היסוד.

כיצד בונים מנוע מודיעין שבאמת עובד?

תרשים ארכיטקטורה תלת־שכבתי המציג את שכבות GraphRAG, Temporal RAG ו־Agentic Workflow עם הפונקציות הספציפיות שלהן וכיצד הן מתחברות, ההופך את המערכת הטכנית למובנת במבט חטוף.

הארכיטקטורה שפיתחנו ב־Veriprajna כוללת שלוש שכבות, שכל אחת פותרת מצב כשל ספציפי. אשרטט אותן בקצרה כאן — לפירוט הטכני המלא, ראו את מאמר המחקר שלנו.

שכבה ראשונה: GraphRAG. במקום להתייחס לארכיון כשק של גושי טקסט מנותקים, אנו מחלצים גרף ידע — ישויות (אנשים, ארגונים, מיקומים, אירועים) והיחסים ביניהן. "אילון מאסק" ← רכש ← "Twitter." אלה מאוחסנים במסד נתונים גרפי שבו כל כתבה מקושרת. כאשר משתמש שואל שאלה מורכבת, המערכת לא רק מחפשת מילות מפתח. היא חוצה את הגרף, קופצת מצומת לצומת, מוצאת קשרים המשתרעים על פני עשורים ואלפי כתבות.

התוצאות דרמטיות. במשימות היסק רב־קפיצות, GraphRAG הראתה שיפורים במקיפות של 72-83% בהשוואה לגישות מבוססות־וקטורים בלבד. היא יכולה לענות "מהם הנושאים המרכזיים בחמש שנות סיקור אקלים?" — שאלה ש־RAG נאיבי אפילו לא יכול לנסות.

שכבה שנייה: Temporal RAG. כל גוש וכל קשת בגרף מתויגים במטא־נתונים של זמן־תוקף. היחסים מנוהלים בגרסאות — קשת "מנכ"ל Apple" עבור סטיב ג'ובס יש לה גבולות זמן שונים מזו של טים קוק. כאשר משתמש שואל שאלה אבולוציונית, המערכת מפרקת אותה לתת־שאילתות זמניות ומרכיבה את התוצאות כרונולוגית. הארכיון הופך למכונת זמן.

שכבה שלישית: זרימות עבודה אֵיגֶנטיות. ה־LLM לא רק מאחזר ועונה. הוא מתכנן. סוכן מְתַכְנֵן מפרק בקשה מורכבת ("כתוב דוח בדיקת נאותות על חברה X") לתת־משימות. סוכן חוקר מבצע שאילתות ממוקדות. סוכן מבקר בוחן את התוצאות לאיתור פערים וסתירות לפני שהמשתמש רואה משהו. סוכן כותב מסנתז את הפלט הסופי עם ציטוטים.

אנחנו לא עוטפים ממשקי API. אנחנו בונים מחדש את יסודות תשתית הידע.

אותו סוכן מבקר הוא קריטי. הוא למעשה בודק עובדות מובנה — קריאת LLM שנייה שמשווה כל טענה שנוצרה מול מסמכי המקור ומסלקת כל דבר שאינו נתמך. בשילוב עם הוראות ביסוס קפדניות ואכיפת ציטוטים, כך אנו שומרים על מה שאני רואה כמדיניות אפס סובלנות לפִבּרוּק.

מה Financial Times יודע שכל האחרים לא?

‏FT השיקה את "Ask FT" — ממשק שיחתי המאפשר למנויים מקצועיים לחקור את הארכיון שלהם. כל תשובה מבוססת אך ורק על עיתונאות FT. לכל טענה יש ציטוט הניתן להקלקה. הוא מתוכנן עבור זרימות עבודה מקצועיות ספציפיות: הכנה לפגישות, בדיקת נאותות מהירה, ניתוח מגמות.

‏Bloomberg הרחיקה עוד יותר עם BloombergGPT, LLM ייעודי לתחום שמתרגם שפה טבעית ל־Bloomberg Query Language. אנליסט יכול לשאול "הראה לי צמיחת הכנסות עבור חברות טכנולוגיה ברבעון השלישי של 2024" ולקבל טבלה מעוצבת. הם יכולים לחקור תמלולי שיחות רווחים — לשאול על הטון של מנכ"ל לגבי גורם סיכון מסוים — במקום לקרוא מאות עמודים באופן לינארי.

אלה אינם ניסויים. אלה מודלים עסקיים. והם מצביעים על היכן שהכסף באמת נמצא.

מהיכן מגיע הכסף?

תרשים מודל הכנסות תלת־שכבתי המציג את שכבות המונטיזציה: שכבת המודיעין, רישוי API, וחפיר הנתונים, עם פרטים מרכזיים, המסייע לקוראים לתפוס במהירות את מבנה המודל העסקי.

אנשים תמיד שואלים אותי אם מודל "מודיעין כשירות" הזה יכול באמת להחליף הכנסות מפרסום. תשובתי הכנה: הוא לא צריך להחליף את כל זה. הוא צריך להחליף את החלק שנעלם.

הכלכלה מתפרקת לשלוש שכבות.

ראשית, מנוי שכבת מודיעין — לא 10$ לחודש עבור "קרא את החדשות", אלא 1,000$+ לשנה עבור אנשי מקצוע הזקוקים לגישה עמוקה לארכיון, זרימות עבודה אֵיגֶנטיות, ומחקר מגובה ציטוטים. אנשי מקצוע בתחום הפיננסים, צוותי מודיעין תאגידי, משרדי עורכי דין המבצעים מחקר רגולטורי. המשתמשים האלה קיימים. הם משלמים כיום לאנליסטים כדי לבצע ידנית את מה שמערכת בנויה היטב עושה בשניות.

שנית, רישוי API. במקום להילחם בסורקי AI באמצעות robots.txt, ננסח באופן רשמי את חילופי הנתונים. מכרו גישה נקייה, מווקטרת, מובנית־גרף לארכיון לפלטפורמות חיפוש ארגוניות, טרמינלים פיננסיים, ומפתחי צד שלישי. גבו לפי שאילתה או לפי טוקן. המודיעין של המפרסם חי בתוך זרימת העבודה של הלקוח.

שלישית, וזה החלק שרוב האנשים מפספסים: חפיר הנתונים עצמו. בעולם שבו כל אחד יכול לגשת ל־GPT-4, המודל אינו היתרון התחרותי. הנתונים הם. ארכיון בן חמישים שנה של חדשות מקומיות הוא מאגר נתונים ש־OpenAI לא יכולה לשכפל. גרף הידע הנגזר מאותו ארכיון — מארג שחקני הכוח המקומיים, ציר הזמן של שינויי המדיניות, רשת היחסים התאגידיים — הוא קניין רוחני קנייני שערכו מצטבר לאורך זמן.

בעולם של מודלי AI שהפכו למצרך, החפיר אינו האלגוריתם. הוא הארכיון.

ומה עם העיתונאים?

אני מקבל את השאלה הזו כל הזמן, ואני חושב שהיא ראויה לתשובה ישירה במקום התחמקות. הפנייה הזו לא מבטלת עיתונאות. היא מבטלת את חוסר היעילות של האופן שבו עיתונאות מגיעה לאנשים. הכתב שמבלה שלושה חודשים בחקירת שערוריית שחיתות עושה עבודה שאף AI לא יכול לשכפל. המערכת שאנו בונים הופכת את העבודה הזו ליותר בת־גילוי, יותר בת־שאילתה, יותר בעלת ערך לאורך זמן. היא הופכת סיפור שנקרא במשך שבוע ואז נקבר בעמוד 47 של תוצאות החיפוש לצומת קבועה ובת־אחזור בגרף ידע שצפה בכל פעם שמישהו שואל שאלה קשורה במהלך חמישים השנים הבאות.

האיום על העיתונאות אינו AI שיחתי. האיום הוא כלכלת ההפניות הקורסת שמממנת את העיתונאות. אם התנועה נעלמה — והיא נעלמה — אז היצמדות למודל הפיד הנתמך בפרסום אינה נאמנות למקצוע. זו הכחשה.

מה קורה אם חברות מדיה לא יבצעו פנייה?

משהו גרוע מדעיכה: חוסר רלוונטיות. הארכיונים שלהם נגרפים על ידי חברות AI, מסונתזים לנתוני אימון, ומוגשים בחזרה למשתמשים ללא ייחוס, ללא תשלום, וללא שכבת האמון שמספקים סטנדרטים עריכתיים. המפרסם הופך לספק תוכן ללא תשלום למוצר המודיעין של מישהו אחר.

חלק מהמפרסמים כבר חותמים על עסקאות רישוי עם OpenAI ואחרים. זו התחלה, אבל זו עסקה חד־פעמית ברווחיות נמוכה. אתם מוכרים חומרי גלם כשיכולתם למכור מודיעין מזוקק. זה ההבדל בין ייצוא נפט גולמי לבין בניית בית זיקוק.

עתיד צריכת החדשות אינו הפיד. הוא השיחה. אנחנו נעים לעבר מה שאני רואה כ־Generative UI — ממשקים שמסתגלים לתשובה. בקשו ציר זמן, קבלו ציר זמן. בקשו השוואה, קבלו טבלה. בקשו תדרוך, קבלו PDF. האתר הסטטי מתמוסס לכדי קנבס נזיל ומסתגל למודיעין.

חברות מדיה ששולטות במבני הנתונים הבסיסיים — הווקטורים, הגרפים, הלוגיקה הזמנית — יגדירו את העתיד הזה. הן לא רק ישרדו את מות פיד החדשות. הן יבנו משהו טוב יותר ממה שהפיד אי פעם היה.

הארכיון אינו מרכז עלויות. הוא כל העסק. השאלה היחידה היא אם אתם תהיו אלה שיפתחו אותו, או אם תצפו במישהו אחר עושה זאת עם הנתונים שלכם.

הפסיקו למכור מילים. התחילו למכור תשובות.

Related Research

בינה מלאכותית שיחתית למוציאים לאור: RAG מעל ארכיוני חדשות | VeriprajnaSolution Page

The Death of the Feed: Media's Pivot to Conversational Intelligence | VeriprajnaInteractive Whitepaper

The Death of the Feed: Conversational Intelligence for MediaTechnical Deep-Dive

Also Published On

LinkedIn · Company LinkedIn · Founder YouTube Medium Instagram Facebook X