صورة معبّرة لأرشيف صحفي يتحوّل إلى رسم بياني معرفي متوهّج ومنظّم — تجسيدًا لأطروحة المقال حول تحويل الصحافة الجامدة إلى ذكاء حواري.
Artificial IntelligenceMediaTechnology

المقال الإخباري سياط عربات، وأرشيفك منجم ذهب

Ashutosh SinghalAshutosh Singhal8 فبراير 202613 min

كنت جالسًا في مواجهة المدير الرقمي لصحيفة عريقة — واحدة قرأتها بالتأكيد — عندما فتح رسمًا بيانيًا على حاسوبه المحمول وأداره نحوي. الزيارات العضوية، شهرًا بعد شهر، على مدى الأشهر الثمانية عشر الماضية. بدا الأمر وكأن أحدهم دفع صخرة عملاقة عن حافة جرف.

قال: "نحن نفعل كل شيء بشكل صحيح. مقالات أكثر، تحسين أفضل لمحركات البحث، تحميل أسرع للصفحات. ومع ذلك نحن نخسر."

لم يكن مخطئًا بشأن التنفيذ. كان مخطئًا بشأن اللعبة. لقد تغيرت اللعبة من تحته بينما كان يُحسِّن أداءه للعبة القديمة. وتلك المحادثة — التي جرت على قهوة فاترة في قاعة اجتماعات تطل على مرآب للسيارات — هي السبب الذي جعلني أقضي الأشهر التالية في بناء شيء أعتقد أنه سيعيد تعريف كيفية بقاء الشركات الإعلامية على قيد الحياة.

الفكرة الجوهرية بسيطة، بسيطة إلى حد يكاد يكون مؤلمًا: على الشركات الإعلامية أن تتوقف عن بيع المقالات وتبدأ ببيع الإجابات. موجز الأخبار قد مات. الأرشيف حيّ يُرزق. والتقنية اللازمة لسد تلك الفجوة — لتحويل خمسين عامًا من الصحافة إلى محرك ذكاء حواري — موجودة بالفعل. علينا فقط أن نبنيها بشكل صحيح.

لقد كتبتُ تحليلًا تفاعليًا معمّقًا حول هذه الأطروحة بأكملها إذا أردت الصورة الكاملة. لكن دعني أروي لك قصة كيف وصلنا إلى هنا، لأن الأرقام وحدها لا تعكس الدوار الذي يصيبك وأنت تشاهد أساس صناعة بأكملها يتصدع.

لماذا لم يعد أحد ينقر بعد الآن؟

رسم معلوماتي يوضح الإحصاءات الرئيسية لانهيار الزيارات المذكورة في المقال — معدلات البحث بلا نقر، وتراجع زيارات الناشرين، وتأثير النظرات العامة بالذكاء الاصطناعي — كي يستوعب القرّاء حجم الأزمة بلمحة واحدة.

إليك الحقيقة التي تُبقي المديرين التنفيذيين في الإعلام مستيقظين ليلًا: 60% من عمليات البحث على Google تنتهي الآن دون أي نقرة واحدة إلى أي موقع إلكتروني. وعلى الأجهزة المحمولة، تبلغ النسبة 77%. لقد أصبح Google هو الوجهة، لا البوابة. محرك البحث الذي بنى اقتصاد النشر الرقمي أصبح بهدوء أكبر منافسيه.

وحجم الضرر مذهل. في النصف الأول من عام 2025، شهد الناشر المتوسط تراجعًا في الزيارات بنسبة 10% على أساس سنوي. لكن كلمة "المتوسط" تخفي المذبحة. تراجعت CNN بنسبة تتراوح بين 27% و38%. وهبطت Forbes وBusiness Insider بنحو 50%. أما HubSpot — الشركة التي اخترعت فعليًا التسويق بالمحتوى الحديث — فقد خسرت 70-80% من زياراتها العضوية.

الجاني هو النظرات العامة بالذكاء الاصطناعي (AI Overviews). عندما يظهر ملخص Google المدعوم بالذكاء الاصطناعي في أعلى نتائج البحث — وهو ما يحدث الآن في نحو 13% من الاستعلامات — تنهار معدلات النقر إلى الروابط العضوية بنحو 47%. الذكاء الاصطناعي يقرأ المقالات كي لا يضطر المستخدم إلى ذلك.

أتذكر أنني وفريقي كنا نحدق في هذه الأرقام خلال جلسة عمل في وقت متأخر من المساء. قال أحدهم: "إذن الناشرون يُنشئون المحتوى، وذكاء Google الاصطناعي يلتهمه، والمستخدم لا يزور الموقع أبدًا؟" هذا صحيح تمامًا. والأمر يزداد سوءًا.

لم يعد محرك البحث محيلًا للزيارات. بل أصبح منافسًا على الانتباه.

الزيارات إلى منصات الذكاء الاصطناعي التوليدي — ChatGPT وPerplexity وClaude — تنمو بمعدل أسرع 165 مرة من الزيارات إلى البحث التقليدي. المستخدمون يطرحون أسئلة أطول وأكثر تعقيدًا. عمليات البحث المكوّنة من خمس كلمات أو أكثر تنمو بمعدل أسرع 1.5 مرة من استعلامات الكلمات المفتاحية القصيرة. الناس لا يريدون عشرة روابط زرقاء. يريدون إجابة واحدة جيدة.

المقال أثر من الماضي (وأقول ذلك بمحبة)

عليّ أن أكون حذرًا هنا لأنني أحب الصحافة الطويلة المعمّقة حقًا. أقرأها باستمرار. لكن عليّ أيضًا أن أكون صادقًا بشأن ما هو صيغة المقال فعليًا: وعاء صُمِّم للتوزيع المطبوع.

فكّر في الأمر. لقد طبعت قصة من 800 كلمة في صحيفة لأنك لم تكن قادرًا على طباعة 800 إجابة منفردة. كان التوزيع المادي مكلفًا ومتقطعًا، لذا جمعت المعلومات في سرديات. كان لذلك معنى تام في عام 1975. وكان له معنى لا بأس به في عام 2005، عندما انتقل المقال إلى الإنترنت لكن سلوك القراءة ظل كما هو تقريبًا.

لم يعد له أي معنى تقريبًا في عام 2025.

المستخدم الذي يبحث عن "ما هو موقف العمدة من الإسكان؟" لا يريد مقالًا مطوّلًا من 1,000 كلمة عن تاريخ تقسيم مناطق المدينة. إنه يريد موقف العمدة من الإسكان. النموذج التقليدي يُجبره على اجتياز مسار عقبات: بحث ← نقر ← تمرير ← مسح سريع ← قراءة ← استخلاص. كل خطوة احتكاك. كل خطوة فرصة لفقدانه.

خضتُ هذا النقاش مع صديقة صحفية دفعت بشدة في الاتجاه المعاكس. قالت: "أنت تختزل الصحافة إلى مجرد حقائق. القصص مهمة. السياق مهم. السرد مهم." وهي محقة تمامًا — بالنسبة لمقالات الرأي والتحقيقات والبورتريهات والريبورتاجات. تلك أشكال فنية. لكن الغالبية العظمى مما يملأ موجز الأخبار ليس فنًا. إنه معلومات محبوسة داخل صيغة غير فعّالة. والمستخدمون يصوّتون بسلوكهم: يفضّلون سؤال ذكاء اصطناعي على الخوض فيها.

ماذا لو لم يكن الأرشيف مقبرة؟

هنا انتقلت المحادثة مع ذلك المدير الرقمي من الكآبة إلى الإثارة الكهربائية.

سألته كم عدد المقالات في أرشيفهم. توقّف لحظة. قال: "ربما... بضعة ملايين؟ تعود إلى السبعينيات؟" قالها وكأنها عبء — تكلفة خوادم، وصداع صيانة.

قلت له إنها أثمن أصل تملكه شركته. أثمن من العلامة التجارية. أثمن من قائمة المشتركين. لأن تلك الملايين من المقالات، التي تمتد على خمسة عقود من السياسة المحلية والأعمال والجريمة والثقافة — تلك مجموعة بيانات لا تستطيع أي شركة ذكاء اصطناعي على وجه الأرض تكرارها دون إذنه.

المشكلة ليست في البيانات. المشكلة أنها محبوسة داخل كتل نصية غير منظّمة ومنفصلة بعضها عن بعض. المقال (أ) يذكر أن الشخص (س) يعمل في الشركة (ص). المقال (ب)، المنشور بعد ثلاث سنوات، يذكر أن الشركة (ص) متورطة في الفضيحة (ز). لا يوجد مقال واحد يربط الشخص (س) بالفضيحة (ز). لكن الصلة موجودة — مدفونة عبر الأرشيف، غير مرئية لأي شريط بحث، تنتظر من يجمعها معًا.

الناشرون الذين ينظرون إلى منتجهم بوصفه "مقالات" فقط إنما يصنعون سياط عربات في عصر السيارات.

ذلك الربط هو ما نبنيه في Veriprajna. ليست روبوتات محادثة. وليست أغلفة لـ GPT. بل محركات ذكاء.

سؤال العمدة الذي غيّر كل شيء

دعني أجعل هذا ملموسًا. تخيّل مستخدمًا — باحثًا في السياسات المحلية، أو مواطنًا مهتمًا، أو صحفيًا في منفذ إعلامي منافس — يريد أن يفهم كيف تطوّر موقف العمدة من الإسكان منذ عام 2010.

في النموذج القديم، يبحثون في موقع الصحيفة عن "موقف العمدة من الإسكان". يحصلون على خمسين نتيجة. يفتحون مقال 2010: "العمدة يعارض تطوير الأبراج السكنية." يفتحون مقال 2015: "العمدة يخفف موقفه وسط أزمة القدرة على تحمّل التكاليف." يفتحون مقال 2022: "العمدة يناصر مشروع قانون ابنِ الآن." يركّبون التطور ذهنيًا. يستغرق ذلك خمسًا وأربعين دقيقة إن كانوا سريعين.

في النموذج الذي نبنيه، يكتبون السؤال. يفكّك النظام السؤال إلى استعلامات فرعية زمنية. يتنقّل عبر رسم بياني معرفي — لا يبحث عن الكلمات المفتاحية فحسب، بل يتتبّع العلاقات بين كيان العمدة وكيان تطوير الإسكان عبر حواف مؤرّخة زمنيًا. يجد التحوّل في الموقف من سلبي (2010) إلى محايد (2015) إلى إيجابي (2022). يولّد سردًا مع استشهادات ترتبط بالمقالات الأصلية. يعرض تصورًا لخط زمني.

عشر ثوانٍ.

هذا ليس روبوت محادثة. هذا منتج ذكاء. وهو من النوع الذي يدفع المحترفون — جماعات الضغط والمحللون والمحامون واستراتيجيو الشركات — أموالًا طائلة مقابله.

لماذا لا يمكنك ببساطة تسليط GPT على أرشيف؟

أتمنى لو كان بمقدورك ذلك. لجعل عملي أسهل بكثير.

جرّبنا النهج الساذج في وقت مبكر. خذ المقالات، قطّعها إلى مقاطع من 500 كلمة، حوّلها إلى متجهات، أجرِ بحثًا بالتشابه، وأدخِل النتائج إلى نموذج لغوي كبير. هذا ما تفعله معظم تطبيقات "روبوتات الدردشة بالذكاء الاصطناعي". وبالنسبة لعمليات البحث البسيطة عن حقيقة واحدة في وثائق ثابتة، تعمل بشكل جيد.

أما بالنسبة لأرشيفات الأخبار، فإنها تفشل بطرق دقيقة وخطيرة.

إنه يفقد خيط السرد. التقطيع يكسر الأقواس السردية. مقطع يناقش حكمًا قضائيًا يُفصل عن المقطع الذي يصف الجريمة. النظام حرفيًا غير قادر على متابعة قصة تتكشّف عبر مقالات متعددة على مدى سنوات متعددة.

إنه أعمى عن الزمن. التشابه المتجهي لا يعرف في أي عام نحن. مقال من عام 2010 يقول "سوق الإسكان ينهار" مطابق دلاليًا لمقال من عام 2024 يقول الشيء نفسه. النظام يخلط بين واقع الماضي والواقع الحالي. لا يستطيع التمييز بين ما كان صحيحًا وما هو صحيح الآن.

لا يستطيع ربط النقاط. إذا لم يظهر الشخص (س) والفضيحة (ز) أبدًا في المقال نفسه، فلن يعثر الاسترجاع الساذج على الصلة أبدًا — حتى لو كانت الشركة (ص) تربط بينهما. يفتقر النظام إلى ما يسميه الباحثون "الاستدلال متعدد القفزات".

إنه يهلوس ليملأ الثغرات. عندما يُغفل الاسترجاع سياقًا ذا صلة، لا يقول النموذج اللغوي الكبير "لا أعرف". بل يخترع. يفبرك اقتباسات. يُنشئ أحداثًا لم تقع قط. في الصحافة، هذا ليس تقرير خطأ برمجي. بل دعوى قضائية.

تعلّمنا كل هذا بالطريقة الصعبة. كان هناك اختبار محدد — لن أُسمِّي المطبوعة — حيث نسب النظام الساذج بثقة اقتباسًا إلى سياسي لم يقل شيئًا يقارب ذلك على الإطلاق. الاقتباس بدا معقولًا. كان متسقًا نحويًا مع طريقة كلام السياسي. وكان مفبركًا تمامًا. كانت تلك اللحظة التي أدركت فيها أننا بحاجة إلى بنية معمارية مختلفة جوهريًا.

كيف تبني محرك ذكاء يعمل فعلًا؟

مخطط لبنية معمارية من ثلاث طبقات يوضح طبقات GraphRAG وTemporal RAG وسير العمل الوكيلي مع وظائفها المحددة وكيفية ترابطها، مما يجعل النظام التقني مفهومًا بلمحة واحدة.

البنية المعمارية التي طوّرناها في Veriprajna تتكوّن من ثلاث طبقات، كل منها يحل نمط فشل محدد. سأرسمها بإيجاز هنا — للاطلاع على التفصيل التقني الكامل، انظر ورقتنا البحثية.

الطبقة الأولى: GraphRAG. بدلًا من التعامل مع الأرشيف باعتباره كيسًا من المقاطع النصية المنفصلة، نستخرج رسمًا بيانيًا معرفيًا — كيانات (أشخاص ومنظمات ومواقع وأحداث) والعلاقات بينها. "إيلون ماسك" ← استحوذ على ← "تويتر." تُخزَّن هذه في قاعدة بيانات رسم بياني حيث يترابط كل مقال. عندما يطرح المستخدم سؤالًا معقدًا، لا يبحث النظام عن الكلمات المفتاحية فحسب. بل يتنقّل عبر الرسم البياني، قافزًا من عقدة إلى عقدة، عاثرًا على صلات تمتد عبر عقود وآلاف المقالات.

النتائج مذهلة. في مهام الاستدلال متعدد القفزات، أظهر GraphRAG تحسينات في الشمولية بنسبة 72-83% مقارنة بالنهج القائم على المتجهات فقط. يمكنه الإجابة عن "ما هي المواضيع الرئيسية في خمس سنوات من تغطية المناخ؟" — وهو سؤال لا يستطيع الاسترجاع الساذج حتى محاولة الإجابة عنه.

الطبقة الثانية: Temporal RAG. كل مقطع وكل حافة في الرسم البياني يُوسم ببيانات وصفية للوقت الصالح. العلاقات مُصدَّرة بإصدارات — حافة "الرئيس التنفيذي لشركة Apple" الخاصة بستيف جوبز لها حدود زمنية مختلفة عن تلك الخاصة بتيم كوك. عندما يطرح المستخدم سؤالًا تطوّريًا، يفكّك النظام السؤال إلى استعلامات فرعية زمنية ويجمّع النتائج ترتيبًا زمنيًا. يصبح الأرشيف آلة زمن.

الطبقة الثالثة: سير العمل الوكيلي. النموذج اللغوي الكبير لا يقتصر على الاسترجاع والإجابة. بل يخطّط. يقوم وكيل مُخطِّط بتفكيك طلب معقد ("اكتب تقرير عناية واجبة عن الشركة X") إلى مهام فرعية. ينفّذ وكيل باحث استعلامات موجّهة. يراجع وكيل ناقد النتائج بحثًا عن الثغرات والتناقضات قبل أن يرى المستخدم أي شيء. يوليّف وكيل كاتب المُخرج النهائي مع الاستشهادات.

نحن لا نغلّف واجهات برمجة التطبيقات. بل نعيد بناء أسس البنية التحتية للمعرفة.

وكيل الناقد ذاك بالغ الأهمية. إنه في جوهره مدقق حقائق مدمج — نداء ثانٍ لنموذج لغوي كبير يقارن كل ادّعاء مُولَّد بالوثائق المصدرية ويجرّد أي شيء غير مدعوم. مقترنًا بتعليمات صارمة للتأريض وفرض الاستشهاد، هذه هي الطريقة التي نحافظ بها على ما أعتبره سياسة عدم تسامح مطلق مع الفبركة.

ما الذي تعرفه صحيفة Financial Times ولا يعرفه أي شخص آخر؟

أطلقت FT خدمة "Ask FT" — واجهة حوارية تتيح للمشتركين المحترفين استجواب أرشيفهم. كل إجابة مؤرّضة حصريًا في صحافة FT. كل ادّعاء له استشهاد قابل للنقر. صُمّمت لسير عمل مهنية محددة: التحضير للاجتماعات، والعناية الواجبة السريعة، وتحليل الاتجاهات.

ذهبت Bloomberg إلى أبعد من ذلك مع BloombergGPT، وهو نموذج لغوي كبير متخصص في مجال بعينه يترجم اللغة الطبيعية إلى لغة استعلام Bloomberg (Bloomberg Query Language). يمكن لمحلل أن يسأل "أرِني نمو الإيرادات لشركات التكنولوجيا في الربع الثالث من 2024" فيحصل على جدول منسّق. يمكنهم استجواب نصوص مكالمات الأرباح — بالسؤال عن نبرة رئيس تنفيذي حيال عامل خطر محدد — بدلًا من قراءة مئات الصفحات خطيًا.

هذه ليست تجارب. إنها نماذج أعمال. وهي تشير إلى المكان الذي توجد فيه الأموال فعلًا.

من أين تأتي الأموال؟

مخطط لنموذج إيرادات ثلاثي المستويات يوضح طبقات تحقيق الدخل: مستوى الذكاء، وترخيص واجهة برمجة التطبيقات، وخندق البيانات، مع تفاصيل رئيسية، مما يساعد القرّاء على استيعاب بنية نموذج الأعمال بسرعة.

يسألني الناس دائمًا عمّا إذا كان نموذج "الذكاء كخدمة" هذا قادرًا فعلًا على أن يحل محل إيرادات الإعلانات. جوابي الصادق: لا حاجة لأن يحل محلها كلها. يحتاج فقط إلى أن يحل محل الجزء الذي يتلاشى.

تتفكك المعادلة الاقتصادية إلى ثلاثة مستويات.

أولًا، اشتراك مستوى الذكاء — ليس 10 دولارات شهريًا لـ "قراءة الأخبار"، بل أكثر من 1,000 دولار سنويًا للمحترفين الذين يحتاجون إلى وصول عميق للأرشيف، وسير عمل وكيلي، وأبحاث مدعومة بالاستشهادات. محترفو التمويل، وفرق الاستخبارات المؤسسية، ومكاتب المحاماة التي تجري أبحاثًا تنظيمية. هؤلاء المستخدمون موجودون. وهم يدفعون حاليًا لمحللين كي يؤدوا يدويًا ما يؤديه نظام مبني جيدًا في ثوانٍ.

ثانيًا، ترخيص واجهة برمجة التطبيقات. بدلًا من محاربة زواحف الذكاء الاصطناعي بملف robots.txt، صُغ تبادل البيانات بشكل رسمي. بِع وصولًا نظيفًا ومحوّلًا إلى متجهات ومنظّمًا في رسم بياني إلى منصات البحث المؤسسية، وطرفيات التمويل، والمطورين الخارجيين. اطلب رسومًا لكل استعلام أو لكل رمز مميز (توكن). يعيش ذكاء الناشر داخل سير عمل العميل.

ثالثًا، وهذا هو الجزء الذي يغفله معظم الناس: خندق البيانات نفسه. في عالم يستطيع فيه أي شخص الوصول إلى GPT-4، لا يكون النموذج هو الميزة التنافسية. البيانات هي كذلك. أرشيف الأخبار المحلية الممتد على خمسين عامًا هو مجموعة بيانات لا تستطيع OpenAI تكرارها. الرسم البياني المعرفي المشتق من ذلك الأرشيف — شبكة أصحاب النفوذ المحليين، والخط الزمني للتحوّلات في السياسات، وشبكة العلاقات المؤسسية — هو ملكية فكرية خاصة تتضاعف قيمتها بمرور الوقت.

في عالم من نماذج الذكاء الاصطناعي المُسلَّعة، الخندق ليس الخوارزمية. بل الأرشيف.

ماذا عن الصحفيين؟

يُطرح عليّ هذا السؤال باستمرار، وأعتقد أنه يستحق إجابة مباشرة بدلًا من المراوغة. هذا التحوّل لا يقضي على الصحافة. بل يقضي على عدم كفاءة الطريقة التي تصل بها الصحافة إلى الناس. المراسل الذي يقضي ثلاثة أشهر في التحقيق في فضيحة فساد يؤدي عملًا لا يستطيع أي ذكاء اصطناعي تكراره. النظام الذي نبنيه يجعل ذلك العمل أكثر قابلية للاكتشاف، وأكثر قابلية للاستعلام، وأكثر قيمة بمرور الوقت. إنه يحوّل قصة تُقرأ لأسبوع ثم تُدفن في الصفحة 47 من نتائج البحث إلى عقدة دائمة قابلة للاسترجاع في رسم بياني معرفي تطفو على السطح في كل مرة يطرح فيها أحدهم سؤالًا ذا صلة خلال الخمسين عامًا القادمة.

التهديد للصحافة ليس الذكاء الاصطناعي الحواري. التهديد هو اقتصاد الإحالة المنهار الذي يموّل الصحافة. إذا اختفت الزيارات — وقد اختفت فعلًا — فإن التشبث بنموذج الموجز المدعوم بالإعلانات ليس ولاءً للحرفة. إنه إنكار.

ماذا يحدث إذا لم تتحوّل الشركات الإعلامية؟

شيء أسوأ من التراجع: اللاأهمية. تُكشط أرشيفاتها بواسطة شركات الذكاء الاصطناعي، وتُصهر في بيانات تدريب، وتُقدَّم مجددًا للمستخدمين دون إسناد، ودون دفع، ودون طبقة الثقة التي توفرها المعايير التحريرية. يصبح الناشر موردًا للمحتوى بلا أجر لمنتج ذكاء يخص شخصًا آخر.

بعض الناشرين يوقّعون بالفعل صفقات ترخيص مع OpenAI وغيرها. تلك بداية، لكنها معاملة منخفضة الهامش لمرة واحدة. أنت تبيع موادّ خامًا في حين كان بإمكانك بيع ذكاء مكرّر. إنه الفرق بين تصدير النفط الخام وبناء مصفاة.

مستقبل استهلاك الأخبار ليس الموجز. إنه المحادثة. نحن نتجه نحو ما أعتبره واجهة مستخدم توليدية (Generative UI) — واجهات تتكيّف مع الإجابة. اطلب خطًا زمنيًا، تحصل على خط زمني. اطلب مقارنة، تحصل على جدول. اطلب موجزًا، تحصل على ملف PDF. يذوب الموقع الثابت في لوحة سائلة متكيّفة للذكاء.

الشركات الإعلامية التي تتقن بنى البيانات الأساسية — المتجهات، والرسوم البيانية، والمنطق الزمني — هي التي ستحدد هذا المستقبل. لن تنجو فقط من موت موجز الأخبار. بل ستبني شيئًا أفضل مما كان عليه الموجز على الإطلاق.

الأرشيف ليس مركز تكلفة. إنه الأعمال بأكملها. السؤال الوحيد هو ما إذا كنت ستكون أنت من يطلق العنان له، أم أنك ستشاهد شخصًا آخر يفعل ذلك ببياناتك.

توقّف عن بيع الكلمات. ابدأ ببيع الإجابات.

Related Research

Also Published On