أرشيفكم هو الأصل. كُفّوا عن ترك Google تؤجّره مجانًا.

نبني محركات ذكاء اصطناعي حوارية فوق أرشيفات الناشرين. إجابات مُلزَمة بالاستشهاد المصدري، واستدلال زمني، وحلّ هوية الكيانات عبر GraphRAG، واستراتيجية ترخيص موازية تلتقط الإيرادات من محركات الذكاء الاصطناعي التي لا تتحكمون بها. للناشرين متوسطي الحجم الذين لا يستطيعون تحمّل تكلفة فريق تعلّم آلي من ستة مهندسين، لكنهم لا يستطيعون تحمّل الانتظار كذلك.

للناشرين الذين يفقدون حركة البحث لصالح نظرات الذكاء الاصطناعي العامة (AI Overviews)

48%

من استعلامات Google تعرض الآن نظرات الذكاء الاصطناعي العامة (AI Overviews)

theStacc / Search Engine Land، مارس 2026

-33%

حركة البحث للناشرين على أساس سنوي، حتى نوفمبر 2025

Reuters Institute، 2026

-43%

تراجع إضافي يتوقعه مدراء الأخبار التنفيذيون بحلول 2029

استطلاع Reuters Institute Trends 2026

اقتصاد الإحالة قد انتهى. واقتصاد الترخيص لم يُبنَ بعد.

سيناريو محدد، لا مشكلة مجرّدة.

صحيفة يومية إقليمية بأربعة ملايين زائر فريد شهريًا وأرشيف عمره 32 عامًا تُجري حساباتها في ملف اجتماع مجلس إدارتها لشهر فبراير 2026. إحالات البحث العضوي منخفضة بنسبة 41% على أساس سنوي. أسعار CPM البرمجية منخفضة بنسبة 18% أخرى. وإيرادات التسويق بالعمولة لديها، التي أبقت نموذج العمل على قيد الحياة في 2023، انهارت إلى ثلث ذروتها. المسار نفسه الذي استشهدت به Penske Media في دعواها لمكافحة الاحتكار ضد Google في سبتمبر 2025. يطرح المدير المالي السؤال البديهي: ما الذي تدين به Google لنا بالضبط، وكيف نجعلها تدفع؟

الإجابة غير مريحة. لا تدين Google لهم بأي شيء تعاقديًا. الاتفاق غير المكتوب (أنتم تتيحون لنا الزحف، ونحن نرسل لكم حركة المرور) أُعيدت صياغته من طرف واحد عندما بدأت نظرات الذكاء الاصطناعي العامة (AI Overviews) بالظهور على 48% من الاستعلامات. عندما تظهر نظرة ذكاء اصطناعي عامة فوق رابط عضوي، قاست Daily Mail انخفاضًا بنسبة 89% في نسبة النقر على سطح المكتب. وجد استطلاع Pew لشهر مارس 2025 أن المستخدمين الذين يصادفون نظرة ذكاء اصطناعي عامة ينقرون للوصول إلى رابط تقليدي في 8% فقط من جميع الزيارات. محتوى الناشر لا يزال يُقرأ. والناشر لم يعد يتقاضى أجرًا.

في الوقت نفسه، الاستجابة البديهية، "نبني ذكاءنا الاصطناعي الخاص"، لها نسيجها الندبي الخاص. أطلقت Washington Post خدمة Ask The Post AI في نوفمبر 2024. وبحلول ديسمبر 2025، تسرّبت رسائل Slack داخلية من محرّر المعايير: كان البودكاست المُولَّد بالذكاء الاصطناعي لديهم يختلق الاقتباسات، ويسيء نسبة المصادر، ويُدرج تعليقات وكأنها الموقف التحريري للصحيفة. "من المذهل حقًا أن يُسمح لهذا بالمضيّ قُدمًا على الإطلاق،" كتب أحد المحررين، "ما كنت لأتخيّل أبدًا أن تشوّه Washington Post صحافتها عمدًا، ثم تدفع بهذه الأخطاء إلى جمهورنا على نطاق واسع." كان الخلل التقني خطوة تحقق من الاستشهاد المصدري مفقودة. أما الضرر الذي لحق بالسمعة فكان عالميًا.

هذه هي الصورة الحقيقية للمشكلة. لا يستطيع الناشرون متوسطو الحجم تحمّل عدم فعل أي شيء. محرك البحث الذي بنى توزيعهم أصبح الآن أكبر منافسيهم. كما لا يمكنهم تحمّل إطلاق روبوت محادثة يهلوس تحت عنوانهم الرئيسي. ولا يمكنهم استنساخ فرق التعلّم الآلي الداخلية التي بنتها FT وBloomberg وNew York Times قبل الهاوية. إنهم بحاجة إلى شريك بناء أنجز العمل غير البرّاق: استيعاب الأرشيف، وحلّ هوية الكيانات، وفرض الاستشهاد المصدري، وقوائم انتظار المراجعة التحريرية، واستراتيجية ترخيص موازية تلتقط الإيرادات من محركات الذكاء الاصطناعي التي لن يمتلكوها أبدًا.

مشهد الذكاء الاصطناعي للناشرين، من البداية إلى النهاية

اعرض هذا في اجتماع استراتيجيتك القادم. لقد حاولنا أن نكون صادقين بشأن ما يفعله كل خيار وما لا يفعله.

الخيار ما يفعله فعليًا أين يقصُر
بائع روبوت محادثة كخدمة (Tars، أغلفة بحث أساسية داخل الموقع) يضع أداة محادثة على موقعك. تضمينات متجهية لمقالاتك. مُسعّر بـ 60K$-120K$، يُنشر خلال أسابيع. لا حلّ لهوية الكيانات. لا استدلال زمني. لا تحقق من الاستشهاد المصدري. يهلوس على الاستعلامات المهمة (متعددة القفزات، الطولية). أرشيفك في سحابتهم.
بناء داخلي لدى الخمسة الكبار (FT، NYT، Bloomberg، WaPo، Guardian) RAG مخصص فوق أرشيف مملوك. يعمل Ask FT على Anthropic Claude مع استشهادات إلزامية. لدى Bloomberg نموذج BloombergGPT وترجمة BQL. بُني على يد فرق تعلّم آلي من 6-20 مهندسًا على مدى 12-24 شهرًا. التكلفة تصل إلى سبعة أرقام. لا يستطيع الناشرون متوسطو الحجم استنساخ عدد الموظفين، نقطة انتهى.
الأربعة الكبار / مُكامِل أنظمة كبير (Accenture، Deloitte، IBM iX) سيبنونه. أنجزوا أعمال ذكاء اصطناعي توليدي لقطاعات مجاورة. تتراوح المشاركات بين 1.5M$-5M$+ مع مرحلة استكشاف تدوم أطول من مدّتك المالية المتبقية. يلجؤون إلى المكدّس نفسه من Microsoft GraphRAG وNeo4j الذي نستخدمه، لكنهم يفرضون رسوم استشارات من فئة الشركاء فوق ذلك. لم يبنوا خمسة أرشيفات ناشرين متتالية.
Cloudflare Pay Per Crawl (يناير 2026) يحظر زواحف الذكاء الاصطناعي افتراضيًا عبر ~20% من حركة الويب العالمية. يتيح لك ضبط السماح / فرض الرسوم / الحظر لكل زاحف بسعر لكل طلب على مستوى النطاق بالكامل. لا يمنع نظرات الذكاء الاصطناعي العامة (AI Overviews) من تلخيص محتواك (إذ تسترجع وقت الاستعلام). لا يُولّد احتفاظًا. مجرد التقاط للتسرّب، واكتشاف السعر لا يزال غير ناضج.
News/Media Alliance + ProRata (مارس 2026) مجمّع ترخيص جماعي لـ 2,200 ناشر صغير/متوسط. حصة إيرادات 50/50 على إجابات الذكاء الاصطناعي المتتبَّعة بالإسناد عبر Gist.ai. تتولى NMA الأعمال الورقية. تعتمد الإيرادات على اكتساب Gist.ai للتبني في مواجهة ChatGPT وPerplexity وGemini. أيام مبكرة. اتفاق NMA+Bria الموازي خاص بـ RAG المؤسسي فقط.
Tollbit / رسوم عبور الروبوتات المباشرة يفرض رسومًا لكل طلب زحف، بآلية مشابهة لـ Cloudflare لكن قابلة للضبط روبوتًا بروبوت. اختبرتها Boston Globe وVox وFuture. القيد البنيوي نفسه مثل Cloudflare: يلتقط إيرادات الزاحف، لا إيرادات الاستعلام. على الناشرين الصادقين تشغيل كلٍّ من Tollbit ولعبة جانب الاستعلام معًا.
Veriprajna (نحن) بناء مخصص للمحرك الحواري على مكدّسك، مع فرض الاستشهاد المصدري، وحلّ هوية الكيانات عبر GraphRAG، والاستدلال الزمني، والحوكمة التحريرية. بالإضافة إلى دمج ProRata وBria وTollbit وCloudflare في استراتيجية إيرادات واحدة. نحن جهة استشارية، لا برمجيات كخدمة. نحن لا نحلّ عدم تماثل القوة بين المنصات. حكومتكم وحدها قادرة على ذلك. لن نتظاهر بأن دولارات الترخيص من ProRata أو Bria ستُعوّض 100% من إيرادات البحث المفقودة. لن تفعل ذلك، في 2026.

ما نبنيه للناشرين

كل مشاركة مخصصة. هذه هي مجالات القدرات الأربعة التي يُطلب منا دائمًا الجمع بينها.

1. استيعاب الأرشيف وحلّ هوية الكيانات

الـ 60% غير البرّاقة من كل مشروع. التعرف الضوئي على الحروف (OCR) المدرك للتخطيط للميكروفيلم الممسوح ضوئيًا وملفات PDF لما قبل 2005 (Tesseract للمستندات النظيفة، وAzure Document Intelligence أو Google Document AI لصفحات الصحف كثيفة الأعمدة). تقسيم دلالي يحترم العناوين الرئيسية والمقدمات وأسماء الكُتّاب بدلًا من التقطيع كل 500 كلمة. إثراء البيانات الوصفية بتاريخ النشر والمؤلف والقسم، والتعرف على الكيانات المُسمّاة (NER) للأشخاص والمنظمات والمواقع ومشاريع القوانين والقضايا.

ثم مرحلة حلّ هوية الكيانات: دمج "Mr. Musk" و"Elon Musk" و"الرئيس التنفيذي لـ Tesla" في عقدة واحدة، والتمييز بين "John Smith عضو المجلس" و"John Smith المدير" عبر 25 عامًا من أسماء الكُتّاب. نجمع بين الاستخراج القائم على نماذج اللغة الكبيرة وقواعد حتمية مضبوطة لمجال تغطيتكم، ثم مراجعة بشرية لأهم 200 كيان حسب عدد المقالات. يتولى Senzing أو Neo4j Graph Data Science الجانب الخوارزمي. أما القرارات التقديرية فهي مسؤوليتنا ومسؤوليتكم، معًا.

2. GraphRAG مع الاستدلال الزمني

البحث المتجهي وحده لا يستطيع الإجابة على "كيف تغيّر موقف العمدة من الإسكان بين 2010 و2024" لأن الإجابة ليست في أي مقطع منفرد. نعالج الأرشيف إلى رسم بياني معرفي بـ Neo4j أو Amazon Neptune بحواف مُصنَّفة (HAS_STANCE، ENDORSED_BY، VOTED_ON)، ثم نُؤرّخ كل حافة بطابعَي زمن valid_start وvalid_end مستمدَّين من تواريخ النشر.

وقت الاستعلام، يقوم مخطط وكيلي بتفكيك السؤال إلى استعلامات فرعية زمنية، ويجتاز الرسم البياني، ويجمّع سردًا زمنيًا مع استشهادات مدمجة. نستخدم Microsoft GraphRAG كعمود فقري مفتوح المصدر ونخصّص مطالبات استخراج الكيانات لمجالات تغطيتكم المحددة. للأرشيفات الأطول نضيف طبقة T-GRAG (arXiv 2510.13590) للاسترجاع الحساس للزمن. هذا هو الفرق بين روبوت محادثة يجد المقالات وآخر يصوغ القصة عبرها.

3. فرض الاستشهاد المصدري والمراجعة التحريرية

حادثة بودكاست Washington Post هي الحالة التحذيرية. ثلاث طبقات، لا اختصارات. أولًا، مطالبة نظام صارمة بالتأريض تمنع أي ادعاء غير موجود في السياق المسترجَع. ثانيًا، مُتحقِّق لاحق (استدعاء نموذج لغة كبير منفصل) يفحص كل جملة مُولَّدة في مقابل مصدرها المُستشهَد به ويُسقط أي جملة لا يحتوي استشهادها فعليًا على الادعاء. ثالثًا، عتبة ثقة توجّه الإجابات منخفضة الثقة إلى قائمة انتظار للمراجعة التحريرية قبل أن تصل إلى المستخدم، مع مستويات شدّة قابلة للضبط.

نزوّد سجل الإجابات بأدوات قياس بحيث يستطيع مكتب المعايير لديكم تدقيق أي جلسة خلال ساعة. كما نبني "مفتاح إيقاف"، عنصر تحكم واحد في لوحة معلومات يُعطّل الأداة العامة مع إبقاء الواجهة الخلفية تعمل للهندسة. مملّ، أساسي، وغير موجود أبدًا في روبوت محادثة كخدمة.

4. استراتيجية إيرادات مزدوجة: محرك احتفاظ + التقاط التسرّب

تبيع لك معظم الجهات الاستشارية لعبة واحدة. الإجابة الصادقة هي أنك بحاجة إلى كلتيهما. لعبة الاحتفاظ هي محركك الحواري الخاص، مُغلَّف كطبقة اشتراك "Intelligence" متميزة (نموذج Ask FT: 1,000$+/سنة لكل مستخدم محترف مع استعلامات وكيلية غير محدودة). أما لعبة التقاط التسرّب فهي الاشتراك في ProRata (حصة إيرادات 50/50 عبر Gist.ai)، وBria (استخدام الذكاء الاصطناعي الداخلي للمؤسسات)، وTollbit (رسوم عبور الروبوتات المباشرة)، بالإضافة إلى وضعية Cloudflare Pay Per Crawl تحظر GPTBot وClaudeBot وCCBot وGoogle-Extended بينما تفرض رسومًا على Perplexity وMistral.

ندمج لوحات معلومات الترخيص مع تحليلات الإيرادات الحالية لديكم بحيث يرى مديركم المالي عرضًا واحدًا، لا خمسة. لن نعد بأن دولارات الترخيص ستُعوّض إيرادات البحث المفقودة في 2026. لكننا سنعدكم بأنكم لا تتركونها على الطاولة.

كيف نعمل

لا عرض تقديمي استكشافي يستغرق ربع سنة. لا وثيقة استراتيجية من 80 صفحة. نُطلق أداة محادثة عاملة أمام فريقكم التحريري في الأسبوع الثامن ونكرّر التحسين من هناك.

المرحلة 0: تدقيق الأرشيف (أسبوعان، سعر ثابت)

نأخذ عيّنة بنسبة 1% من أرشيفك، ونقيس صعوبة الاستيعاب (تصدير Arc XP نظيف مقابل ميكروفيلم ممسوح ضوئيًا مقابل HTML معطوب من 2003)، ونعدّ جردًا أوليًا لأهم 200 شخص/منظمة/مكان لديكم، ونُسعّر البناء الكامل بفاصل ثقة قابل للدفاع. التباين بين أفضل وأسوأ حالة للاستيعاب وحده هو نحو 8 إلى 1 في الجهد. نعطي مديركم المالي رقمًا، لا نطاقًا.

المرحلة 1: الاستيعاب والفهرس الهجين (الأسابيع 3-8)

بناء خط أنابيب الاستيعاب (OCR، التقسيم الدلالي، إثراء البيانات الوصفية). إقامة طبقة الاسترجاع الهجين: بحث BM25 المتناثر للمطابقات الدقيقة للكيانات بالإضافة إلى تضمينات متجهية كثيفة للتشابه الدلالي، مع مُعيد ترتيب Cohere أو BGE فوقها. نشر أداة المحادثة إلى بيئة مرحلية يستطيع محرروكم كسرها في الخفاء.

المرحلة 2: رسم بياني للكيانات وطبقة زمنية (الأسابيع 9-18)

تشغيل استخراج الكيانات وحلّ هويتها عبر الأرشيف الكامل. إقامة Neo4j بحواف مُؤرّخة بإصدارات. إضافة مُفكِّك الاستعلامات الزمني. بنهاية المرحلة 2 تستطيع أداة المحادثة الإجابة على "كيف تطوّر X عبر Y من السنوات" بإجابة مرتبة زمنيًا ومدعومة بالاستشهاد المصدري.

المرحلة 3: فرض الاستشهاد المصدري، المراجعة التحريرية، الإطلاق الناعم (الأسابيع 19-24)

نشر مُتحقِّق الاستشهاد المصدري اللاحق، وقائمة انتظار المراجعة بعتبة الثقة، وأدوات تدقيق مكتب المعايير. فتح الأداة لنسبة صغيرة من المشتركين المُصادَق عليهم خلف علامة ميزة. ضبط سياسة طول الإجابة وقوالب الرفض في مقابل سجلات استعلام حقيقية، لا معايير اصطناعية.

المرحلة 4: دمج الترخيص وطبقة Intelligence (الأسبوع 25 وما بعده)

ربط إسناد ProRata وBria بلوحة معلومات إيراداتكم. تكوين قواعد Cloudflare Pay Per Crawl لكل زاحف. مساعدة المنتج والتسعير في تصميم طبقة Intelligence وتدفق تجربتها. تسليم الملكية التشغيلية إلى فريقكم مع مدّة دعم مقترن مدتها 90 يومًا.

تحفّظ صادق: تفترض الجداول الزمنية أرشيفًا من 100K-500K مقال على Arc XP أو Brightspot أو WordPress VIP. أرشيف علمي من 5 ملايين مقال على Atypon، أو كومة ميكروفيلم ممسوحة ضوئيًا من التسعينيات، يمكن أن يضيف 8-16 أسبوعًا إلى المرحلة 1 وحدها. تدقيق المرحلة 0 موجود لاكتشاف هذا قبل أن توقّعوا على رقم.

تقييم جاهزية الأرشيف

ثمانية أسئلة. تخبرك أي مرحلة ستهيمن على تكلفة بنائك وما الذي ينبغي إصلاحه قبل طلب عرض سعر من أي بائع.

أسئلة يطرحها الناشرون علينا فعليًا

كم تكلفة بناء روبوت محادثة RAG للناشرين فوق أرشيفنا؟

لأرشيف عمره 10-25 عامًا يضم 100K-500K مقال، يبلغ المحرك الحواري بمستوى إنتاجي نحو 180K$-450K$ للبناء الأولي، بالإضافة إلى 4K$-15K$ شهريًا للاستدلال وتخزين المتجهات واستدعاءات مُعيد الترتيب عند أحجام استعلام نموذجية لناشر متوسط الحجم. خط أنابيب الاستيعاب هو أكبر بند، وعادةً 50-60% من تكلفة البناء. يعتمد التباين على ثلاثة أمور: مدى نظافة الأرشيف بالفعل (تصدير Arc XP حديث مقابل ميكروفيلم ممسوح ضوئيًا من التسعينيات)، وما إذا كنتم بحاجة إلى طبقة رسم بياني معرفي للاستعلامات متعددة القفزات، وعمق أدوات المراجعة التحريرية. غلاف روبوت محادثة كخدمة يبيعه بائع منصة سيسعّر لك 60K$ لكنه سيهلوس على الاستعلامات المهمة، لأنه لم يبنِ أبدًا عرضًا محلولًا للكيانات لأرشيفكم المحدد.

إذا بنينا ذكاءنا الاصطناعي الحواري الخاص، فهل سيلتهم مشاهدات صفحات اشتراكنا؟

تشير البيانات المبكرة من FT Professional وBloomberg Terminal إلى الاتجاه المعاكس. زاد Ask FT ما تسميه FT داخليًا تفاعل القارئ الأساسي الفعلي عبر إبراز محتوى الأرشيف دائم الخضرة الذي ما كان المشتركون ليجدوه بطريقة أخرى. مخاوف الالتهام تفترض مجمّعًا ثابتًا من النيّة. في الواقع، تسحب الاستعلامات الحوارية المستخدمين إلى جلسات أعمق حول مواضيع كانوا سيهجرونها بعد تصفّح سريع لنتيجة بحث واحدة. الخطر حقيقي بالنسبة للمحتوى الإخباري العام الخفيف حيث يستطيع روبوت المحادثة تلخيص مقال واحد في فقرة واحدة. وهو أقل بكثير بالنسبة للمحتوى التحليلي والطولي والاستقصائي حيث تكون تجربة المحادثة مساعد بحث، لا ملخصًا (TL;DR). نحدّد حجم طبقة التسعير وسياسة طول الإجابة لتطابق عمق محتواكم، لا لنسخ قالب من ناشر مختلف.

هل ينبغي أن نحظر زواحف الذكاء الاصطناعي باستخدام Cloudflare Pay Per Crawl، وهل ستُزيلنا Google من الفهرسة إن فعلنا؟

يتيح لك Cloudflare Pay Per Crawl، الذي أُطلق في يناير 2026 عبر نحو 20 بالمئة من حركة الويب العالمية، ضبط السماح أو فرض الرسوم أو الحظر لكل زاحف بسعر على مستوى النطاق. الإجابة الصحيحة تقنيًا هي أنه يمكنك حظر GPTBot وClaudeBot وCCBot وPerplexityBot مع الاستمرار في السماح لـ Googlebot وBingbot، لأن Google تفصل علنًا زحف Googlebot عن Google-Extended (جالب تدريب Gemini). حظر Google-Extended لا يؤثر على ترتيب البحث. أما الشاغل السياسي فهو أن نظرات الذكاء الاصطناعي العامة (AI Overviews) من Google لا تزال تُبرز محتوى من الصفحات المُفهرسة حتى عند حظر Google-Extended، لأنها تسترجع وقت الاستعلام. لذا فالحظر لا يمنع محتواك من أن يُلخَّص في AIO، بل يمنع فقط استخدامه لتدريب إصدارات Gemini المستقبلية. الوضعية القابلة للدفاع لمعظم الناشرين متوسطي الحجم في 2026 هي: حظر GPTBot وClaudeBot وCCBot وGoogle-Extended. فرض الرسوم على PerplexityBot وMistral. السماح لـ Googlebot وBingbot. ثم توجيه دولارات الترخيص عبر ProRata وBria وTollbit لالتقاط الإيرادات من محركات الذكاء الاصطناعي التي لا تتحكمون بها.

من المسؤول عندما يختلق مساعد الذكاء الاصطناعي لدينا اقتباسًا أو يسيء نسبة قصة؟

أنتم المسؤولون. حادثة بودكاست الذكاء الاصطناعي لـ Washington Post من ديسمبر 2025 (اقتباسات خيالية، وإدراج تعليقات على أنها الموقف التحريري للصحيفة) هي الحالة التحذيرية التي حوّلت هذا من فرضية إلى سؤال على مستوى مجلس الإدارة للناشرين. لا توجد حماية بموجب المادة 230 (Section 230) للمحتوى الذي يولّده نظامكم الخاص من أرشيفكم الخاص؛ يُعامَل مُخرَج الذكاء الاصطناعي على أنه منتَج عملكم التحريري. التخفيفات معمارية، لا تعاقدية. نفرض ثلاث طبقات: مطالبة نظام صارمة بالتأريض تمنع استخدام أي معرفة خارج المقاطع المسترجَعة، وتحقق لاحق من الاستشهاد المصدري يُسقط أي جملة لا يحتوي مصدرها المُستشهَد به على الادعاء، وعتبة ثقة توجّه الإجابات منخفضة الثقة إلى قائمة انتظار للمراجعة التحريرية قبل أن تصل إلى المستخدم. كما نزوّد سجل الإجابات بأدوات قياس بحيث يستطيع مكتب المعايير لديكم تدقيق أي جلسة خلال ساعة من وقوعها. لا شيء من هذا موجود في غلاف روبوت محادثة كخدمة.

كيف يساعد GraphRAG فعليًا على أرشيف إخباري مقابل RAG متجهي عادي؟

يسترجع RAG المتجهي مقاطع متشابهة دلاليًا مع الاستعلام. هذا يعمل لاسترجاع الحقائق. وهو يفشل في الاستعلامات التي تجعل أرشيفًا إخباريًا ذا قيمة: كيف تطوّر موقف العمدة من الإسكان عبر 12 عامًا. من يربط الشخص X بالفضيحة Z عبر أي منظمات وسيطة. ما المصادر المتكررة المُستشهَد بها في تغطية جدل مجلس المدرسة. هذه استعلامات متعددة القفزات وطولية ومدفوعة بالكيانات. يقوم GraphRAG بمعالجة الأرشيف مسبقًا إلى رسم بياني للكيانات (أشخاص، منظمات، أماكن، أحداث) بعلاقات مُصنَّفة، ثم يجتاز الرسم البياني وقت الاستعلام. الجزء الصعب ليس قاعدة بيانات الرسم البياني (يتولاها Neo4j أو Amazon Neptune). الجزء الصعب هو حلّ هوية الكيانات: دمج 'Mr. Musk' و'Elon Musk' و'الرئيس التنفيذي لـ Tesla' و'مالك X' في عقدة واحدة، والتمييز بين 'John Smith عضو مجلس المدينة' و'John Smith مدير المدرسة الثانوية' عبر 25 عامًا من أسماء الكُتّاب وأخطاء المراسلين المؤقتين المطبعية. نستخدم مزيجًا من الاستخراج القائم على نماذج اللغة الكبيرة، وقواعد حتمية لحلّ هوية الكيانات مضبوطة لمجال تغطيتكم، ومراجعة بشرية لأهم 200 كيان حسب عدد المقالات. هذا هو الجزء الذي لن يفعله أحد غيرنا لكم.

نستخدم Arc XP / WordPress VIP / Brightspot. كيف يتكامل هذا مع نظام إدارة المحتوى (CMS) لدينا؟

المحرك الحواري خدمة منفصلة تستهلك تغذية من نظام إدارة المحتوى (CMS) لديكم وتُتيح واجهة برمجة محادثة (chat API) عائدة إلى موقعكم. يختلف نمط التكامل حسب المكدّس. يُتيح Arc XP واجهة Content API وخطافات ويب (webhooks) لكن دون خطافات تضمين، لذا نشغّل مهمة مزامنة تسحب القصص الجديدة والمُحدَّثة كل خمس دقائق وتُعيد تضمينها. يدعم WordPress VIP نقاط نهاية REST مخصصة، وننشر عادةً كخدمة مصغّرة منفصلة بالإضافة إلى كتلة Gutenberg لأداة المحادثة. Brightspot هو الأكثر مرونة بفضل نموذج أنواع المحتوى لديه، ما يجعل استخراج البيانات الوصفية المنظمة أنظف بكثير. ناشرو Atypon (معظمهم علميون) يقفون إلى جانب بحث Literatum بدلًا من استبداله. في كل حالة، أداة المحادثة تضمين JS يستطيع محرروكم إسقاطه على أي صفحة، والواجهة الخلفية تعمل في حساب سحابتكم، لا حسابنا. نحن لا نقيّدكم بخدمة مُستضافة.

هل ينبغي أن ننضم إلى News/Media Alliance أو ProRata أو Bria، أم نبني محركنا الخاص، أم كليهما؟

كليهما، وهما يحلان مشكلات مختلفة. اتفاق NMA + ProRata المُعلَن في مارس 2026 هو مجمّع ترخيص جماعي: يمكن لـ 2,200 ناشر الاشتراك لتحقيق إيرادات من الطلب المؤسسي المدفوع بـ RAG مقابل حصة إيرادات 50/50، مُتتبَّعة بالإسناد. Bria هو الاتفاق الموازي الذي يستهدف استخدام الذكاء الاصطناعي الداخلي للمؤسسات. هذه التقاط للتسرّب، إذ تدفع لكم عندما يستخدم محتواكم محرك ذكاء اصطناعي لا تمتلكونه. أما محركك الحواري الخاص فهو لعبة الاحتفاظ: يعمّق التفاعل مع جمهوركم الحالي ويُنشئ طبقة متميزة. يدفع لك ProRata جزءًا من جزء لكل استعلام. أما طبقة Intelligence الخاصة بكم (يفرض Ask FT 1K$+/سنة لكل مستخدم محترف) فهي ذات هامش مرتفع وتتضاعف قيمتها مع قيمة أرشيفكم. شغّلوا كليهما. تكلفة المشاركة في ProRata تقترب من الصفر (تتولى NMA الأعمال الورقية)، والإيراد إضافي على الاستثمار الهندسي الذي تقومون به بالفعل.

كم يستغرق البناء من الانطلاق حتى أداة محادثة على موقعنا؟

لأرشيف نظيف على Arc XP أو Brightspot يضم 100K-500K مقال، تُطلَق أداة محادثة مُؤرَّضة بالاستشهاد المصدري مع بحث هجين وتصفية زمنية أساسية خلال 14-18 أسبوعًا. يضيف GraphRAG مع حلّ هوية الكيانات 10-14 أسبوعًا أخرى. وتضيف طبقة مساعد بحث وكيلية 8-12 أسبوعًا فوق ذلك. أطول بند منفرد هو دائمًا استيعاب الأرشيف، خاصةً إذا كان لديكم محتوى لما قبل 2005 بـ HTML معطوب، أو صور مفقودة، أو ملفات PDF ممسوحة ضوئيًا من مشروع رقمنة ميكروفيلم. نبدأ بتدقيق أرشيف مدته أسبوعان قبل اقتراح جدول زمني ثابت، لأن التباين بين 'تصدير من نظام إدارة المحتوى' و'إجراء OCR على مليون صفحة ممسوحة ضوئيًا' هو 8 إلى 1 في الجهد. يعطيكم التدقيق رقمًا قابلًا للدفاع تأخذونه إلى مديركم المالي.

البحث التقني

الورقة البيضاء التفاعلية التي تدعم صفحة الحل هذه.

أرشيفكم يساوي أكثر من مخزون إعلاناتكم. دعونا نثبت ذلك.

ابدأ بتدقيق الأرشيف الذي يستغرق أسبوعين. سعر ثابت، دون التزام بالبناء الكامل.

نأخذ عيّنة بنسبة 1% من محتواك، ونقيس صعوبة الاستيعاب، ونعدّ جردًا أوليًا لأهم 200 كيان لديك، ونعطي مديرك المالي رقمًا قابلًا للدفاع للبناء الكامل. إذا قال التدقيق لا تبنِ، فسنخبرك بذلك.

المرحلة 0: تدقيق الأرشيف

  • ✓ اختبار استيعاب عيّنة بنسبة 1% (OCR حقيقي، تقسيم حقيقي)
  • ✓ جرد أهم 200 كيان ومرحلة فكّ التباس
  • ✓ اختبار سريع لتكامل نظام إدارة المحتوى (Arc XP، WordPress VIP، Brightspot، Atypon)
  • ✓ عرض سعر ثابت للبناء الكامل للمراحل 1-4

مشاركة البناء الكامل

  • ✓ GraphRAG + استدلال زمني + فرض الاستشهاد المصدري
  • ✓ قائمة انتظار المراجعة التحريرية وأدوات تدقيق مكتب المعايير
  • ✓ دمج ProRata وBria وTollbit وCloudflare Pay Per Crawl
  • ✓ دعم تسعير طبقة Intelligence وتصميم المنتج