صورة معبّرة تجسّد اصطدام مرجعية الاستشهاد القانوني باختلاق الذكاء الاصطناعي — مذكرة قضائية يتفتّت نص استشهاداتها ويتلاشى حيث تظهر القضايا المزيّفة.

Artificial IntelligenceLawTechnology

الذكاء الاصطناعي الذي اختلق قضية محكمة — والبنية المعمارية التي بنيناها لجعل ذلك مستحيلًا

Ashutosh Singhal 24 يناير 202615 min

أتذكر اللحظة الدقيقة التي كففتُ فيها عن الثقة بالطريقة التي يبني بها معظم الناس الذكاء الاصطناعي القانوني.

كان الوقت متأخرًا من مساء يوم ثلاثاء، وكنت أقرأ محضر المحكمة الخاص بقضية Mata v. Avianca. لم يكن ملخصًا. ولا سلسلة تغريدات. بل المذكرة القضائية الفعلية. كان محامٍ قد قدّم مذكرة يستشهد فيها بقضية Varghese v. China Southern Airlines، وShaboon v. Egyptair، وPetersen v. Iran Air — مكتملةً بأرقام الملفات والتواريخ والأحكام المقتبسة. مقنعةً إلى حدٍّ اضطُرَّ معه محامي الخصم إلى البحث عنها. لم تكن هذه القضايا موجودة. لقد اختلقها ChatGPT. وعندما عاد المحامي إلى ChatGPT للتحقق مرة أخرى، أكّد النموذج بمرحٍ اختلاقاته الخاصة: "نعم، هذه القضايا موجودة بالفعل ويمكن العثور عليها في قواعد البيانات القانونية الموثوقة."

وضعتُ المحضر جانبًا وفكّرت: هذه ليست مشكلة في صياغة الأوامر. إنها مشكلة في البنية المعمارية. ومعظم صناعة الذكاء الاصطناعي القانوني تتظاهر بعكس ذلك.

تلك الحادثة — التي أسفرت عن غرامة قدرها 5,000 دولار، وتوبيخٍ قضائي، وحفرةٍ عميقة في السمعة — أصبحت دراسة الحالة التأسيسية لما يبنيه فريقي في Veriprajna الآن: أنظمة GraphRAG المُلزِمة بالاستشهاد للذكاء الاصطناعي القانوني. أنظمةٌ يكون فيها الذكاء الاصطناعي، ماديًا، عاجزًا تمامًا عن إخراج استشهاد قضائي لا يقابله مدخل موثَّق في الرسم البياني المعرفي (Knowledge Graph). ليس "على الأرجح لن يفعل". بل يستحيل عليه ذلك.

أريد أن أشرح لماذا يهمّ هذا التمييز، وما الذي تطلّبه بناؤه، ولماذا أعتقد أن عصر لصق واجهة روبوت محادثة على نموذج أساسي وتسميته "ذكاءً اصطناعيًا قانونيًا" قد انتهى.

لماذا اختلق ChatGPT قضية محكمة؟

هذا هو السؤال الذي يطرحه الجميع، والذي لا يجيب عنه أحدٌ تقريبًا إجابةً صحيحة.

التفسير الشائع هو "الهلوسة" — وهي كلمة أُفرِط في استخدامها إلى حدِّ فقدانها قيمتها التشخيصية. أما ما حدث فعلًا في قضية Mata v. Avianca فهو أكثر تحديدًا وأشدُّ إدانةً. طُلب من النموذج أن يجد سوابق قضائية بشأن مسؤولية شركات الطيران عن إصابات الركاب. لكنه لم يبحث في قاعدة بيانات. فهو لا يملك واحدة. بل تنبّأ بالتسلسل التالي الأكثر احتمالًا إحصائيًا من الكلمات.

"Varghese" اسم مدَّعٍ معقول. و"China Southern Airlines" مدَّعىً عليه معقول. ورقم ملفٍ مثل "2017 WL 3245891" يتبع النمط النحوي للاستشهادات الحقيقية. لقد جمّع النموذج هذه الشظايا بالطريقة نفسها التي يجمّع بها قصيدةً أو رسالة تسويقية — عبر تقليل شيءٍ يُسمّى الحيرة (perplexity)، وهي في جوهرها مقياسٌ لمدى "دهشة" النموذج من مخرجاته هو. فالدهشة المنخفضة تعني نصًا سلسًا. والنص السلس ليس هو النص الصحيح.

النموذج مُدرَّبٌ على تقليل الحيرة — أي مدى دهشته من الكلمة التالية. وهو غير مُدرَّبٍ على تحسين المصدرية — أي ما إذا كانت تلك الكلمة تعود إلى شيءٍ حقيقي.

هذا هو التوتر الجوهري. فنماذج اللغة الكبيرة تُحسِّن من أجل التماسك. أما القانون فيتطلّب المصدرية. وهذان هدفان مختلفان اختلافًا جوهريًا، ولا قدر من هندسة الأوامر يسدّ الفجوة بينهما. يمكنك أن تقول لـ GPT-4: "أنت محامٍ حذر، لا تستشهد إلا بالقضايا الحقيقية." سيومئ ويمتثل — حتى اللحظة التي تخلو فيها بياناته التدريبية من القضية التي تحتاجها، وعندها سيختلق واحدةً تبدو صحيحة، لأن أن يبدو الأمر صحيحًا هو حرفيًا ما جرى تحسينه للقيام به.

اختبر باحثون من جامعة Stanford هذا بصرامة. فروبوتات المحادثة العامة الغرض، حتى تلك التي تملك وصولًا إلى الإنترنت أو قدرات استرجاع أساسية، هلوَست بنسبة تتراوح بين 58% و82% من الوقت في الاستعلامات القانونية المعقّدة. ليست حالات هامشية. بل أسئلة بحث قانوني روتينية.

فخّ الغلاف (Wrapper)

بعد قضية Mata، بدأتُ أُفهرِس أدوات الذكاء الاصطناعي القانوني الموجودة في السوق. كان معظمها ما تسمّيه الصناعة بلطفٍ "أغلفة" (wrappers) — واجهات مستخدم رقيقة مُركَّبة فوق واجهة برمجة تطبيقات OpenAI أو Anthropic. أمرُ نظامٍ يقول "أنت مساعد قانوني مفيد." وربما خاصية لرفع ملف PDF. وربما خطٌّ أجمل.

أجريتُ مكالمة مع عميلة محتملة — مستشارة عامة في شركة متوسطة الحجم — أخبرتني أنهم كانوا يقيّمون إحدى هذه الأدوات. قالت: "إنها سريعة. لكنها الأسبوع الماضي استشهدت برأيٍ مخالف كأنه الحكم الأغلبي. كاد زميلي أن يودعه لدى المحكمة." ثم توقّفت. "الجزء المخيف هو أن القضية كانت حقيقية. الحكم كان فقط... خاطئًا."

هذا هو ما يؤرّقني ويحرمني النوم بشأن الهلوسات القانونية. Mata كانت مثيرة لأن القضايا كانت مختلَقة بالكامل. لكن الأخطاء الأدقّ — قضية حقيقية بحكمٍ خاطئ؛ قانون سارٍ لكنه أُلغي منذ ذلك الحين؛ سابقة مُلزِمة من ولاية قضائية خاطئة — أصعبُ في الاكتشاف ويمكن القول إنها أكثر خطورة. القضية المزيَّفة تُرصد عند أول خطوة تحقق. أما قضية حقيقية يُستشهد بها لدعم طرحٍ لا تسنده؟ فتلك يمكن أن تنجو من جولات مراجعة متعددة.

لا يستطيع نهج الغلاف حلَّ هذا لأنه لا يملك طبقة البيانات. فهو لا يعرف أي القضايا موجودة. ولا يعرف أيها أُلغيت. ولا يفهم أن قرار الدائرة الثانية لا يُلزِم محكمة الدائرة التاسعة. إنه صندوق نصٍّ أنيق متصل بمحرّك احتمالات.

والاقتصاديات وحشية. يُظهر تحليل سوق الأغلفة أنه بينما يصل بعضها إلى الإيرادات بسرعة، فإن الغالبية العظمى تفشل لأنها تفتقر إلى أي تقنية قابلة للدفاع عنها. ومع تحسّن النماذج الأساسية، تُمتَص كل خاصية جعلت الغلاف مفيدًا — التلخيص والصياغة والأسئلة والأجوبة — داخل النموذج الأساسي. أنت تبني على أرضٍ مستأجَرة، والمالك هو OpenAI.

ماذا يحدث حين تمنح الذكاء الاصطناعي خريطةً للقانون؟

رسمٌ للمقارنة جنبًا إلى جنب يوضّح كيف يسترجع نظام Vector RAG أجزاءً نصية معزولة بحسب التشابه، بينما يعبُر نظام GraphRAG العلاقاتِ القانونية الصريحة (يستشهد، يُلغي، يُفسِّر) للعثور على مرجعية مترابطة بنيويًا.

هنا يبدأ هوس فريقي.

الإصلاح المعياري للهلوسة هو التوليد المعزَّز بالاسترجاع — RAG. فبدلًا من الاعتماد على ذاكرة النموذج، تسترجع مستنداتٍ ذات صلة من قاعدة بيانات وتقدّمها كسياق. إنه تحسينٌ حقيقي. لكنه بالنسبة للقانون غير كافٍ، وأريد أن أشرح السبب بمثالٍ محدَّد أفقدنا صوابنا لأسابيع.

كنا نختبر خط أنابيب Vector RAG معياريًا على سؤالٍ عمّا إذا كانت لائحة بيئية محدَّدة من عام 1990 لا تزال قابلة للإنفاذ بعد قرارٍ للمحكمة العليا في عام 2023. وفعل Vector RAG ما يفعله عادةً: وجد أجزاءً نصية متشابهة دلاليًا مع الاستعلام. أعاد اللائحة. وأعاد رأي المحكمة العليا. وأعاد مقالًا في مجلة قانونية يناقش كليهما.

خاط نموذج اللغة الكبير بينها معًا في إجابةٍ واثقة وجيدة الصياغة كانت خاطئة تمامًا. فقد عامل مقال المجلة القانونية — وهو تعليق أكاديمي مقنع لكنه غير مُلزِم — كأنه يحمل الوزن نفسه الذي يحمله حكم المحكمة العليا. والأسوأ أنه فاته أن اللائحة قد أُبطلت فعليًا، لأن سلسلة المرجعية التي تربط اللائحة بالقرار المُبطِل كانت تمرّ عبر قضية استئنافية وسيطة لم يسترجعها البحث المتّجهي. لم تكن الصلة دلالية. بل كانت بنيوية.

أتذكر مهندسي الرئيسي، وهو في منتصف تصحيح هذا الخطأ، يلتفت إليّ قائلًا: "المشكلة ليست في الاسترجاع. المشكلة أن المتّجهات لا تفهم العلاقات."

كانت محقّة. وهذه هي الرؤية الكامنة خلف GraphRAG — التوليد المعزَّز بالاسترجاع القائم على الرسوم البيانية.

فبدلًا من تخزين المستندات القانونية كنقاطٍ معزولة في فضاء المتّجهات، نحن نرسمها داخل الرسم البياني المعرفي: شبكةٌ يكون فيها كل قانون وقضية ولائحة ومبدأ قانوني عقدةً (node)، وتكون العلاقات بينها — يستشهد، يُلغي، يُميّز، يُفسِّر، يؤيّد — حوافَّ (edges) صريحة وموسومة. وقد كتبتُ عن البنية المعمارية الكاملة في النسخة التفاعلية من بحثنا.

يسأل Vector RAG: "جِد نصًا يشبه هذا الاستعلام." أما GraphRAG فيسأل: "جِد القانون، واعبُر حافة 'التفسير' (interprets) للعثور على السوابق القضائية، ثم اعبُر حافة 'الإلغاء' (overrules) للتأكد من أنها لا تزال سارية."

هذا ليس فرقًا طفيفًا. إنه الفرق بين البحث في مكتبة بالحدس، والبحث فيها عبر فهرس البطاقات وفهرس الاستشهادات وتقرير Shepard's في آنٍ واحد.

كيف توقف الذكاء الاصطناعي عن اختلاق استشهاد؟

رسمٌ تفصيلي خطوة بخطوة يوضّح عملية فك الترميز المقيَّد بـ KG-Trie — يولّد نموذج اللغة الكبير استشهادًا جزئيًا، فتتحقق بنية الـ Trie من الاستكمالات الصالحة مقابل الرسم البياني المعرفي، وتُحجب مسارات الرموز غير الصالحة (بتعيين احتمالها إلى ما لا نهاية سالبة).

هذا هو الجزء الذي استغرق منا أطول وقت لضبطه، وهو الجزء الذي أفخر به أكثر من أي شيء.

امتلاك رسمٍ بياني معرفي ضروري لكنه غير كافٍ. فالرسم يمنحك البنية. لكن نموذج اللغة الكبير لا يزال يولّد النص رمزًا تلو الآخر، وقد ينحرف في أي لحظة عن الرسم ويبدأ في الاختلاق. كنا بحاجة إلى آلية لا تشجّع النموذج على الاستشهاد بالقضايا الحقيقية فحسب — بل تمنعه ماديًا من الاستشهاد بالقضايا المزيّفة.

نسمّي هذا فك الترميز المقيَّد بالرسم البياني (Graph-Constrained Decoding)، والآلية الأساسية فيه هي شيء يُسمّى KG-Trie.

إليك كيف يعمل بلغة بسيطة. نأخذ كل كيان صالح في رسمنا البياني المعرفي — كل اسم قضية، وكل استشهاد مرجعي، وكل رقم ملف — ونبني منها شجرة بادئات (Trie) من تلك المعرّفات. وحين يولّد نموذج اللغة الكبير النص ويصل إلى نقطة يوشك فيها على إخراج استشهاد، تُفعَّل آلية التقييد. فتتحقق: ما هي الرموز التالية الصالحة وفقًا لبنية الـ Trie؟

إذا كان النموذج قد ولّد "Mata v. A" — فإن الـ Trie يسمح بالرموز التي تُكمل أسماء قضايا صالحة تبدأ بتلك السلسلة. "Avianca" صالحة. أما كل ما عداها فيُضبط احتماله إلى ما لا نهاية سالبة. محجوب.

إذا حاول النموذج توليد "Varghese v. Chi" — فإن الـ Trie لا يجد أي استكمال صالح. فيُوقَف التوليد. ويُجبَر النموذج على التراجع، فإمّا أن يجد استشهادًا حقيقيًا أو يُخرِج شيئًا مثل "لم يُعثر على سابقة."

لا يستطيع الذكاء الاصطناعي أن يحلم بقضية لأنه ماديًا لا يستطيع إخراج تسلسل الرموز الخاص بقضية غير موجودة في قاعدة البيانات الموثَّقة.

هذا ضمانٌ بنيوي، لا احتمالي. نحن لا نقول "إن النموذج أقل عرضة للهلوسة بنسبة 95%." بل نقول إن مسار الاختلاق مغلق. فتسلسل الرموز الخاص باستشهاد مزيّف لا يمكن إنتاجه حرفيًا.

والآن، أريد أن أكون دقيقًا بشأن ما يفعله هذا وما لا يفعله. إنه يمنع الاختلاق — أي اختراع قضية غير موجودة. لكنه لا يمنع سوء التفسير — أي الاستشهاد بقضية حقيقية لكن مع استخلاص الاستنتاج الخاطئ منها. فذلك خطأ في الاستدلال، ولا يزال يتطلّب مراجعة بشرية. لكن القضاء على الاختلاق أمرٌ هائل. فهو يُخرج نمط الفشل الأكثر كارثيةً — سيناريو Mata — من الطاولة تمامًا.

كانت هناك ليلة، في وقت مبكر من التطوير، أجرينا فيها أول اختبار شامل من البداية إلى النهاية. أدخلنا إلى النظام الاستعلام نفسه الذي أنتج الاستشهادات المزيّفة في قضية Mata. حاول النظام المقيَّد توليد "Varghese"، فاصطدم بجدار الـ Trie، وتراجع، وأعاد قضية حقيقية بسلسلة استشهاد صالحة. أرسل مهندسي لقطة شاشة إلى دردشة مجموعتنا في الساعة 1:47 صباحًا. لم يردّ أحد بكلمات. بل بصفٍّ من رموز النار التعبيرية فقط.

لماذا لا تستطيع الأغلفة فعل هذا؟

يسألني الناس هذا باستمرار، والجواب معماري، لا تجاري.

يتطلّب فك الترميز المقيَّد بالرسم البياني التلاعب باحتمالات رموز النموذج — أي الـ logits الخاصة به — في الزمن الحقيقي أثناء التوليد. تحتاج إلى الوصول إلى محرّك الاستدلال على مستوى فك الترميز. وواجهات برمجة التطبيقات التجارية المعيارية مثل GPT-4 لا تتيح هذا. يمكنك إرسال أمرٍ والحصول على استجابة. لكنك لا تستطيع اعتراض عملية التوليد في منتصف الرمز وحقن قيود.

لهذا نبني على نماذج مفتوحة الأوزان — Llama، Mistral — أو ننشر عبر نقاط نهاية مؤسسية تتيح حلقات فك ترميز مخصَّصة. نحن نستضيف النموذج. ونتحكم في خط أنابيب الاستدلال. ونحقن قيود KG-Trie مباشرةً في التوزيع الاحتمالي لكل رمز أثناء توليده.

أما الغلاف، فبحكم تعريفه، لا يستطيع فعل هذا. إنه يستدعي واجهة برمجة تطبيقات شخصٍ آخر. إنه راكب، لا الطيّار.

الجزء الأصعب الذي لا يتحدث عنه أحد

كان بناء آلية التقييد مُرضيًا فكريًا. أما بناء الرسم البياني المعرفي الذي تحته فكان عملًا شاقًا ومُرهِقًا.

النص القانوني فوضوي بطرقٍ تجعل مهندس البيانات يبكي. فقد يُشار إلى قضية واحدة بـ "Mata v. Avianca"، أو "Mata"، أو "678 F. Supp. 3d 443"، أو "قضية Avianca"، أو ببساطة "Id." — وهي اختصار من حرفين يعني "القضية التي ذكرتها للتو." وكل هذه يجب أن تتحلّل إلى عقدة قانونية واحدة في الرسم. فإن فاتتك واحدة، صار لديك ثغرة في شبكة الاستشهاد.

أمضينا شهورًا في بناء خطوط أنابيب لتحليل الكيانات (Entity Resolution) تتولى إزالة التكرار ("Smith v. Jones, 123 F.3d 456" و"Smith, 123 F.3d at 456" هما القضية نفسها)، وفكّ الالتباس ("Smith v. Jones (1995)" مقابل "Smith v. Jones (2002)" — قضيتان مختلفتان بالاسم نفسه)، وجحيمَ حلّ إشارات "Id." على وجه الخصوص باستخدام تحليل السياق بنافذة منزلقة.

ثم هناك المعالجة السلبية — نظام "العلَم الأحمر". فالرسم البياني المعرفي القانوني الذي يعامل القضايا المُلغاة كمرجعية صالحة أسوأ من عديم الفائدة. نحن نستوعب إشارات أدوات الاستشهاد — عباراتٍ مثل "مُلغى" و"مُبطَل" و"مُستبدَل" — ونرمّزها كحوافّ حاجبة في الرسم. وحين يعبُر النظام مسارًا ويصطدم بحافة OVERRULES، يُبطَل ذلك المسار كمرجعية مُلزِمة. فإذا سأل أحدٌ عن Roe v. Wade في شأن الحقوق الإنجابية، يُظهِر الرسم فورًا حافة OVERRULES القادمة من Dobbs v. Jackson. أما البحث المتّجهي فقد يظلّ يستشهد بحماس بـ Roe لأن الحجم الهائل من النصوص التاريخية الداعمة لها يهيمن على درجات التشابه.

للاطلاع على التفصيل التقني الكامل لمخطط الرسم، وخط أنابيب تحليل الكيانات، وبنية التقييد، انظر ورقتنا البحثية.

ماذا يعني هذا فعليًا لمكتب محاماة؟

أجريتُ محادثة مع شريك إداري عبّر عن الأمر بصراحة: "لا يهمّني أمر الرسوم البيانية المعرفية. ما يهمّني هو ما إذا كان مساعدوني سيُحرجونني أمام قاضٍ."

عادل. فدعوني أترجم.

لم تكن تكلفة قضية Mata v. Avianca هي 5,000 دولار. بل كانت الإهانة العلنية، وشرط إخطار العميل، والتعرّض لدعوى سوء الممارسة، والإشارة لكل عميل محتمل إلى أن هذا المكتب لا يتحقق من عمله. فبالنسبة لمكتب كبير، ملفٌّ واحد مبني على هلوسة يمثّل حدثًا وجوديًا يمسّ السمعة.

يعمل نظام GraphRAG المُلزِم بالاستشهاد بوصفه وثيقة تأمين ضد الاختلاق. فنهج الغلاف يقدّم تكلفة أولية منخفضة ومسؤولية غير محدودة. أما نهجنا فيتطلّب استثمارًا حقيقيًا في طبقة البيانات وبنية التقييد، لكنه يقلّص خطر اختلاق الاستشهادات إلى الصفر.

وهناك أيضًا حجة تتعلق بالكفاءة أقلّ وضوحًا. ففي الوقت الراهن، إذا استخدم مكتبٌ الذكاء الاصطناعي للبحث، على المساعد أن يتحقق من كل استشهاد على حدة. وغالبًا ما تستغرق خطوة التحقق هذه وقتًا أطول من البحث نفسه، ما يُبطل الغرض منه. تُظهِر معايير قياس أداء GraphRAG تحسّنًا بنسبة 30-35% على RAG المعياري في مهام الاستدلال متعدد القفزات — أي ذلك النوع من البحث المعقّد الذي يربط النقاط والذي يهمّ فعلًا في التقاضي. والأهم أنه، لأن الاستشهادات مضمونة الصلاحية بنيويًا، ينتقل دور الإنسان من "مدقّق حقائق" إلى "مراجع استراتيجية." فأنت لا تقضي ثلاث ساعات في التأكد من وجود القضايا. بل تقضي ذلك الوقت في ما إذا كانت الحجة مقنعة.

حين يكون كل استشهاد مُتحقَّقًا منه بنيويًا، ينتقل عمل المحامي من التدقيق في حقائق الذكاء الاصطناعي إلى التفكير في الاستراتيجية. وهناك تكمن الرافعة الحقيقية.

وهناك بُعدٌ يتعلق بالشفافية مهمٌّ للامتثال. فالغلاف لا يستطيع أن يشرح لماذا اختار قضيةً ما. أما نظام GraphRAG فيمكنه أن يُظهِر مسار العبور الدقيق: "اخترتُ القضية أ لأنها تُفسِّر القانون ب وأيّدتها المحكمة ج، وهي مُلزِمة في ولايتك القضائية." وهذا الأثر التدقيقي ليس مجرد ميزة لطيفة — بل بات توقّعًا تنظيميًا.

إلى أين يتجه هذا بعد ذلك؟

تنتقل الصناعة من روبوتات المحادثة إلى الوكلاء — أي أنظمة ذكاء اصطناعي لا تكتفي بالإجابة عن الأسئلة بل تخطّط لمهام متعددة الخطوات وتنفّذها. فالوكيل القانوني المطلوب منه صياغة طلب ردٍّ للدعوى يحتاج إلى البحث في المعيار المُطبَّق، وإيجاد السوابق القضائية الداعمة، والتحقق من أن القضايا لا تزال قانونًا سليمًا، وفحص المتطلبات الإجرائية، وتجميع الحجة.

الوكيل الذي يعمل على البحث المتّجهي لا يملك خريطة. بل يملك كومة من المستندات وتخمينًا جيدًا. أما الوكيل الذي يعمل على رسمٍ بياني معرفي فيملك بنية صريحة يمكنه عبورها: قانون ← قضايا مُفسِّرة ← قواعد إجرائية ← متطلبات خاصة بالولاية القضائية. فالرسم هو طبقة التخطيط لدى الوكيل.

لهذا أعتقد أن الاستثمار في بنية الرسوم البيانية الآن يدفع عوائد مركّبة لاحقًا. فالأغلفة تخلّف وراءها سجلات محادثة. أما الرسوم البيانية المعرفية فتخلّف وراءها خريطة منظّمة ومتنامية ومتزايدة القيمة للمرجعية القانونية، تزداد فائدةً مع كل قضية تُضاف، وكل علاقة تُرمَّز، وكل إشارة معالجة سلبية تُستوعَب.

الاعتراض الصادق

يعترض الناس على جبهتين، وأريد أن أتناول كلتيهما مباشرة.

أولًا: "أليس هذا مجرد Westlaw بخطوات إضافية؟" لا. فـ Westlaw محرك بحث للبشر. يعيد مستنداتٍ يقرؤها المحامي ويفسّرها. أما ما نبنيه فهو بنية تقييد للذكاء الاصطناعي — نظامٌ يحكم ما يستطيع الذكاء الاصطناعي قوله وما لا يستطيع. Westlaw يساعد المحامين على إيجاد القانون. أما GraphRAG فيمنع الذكاء الاصطناعي من اختراعه. إنهما متكاملان، لا متنافسان.

ثانيًا: "ألا يمكنك ببساطة ضبط النموذج (fine-tune) ليتوقف عن الهلوسة؟" جرّبنا ذلك. ففي وقت مبكر من عملنا، جرّبنا الضبط الدقيق على مجموعات بيانات قانونية موثَّقة. فخفّض ذلك معدلات الهلوسة. لكنه لم يقضِ عليها. فالنموذج المضبوط دقيقًا لا يزال محرّك احتمالات. إنه محرّك احتمالات أفضل، لكن "أفضل" في الاستشهاد القانوني تعني "يخطئ أقل"، و"يخطئ أقل" ليس معيارًا ستقبله أي محكمة. والطريقة الوحيدة لضمان اختلاق صفري هي جعل الاختلاق مستحيلًا بنيويًا، وهو ما يعني تقييد فضاء المخرجات، لا مجرد تحسين بيانات المدخلات.

نهاية عصر "الجيد بما يكفي"

إليك ما أعود إليه دائمًا. تقوم مهنة المحاماة على فرضية بسيطة: حين تستشهد بمرجعية، يجب أن تكون تلك المرجعية حقيقية. ليست حقيقية على الأرجح. ولا حقيقية في العادة. بل حقيقية.

طوال عامين بعد قضية Mata، ظلّت المحاكم تصعّد العقوبات، وتُصدِر أوامر دائمة بشأن الإفصاح عن استخدام الذكاء الاصطناعي، وتوضّح أن "الذكاء الاصطناعي هو من فعلها" ليس دفاعًا. فالمهنة ترسم خطًا: إذا استخدمت الذكاء الاصطناعي، فيجب التحقق من مخرجاته. وإذا كان التحقق من المخرجات يستغرق وقتًا أطول من أداء العمل يدويًا، فإن الذكاء الاصطناعي ليس أداة — بل عبء ومسؤولية.

لقد حلّ عصر الأغلفة المشكلة الخطأ. فقد جعل البحث القانوني أسرع. لكنه كان بحاجة إلى أن يجعل البحث القانوني جديرًا بالثقة. فالسرعة بلا ثقة ليست سوى سوء ممارسة كفؤ.

ما نبنيه في Veriprajna ليس روبوت محادثة يصادف أنه يعرف بعض القانون. بل هو نظام استدلال مقيَّد يكون فيه كل استشهاد عبورًا مُتحقَّقًا منه عبر رسمٍ بياني معرفي، وكل علاقة صريحة وقابلة للتدقيق، ويُمنَع النموذج التوليدي ماديًا من العبور إلى عالم الخيال.

المهنة التي اخترعت مفهوم السابقة المُلزِمة تستحق ذكاءً اصطناعيًا يحترمها فعلًا.

Related Research

التحقق من الاستشهادات القانونية بالذكاء الاصطناعي وحوكمته | VeriprajnaSolution Page

The $5,000 Hallucination: Citation-Enforced GraphRAG for Legal AI | VeriprajnaInteractive Whitepaper

The $5,000 Hallucination: Why Enterprise Legal AI Needs GraphRAGTechnical Deep-Dive

Also Published On

LinkedIn · Company LinkedIn · Founder YouTube Medium Instagram Facebook X