استعارة بصرية تُظهر بيانات الشركة وهي تتسرّب عبر فجوة بين حاسوب محمول مؤسسي مقفل وهاتف شخصي، تجسيدًا لمفهوم "فجوة اللصق" المحوري في المقال.
Artificial IntelligenceCybersecurityEnterprise Technology

موظفوك يسرّبون أسرارك إلى ChatGPT بالفعل — وحظره زاد الأمر سوءًا

Ashutosh SinghalAshutosh Singhal30 يناير 202613 min

كنت جالسًا قبالة مدير أمن المعلومات في شركة كبرى للخدمات المالية عندما قال شيئًا ظل عالقًا في ذهني لأسابيع. اتكأ إلى الوراء، وفرك صدغيه، وقال: "لقد حظرنا ChatGPT على كل جهاز نديره. وحدّثنا سياسة الاستخدام المقبول. وأرسلنا ثلاث رسائل بريد إلكتروني على مستوى الشركة بأكملها. ويوم الثلاثاء الماضي، اكتشفت أن فريق الاندماجات والاستحواذات بأكمله لدينا كان يلصق شروط الصفقات في Claude على هواتفهم الشخصية أثناء استراحة الغداء."

لم يكن غاضبًا. كان مُنهكًا. لقد فعل كل ما أملاه عليه دليل الأمن السيبراني، ولم ينجح ذلك.

بلوَرت تلك المحادثة شيئًا كنت ألاحظه في كل مهمة مؤسسية تولّاها فريقي في Veriprajna: حظر الذكاء الاصطناعي التوليدي لا يمنع الناس من استخدامه — بل يدفعهم فقط إلى إخفائه.والاستخدام الخفي أخطر بما لا يُقاس من الاستخدام الظاهر. والبيانات تروي القصة نفسها. ستة وأربعون بالمئة من الموظفين يقولون إنهم سيواصلون استخدام أدوات الذكاء الاصطناعي حتى لو حظرتها شركتهم صراحةً. وثمانية وثلاثون بالمئة يعترفون بأنهم شاركوا بالفعل بيانات عمل حساسة مع منصات ذكاء اصطناعي عامة دون إخبار أحد. وقد ازداد حجم البيانات المتدفقة إلى تطبيقات الذكاء الاصطناعي التوليدي بمقدار ثلاثين ضعفًا على أساس سنوي. هذه ليست مشكلة سياسات. إنها مشكلة معمارية.

الليلة التي غيّرت فيها Samsung كل شيء

في مايو 2023، فعل ثلاثة مهندسين في قسم أشباه الموصلات بشركة Samsung شيئًا منطقيًا تمامًا. كانوا يصحّحون أخطاء شيفرة برمجية مملوكة لتصنيع الرقائق — عمل معقد وعالي المخاطر حيث قد يوفّر رأي ثانٍ أيامًا من الجهد. لذا لصقوا شيفرتهم في ChatGPT.

رفع أحدهم الشيفرة المصدرية لقواعد بيانات قياس أشباه الموصلات. وشارك آخر منطق برنامج لتحديد عيوب الإنتاجية — وهو نوع البيانات الذي يؤثر مباشرة في سعر سهم Samsung. ورفع ثالث تسجيلًا لاجتماع داخلي لتوليد محضره.

لم يكن أيٌّ منهم يحاول إلحاق الضرر بالشركة. كانوا يحاولون أداء وظائفهم بإتقان. تعاملوا مع ChatGPT كما تتعامل مع آلة حاسبة: تُدخِل شيئًا، وتحصل على شيء، وتمضي. ما لم يدركوه تمامًا هو أن شروط خدمة OpenAI في ذلك الوقت كانت تسمح بالاحتفاظ بالمدخلات — وربما استخدامها لتدريب النماذج، وتخزينها بالتأكيد على خوادم خارج سيطرة Samsung.

أتذكّر أنني قرأت التغطية الإخبارية وشعرت بعقدة في معدتي. ليس لأن التسريب كان مفاجئًا — فقد كنت أحذّر العملاء من هذا السيناريو بالضبط — بل لأن استجابة Samsung كانت متوقّعة إلى هذا الحد. أصدروا حظرًا على مستوى الشركة بأكملها. وهدّدوا بإنهاء الخدمة عند المخالفات. وأغلقوا الشبكة بإحكام.

وكنت أعلم، بيقين مطلق، أنه لن ينجح.

لماذا يأتي حظر الذكاء الاصطناعي دائمًا بنتائج عكسية؟

إليك ما تخطئ فيه معظم فرق الأمن: إنها تُنمذج التهديد كما لو أن الموظفين خصوم. ابنِ جدارًا أعلى، وتختفي المشكلة. لكن الأشخاص الذين يسرّبون البيانات إلى ChatGPT ليسوا خصومًا. إنهم أفضل موظفيك أداءً.

فكّر في مَن يستخدم فعليًا أدوات الذكاء الاصطناعي في العمل. إنه ليس الشخص الذي يمرّر يومه بلا جهد. إنه المهندس الواقع تحت ضغط الإنجاز بحلول يوم الجمعة. المحلل الذي يحتاج إلى تلخيص أربعين صفحة من العناية الواجبة بحلول الصباح. المطوّر الذي يعلم أن الذكاء الاصطناعي يستطيع رصد خطأ في ثوانٍ قد يستغرق منه ساعة للعثور عليه يدويًا.

حين تحظر الأداة، فأنت تقول لأكثر موظفيك إنتاجية: "كن أبطأ. كن أقل فاعلية. راقب منافسيك يتجاوزونك، واقبل بذلك." بالطبع لن يمتثلوا. سينتقلون ببساطة إلى هواتفهم الشخصية. يستخدمون نقاط اتصال 4G لتجاوز شبكة الشركة. يجدون واحدًا من أكثر من 317 تطبيق ذكاء اصطناعي توليدي متميّزًا تتبّعتها Netskope في بيئات المؤسسات — لأنه حتى لو حظرت OpenAI وGoogle وAnthropic، فهناك المئات من البدائل الأصغر والأقل أمانًا في الانتظار.

حين يُنظر إلى الأمن باعتباره عائقًا لا ممكّنًا، يتحول أكثر موظفيك التزامًا إلى المخالفين الأساسيين للسياسات.

بدأت أطلق على هذا "فجوة اللصق" في المحادثات مع فريقي. تغادر البيانات الحاسوب المحمول المؤسسي الآمن، وتنتقل إلى جهاز شخصي، وتُلصق في خدمة سحابية عامة. لا جدار حماية يلتقطها. ولا وسيط أمان الوصول إلى السحابة (CASB) يسجّلها. إنها غير مرئية. وهي تحدث الآن، في كل مؤسسة حاولت حل هذه المشكلة بمذكرة سياسات.

الأرقام مذهلة: زيادة بنسبة 485% في الشيفرة المصدرية المملوكة التي تُلصق في أدوات الذكاء الاصطناعي. واثنان وسبعون بالمئة من استخدام الذكاء الاصطناعي المؤسسي يجري عبر حسابات شخصية، خارج رؤية تقنية المعلومات تمامًا. هذا ليس تسريبًا خفيفًا. إنه طوفان، والسدود مصنوعة من ورق.

ما الذي أخطأت في فهمه بشأن مستويات الذكاء الاصطناعي "المؤسسية"

سأكون صريحًا — حين أطلقت OpenAI منتج ChatGPT Enterprise، ظننت أنه قد يكون كافيًا. عدم الاحتفاظ بالبيانات إطلاقًا. لا تدريب على بيانات الأعمال. امتثال SOC 2. لقد استوفى المتطلبات.

ثم بدأنا نجري عناية واجبة أعمق لصالح عملائنا، فظهرت الشروخ.

حتى الاتفاقيات المؤسسية تتضمن عادةً نافذة قصيرة للاحتفاظ بالبيانات — غالبًا ثلاثين يومًا — لمراقبة إساءة الاستخدام. هذه ثلاثون يومًا تظل فيها أكثر مطالباتك حساسية على خوادم شخص آخر. و"شخص آخر" هو شركة مقرها الولايات المتحدة، مما يقودنا إلى مشكلة تؤرّق مدراء أمن المعلومات الأوروبيين ليلًا.

قانون CLOUD الأمريكي — قانون توضيح الاستخدام القانوني للبيانات في الخارج — يسمح لجهات إنفاذ القانون الأمريكية بإجبار شركات التكنولوجيا الأمريكية على تسليم البيانات المخزّنة على خوادمها، بصرف النظر عن الموقع الفعلي لتلك الخوادم.إذا استخدم بنك ألماني Azure OpenAI مع مركز بيانات في فرانكفورت، فقد تكون البيانات "في حالة سكون" داخل الاتحاد الأوروبي، لكن الكيان القانوني المُسيطِر لا يزال خاضعًا للأوامر القضائية الأمريكية. وأثناء الاستدلال — عندما يعالج النموذج بياناتك فعليًا — قد لا تزال تمرّ عبر بنية تحتية خاضعة للسيطرة الأمريكية.

رأيت قاعة مليئة بمسؤولي الامتثال يشحبون حين شرحت لهم هذا الأمر خطوة بخطوة. لقد وقّعوا الاتفاقية المؤسسية ظنًّا منهم أنهم حلّوا مشكلة السيادة. لم يكونوا قد لامسوها حتى.

كتبت عن مشكلة المعمارية هذه — ونموذج التهديد الكامل — في الورقة البيضاء التفاعلية الخاصة بنا حول الذكاء الاصطناعي الظلّي ونماذج اللغة الكبيرة المؤسسية الخاصة. لقد وُلدت من هذه المحادثات بالتحديد.

فخ الغلاف

في الوقت نفسه تقريبًا، بدأ صندوق بريدي يمتلئ بعروض من شركات استشارات الذكاء الاصطناعي. "سنبني لك حل ذكاء اصطناعي مخصصًا!" معظمها كانت أغلفة — واجهة أنيقة مركّبة فوق واجهة برمجة تطبيقات OpenAI، ربما مع مطالبة نظام تقول "أنت مساعد قانوني مفيد."

جلست خلال عرض توضيحي أظهر فيه المورّد بفخر "منصة ذكاء اصطناعي مملوكة" لتحليل العقود. طرحت سؤالًا واحدًا: "إلى أين تذهب البيانات عندما يرفع مستخدم عقدًا؟" صمت. ثم: "حسنًا، تذهب إلى واجهة برمجة تطبيقات OpenAI، لكن لدينا اتفاقية شراكة أعمال (BAA) قائمة."

هذا ليس حلًّا. إنه وسيط يضيف زمن استجابة إلى تسريب بياناتك.

الغلاف لا يحل مشكلة سيادة البيانات. إنه فقط يُجمّل واجهة تسرّب البيانات.

تُخفق الأغلفة مع المؤسسات بثلاث طرق محددة. أولًا، يمكن تكرارها بسهولة تافهة — إذا كان "حل الذكاء الاصطناعي" لديك عبارة عن مطالبة زائد مفتاح واجهة برمجة تطبيقات، فبإمكان متدربك إعادة بنائه في عصر يوم واحد. ثانيًا، تفتقر إلى تكامل عميق مع بياناتك الفعلية، وتتعثر أمام دقائق المصطلحات الخاصة بالشركة، أو الشيفرات البرمجية القديمة، أو ضوابط الوصول. ثالثًا — وهذا هو القاتل — لا تزال ترسل بياناتك عبر الإنترنت العام إلى مزوّد خارجي. لم يتغيّر الخطر الأمني. لقد أضفت إليه شعارًا فحسب.

ماذا يعني "امتلاك الذكاء" فعليًا؟

مخطط معماري يقارن بين ثلاثة أساليب — واجهة برمجة تطبيقات عامة/غلاف، ومستوى واجهة برمجة تطبيقات مؤسسي، ونموذج لغة كبير خاص مُستضاف ذاتيًا — يوضح إلى أين تنتقل البيانات في كل سيناريو.

كانت هناك لحظة محددة تبلوَر فيها نهجنا في Veriprajna. كنا نعمل مع عميل في قطاع خاضع للتنظيم — لا أستطيع القول أيّ قطاع، لكن تخيّل "نوع البيانات الذي يجعل تسريبه خبرًا في نشرة المساء." كان فريقهم القانوني قد أوقف للتو تجربة ذكاء اصطناعي واعدة لأنها اعتمدت على واجهة برمجة تطبيقات عامة. فريق الهندسة كان غاضبًا. ووحدة الأعمال كانت تهدّد بالتمرّد وبناء حلّها الخاص باستخدام حسابات شخصية.

كنت في مكالمة مع كبير المعماريين لدي، فقال شيئًا بسيطًا: "لماذا نتجادل بشأن أيّ واجهة برمجة تطبيقات نستخدم؟ ينبغي لنا ببساطة أن نشغّل النموذج بأنفسنا."

حينها التزمنا التزامًا كاملًا بما أسمّيه الآن الذكاء الاصطناعي العميق (Deep AI)— نشر نماذج لغوية كبيرة مفتوحة المصدر مباشرة داخل البنية التحتية الخاصة بالعميل. لا تغليف نموذج شخص آخر. لا استئجار الذكاء بالوحدة الرمزية (token). بل امتلاكه فعليًا.

إليك كيف يبدو ذلك عمليًا. تأخذ نموذجًا مفتوح الأوزان عالي الأداء — مثل Llama 3 من Meta، حيث تنافس نسخة الـ70 مليار معامل نموذج GPT-4 في العديد من المعايير — وتنشره على وحدات معالجة رسومية (GPU) داخل السحابة الخاصة الافتراضية للعميل. تعيش أوزان النموذج على عتاد يتحكم فيه العميل. ويعمل محرّك الاستدلال خلف جدار حماية الشركة. حين يطلب مطوّر من النموذج معالجة شيفرة مملوكة، تنتقل تلك الشيفرة من حاسوبه المحمول إلى خادم داخلي، وتُعالَج في الذاكرة، ثم تعود. إنها لا تلامس الإنترنت العام أبدًا. ولا تحطّ أبدًا على خادم طرف ثالث.

نقرن هذا بما نسمّيه RAG الخاص — التوليد المعزَّز بالاسترجاع المبني على قواعد بيانات متجهية منشورة داخل البيئة الآمنة نفسها. تُدخَل مستندات الشركة، وتُضمَّن، وتُخزَّن محليًا. والأهم أن النظام يحترم ضوابط الوصول القائمة. إذا لم يكن لديك إذن برؤية مستند في SharePoint، فلن يسترجعه الذكاء الاصطناعي للإجابة عن سؤالك أيضًا. مشكلة "التفويض المسطّح" تلك — حيث يكشف روبوت محادثة عن غير قصد بيانات سرية لأي شخص يسأل — ببساطة غير موجودة في هذه المعمارية.

كيف تجعل نموذجًا خامًا بمستوى المؤسسات؟

من أصعب الدروس التي تعلّمناها مبكرًا: نشر النموذج ربما يمثّل ثلاثين بالمئة من العمل. أما جعله آمنًا لآلاف الموظفين لاستخدامه يوميًا — فذلك هو السبعون بالمئة الأخرى.

النماذج اللغوية الخام لا يمكن التنبؤ بها. ستناقش بلا تردّد مواضيع لا ينبغي لها مناقشتها، أو تولّد محتوى ينتهك سياسة الشركة، أو تستجيب لحقن مطالبات ذكية مصممة لتجاوز بروتوكولات السلامة. أنت بحاجة إلى حواجز حماية (guardrails) — وهي في جوهرها جدار حماية للمطالبات.

نُطبّق NVIDIA NeMo Guardrails كطبقة قابلة للبرمجة حول النموذج. قبل أن تصل المطالبة إلى النموذج، تُفحَص. إذا كتب أحدهم رقم ضمان اجتماعي أو رقم بطاقة ائتمان، تلتقطه حواجز الحماية. إذا سأل أحدهم روبوت الموارد البشرية عن كلمات مرور قاعدة البيانات، يدرك النظام عدم تطابق النية ويرفض. إذا حاول أحدهم هجوم كسر الحماية — تلك الحيل من نوع "تجاهل كل التعليمات السابقة" — تعترضه طبقة الدفاع.

أتذكّر اختبار اختراق أجريناه على أحد عمليات النشر المبكرة لدينا. أمضى فريقنا الأحمر يومين محاولًا استخراج بيانات التدريب أو تجاوز قيود المواضيع. أظهروا إبداعًا — مطالبات تمثيل أدوار متداخلة، وتعليمات مشفّرة، وكل شيء. صمدت حواجز الحماية. أرسل لي المعماري لديّ لقطة شاشة لسجل المحاولات المحظورة في الثانية صباحًا مع رسالة واحدة: "الجدار متين." كانت تلك ليلة طيبة.

للحصول على التفصيل التقني الكامل لهذه المعمارية — منظومة الاستدلال، وتهيئة قاعدة البيانات المتجهية، وتطبيق حواجز الحماية — راجع تحليلنا التقني المتعمّق حول أمن الذكاء الاصطناعي المؤسسي.

"لكن وحدات معالجة الرسومات باهظة الثمن وواجهات برمجة التطبيقات رخيصة"

إنفوغرافيك لمقارنة التكاليف يوضح كيف تتوسّع تكاليف واجهة برمجة التطبيقات خطيًا بينما تبقى تكاليف الاستضافة الذاتية مسطّحة نسبيًا، مع نقاط بيانات رئيسية من المقال.

هذا هو الاعتراض الذي أسمعه غالبًا من المدراء الماليين، وهو خاطئ بطريقة تستحق التفكيك.

نعم، تبدو أسعار واجهة برمجة التطبيقات رخيصة ظاهريًا — أجزاء من السنت لكل وحدة رمزية (token). لكن تطبيقات RAG المؤسسية شرهة للوحدات الرمزية إلى حد نهم. للإجابة عن سؤال واحد، قد يسترجع النظام عشر صفحات من السياق كوحدات رمزية مُدخَلة. اضرب ذلك عبر ألف موظف يطرحون عشرة أسئلة يوميًا، وستجد نفسك أمام 1,000 إلى 3,000 دولار يوميًا. هذا يعني مليون دولار سنويًا محتملًا، ويتوسّع خطيًا. إذا تضاعف التبنّي، تضاعفت الفاتورة.

النماذج المستضافة ذاتيًا تعمل بشكل مختلف. أنت تدفع مقابل العتاد — استئجار وحدات معالجة الرسومات أو شراؤها — والكهرباء. تستطيع عقدة واحدة مهيّأة جيدًا معالجة آلاف الطلبات في الثانية. وإلى أن تُشبِع تلك العقدة، فإن التكلفة الحدية للوحدة الرمزية التالية تساوي صفرًا فعليًا. بالنسبة إلى شركة متوسطة الحجم تعالج مليار وحدة رمزية شهريًا، رأينا الاستضافة الذاتية تأتي بتكلفة أقل بنسبة 50 إلى 70 بالمئةمن تكاليف واجهة برمجة التطبيقات المكافئة، مع الخصوصية كمكافأة مجانية.

وثمة تكاليف خفية لواجهات برمجة التطبيقات لا تظهر أبدًا في الفاتورة. حدود المعدّل التي تسبّب انقطاعات أثناء عمليات النشر على مستوى الشركة بأكملها. وإيقاف النماذج الذي يجبرك على إعادة اختبار كل مطالبة وسير عمل حين يسحب المزوّد نسخة ما. مع نموذج مستضاف ذاتيًا، لا يتغيّر شيء إلا إذا قرّرت أنت ترقيته. تحصل على الاستقرار. تحصل على القابلية للتنبؤ. تتوقف عن القلق بشأن ما ستقرّره لجنة تسعير OpenAI في الربع المقبل.

على النطاق المؤسسي، الاستضافة الذاتية ليست الخيار المكلف. إنها الخيار الذي لا يُفلسك حين ينجح التبنّي.

لماذا لا يفعل الجميع هذا بالفعل؟

يسألني الناس هذا، والإجابة الصادقة هي: إنه أمر صعب. ليس مفاهيميًا — فالمنطق واضح — بل تشغيليًا. أنت بحاجة إلى أشخاص يفهمون تنسيق وحدات معالجة الرسومات باستخدام Kubernetes، ويستطيعون تهيئة vLLM للحصول على إنتاجية مثلى، ويعرفون كيفية بناء خطوط استرجاع تراعي التحكم في الوصول المبني على الأدوار (RBAC)، ويستطيعون تطبيق حواجز حماية صارمة بما يكفي لمنع سوء الاستخدام، لكنها مرنة بما يكفي كي لا تُحبِط المستخدمين.

معظم المؤسسات لا تملك هذا الفريق. ومعظم شركات استشارات الذكاء الاصطناعي لا تملكه أيضًا — فهي تعرف كيف تستدعي واجهة برمجة تطبيقات، لا كيف تنشر منظومة استدلال. هذه هي الفجوة التي نسدّها في Veriprajna. نحن لا نبيع الوصول إلى نموذج. بل نبني القدرة على تشغيل النماذج باستقلالية. حين نغادر، يمتلك العميل كل شيء — أوزان النموذج المضبوطة بدقة، والفهارس المتجهية، والبنية التحتية للتنسيق. إنها ملكه. هذا هو جوهر الأمر برمّته.

الأمر الآخر الذي يبطئ التبنّي هو الجمود. مدير أمن المعلومات الذي حظر ChatGPT يشعر بأنه فعل شيئًا. والاعتراف بأن الحظر لم ينجح يعني الاعتراف بأن العام الماضي من إنفاذ السياسات كان مجرد مسرحية. تلك محادثة صعبة تُجرى مع مجلس إدارة. لكن البديل — التظاهر بأن المشكلة غير موجودة بينما يلصق الموظفون الشيفرة المصدرية في حسابات ذكاء اصطناعي شخصية — أسوأ. المسألة ليست ما إذا كان التسريب التالي بحجم Samsung سيحدث. المسألة هي متى، وما إذا كان سيحدث لك.

الإشارة الخفية في الذكاء الاصطناعي الظلّي

إليك ما أعتقد أن معظم الناس يغفلونه بشأن وباء الذكاء الاصطناعي الظلّي: إنه ليس مجرد مشكلة أمنية. إنه إشارة. إشارة صاخبة لا لبس فيها بأن قوّتك العاملة يائسة للحصول على أدوات أفضل ومستعدة للمخاطرة بوظائفها للحصول عليها.

ستة وأربعون بالمئة من الموظفين يقولون إنهم سيتحدّون حظرًا صريحًا. هذا ليس تحدّيًا لمجرد التحدّي. إنهم أشخاص يخبرونك، عبر أفعالهم، بأن الذكاء الاصطناعي أصبح أساسيًا لطريقة عملهم. السؤال ليس ما إذا كانت مؤسستك ستستخدم الذكاء الاصطناعي التوليدي. لقد اتُّخذ ذلك القرار بالفعل — من قِبل موظفيك، دون إذنك، على أجهزتهم الشخصية، أثناء استراحة الغداء.

السؤال الوحيد المتبقي هو ما إذا كنت ستوفّر طريقة آمنة لفعل ما يفعلونه بالفعل على نحو غير آمن.

الذكاء الاصطناعي الظلّي هو تصويت قوّتك العاملة بضغطات لوحة المفاتيح. لقد اختاروا الذكاء الاصطناعي. والآن اختر أنت: ظاهر وآمن، أم خفيّ ينزف البيانات.

لقد تجاوزنا الحقبة التي كانت فيها كلمة "لا" استراتيجية مقبولة للذكاء الاصطناعي. النماذج مفتوحة المصدر جيدة بما يكفي. والبنية التحتية للنشر ناضجة بما يكفي. والاقتصاديات منطقية. الشيء الوحيد الذي يقف بين معظم المؤسسات والقدرة السيادية على الذكاء الاصطناعي هو الاستعداد للتوقف عن التظاهر بأن الحظر ينجح.

لست بحاجة إلى حظر الذكاء الاصطناعي. أنت بحاجة إلى امتلاكه.

Related Research

Also Published On