صورة تحريرية تصوّرية تُظهر حاجز تجربة أداء الأوركسترا كاستعارة للتقييم الأعمى العادل — الاستعارة المحورية للمقال.

Artificial IntelligenceHiringMachine Learning

أداة التوظيف بالذكاء الاصطناعي التي تعلّمت التحيّز الجنسي — وما علّمتني إياه عن بناء أدوات عادلة

Ashutosh Singhal 12 فبراير 202616 min

قبل بضعة أشهر، جلستُ قبالة مدير موارد بشرية تنفيذي (CHRO) في شركة تقنية متوسطة الحجم، أخبرني بفخر حقيقي بأنهم «حلّوا مشكلة التحيّز» في مسار التوظيف لديهم. كانوا قد اشتروا أداة فرز مدعومة بالذكاء الاصطناعي. كانت تحلّل السير الذاتية، وتصنّف المرشّحين، وتقلّص زمن شغل الوظائف لديهم بنسبة 40%.

طرحتُ سؤالاً واحداً: «بماذا تتنبّأ الأداة؟»

صمتٌ. ثم: «ماذا تقصد؟ إنها تتنبّأ بمن يجب توظيفه.»

«لا»، قلتُ. «إنها تتنبّأ بمن كنتَ ستوظّفه. بناءً على عقد من البيانات كان فيه فريق الهندسة لديك ذكورياً بنسبة 84%.»

غادر الدمُ وجهه. كان قد أنفق مبلغاً من ستة أرقام على أداة تُؤتمت التحيّز نفسه الذي ظنّ أنه يقضي عليه.

تطاردني هذه المحادثة لأنها ليست حالة استثنائية. إنها القاعدة. فالجيل الأول بأكمله من أدوات التوظيف بالذكاء الاصطناعي — وأعني الغالبية الساحقة مما هو متوفّر في السوق الآن — مبنيٌّ على فرضية معيبة جوهرياً إلى حدّ يجعلها مثيرة للسخرية لولا أن العواقب تمسّ أرزاق الناس. تستخدم هذه الأدوات الذكاء الاصطناعي التنبؤي المُدرَّب على بيانات التوظيف التاريخية. إنها تتعلّم مَن جرى توظيفه في الماضي. ثم تكرّر ذلك النمط على نطاق واسع، بكفاءة لا ترحم، مُجرِّدةً إيّانا من الشيء الوحيد الذي ربما كان لينقذنا: ذلك المسؤول البشري عن التوظيف الذي كان بين الحين والآخر ينظر إلى مرشّح غير بديهي فيفكّر، أتعلم، دعنا نجازف.

في Veriprajna، نبني أنظمة توظيف بالذكاء الاصطناعي بطريقة مختلفة. نحن نستخدم الذكاء الاصطناعي السببي — لا للتنبؤ بمن كان سيُوظَّف، بل للتنبؤ بمن سيؤدّي فعلاً أداءً جيداً. ثم نُخضِع ذلك التنبؤ لاختبار إجهاد بطرح سؤال لا تستطيع معظم أنظمة الذكاء الاصطناعي حتى تحليله: لو كان هذا المرشّح من فئة ديموغرافية مختلفة، فهل ستتغيّر إجابتنا؟

إن كانت ستتغيّر، فإن النموذج يفشل. نعود ونُصلحه.

هذه هي قصة لماذا يهمّ ذلك التمييز أكثر من أي شيء آخر يحدث في تقنية الموارد البشرية الآن.

«التوافق الثقافي» ليس إلا تماثلاً اجتماعياً بتسويق أفضل

قبل أن أخوض في التقنية، عليّ أن أتحدّث عن المشكلة البشرية — لأن مشكلة الذكاء الاصطناعي هي نتيجة لها.

هناك مفهوم في علم الاجتماع يُسمّى التماثل الاجتماعي: ميل الناس إلى مخالطة من يشبهونهم والارتباط بهم وتفضيلهم على غيرهم. وهو من أكثر الظواهر توثيقاً ورسوخاً في العلوم الاجتماعية. وهو المحرّك الخفيّ الذي يقود معظم قرارات التوظيف في العالم.

التماثل الاجتماعي هو السبب في أن مدير التوظيف الذي لعب الرغبي يرفع لا شعورياً تقييم المرشّح الذي يذكر الرغبي. وهو السبب في أن «التوافق الثقافي» — تلك العبارة المقدّسة التي لا تُمسّ في قاموس كل مسؤول توظيف — تُترجَم دائماً تقريباً إلى «هذا الشخص يذكّرني بنفسي». وجد باحثون في جامعة بيركلي أن المُقابِلين يخلطون على نحو معتاد بين «مهارات التواصل» و«يتحدّث مثلي». والمرشّح الذي ينحدر من خلفية اجتماعية-اقتصادية مختلفة ويستخدم سجلّاً لغوياً مختلفاً يُخفَّض تقييمه بحجة «افتقاره إلى الصقل». أما مضمون إجاباته فلا يكاد يُلتفت إليه.

أتذكّر نقاشاً محتدماً مع مستشار كبير في بدايات حياة Veriprajna. كان يصرّ على أن التوافق الثقافي معيار توظيف مشروع — وأن الفرق تحتاج إلى تماسك وقيم مشتركة ولغة واحدة. لم أختلف معه في المبدأ. بل اختلفت معه في التطبيق. لأن الباحثين حين يدرسون فعلاً ما يحدث في المؤسسات التي تُحسّن على أساس «التوافق الثقافي»، يجدون شيئاً مقلقاً: تقع تلك المؤسسات فيما يسمّيه علماء الشبكات مصائد التماثل الاجتماعي. فبمجرّد أن يهبط تمثيل الأقلية دون نحو 25%، تُوظّف الأغلبيةُ الأغلبيةَ، ويتجمّد التركيب الديموغرافي في مكانه. يتوقّف الابتكار. ويسيطر تفكير القطيع. وتغدو المؤسسة قاعة مرايا.

يبدو «التوافق الثقافي» وكأنه معيار توظيف. أما في الواقع فهو آلية لاستنساخ الفريق القائم — وتسميةُ ذلك استراتيجيةً.

الحلّ ليس إلغاء مفهوم الاتساق الثقافي. بل الانتقال من «التوافق الثقافي» إلى «الإضافة الثقافية» — توظيف أشخاص يتحدّون الافتراضات بدلاً من تأكيدها. لكن هذا الانتقال يتطلّب شيئاً لا يستطيع معظم مسؤولي التوظيف البشر فعله بموثوقية: تقييم الإسهام المحتمل للمرشّح مع كونهم عمياً حقاً عن إشاراته الديموغرافية.

وهذا ما يقودنا إلى التجربة الأدائية العمياء.

ما الذي اكتشفته الأوركسترات في سبعينيات القرن الماضي

في سبعينيات القرن الماضي، كانت الأوركسترات السيمفونية الأمريكية الكبرى ذكورية في غالبيتها الساحقة. وكانت الحكمة السائدة أن النساء يفتقرن إلى «قوة الرئة» أو «المزاج» اللازم لآلات معيّنة. ثم بدأت الأوركسترات تضع المرشّحين خلف حاجز. كان بوسع الحكّام سماع الموسيقى — المحرّك السببي الفعلي للأداء — لكن دون أن يروا العازف.

ارتفع توظيف النساء ارتفاعاً حاداً.

لم يغيّر الحاجز جودة الموسيقى. بل غيّر جودة الاستماع. فقد أجبر المقيّمين على الاستجابة للإشارة (الصوت) بدلاً من الضجيج (المظهر).

غدا هذا التشبيه أساسياً في طريقة تفكيري بشأن ما نبنيه. في العصر الرقمي، لا يمكنك وضع كل مرشّح لوظيفة خلف حاجز مادي. لكن يمكنك بناء ذكاء اصطناعي يعمل بمثابة حاجز رياضي — حاجزٍ يقيّم المحرّكات السببية للأداء الوظيفي مع كونه أعمى على نحو قابل للإثبات عن السمات المحمية مثل الجنس أو العِرق أو السنّ.

المشكلة أن الذكاء الاصطناعي المعياري يفعل العكس. فهو يعمل كنافذة شفافة. وكل تحيّز في البيانات التاريخية يتدفّق عبره مباشرة.

لماذا عاقب الذكاء الاصطناعي لدى أمازون كلمة «نسائي»؟

أشهر قصة تحذيرية في التوظيف بالذكاء الاصطناعي هي أداة التوظيف الداخلية لدى أمازون، التي أُلغيت في عام 2018. دُرِّب النظام على عقد من السير الذاتية المقدّمة إلى الشركة. ولأن قطاع التقنية يميل بشدّة نحو الذكور، عكست بيانات التدريب ذلك الميل.

الذكاء الاصطناعي، إذ يفعل تماماً ما صُمّم من أجله — إيجاد الأنماط التي تتنبّأ بـ«الحصول على وظيفة» — تعلّم أن الإشارات المرمّزة ذكورياً ترتبط بنجاح التوظيف. فعاقب السير الذاتية التي تحوي كلمة «نسائي»، كما في «قائدة نادي الشطرنج النسائي». وخفّض تقييم خرّيجات كليتين نسائيتين خالصتين. لم يبرمجه أحد ليكون متحيّزاً جنسياً. بل اكتشف ببساطة أن كون المرء ذكراً كان مؤشّراً قوياً على التوظيف في أمازون، فحسّن أداءه على أساس ذلك النمط.

أن تكون دقيقاً إزاء الماضي يعني أن تكون مُجحفاً بحق المستقبل. فإذا كانت «الدقة» تعني التنبؤ بالقرار البشري، فإن الذكاء الاصطناعي «الجيّد» متحيّز بالضرورة.

هذا هو الإخفاق الجوهري في التعلّم بالمحاكاة — أي تدريب الذكاء الاصطناعي على محاكاة مسؤولي التوظيف البشر. وإذا كان مسؤولو التوظيف متحيّزين (وبفعل التماثل الاجتماعي، كانوا كذلك)، يصبح الذكاء الاصطناعي ما بدأتُ أسمّيه «كبسولة تحيّز». إنه يبلور عقداً من التحامل ويطبّقه بسرعة الآلة على كل متقدّم جديد.

على الأقل تحلّت أمازون بالنزاهة الكافية لإيقاف المشروع. أما معظم الشركات التي تستخدم أدوات مماثلة فلا تعرف حتى أنها تعاني من المشكلة.

ماذا عن GPT؟ فخّ الغلاف حول النموذج اللغوي الكبير

بعد أن تفجّرت قصة أمازون، افترضتُ أن القطاع سيصحّح مساره. لكن بدلاً من ذلك، أنتجت طفرة الذكاء الاصطناعي التوليدي شيئاً قد يكون أسوأ: سيلاً من أدوات التوظيف «المدعومة بالذكاء الاصطناعي» وهي واجهات رقيقة — أغلفة — مبنية فوق نماذج لغوية كبيرة عامة الغرض مثل GPT-4 أو Claude.

فقدتُ عدّ المستثمرين والشركاء المحتملين الذين قالوا لي: «استخدم GPT فحسب. اضبطه بدقّة على بعض بيانات التوظيف. وأطلقه.» وفي كل مرة، يكون جوابي واحداً: هل تعرف على ماذا دُرِّب GPT؟

على الإنترنت المفتوح. على مجمل النصّ البشري — بما فيه من تحيّزات وقوالب نمطية وأحكام مسبقة. وجد باحثون في جامعة واشنطن أنه عندما تفرز النماذج اللغوية الكبيرة السير الذاتية، تُفضَّل الأسماء المرتبطة بالبيض في 85% من الحالات، حتى عندما تكون المؤهلات متطابقة. وفي بعض تكرارات الاختبار، لم تُصنَّف أسماء الرجال السود في المرتبة الأولى قطّ. يربط النموذج أسماءً معيّنة بـ«الكفاءة» استناداً إلى أنماط إحصائية في بيانات تدريبه. ولا يستطيع الغلاف إيقاف ذلك بسهولة لأن التحيّز منسوج في فهم النموذج الأساسي للغة.

وهذا قبل أن تصل إلى الهلوسات. فالنماذج اللغوية الكبيرة مولّدات نصوص احتمالية، لا محرّكات منطق. يمكنها اختلاق مهارات لا يملكها المرشّح، أو إغفال مهارات يملكها، لأن النموذج يُحسّن من أجل نصّ يبدو معقولاً، لا الدقة الوقائعية. وفي سياق امتثالي — حيث قد يرفع مرشّح مرفوض دعوى قضائية — لا يُعدّ قولُ «هلوس الذكاء الاصطناعي بأنك تفتقر إلى شهادة مطلوبة» دفاعاً قانونياً قابلاً للتطبيق.

ثم هناك مشكلة الصندوق الأسود. اسأل غلافاً لماذا صنّف المرشّح (أ) فوق المرشّح (ب)، وسيتمكّن من توليد تفسير يبدو واثقاً. لكن ذلك التفسير تبرير لاحق للحدث، لا حساب سببي للقرار. وبموجب قانون مدينة نيويورك المحلي 144 وقانون الذكاء الاصطناعي للاتحاد الأوروبي، تغدو هذه العتامة غير ممتثلة على نحو متزايد.

كتبتُ عن هذه المشكلة — وعن نهجنا في حلّها — في النسخة التفاعلية من بحثنا.

السؤال الخاطئ في مقابل السؤال الصحيح

مخطّط مقارنة جنباً إلى جنب يوضّح الفارق الجوهري بين الذكاء الاصطناعي القائم على المحاكاة (التنبؤ بمن يُوظَّف) والذكاء الاصطناعي القائم على النتائج (التنبؤ بمن يؤدّي جيداً)، بما في ذلك ما يتدرّب عليه كل نهج وما يُنتجه.

هذا هو جوهر كل شيء.

يسأل ذكاء التوظيف الاصطناعي المعياري: «استناداً إلى التاريخ، هل سيُوظَّف هذا الشخص؟»

نحن نسأل: «هل سيؤدّي هذا الشخص أداءً جيداً؟»

يبدوان متشابهين. لكن بينهما بونٌ شاسع.

السؤال الأول يتدرّب على قرار مسؤول التوظيف — وهو قرار ملوّث بالتماثل الاجتماعي وتحيّز الألفة ومطابقة الأنماط مع ديموغرافيا الفريق القائم. أما السؤال الثاني فيتدرّب على نتائج الأعمال: الاحتفاظ بالموظف بعد 18 شهراً، وتحقيق مؤشرات الأداء الرئيسية، وتقييمات الأداء، وتحسّن مخرجات الفريق.

عندما تتدرّب على النتائج بدلاً من القرارات، يحدث شيء لافت. فإذا كان المرشّحون المتنوّعون قد أدّوا تاريخياً أداءً جيداً لكن نادراً ما وُظّفوا — وهو بالضبط ما تُظهره البيانات في كثير من المؤسسات — فإن النموذج القائم على النتائج يتعلّم تقديرهم. أما النموذج القائم على المحاكاة فيتعلّم تجاهلهم.

هذا ليس تمييزاً دقيقاً طفيفاً. إنه الفرق بين أتمتة الماضي وهندسة المستقبل.

كيف تجعل ذكاءً اصطناعياً عادلاً على نحو قابل للإثبات؟

مخطّط يوضّح كيف يتعامل النموذج السببي البنيوي مع مثال الرمز البريدي — مبيّناً المسار المشروع في مقابل المسار الزائف، وكيف يُحجَب المسار الزائف رياضياً.

حسناً. إذاً نحن نتدرّب على النتائج بدلاً من القرارات. وهذا ضروري لكنه غير كافٍ. لأنه حتى بيانات النتائج قد تحمل آثاراً من التحيّز البنيوي — فإذا مُنح الموظفون المتنوّعون موارد أقل، ومهام أسوأ، وإرشاداً أقل، فقد تُكبَح نتائجهم بصورة مصطنعة.

هنا ننتقل من الذكاء الاصطناعي التنبؤي إلى الذكاء الاصطناعي السببي، وتحديداً إلى إطار يُسمّى العدالة المضادّة للواقع.

الفكرة، المتجذّرة في «سُلّم السببية» لجوديا بيرل، تبدو بسيطة على نحو خادع. فتعلّم الآلة المعياري يعمل عند المستوى الأول من سُلّم بيرل: الارتباط. فهو يرى الأنماط. «الأشخاص ذوو السمة س يميلون إلى الحصول على النتيجة ص.» مفيد، لكنه أعمى عن الفرق بين الارتباط والسببية.

أما الذكاء الاصطناعي السببي فيعمل عند المستوى الثالث: المضادّات للواقع. فبإمكانه تخيّل وقائع بديلة. «لو كان هذا المرشّح ذكراً بدلاً من كونه أنثى، مع تثبيت كل شيء آخر، فهل سيتغيّر تنبّؤ النموذج؟»

إن كان الجواب نعم، فإن النموذج مُجحف. وانتهى الأمر.

نحن نطبّق هذا باستخدام النماذج السببية البنيوية — وهي رسوم بيانية شفافة تُخطّط علاقات السبب والنتيجة بين المتغيّرات. وعلى عكس الشبكات العصبية ذات الصندوق الأسود، يتيح لنا النموذج السببي البنيوي أن نرى بالضبط أيّ المسارات تربط المدخلات بالمخرجات، ولماذا.

إليك مثالاً ملموساً أبقى فريقي مستيقظاً حتى وقت متأخّر من إحدى الليالي. كنّا نبني نموذجاً ولاحظنا أن «الرمز البريدي» كان مؤشّراً قوياً على الاحتفاظ بالموظف. وهذا منطقي — فالتنقّلات الطويلة تُنهك الناس. لكن الرمز البريدي يرتبط أيضاً بالعِرق في معظم المدن الأمريكية. والنموذج المعياري سيستخدم الرمز البريدي دون تمييز، مُمارساً فعلياً تمييزاً على أساس العِرق بينما يبدو أنه يستخدم متغيّراً «محايداً».

يُخطّط نموذجنا السببي البنيوي كلا المسارين:

المسار المشروع: الرمز البريدي ← زمن التنقّل ← الاحتفاظ بالموظف
المسار الزائف: الرمز البريدي ← الديموغرافيا ← التحيّز التاريخي

نحن نحجب المسار الثاني رياضياً مع الحفاظ على الأول. يمكن للنموذج استخدام الرمز البريدي فقط بقدر ما يتنبّأ بزمن التنقّل. فإذا بدأ باستخدام الرمز البريدي لاستنتاج العِرق، تُفعَّل العقوبة.

المسألة ليست ما إذا كان ذكاؤك الاصطناعي يستخدم السمات المحمية مباشرة. بل ما إذا كان يستخدم وسائط بديلة تُهرّب تلك السمات إلى الداخل عبر الباب الجانبي.

تدريب النموذج على نسيان تحامله الخاص

مخطّط يوضّح بنية إزالة التحيّز التخاصمية — النموذج الرئيسي يُحسّن من أجل التنبؤ بالأداء بينما يحاول النموذج الخصم كشف الديموغرافيا، مُنشئاً حلقة عقوبة متنافسة.

كيف نفرض هذا فعلاً أثناء التدريب؟ عبر تقنية تُسمّى إزالة التحيّز التخاصمية — وهي في جوهرها عقوبة عدالة مغروسة في عملية تعلّم النموذج.

أثناء التدريب، يُحسّن النموذج في مواجهة هدفين متنافسين في آن واحد. الأول: تعظيم الدقة في التنبؤ بالأداء الوظيفي. الثاني: تقليل القدرة على التنبؤ بالسمات المحمية للمرشّح (العِرق، الجنس، السنّ) من التمثيل الداخلي للنموذج.

نُدخِل «خصماً» — نموذجاً ثانوياً وظيفته الوحيدة محاولة تخمين ديموغرافيا المرشّح من مخرجات النموذج الرئيسي. فإذا بدأ النموذج الرئيسي يعتمد على سمات وسيطة مثل «لعبة اللاكروس» (وسيط للوضع الاجتماعي-الاقتصادي الذي يرتبط بالعِرق) أو أسماء جامعات معيّنة، يكتشف الخصمُ أن بوسعه الآن تخمين الديموغرافيا بسهولة أكبر. وهذا يُفعّل عقوبة، ترفع تكلفة الحالة الراهنة للنموذج الرئيسي.

ولتقليل الخسارة الإجمالية، يُضطرّ النموذج إلى إيجاد سمات تتنبّأ بالأداء دون الكشف عن الديموغرافيا. المهارات. الخبرة. درجات الاختبارات الموضوعية. المحرّكات السببية الفعلية.

أشرح هذا أحياناً بتشبيه ساذج يكرهه فريقي: الأمر أشبه بتدريب كلب على إحضار صحيفة. فإذا أحضر الكلب الصحيفة لكنه مزّقها، فلا مكافأة. وفي النهاية يتعلّم الكلب الإحضار دون تمزيق. ونموذجنا يتعلّم التنبؤ دون تمييز.

قبل النشر، نُجري آلاف عمليات المحاكاة المضادّة للواقع. نأخذ سيرة ذاتية لمرشّح حقيقي، ونولّد «توأماً اصطناعياً» باسم وضمائر مختلفة لكن بمهارات وخبرة متطابقة، ونمرّر كليهما عبر النموذج. فإذا تباعدت الدرجات، يرسب النموذج في التدقيق. ونكرّر العملية حتى تتقارب. وللاطّلاع على التفصيل التقني الكامل لهذه العملية، انظر ورقتنا البحثية.

لماذا يهمّ أيٌّ من هذا قانونياً؟

لأن الجدران التنظيمية تضيق، ومعظم الشركات ليست مستعدّة.

قانون مدينة نيويورك المحلي 144، النافذ منذ عام 2023، يحظر استخدام أدوات التوظيف المؤتمتة ما لم تخضع لتدقيق تحيّز مستقلّ خلال العام الماضي. ويُلزم القانون بحساب نسب الأثر — بمقارنة معدّلات الاختيار عبر الفئات الديموغرافية. ويفشل كثير من موردي الصندوق الأسود في هذه التدقيقات لأنهم لا يستطيعون التحكّم في كيفية ترجيح نماذجهم لمختلف السمات. وهم يتخبّطون لترقيع التحيّز بعد وقوعه، وهو أشبه بمحاولة إعادة كعكة مخبوزة إلى عجين.

أما قانون الذكاء الاصطناعي للاتحاد الأوروبي فيذهب أبعد من ذلك، إذ يصنّف ذكاء التوظيف الاصطناعي على أنه «عالي المخاطر» — الفئة التنظيمية نفسها التي تندرج فيها الأجهزة الطبية. وهذا يفرض متطلّبات صارمة بشأن حوكمة البيانات والإشراف البشري والغياب القابل للإثبات للتحيّز. وحلول الأغلفة التي تعالج البيانات عبر واجهات برمجة تطبيقات تابعة لأطراف ثالثة تواجه هنا مشكلة وجودية: فالبيانات تغادر بنيتك التحتية، والنموذج معتم، ولا يمكنك ضمان الامتثال.

نماذجنا جاهزة للتدقيق بحكم تصميمها. ولأن عقوبة العدالة أثناء التدريب أكثر صرامة رياضياً مما يتطلّبه القانون، يكون الامتثال منتجاً ثانوياً طبيعياً، لا فكرة لاحقة. ولأن الرسم البياني السببي شفاف، يمكننا أن نُظهر لمدقّق — أو لمحكمة — أيّ العوامل بالضبط دفعت أيّ قرار، وأن نُثبت أن السمات المحمية كان وزنها صفراً.

يسألني الناس أحياناً عمّا إذا كانت كل هندسة العدالة هذه تأتي على حساب الأداء. إنه الاعتراض الأكثر شيوعاً الذي أسمعه، وعادةً ما يُصاغ هكذا: «ألا توجد مفاضلة بين العدالة والدقة؟»

لا توجد. أو بدقّة أكبر: توجد مفاضلة بين العدالة ووهم الدقة. فالنموذج «الدقيق» في التنبؤ بالقرارات البشرية المتحيّزة ليس في الواقع دقيقاً في التنبؤ بالأداء الوظيفي. إنه دقيق في التنبؤ بالتحامل. وعندما تنزع التحيّز وتتدرّب على النتائج الحقيقية، لا تفقد القدرة التنبؤية — بل تعيد توجيهها نحو ما يهمّ فعلاً.

مبدأ Moneyball مطبَّقاً على التوظيف

في إحدى دراسات الحالة المتعلّقة بتناقص الموظفين، كشف الاستدلال السببي أن «نقص فرص التدريب» — لا الراتب — كان المحرّك الحقيقي للتسرّب. تدخّلت الشركة ببرامج تدريبية بدلاً من زيادات شاملة، فقلّصت التناقص بنسبة 23.9% بجزء يسير من التكلفة. تلك هي قوة أن تسأل لماذا بدلاً من مجرّد ماذا.

شركات مثل Unilever وHilton التي انتقلت إلى نماذج توظيف قائمة على البيانات وعلى النتائج أفادت بتقليص زمن التوظيف بنسبة تصل إلى 90% مع زيادة التنوّع في آن واحد. العدالة والكفاءة ليستا في تعارض. بل هما نتيجتان مترابطتان لنظام يقيس فعلاً الأشياء الصحيحة.

أفكّر في هذا بوصفه مبدأ Moneyball مطبَّقاً على الموارد البشرية. فمسؤولو التوظيف التقليديون يبالغون في تقدير النسب — شهادات رابطة اللبلاب، وأصحاب العمل ذوي الأسماء اللامعة — بالطريقة نفسها التي كان بها كشّافو البيسبول يبالغون في تقدير معدّل الضرب. أما الذكاء الاصطناعي السببي فيجد ما يعادل نسبة الوصول إلى القاعدة: الإشارات المُقلَّل من قيمتها التي تتنبّأ فعلاً بالنتائج الفائزة. وبإزالة تحيّز «التوافق الثقافي»، توسّع مجمّع المواهب ليشمل ذوي الأداء العالي الذين تتغافل عنهم كل شركة أخرى بصورة منهجية.

العدالة ليست ضريبةً على الأداء. بل هي ما يبدو عليه الأداء حين تكفّ عن الخلط بين النسب والإمكانات.

الجزء الذي أعترف فيه بما هو صعب

سأكون كاذباً لو قلتُ إن هذا كان سهل البناء، أو سهل البيع.

التقنية صعبة. فالنماذج السببية تتطلّب خبرة في المجال لبنائها — إذ عليك أن تفهم البنية السببية الفعلية للأداء الوظيفي في دور معيّن، لا أن ترمي البيانات إلى خوارزمية فحسب. والخطأ في تحديد تلك البنية يعني حجب مسارات مشروعة أو ترك مسارات زائفة مفتوحة. وقد خضنا نقاشات داخلية دامت أياماً حول ما إذا كان متغيّر بعينه مؤشّراً مشروعاً أم وسيطاً. ما من طريق مختصر. عليك أن تفكّر.

ودورة المبيعات صعبة أيضاً. فمديرو التوظيف يثقون بحدسهم. ويعتقدون أنهم حَكَمة جيّدون على الطباع. وإخبار أحدهم بأن «حدسه» هو في الواقع مطابقة أنماط مع ملفّه الديموغرافي الخاص لا يجعلك محبوباً في حفلات العشاء. وقد تعلّمنا أن نُقدّم التقنية لا بوصفها اتهاماً بل بوصفها أداة لدعم القرار — «فحص تحيّز» يشبه المدقّق الإملائي. فهو لا يكتب الكتاب نيابةً عنك. بل يضمن ألّا ترتكب أخطاءً يمكن تجنّبها.

وجاهزية البيانات تحدٍّ حقيقي. فالذكاء الاصطناعي السببي يحتاج إلى بيانات متينة، وكثيراً ما تكون فئات الأقليات ممثَّلة تمثيلاً ناقصاً في مجموعات البيانات التاريخية. ونعالج هذا بتوليد البيانات الاصطناعية — باستخدام الشبكات التوليدية التخاصمية (GANs) لإنشاء نقاط بيانات آمنة للخصوصية تحاكي الخصائص الإحصائية للفئات الممثَّلة تمثيلاً ناقصاً، بما يضمن أن يكون لدى النموذج أمثلة كافية ليتعلّم حدود قرار عادلة للجميع.

ما من شيء في هذا بسيط ببساطة تغليف استدعاء واجهة برمجة تطبيقات لـGPT وإطلاق منتج. لكن النسخة البسيطة لا تنجح. إنها تفشل بهدوء فحسب، على نطاق واسع، بطرق تُلحق الضرر بحياة أناس حقيقيين.

الحاجز، لا المرآة

كان الجيل الأول من الذكاء الاصطناعي في التوظيف مرآة. عكس تحيّزاتنا نحونا، مُضخَّمةً بالأتمتة، وأسميناه ذكاءً.

الجيل التالي يجب أن يكون حاجزاً — كذلك الذي في تجارب أداء الأوركسترا تلك. ليس أداة تنظر إلى المرشّحين فترى الديموغرافيا. بل أداة تُصغي إلى الموسيقى.

لم نبلغ ذلك بعد كقطاع. فلا تزال السوق تهيمن عليها أدوات تُحسّن من أجل الهدف الخاطئ، مبنية على نماذج لا تستطيع تفسير نفسها، تُباع لشركات لا تعرف أيّ الأسئلة تطرح. لكن البيئة التنظيمية تتحوّل. والأدلّة تتراكم. والمؤسسات التي تدرك هذا أولاً ستحظى بالوصول إلى مجمّع مواهب يستبعده منافسوها خوارزمياً.

لم أؤسّس Veriprajna لأنني ظننت أن العدالة أمر مستحسن لكنه غير ضروري. أسّستها لأنني نظرت إلى البيانات وأدركت أن التحيّز ليس مجرّد إخفاق أخلاقي — إنه إخفاق تنبّؤي. ففي كل مرة يرفض فيها نموذجٌ مرشّحاً مؤهّلاً بسبب اسم أو رمز بريدي أو هواية ترتبط بالفئة الديموغرافية «الخطأ»، يكون بذلك يقدّم تنبّؤاً خاطئاً. إنه يترك أداءً على الطاولة دون استغلال. إنه يختار الراحة على حساب الدقة.

المسألة ليست ما إذا كان الذكاء الاصطناعي سيُحوّل التوظيف. بل ما إذا كنّا سنستخدمه لنُوسّع نطاق أفضل غرائزنا أم أسوأها.

أعرف لأيّ جانب أبني.

Related Research

الامتثال في التوظيف بالذكاء الاصطناعي وعمليات تدقيق التحيز لأصحاب العمل متعددي الولايات القضائية | VeriprajnaSolution Page

Engineering Fairness in AI Recruitment: Causal AI vs Predictive AI | VeriprajnaInteractive Whitepaper

Beyond the Mirror: Causal AI for Fair RecruitmentTechnical Deep-Dive

Also Published On

LinkedIn · Company LinkedIn · Founder YouTube Medium Instagram Facebook X