
مدرّس الذكاء الاصطناعي لا يعرف أنك عانيت من الكسور الأسبوع الماضي
بعد بضعة أشهر من بناء أول نموذج أولي للتدريس بالذكاء الاصطناعي لدينا في Veriprajna، شاهدت عرضًا توضيحيًا كان من المفترض أن يجعلني فخورًا. كتبت طالبة سؤالاً عن المعادلات التربيعية. استجاب الذكاء الاصطناعي على نحو رائع — بصبر، وبأسلوب سقراطي، ومشجّع. أرشد الطالبة خطوة بخطوة في عملية التحليل إلى عوامل بدفء معلّم محبوب. كان الجميع في الغرفة يومئون برؤوسهم موافقين.
ثم عادت الطالبة في اليوم التالي وسألت عن النسب. لم يكن لدى الذكاء الاصطناعي أدنى فكرة أن هذه هي الطالبة نفسها التي كانت تعاني من الكسور طوال ثلاثة أسابيع. عاملها كأنها غريبة. قدّم لها محتوى يفترض إتقانًا لم يكن لديها. وفي غضون أربع دقائق، أغلقت التبويب.
ذلك العرض كسر شيئًا في داخلي. ليس لأن التقنية فشلت — فقد أدّت تمامًا كما صُمّمت. لقد ولّدت الرمز التالي الأكثر احتمالاً إحصائيًا في المحادثة. لعبت دور معلّم بطلاقة مذهلة. لكنها لم تكن تعرف أي شيء عن هذه الطالبة. لم تستطع ربط معاناتها مع الكسور بمسألة النسب الماثلة أمامها. لم يكن لديها ذاكرة، ولا نموذج، ولا نظرية عن هويتها كمتعلّمة.
عندها أدركت: معظم مدرّسي الذكاء الاصطناعي ليسوا مدرّسين على الإطلاق. إنهم روبوتات دردشة ترتدي زيّ معلّم.
وهذا الإدراك دفع فريقي إلى مسار غيّر جذريًا ما نبنيه.
ما الذي يجعل المعلّم معلّمًا؟
فكّر في أفضل معلّم حظيت به على الإطلاق. أراهن أن ما جعله عظيمًا لم يكن قدرته على شرح الأمور بوضوح — رغم أنه ربما فعل ذلك أيضًا. بل كان أنه عرفك حقًا. لقد تذكّر أنك كنت تتجمد خوفًا أثناء العروض الشفهية. لاحظ أنك كنت دائمًا تستوعب المفهوم لكنك ترتكب أخطاء حسابية تحت الضغط. كان يعدّل، جلسة بعد جلسة، بانيًا نموذجًا ذهنيًا لنقاط قوتك وثغراتك يستمر على مدى أشهر.
ذلك النموذج الذهني هو الجوهر. ليس الشرح. ليس الطرح السقراطي للأسئلة. بل نموذج عقل المتعلّم الذي يتطور بمرور الوقت.
انظر الآن إلى ما تسمّيه صناعة التعليم التقني "التعلّم المخصّص المدعوم بالذكاء الاصطناعي". تكاد هذه المنتجات دون استثناء أن تكون أغلفة برمجية رقيقة حول واجهة برمجة تطبيقات عامة — GPT-4، أو Claude، أو أيًّا كان ما يُطرح في الربع القادم. "الذكاء" بأكمله يعيش في موجّه نظام يقول شيئًا مثل: "أنت مدرّس رياضيات مفيد. كن صبورًا ومشجّعًا."
ذلك الموجّه يتحكم في النبرة، لا في الاستراتيجية. إنه يخبر النموذج كيف يبدو صوته، لا ما ينبغي تدريسه. ولأن نماذج اللغة الكبيرة محرّكات احتمالية عديمة الحالة — فهي تتنبأ بالكلمة التالية بناءً على نافذة المحادثة الحالية — فإنها تعامل كل جلسة كحدث منعزل. لا يمكنها ربط فهمٍ خاطئ نشأ قبل ثلاثة أشهر بإخفاقٍ يقع اليوم، لأنها لا تملك تمثيلاً دائمًا لمعرفة المتعلّم.
التعليم ليس توليد الشروح. إنه إدارة الحالة المعرفية للمتعلّم بمرور الوقت.
هذا هو التمييز الذي يخطئ فيه سوق "مدرّس الذكاء الاصطناعي" بأكمله.
الليلة التي روت فيها الأرقام قصة مختلفة
أحتاج أن أخبركم عن أمسية بعينها، لأنها غيّرت اتجاه شركتنا.
كنا نشغّل نموذجنا الأولي القائم على الغلاف مع مجموعة صغيرة من الطلاب، وكنت أراجع سجلات التفاعل في وقت متأخر من إحدى الليالي، متوقعًا أن أجد النمط المعتاد — الطلاب يطرحون الأسئلة، الذكاء الاصطناعي يجيب عنها، والجميع سعداء. لكن بدلاً من ذلك، وجدت شيئًا مقلقًا.
كان الذكاء الاصطناعي قد أعطى طالبًا إجابة نهائية صحيحة لمسألة جبرية — لكن خطوات الاستدلال الوسيطة كانت خاطئة. الطالب، وهو تلميذ في الصف العاشر لا يملك وسيلة للتمييز بين المنطق السليم والهلوسة الواثقة، استوعب الاستدلال المعيب وطبّقه على المسائل الثلاث التالية. كانت كل إجابة لاحقة خاطئة بطريقة تعود مباشرة إلى الشرح الملفّق للذكاء الاصطناعي.
الأبحاث تؤكد هذا. وجدت دراسات لنماذج اللغة الكبيرة في تدريس الرياضيات أن النماذج كثيرًا ما تقدّم إجابات صحيحة عبر خطوات وسيطة خاطئة، أو تصنّف عمل الطالب الصحيح على أنه خاطئ. لا يستطيع الطالب المبتدئ التمييز بين الشرح الحقيقي والهلوسة التي تبدو معقولة. يبدو الذكاء الاصطناعي موثوقًا في كلتا الحالتين.
اتصلت بشريكي المؤسّس تلك الليلة. قلت له: "نحن لا نبني مدرّسًا. نحن نبني كذّابًا واثقًا يصيب الحقيقة من حين لآخر."
كان ذلك قاسيًا. لكنه كان أيضًا اللحظة التي بدأنا فيها نطرح سؤالاً مختلفًا: ماذا لو كان الذكاء في مدرّس الذكاء الاصطناعي يجب ألا يعيش في نموذج اللغة على الإطلاق؟
لماذا يفشل تغليف نموذج اللغة الكبيرة في التعلّم الحقيقي؟

الإخفاقات ليست حالات هامشية. إنها معمارية. ثلاث مشكلات ظلّت تظهر في سجلاتنا، وهي المشكلات الثلاث نفسها التي سيصطدم بها في النهاية كل مدرّس قائم على الغلاف:
عجز الذاكرة. رحلة تعلّم الطالب تمتد لأشهر — آلاف التفاعلات الدقيقة. حتى مع نوافذ السياق المتوسّعة، فإن تكلفة وزمن معالجة تاريخ الطالب بأكمله في كل تبادل واحد باهظان على نطاق واسع. لذا ينسى الذكاء الاصطناعي. ينسى أن هذا الطالب أتقن جمع الأعداد الصحيحة قبل أسابيع ولا يحتاج إلى مراجعته. ينسى أنها تظل ترتكب خطأ الإشارة نفسه في المعادلات. تبدأ كل جلسة من نقطة تقارب الصفر.
مشكلة الهلوسة. سبق أن وصفت هذا، لكنه يستحق التأكيد: عندما يرشد الذكاء الاصطناعي طالبًا بثقة عبر استدلال خاطئ، فإن الضرر يتراكم. لا يخطئ الطالب في مسألة واحدة فحسب — بل يستوعب نموذجًا ذهنيًا معيبًا يفسد التعلّم المستقبلي. وليس لدى الذكاء الاصطناعي آلية لاكتشاف هذا، لأنه لا يملك نموذجًا لما يعرفه الطالب فعلاً.
فراغ الاستراتيجية. "تصرّف كمعلّم" هو تعليمة عن الشخصية، لا عن التربية. المعلّم الحقيقي يتخذ مئات القرارات الدقيقة في كل درس: هل أعطي تلميحًا أم أدعهم يكافحون؟ هل أعود إلى المادة التمهيدية أم أمضي قدمًا؟ هل أنتقل من الشرح البصري إلى الشرح اللفظي؟ هذه القرارات تتطلب نظرية عن الطالب. الغلاف لا يملك نظرية. إنه يتفاعل مع الرسالة الحالية. هذا كل ما في الأمر.
ما هو تتبّع المعرفة العميق، ولماذا ينبغي أن يهمّك؟
هنا أحتاج أن أدخل في شيء من التقنية، لكنني أعدك أنه يرتبط مجددًا بالطالبة التي أغلقت التبويب.
تتبّع المعرفة مهمة من مهام تعلّم الآلة ذات هدف محدد: نمذجة معرفة الطالب بمرور الوقت للتنبؤ بالأداء المستقبلي. إنه موجود منذ عقود، بدءًا بما يُسمى تتبّع المعرفة البايزي — وهو نظام يعامل المعرفة كثنائية. فأنت إما "تعرف" الكسور أو لا تعرفها. كل مفهوم يعيش في صومعته الخاصة. ويجب وسم كل سؤال يدويًا من قِبل خبير بشري.
ذلك النهج محدود بطرق مهمة. التعلّم ليس ثنائيًا. يمكنك أن تفهم مفهوم الكسور لكنك ترتكب أخطاء باستمرار عندما تختلف المقامات. يمكن أن تكون "صدئ المهارة" في شيء أتقنته الشهر الماضي. والمفاهيم ليست مستقلة — المعاناة مع الضرب تنبئ بالمعاناة مع القسمة، لكن النماذج القديمة لم تستطع التقاط ذلك ما لم يرمّز إنسان العلاقة صراحةً.
تتبّع المعرفة العميق، الذي قُدّم في ورقة بحثية بارزة من تأليف Piech وزملائه في جامعة ستانفورد، تخلّص من كل ذلك. فبدلاً من التصنيفات الثنائية والتبعيات المرمّزة يدويًا، يستخدم تتبّع المعرفة العميق الشبكات العصبية المتكررة — وتحديدًا شبكات الذاكرة طويلة قصيرة المدى — لتعلّم بنية المعرفة مباشرةً من بيانات تفاعل الطلاب. لا وسم يدوي. لا افتراضات ثنائية.
الابتكار الجوهري هو ما بدأت أسمّيه "حالة الدماغ" — متجه عالي الأبعاد يعمل كوكيل رقمي لكل ما يعتقده النظام عن المعرفة الحالية للطالب. إنه ليس دفتر درجات يسجّل الأداء الماضي. إنه نموذج تنبؤي للقدرة الحالية يتحدّث مع كل تفاعل واحد.
حالة الدماغ لا تسجّل ما أصبته صوابًا بالأمس. إنها تتنبأ بما ستصيبه صوابًا غدًا — ولماذا.
عندما يجيب الطالب عن سؤال، تحدّث شبكة الذاكرة طويلة قصيرة المدى هذا المتجه. والمخرَج هو احتمال لكل سؤال آخر في قاعدة البيانات: ما مدى احتمال أن يجيب هذا الطالب عن كل سؤال منها إجابة صحيحة، الآن؟ تلك الخريطة الاحتمالية هي حيث يحدث السحر الحقيقي.
كتبت عن المعمارية التقنية الكاملة — آليات البوابات، ومشكلة تلاشي الانحدار، وبيانات الأداء المقارن — في ورقتنا البحثية. لكن الرؤية التي تهمّ في هذا المقال أبسط: أظهر تتبّع المعرفة العميق تحسّنًا بنسبة 25% في دقة التنبؤ مقارنةً بالطرق البايزية التقليدية. هذا ليس مكسبًا تدريجيًا. هذا هو الفرق بين نظام يعرف طالبك بشكل ما ونظام يعرفه فعلاً.
الحجة التي كادت تخرجنا عن المسار
أريد أن أكون صادقًا بشأن أمر ما. عندما اقترحت أول مرة بناء نظام تتبّع معرفة عميق بدلاً من التكرار على غلاف روبوت الدردشة لدينا، عارضني فريقي. بشدة.
قال أحد مهندسينا: "لدينا منتج يعمل. المستخدمون يحبون التحدث إليه. لماذا نعيد بناء الأساس؟"
كان أحد المستشارين أكثر صراحةً: "استخدم GPT فحسب. النموذج يتحسّن كل ستة أشهر. سيصبح شيء تتبّع المعرفة الخاص بك عتيقًا قبل أن تطلقه."
فهمت المنطق. نماذج اللغة الكبيرة تتحسّن بسرعة. نوافذ السياق تتوسّع. لماذا نبني معمارية معرفية منفصلة بينما قد يتولى نموذج اللغة في النهاية كل شيء؟
إليكم ما قلته لهم، وما زلت أؤمن به: نموذج لغة يتحسّن في توليد النص لا يتحسّن في فهم المتعلّم. هاتان قدرتان مختلفتان جوهريًا. إحداهما لغوية. والأخرى معرفية. يمكن أن يكون لديك أبلغ مدرّس في العالم، لكن إن لم يتذكّر أنك عانيت من الكسور الأسبوع الماضي، فإن بلاغته تذهب هدرًا.
استوعب الفريق الفكرة في النهاية — ليس بسبب حجتي، بل بسبب البيانات. أجرينا تجربة بسيطة: أعطينا المجموعة نفسها من الطلاب المنهج نفسه، نصفهم عبر غلافنا ونصفهم عبر نسخة مبكرة بدائية من نظامنا الموجّه بتتبّع المعرفة العميق. كان معدل إكمال مجموعة تتبّع المعرفة العميق قريبًا من ثلاثة أضعاف. ليس لأن الشروح كانت أفضل. بل لأن التسلسل كان أفضل. النظام كان يعرف متى يدفع ومتى يقدّم الدعامات.
كيف تُبقي الطالب في منطقة التدفّق؟

هنا يلتقي علم النفس بالرياضيات، وهو الجزء من عملنا الذي أجده أجمل ما يكون.
يصف مفهوم "التدفّق" لميهاي تشيكسنتميهالي حالة من الانغماس التام — حين تكون منهمكًا في مهمة إلى درجة أن الوقت يتلاشى. لا يحدث ذلك إلا عندما يتطابق التحدي مع مستوى مهارتك. أسهل مما ينبغي، فتشعر بالملل. أصعب مما ينبغي، فتشعر بالقلق. والنقطة المثالية ضيّقة.
في الفصل الدراسي التقليدي، يكاد يكون إيجاد تلك النقطة المثالية لثلاثين طالبًا مختلفًا في آنٍ واحد أمرًا مستحيلاً. في روبوت الدردشة القياسي، لا تُحاوَل حتى — فالذكاء الاصطناعي يجيب فقط عمّا تسأله. لكن في نظام تتبّع المعرفة العميق، يمنحك المتجه الاحتمالي شيئًا استثنائيًا: خريطة في الوقت الفعلي لموضع منطقة التدفّق لكل طالب.
تذكّر ذلك المخرَج — احتمال الإجابة الصحيحة لكل سؤال في قاعدة البيانات؟ يمكننا تخطيط تلك الاحتمالات مباشرةً على الحالات النفسية:
عندما يكون الاحتمال المتوقّع أعلى من 0.75، يكون الطالب قد أتقن ذلك المحتوى على الأرجح. عرضه عليه يخاطر بالملل. أما دون 0.35، فمن المرجح أن يفشل — تقديمه دون دعم يخاطر بالإحباط والانسحاب. لكن في ذلك النطاق بين 0.40 و0.70، حيث يكون لدى الطالب ربما فرصة بنسبة 55% أو 60% للإجابة الصحيحة؟ تلك هي المنطقة. إنهم يعرفون ما يكفي لمحاولة المسألة لكن عليهم أن يفكّروا لحلّها. تلك هي منطقة النمو القريبة لفيغوتسكي، مُكمّمةً بالأرقام.
حوّلنا نظرية نفسية من سبعينيات القرن الماضي إلى خوارزمية اختيار. الطالب لا يدرك أن ذلك يحدث. إنه فقط يشعر أن المادة دائمًا مناسبة تمامًا.
يشغّل نظامنا حلقة مستمرة: يجيب الطالب، فتحدّث شبكة الذاكرة طويلة قصيرة المدى حالة الدماغ، وتتحوّل الاحتمالات، ويُختار السؤال التالي لإبقائه معلّقًا في تلك المنطقة من أقصى انخراط. إن تعثّر، يقدّم النظام تلقائيًا محتوى دعم أبسط لإعادة بناء الثقة قبل العودة إلى التعقيد. وإن كان يمرّ بسهولة، يدفع بقوة أكبر.
هذا ما أعنيه حين أقول إن الذكاء يجب ألا يعيش في نموذج اللغة. نموذج اللغة الكبير لا يقرّر ما يُدرَّس. حالة الدماغ هي التي تقرّر ذلك. نموذج اللغة الكبير يقرّر فقط كيف يقوله.
لماذا لا يستطيع نموذج اللغة أن يفعل كل هذا بمفرده؟

يسألني الناس هذا باستمرار، وهو سؤال وجيه. إن كانت نماذج اللغة الكبيرة تزداد ذكاءً، وأطول سياقًا، وأكثر قدرة، فلماذا نبني نظامًا منفصلاً؟
ثلاثة أسباب.
أولاً، التكلفة وزمن الاستجابة. معالجة تاريخ تفاعل الطالب بأكمله — ربما آلاف التبادلات على مدى أشهر — عبر نموذج لغة كبير في كل استجابة واحدة أمر مكلف حسابيًا وبطيء. أما نموذج تتبّع المعرفة العميق فيعالج البيانات نفسها في أجزاء من الألف من الثانية لأنه مصمّم معماريًا لتتبّع الحالة التسلسلية. إنه الأداة المناسبة للمهمة.
ثانيًا، احتواء الهلوسة. عندما يحدّد نظامنا السؤال التالي الأفضل لعرضه، فإنه يقيّد نطاق نموذج اللغة الكبير. فبدلاً من ترك GPT يتجوّل بحرية عبر كل الرياضيات، نخبره: "اعرض المسألة رقم 882. لدى الطالب فرصة بنسبة 60% لحلّها. قدّم تلميحًا متعلّقًا بالتحليل إلى عوامل إن تردّد." وبتقييد مساحة البحث، نقلّل بشكل كبير من فرصة توليد النموذج هراءً يبدو معقولاً.
ثالثًا — وهذه هي الحجة الاستراتيجية — قابلية الدفاع. إن كان منتجك بأكمله موجّهًا ملفوفًا حول واجهة برمجة تطبيقات عامة، فليس لديك خندق دفاعي. يستطيع أي أحد أن يكرّره في عطلة نهاية أسبوع. لكن نموذج تتبّع معرفة عميق مدرّب على آلاف مسارات التعلّم، ومُصقَل باستمرار ببيانات طلاب حقيقيين؟ ذلك أصل مملوك حصريًا. وكلما استخدم طلاب أكثر النظام، ازدادت دقة تنبؤه، وكلما ازدادت دقة تنبؤه، بقي طلاب أكثر. إنه دولاب طيّار للبيانات لا يستطيع المنافسون استنساخه عبر استدعاء واجهة برمجة تطبيقات.
لنظرة أعمق على كيفية هندستنا لهذا — التكامل العصبي الرمزي، ومشكلة البدء البارد، واستراتيجيات نقل التعلّم — أعددت جولة تفاعلية تدخل في تفاصيل أكثر مما يمكنني هنا.
البدء البارد والأسئلة العشرون الأولى
أحد التحديات التي صارعناها لأسابيع: ماذا تفعل مع طالب جديد تمامًا؟ يحتاج نموذج تتبّع المعرفة العميق إلى بيانات تفاعل لبناء حالة دماغ، لكن الطالب لا يملك تاريخًا. هذه هي مشكلة "البدء البارد" الكلاسيكية في تعلّم الآلة، وفي التعليم تكون مؤلمة بشكل خاص لأن تلك التفاعلات القليلة الأولى تحدد ما إذا كان الطالب سيعود.
حلّنا من ثلاث طبقات. ندرّب النموذج مسبقًا على بيانات مجمّعة مجهولة الهوية من آلاف مسارات التعلّم التاريخية، مرسّخين خطًّا أساسيًا. وعندما يصل طالب جديد، نُسنده إلى عنقود متعلّمين بناءً على تقييم تشخيصي قصير، مغذّين حالته الخفية بمركز المتعلّمين المتشابهين. ثم — وهذا الجزء تطلّب أكبر قدر من الضبط — صمّمنا شبكة الذاكرة طويلة قصيرة المدى لتتباعد بسرعة عن الخط الأساسي العام إلى حالة مخصّصة خلال أول 10 إلى 20 تفاعلاً.
تلك الأسئلة العشرون الأولى هي الأهم. أمضينا أسابيع في معايرتها — ليس فقط من أجل دقة التشخيص، بل من أجل الانخراط. إن بدا التشخيص كاختبار، ينسحب الطلاب. إن بدا كمحادثة، ينخرطون. كان تحقيق ذلك مشكلة تصميم بقدر ما هو مشكلة تعلّم آلة.
ما الذي تُظهره معدلات الإكمال فعلاً
لن أتظاهر بأن نظامنا مثالي. ما زلنا في مرحلة مبكرة. لكن الأرقام من تجاربنا التجريبية تروي قصة يصعب الجدال معها.
الدورات التعليمية التقليدية عبر الإنترنت — الدورات المفتوحة الضخمة عبر الإنترنت، ومنصات نظم إدارة التعلّم القياسية — تشهد معدلات إكمال تقارب 15 إلى 20%. ذلك الرقم ظلّ ثابتًا بعناد لأكثر من عقد. أما الأنظمة التكيّفية المدعومة بتتبّع المعرفة فترفع ذلك إلى 60 إلى 80%. وفي سياقات التدريب المؤسّسي، حيث يكون المقياس المهم هو الوقت اللازم للإتقان، أظهرت الأنظمة التكيّفية انخفاضًا بنسبة 40 إلى 50% في إجمالي وقت التدريب — لأن الموظفين يتخطّون المحتوى الذي أتقنوه بالفعل ويركّزون فقط على ثغراتهم الفعلية.
مشكلة "السيغما الاثنين"، التي حدّدها الباحث التربوي بنجامين بلوم، أظهرت أن التدريس الفردي وجهًا لوجه ينتج مخرجات تعلّم أعلى بانحرافين معياريين من التدريس داخل الفصل. كان التحدي دائمًا هو قابلية التوسّع — لا يمكنك أن تمنح كل طالب مدرّسًا شخصيًا. لا يحلّ تتبّع المعرفة العميق تلك المشكلة تمامًا، لكنه يقترب أكثر من أي شيء آخر رأيته، لأنه يمنح كل طالب نظامًا ينمذج فعلاً معرفته هو، لا منهجًا عامًا.
مشكلة السيغما الاثنين لم تكن أبدًا عن إيجاد شروح أفضل. كانت عن إيجاد طريقة لمعرفة كل متعلّم بشكل فردي، على نطاق واسع. إنها مشكلة تتبّع حالة، لا مشكلة لغة.
الحقيقة غير المريحة بشأن "التعلّم المخصّص"
إليكم ما توصّلت إلى الإيمان به، وأعلم أنه ليس رأيًا شائعًا في صناعة التعليم التقني: "التعلّم المخصّص" كما تمارسه الصناعة حاليًا هو في معظمه كذبة.
تغيير حجم الخط ليس تخصيصًا. السماح للطالب بالاختيار بين الفيديو والنص ليس تخصيصًا. حتى تكييف الصعوبة بناءً على الإجابات الثلاث الأخيرة يكاد لا يكون تخصيصًا — إنه منظّم حرارة، لا مرشد.
التخصيص الحقيقي يتطلب نموذجًا دائمًا ومتطورًا للمتعلّم الفرد. يتطلب تذكّر أن هذا الطالب يتقن المفاهيم البصرية بسرعة لكنه يعاني مع الترميز الرمزي. يتطلب فهم أن إخفاقها في مسألة النسب اليوم مرتبط بثغرة في فهم الكسور من أسابيع مضت. يتطلب التنبؤ ليس فقط بما إذا كانت ستجيب عن السؤال التالي بشكل صحيح، بل لماذا قد تخطئ فيه — وتعديل المسار وفقًا لذلك.
هذا ما تفعله حالة الدماغ. وهذا هو سبب إيماني بأن مستقبل الذكاء الاصطناعي التعليمي ليس عن بناء روبوتات دردشة أفضل. إنه عن بناء معماريات معرفية أفضل تحتها.
نموذج اللغة الكبير هو الفم. نموذج تتبّع المعرفة العميق هو الدماغ. من دون الدماغ، الفم يتكلم فحسب.
نظام يتذكّر
أظل أعود إلى تلك الطالبة من عرضنا التوضيحي المبكر — تلك التي أغلقت التبويب حين نسيها الذكاء الاصطناعي. أفكّر فيها لأنها تمثّل ملايين المتعلّمين الذين وُعدوا بتعليم مخصّص وتلقّوا روبوت دردشة بموجّه نظام ودود.
نحن نبني شيئًا مختلفًا. ليس نظامًا يولّد شروحًا أفضل — فنماذج اللغة الكبيرة ستستمر في التحسّن في ذلك من تلقاء نفسها. نحن نبني نظامًا يتذكّر. نظامًا يعرف أنك عانيت من الكسور الأسبوع الماضي، ولذلك يتوقّع معاناتك مع النسب اليوم. نظامًا يُبقيك في النطاق الضيّق حيث يحدث التعلّم فعلاً — متحدَّى بما يكفي لتنمو، ومدعوم بما يكفي لئلا تستسلم.
التقنية اللازمة لهذا موجودة. تتبّع المعرفة العميق ليس نظريًا. معماريات الذاكرة طويلة قصيرة المدى مثبتة. منطقة التدفّق يمكن تكميمها واستهدافها. لم يكن السؤال أبدًا ما إذا كان ذلك ممكنًا. كان السؤال ما إذا كان أحد سيكلّف نفسه عناء بنائه بينما كان لصق غلاف على GPT أسهل بكثير.
نحن كلّفنا أنفسنا العناء. وأعتقد أن الطلاب الذين يبقون — أولئك الذين لا يغلقون التبويب — سيكونون الدليل.