تفشل الرؤية الحاسوبية العامة عند الحالات الحدّية: رؤوس صلعاء تُحسب كرات قدم، وجزيئات غبار تُصنَّف عيوبًا مهلكة، وظلال تُطلق فرامل وهمية. نحن نبني أنظمة رؤية مقيّدة بالفيزياء ترفض المستحيل قبل أن يصبح مُكلِفًا.
سواء كنت تشغّل كاميرات آلية في الملاعب، أو تفحص رقائق السيليكون عند 10 نانومتر، أو تصنّف العيوب على خط إنتاج، فالمشكلة واحدة: الكاشف لديك يجد الأنماط، لكنه لا يفهم الفيزياء. الكرة لا يمكن أن تنتقل آنيًّا. للعيب اختلاف منظر (parallax). الظل لا عمق له. نحن ندمج هذه القيود الفيزيائية مباشرةً في مسار الرؤية لديك، لنسدّ الفجوة بين الكشف والفهم.
في أكتوبر 2020، تتبّع نظام الكاميرا الآلي من Pixellot في نادي Inverness Caledonian Thistle رأس حَكَمٍ مساعدٍ أصلع طوال المباراة بدلًا من الكرة. استخدم النظام كاشف CNN قياسيًّا (على الأرجح من عائلة YOLO) يعالج كل إطار على حدة. تحت أضواء الملعب الكاشفة، أنتج رأس الحَكَم المساعد انعكاسات لمعانٍ بتدرّجات بكسلية لا يمكن تمييزها إحصائيًّا عن كرة قدمٍ بيضاء. أسند الكاشف ثقة 98% إلى «كرة» على الرأس، بينما حصلت الكرة الفعلية (المتحركة بسرعة، والمموّهة عبر الظلال) على 80%. تَبِع النظام الإشارة الأعلى ثقةً. لم يكن لديه أي آلية للتحقق من أن «كرة» تتحرك بسرعة 3 أميال في الساعة على ارتفاعٍ ثابتٍ قدره 1.7 متر، ملتصقةً بجسمٍ أسطوانيٍّ رأسي، تنتهك كل قيدٍ حركيٍّ لكرة قدمٍ في اللعب. الحل ليس بياناتٍ تدريبية أفضل. إنه الفيزياء.
تهيمن KLA على فحص أشباه الموصلات بحصة سوقية تبلغ 63%، وتستطيع سلسلتها 2900 الكشف عن سماتٍ صغيرة بحجم 10 نانومتر. لكن الكشف ليس عنق الزجاجة. عنق الزجاجة هو مشكلة العيوب المُزعجة: عند عُقد العمليات المتقدمة، يلتقط مسحٌ عريض النطاق آلاف الشذوذات لكل رقاقة. معظمها مصنوعاتٌ سطحية، أو جزيئات غبار، أو ضوضاء نمطية لن تؤثر على المردود. كلٌّ منها يتطلب تصنيفًا. خسارة مردودٍ بنسبة 1% عند العُقد المتقدمة تُترجَم إلى ملايين من الإيرادات المفقودة لأن رقاقةً واحدة قد تُكلّف عشرات الآلاف من الدولارات. المعيار الصناعي هو مصنّفات التعلم العميق المدرَّبة على مكتبات العيوب التاريخية، لكن هذه المصنّفات لا تملك أي نموذجٍ لكيفية تفاعل الضوء فيزيائيًّا مع حفرةٍ مقابل بقعةٍ مقابل بقايا عملية. وعندما ينتقل المصنع إلى عُقدة عمليةٍ جديدة (مثلًا، البوابة المُحيطة بالكامل عند 2 نانومتر)، تصبح بيانات تدريب المصنّف عتيقةً ويرتفع معدل الإزعاج بشدة. النماذج الفيزيائية للعيوب التي تفهم اختلاف المنظر، وانعكاسية المادة، والتشتت الطوبوغرافي تفصل العيوب الحقيقية عن الضوضاء بصرف النظر عن عُقدة العملية.
على خطوط الإنتاج التي تستخدم مراقبة الجودة المعتمدة على الذكاء الاصطناعي، نادرًا ما تعرف متى يكون نموذج الرؤية الحاسوبية مخطئًا. بدون تسميات الحقيقة الأرضية في الوقت الفعلي، يتراكم الانحراف بهدوء بينما يستمر الإنتاج. تنزاح زاوية إضاءةٍ بعد الصيانة. تتضبّب عدسةٌ على مدى أسابيع. يتآكل تثبيت. ترتفع حالات الرفض الخاطئ (حلقات إعادة العمل، احتكاك الإنتاجية) أو تتسلل حالات القبول الخاطئ (مخاطر الإفلات، التعرض للضمان). وبحلول الوقت الذي يظهر فيه إفلاتٌ في الجودة، فإنه يُطلق احتواءً واسعًا، وحجرًا موسّعًا، وإعادة فحص، ومراجعة يدوية. تبلغ تكلفة الجودة الرديئة نحو 20% من إجمالي المبيعات لدى المُصنّعين المتوسطين. تعمل القيود الفيزيائية كمراسٍ ثابتة: الخصائص الفيزيائية لقطعةٍ مُصنّعة بشكلٍ صحيح لا تتغير عندما تنزاح الإضاءة. يقيس النظام المُستنير بالفيزياء ما إذا كانت الصورة المرصودة متسقةً مع الهندسة المعروفة وخصائص المادة، وليس فقط ما إذا كانت «تبدو مثل» قطعةٍ جيدة مقارنةً بصور التدريب التاريخية.
| المزوِّد | المجال | ما الذي يُقدِّمونه | تكامل الفيزياء | أين يقصُرون |
|---|---|---|---|---|
| Pixellot | البث الرياضي | كاميرات آلية بالذكاء الاصطناعي، تتبّع تلقائي، زوايا متعددة. أكثر من 150 دوريًّا، وشراكة مع GameChanger. | ترشيح Kalman أساسي لتنعيم المسار. التتبّع متعدد الفرضيات في V4 أصلح إلى حدٍّ كبير فئة أخطاء الرأس الأصلع. | أنماط فشل جديدة: التعرف الضوئي على أرقام القمصان تحت تشوّش الحركة، وإسقاط التسلل على ملاعب غير مستوية. الفيزياء تنعيمٌ لاحق، وليست طبقة قيود. |
| Hawk-Eye (Sony) | تحكيم رياضي | تثليث متعدد الكاميرات، تتبّع هيكلي (29 نقطة لكل لاعب). NFL وMLB وATP. | قيود هندسية قوية عبر معايرة متعددة الكاميرات. | مكلِفة (أكثر من $1M لكل ملعب). مملوكة ومغلقة. تتطلب بنية تحتية مخصصة (6-8 كاميرات 4K/8K لكل ملعب). |
| KLA Corporation | فحص أشباه الموصلات | فحص عريض النطاق من سلسلة 2900، حساسية 10 نانومتر. حصة سوقية 63% في التحكم بالعمليات. | نماذج فيزياء العيوب القائمة على القواعد، مدمجة في عُقد عمليةٍ محددة. | النماذج خاصة بعُقدة العملية. انتقالات العُقد الجديدة تسبب ارتفاعات في معدل الإزعاج. استثمار $2.3B في البحث والتطوير يشير إلى أنهم يعرفون بوجود الفجوة. |
| Cognex | ضمان جودة التصنيع | تعلم عميق VisionPro ViDi، تعلم حافيٌّ على الكاميرا (5-10 صور تدريب). | لا شيء عند الاستدلال. الرؤية الآلية التقليدية تتولى القياس/المترولوجيا. | مدفوعٌ بالبيانات فقط. عُرضةٌ للانحراف الصامت. تخفيض 90% في وقت الإعداد لكن دون تأصيلٍ فيزيائي. |
| NVIDIA | المنصة/البنية التحتية | منظومة Metropolis (أكثر من 1,000 شركة)، وOmniverse لمحاكاة التوأم الرقمي، وCosmos للبيانات التركيبية. | الفيزياء في وقت التدريب (التصيير)، وليس الاستدلال. يحاكي Omniverse الفيزياء لتوليد البيانات التركيبية. | منصة، وليست حلًّا. الفيزياء تتوقف عند التدريب. النموذج المنشور لا يزال مدفوعًا بالبيانات بحتًا. |
| Veo | الرياضة (القاعدية) | كاميرات ذكاء اصطناعي تُباع مباشرةً للمستهلك، أكثر من 40,000 نادٍ، 100 دولة، أكثر من 4 ملايين مباراة مصوَّرة. | ضئيل. تتبّع من فئة المستهلك. | غير مقيّدة بالفيزياء. سعر المستهلك يعني حوسبةً محدودة لطبقات القيود. |
| كبرى شركات التدقيق الأربع / مكاملو الأنظمة الكبار | متعدد الصناعات | تطبيقات المنصات (NVIDIA، واجهات برمجة التطبيقات السحابية)، وخدمات التكامل، وإدارة التغيير. | يطبّقون أدوات فيزياء المورّدين. لا يبنون طبقات قيودٍ مخصصة. | هم ينشرون المنصات. بناء مسار ترشيح Kalman مخصص ومضبوط على فيزياء حالتك المحددة ليس ضمن أساليبهم. تتراوح المشاريع بين $500K و$5M+ وتستغرق 6-18 شهرًا. |
| واجهات برمجة التطبيقات السحابية | الأغراض العامة | كشف/تصنيف مُدرَّب مسبقًا، تكامل سهل عبر واجهة برمجة التطبيقات، الدفع لكل استدعاء. | لا شيء. استدلالٌ مستقل عن الإطار بالتصميم. | لا اتساق زمني. لا قيود فيزيائية. «فخ الـ90%»: سريعٌ إلى دقة 90%، مستحيلٌ سدّ آخر 10% دون فيزياء خاصة بالمجال. |
الفجوة متسقة عبر كل قطاع: الفيزياء إما غائبة، أو محصورة في التدريب، أو محبوسة داخل نظامٍ مملوك. لا أحد يقدّم طبقات قيودٍ فيزيائية مخصصة كخدمة، مُدمجة في مسارك الحالي، ومضبوطة على فيزياء مجالك المحدد. هذا ما نبنيه.
نضيف طبقة تحقّقٍ حتميةً بين كاشفك ونظام أفعالك. كل عملية كشف تمرّ عبر ثلاث بوابات قبل قبولها: بوابة Kalman الحركية (هل هذه الحركة ممكنة فيزيائيًّا بالنظر إلى كتلة الجسم وفرق الزمن؟)، وبوابة التدفق الضوئي (هل تطابق حركة البكسل داخل المربع المُحيط ملف السرعة المتوقَّع؟)، وبوابة هندسية (هل يفي حجم الجسم بقيود المنظور ثلاثي الأبعاد نسبةً إلى موضع الكاميرا؟). نضبط النموذج الفيزيائي على مجالك. ديناميكا المقذوفات لتتبّع الكرة. هندسة اختلاف المنظر لفحص الرقائق. قيود مستوى الطريق للملاحة الذاتية. ترفض البوابات الإيجابيات الكاذبة التي لا يمكن للثقة البصرية وحدها التقاطها.
لمصانع أشباه الموصلات والتصنيع الدقيق، نبني مصنّفات عيوبٍ تنمذج كيفية تفاعل الضوء فيزيائيًّا مع شذوذات السطح. الحفرة الحقيقية تشتت الضوء بطريقةٍ مختلفة عن جزيء الغبار. بقايا العملية لها انعكاسيةٌ مختلفة عن الدارة القصيرة. نستخدم هندسة المنظور المتعدد ونماذج التصيير القائمة على الفيزياء لتوصيف كل شذوذٍ بخصائصه الفيزيائية، وليس فقط بمظهره البصري. هذا يعني أن المصنّف يُعمِّم عبر عُقد العمليات لأن فيزياء تفاعل الضوء مع المادة لا تتغير عند انتقالك من FinFET إلى البوابة المُحيطة بالكامل.
انحراف النموذج هو القاتل الصامت للرؤية الحاسوبية الإنتاجية. نبني بُنًى تستخدم الثوابت الفيزيائية كمراسي استقرار. الهندسة الفيزيائية لقطعةٍ مُصنّعة بشكلٍ صحيح لا تتغير عندما تنزاح زاوية إضاءةٍ أو تتضبّب عدسة. نُرمّز هذه الثوابت في النظام بحيث يؤثر التباين البيئي على الإشارة الخام لكن ليس على المُخرَج المُتحقَّق منه فيزيائيًّا. هذا يقلّل دورات إعادة التدريب الطارئة من شهريةٍ إلى ربع سنويةٍ أو أقل، ويلتقط الانحراف قبل أن يسبب إفلاتاتٍ في الجودة.
عندما تكون الشبكات العصبية المُستنيرة بالفيزياء (PINNs) منطقيةً لتطبيقك، نبني مسار التدريب. تضيف PINNs مصطلح خسارةٍ فيزيائيًّا إلى خسارة البيانات القياسية: تُعاقَب الشبكة لا فقط على إغفال الهدف، بل على انتهاك المعادلات الحاكمة (Navier-Stokes، حركة المقذوفات، حفظ الطاقة). والنتيجة نموذجٌ يحتاج إلى بياناتٍ تدريبية أقل، ويُعمِّم بشكلٍ أفضل على الظروف غير المرئية، ويُنتج مُخرجاتٍ معقولةً فيزيائيًّا. نتولّى الأجزاء الصعبة: ضبط لامبدا (وزن الخسارة الفيزيائية)، وتثبيت التقارب، ومعالجة الانقطاعات (اصطدام الكرة بقائم، تأثيرات حافة الرقاقة) التي تجعل تطبيقات PINN الساذجة تفشل.
إليك بالضبط ما يحدث عندما يعالج نظامٌ مُبوَّبٌ بالفيزياء سيناريو مباراة Inverness، إطارًا تلو الآخر.
يجد الكاشف الكرة عند الإحداثيات (512, 380) بثقة 92%. يُهيِّئ ترشيح Kalman: الموضع (512, 380)، والسرعة المقدَّرة بـ18 م/ث باتجاه الشرق من الإطارات السابقة. عدم اليقين في الحالة منخفض. يُظهر التدفق الضوئي عند منطقة الكشف حركةً قويةً نحو اليمين تتسق مع كرةٍ مركولة. تجتاز كل البوابات الثلاث. يقبل النظام عملية الكشف ويحدّث المسار.
يعيد الكاشف مرشَّحين:
تنبّأ المُرشِّح بأن الكرة ستكون قرب (531, 376) بناءً على سرعتها والجاذبية. ابتكار المرشَّح A (المتبقي) هو 1.4 بكسل. ابتكار المرشَّح B هو 669 بكسلًا. مسافة Mahalanobis للمرشَّح B هي 47 انحرافًا معياريًّا. أي شيء يتجاوز 3 سيغما يُرفَض. يُستبعَد المرشَّح B قبل أن يصل إلى البوابة التالية.
يُظهر المرشَّح A مجال تدفقٍ قدره 450 بكسلًا/الثانية نحو اليمين، يتسق مع كرةٍ بسرعة 18 م/ث. حتى لو كان B قد اجتاز البوابة 1، فإن مجال تدفقه يُظهر حركةً تقارب الصفر (رأس ثابت). «كرة» بسرعةٍ صفرية في منتصف اللعب تنتهك الملف المتوقَّع. رفضٌ ثانٍ.
يمتد المرشَّح A عبر 22 بكسلًا عند هذه المسافة، يتسق مع كرةٍ بقطر 22 سم على بُعد 12 مترًا من الكاميرا. يمتد المرشَّح B عبر 45 بكسلًا. كرةٌ بقطر 22 سم على بُعد 12 مترًا لا يمكن أن تمتد عبر 45 بكسلًا. رفضٌ ثالث.
يتبع النظام المرشَّح A (الكرة الفعلية) بثقةٍ بصرية قدرها 80%، رافضًا المرشَّح B رغم ثقته البالغة 98%. الفيزياء تَجُبّ البكسلات.
تنطبق هذه البنية نفسها على أي مجالٍ تخضع فيه الأجسام لقوانينٍ فيزيائية. في مصنع أشباه الموصلات، تصبح «بوابة Kalman» فحص اتساق اختلاف المنظر عبر زوايا الفحص. في ضمان جودة التصنيع، تصبح «بوابة التدفق الضوئي» نموذج انعكاسية السطح. الإطار واحد؛ الفيزياء تتغير.
نقيس مسار الرؤية الحاسوبية الحالي لديك لنحدد بالضبط أين يفشل: معدلات الإيجابيات الكاذبة حسب الفئة، وزمن الاستجابة لكل خطوة استدلال، وتكرار الحالات الحدّية. نحدد أي القيود الفيزيائية تنطبق على مجالك وأي حالات فشل الكشف ستمنعها. المُخرَج: وثيقة مواصفات قيودٍ مع التخفيض المتوقَّع للإيجابيات الكاذبة وتوصيةٍ بالمضي/عدم المضي. إذا لم تكن القيود الفيزيائية ستحسّن نظامك بشكلٍ ملموس، نخبرك بذلك.
نبني الطبقة الفيزيائية وندمجها في مسارك. هذا ليس نظامًا منفصلًا؛ إنه طبقة تحقّقٍ تقع بين كاشفك الحالي ومنطق أفعالك. نضبط نموذج حالة ترشيح Kalman على ديناميكا أجسامك، ونعاير عتبات التدفق الضوئي على إعداد كاميراتك، ونتحقق من القيود الهندسية مقابل بيئتك الفيزيائية. يعتمد الجدول الزمني على التعقيد: مُتتبّع رياضيٌّ بكاميرا واحدة هو 8 أسابيع. نظام فحص أشباه موصلاتٍ متعدد المناظير بنماذج فيزياء مخصصة هو 16 أسبوعًا.
ننشر في الإنتاج مع المراقبة. نقيس كل بوابةٍ لتسجيل أسباب الرفض، ونقيس معدلات الإيجابيات الكاذبة والسلبيات الكاذبة مقابل معايير قبولك، ونتحقق من أن القيود الفيزيائية لا تضيف زمن استجابةٍ غير مقبول إلى مسارك. نضبط العتبات بناءً على بيانات الإنتاج، وليس ظروف المختبر. المُخرَج: نظام إنتاجي بخطوط أداءٍ مرجعية موثَّقة ولوحة معلومات لمراقبة الانحراف.
ما الذي يستغرق وقتًا أطول
معايرة الكاميرات المتعددة في الملاعب ذات التخطيطات غير المعيارية. انتقالات عُقد العمليات في أشباه الموصلات (يحتاج النموذج الفيزيائي إلى بيانات توصيفٍ من العُقدة الجديدة). التكامل مع وحدات PLC أو أنظمة SCADA القديمة التي لا تكشف عن تدفقات بياناتٍ في الوقت الفعلي.
أجب على ستة أسئلةٍ حول نشر الرؤية الحاسوبية الحالي لديك. احصل على تحليلٍ محدد لأي القيود الفيزيائية ستفيد وما التخفيض المتوقَّع للإيجابيات الكاذبة.
1. ماذا يتتبّع نظام الرؤية لديك أو يفحص؟
2. ما هو معدل الإيجابيات الكاذبة الحالي لديك؟
3. هل يعالج نظامك الإطارات بشكلٍ مستقل أم يحافظ على حالةٍ زمنية؟
4. كم مرةً تعيد تدريب نماذجك بسبب الانحراف البيئي؟
5. ما هي ميزانية زمن الاستجابة لكل إطار؟
6. هل لديك نماذج فيزياء لمجالك (معادلات حركية، خصائص مادية، قيود هندسية)؟
يعمل التخفيض التقليدي للإيجابيات الكاذبة عبر رفع عتبة الثقة: اشتراط ثقة 95% بدلًا من 80%. هذا يقلّل الإيجابيات الكاذبة لكنه يزيد حتمًا السلبيات الكاذبة لأن عمليات الكشف المشروعة ذات الثقة الأدنى تُرفَض أيضًا. تعمل القيود الفيزيائية بشكلٍ متعامد. إنها لا تمسّ عتبة الثقة. بل تتحقق مما إذا كانت عملية الكشف ممكنةً فيزيائيًّا بصرف النظر عن درجة ثقتها البصرية. رأسٌ أصلع بثقة 98% لا يزال مستحيلًا فيزيائيًّا ككرة، لذا يُرفَض. كرةٌ بثقة 75% تطابق التنبؤ الحركي تُقبَل. ينخفض معدل الإيجابيات الكاذبة لأن عمليات الكشف المستحيلة فيزيائيًّا تُستبعَد. ويبقى معدل السلبيات الكاذبة ثابتًا أو يتحسن لأن عمليات الكشف المشروعة ذات الثقة الأدنى تجتاز فحص الفيزياء. في فحص أشباه الموصلات، هذا يعني التقاط عيوبٍ حقيقية كانت عتبة الثقة العالية ستُفوّتها (حفرٌ خافتة لكنها حقيقية فيزيائيًّا) مع رفض الإشارات المُزعجة التي تصادف أن تبدو مثل العيوب (جزيئات سطحية بتشابهٍ بصري عالٍ لكن بسلوك اختلاف منظرٍ خاطئ).
نعم، وهذا هو النهج المعياري. تقع الطبقة الفيزيائية بين كاشفك ونظام أفعالك. يستمر كاشفك الحالي (YOLO، EfficientDet، CNN مخصص، واجهة برمجة تطبيقات سحابية) في توليد عمليات الكشف المرشَّحة. تقيّم الطبقة الفيزيائية كل مرشَّحٍ مقابل القيود الحركية والتدفق الضوئي والهندسية قبل تمريره إلى أسفل السلسلة. تعتمد نقاط التكامل على بنيتك: إذا كنت تُجري الاستدلال على الجهاز، تعمل الطبقة الفيزيائية على نفس العتاد (تحديثات ترشيح Kalman رخيصة حسابيًّا مقارنةً باستدلال CNN). إذا كنت تستخدم واجهة برمجة تطبيقات سحابية، يمكن للطبقة الفيزيائية أن تعمل عند الحافة لديك أو في مسار معالجتك. يضيف التكامل النموذجي 1-3 ميلي ثانية لكل إطار لبوابتَي ترشيح Kalman والتدفق الضوئي. يعتمد زمن استجابة البوابة الهندسية على تعقيد نموذجك ثلاثي الأبعاد لكنه نادرًا ما يتجاوز 5 ميلي ثانية. إجمالي زمن الاستجابة المُضاف: 2-8 ميلي ثانية. بالنسبة للأنظمة التي تعمل بالفعل بمعدل 25-60 إطارًا في الثانية (16-40 ميلي ثانية لكل إطار)، يناسب هذا الميزانية.
تعالج إعادة التدريب الانحراف لكن ليس المشكلة الجوهرية: لا يزال بإمكان النموذج المُعاد تدريبه أن يصدر تنبؤاتٍ مستحيلة فيزيائيًّا لأنه لا يملك أي مفهومٍ للفيزياء. يساعد توسيع بيانات التدريب في التغطية لكن له عوائد متناقصة على الحالات الحدّية (لا يمكنك التدرّب على نحوٍ يلغي قوانين الفيزياء). يتراوح بناء مسار قيودٍ فيزيائية بين $80K و$250K حسب التعقيد. تتبّع جسمٍ واحد بكاميرا واحدة (الرياضة) عند الطرف الأدنى. فحص أشباه الموصلات متعدد المناظير بنماذج فيزياء مخصصة عند الطرف الأعلى. قارن ذلك بالتكلفة المستمرة للمشكلة: مصنع أشباه موصلاتٍ تُكلّف فيه كل رقاقةٍ مهدورة عشرات الآلاف من الدولارات وتستنزف المراجعة اليدوية المدفوعة بالإزعاج ساعات المهندسين بسعر $150-200/ساعة. مذيعٌ رياضي تُفوّت كاميرته الآلية اللقطات الرئيسية يفقد مشتركين. مُصنّعٌ ينفق خُمس الإيرادات على تكاليف الجودة، يُدفع جزءٌ كبير منها بحالات الرفض الخاطئ التي ستمنعها القيود الفيزيائية. الطبقة الفيزيائية بناءٌ لمرةٍ واحدة بتكلفة صيانةٍ منخفضة لأن الفيزياء لا تنحرف. قوانين حركة المقذوفات لن تتغير في الربع القادم.
أصلح التتبّع متعدد الفرضيات في V4 من Pixellot إلى حدٍّ كبير فئة أخطاء «الرأس الأصلع». التثليث متعدد الكاميرات في Hawk-Eye مع التتبّع الهيكلي هو المعيار الذهبي للرياضات المُحكَّمة. لكن السوق تجاوز الطبقة العليا. كأس العالم لكرة القدم FIFA يحصل على إعداد Hawk-Eye بأكثر من $1M لكل ملعب. أكثر من 40,000 نادٍ يستخدمون كاميرات Veo الاستهلاكية لا يحصلون عليه. الفجوة في الرياضات متوسطة الطبقة والقاعدية: الدوريات التي تحتاج بثًّا آليًّا بدقةٍ أفضل من المستهلك لكنها لا تستطيع تحمّل بنية Hawk-Eye التحتية. القيود الفيزيائية على إعداد كاميرا واحدة تسدّ جزءًا ملموسًا من فجوة الدقة تلك بجزءٍ يسير من التكلفة. تحديدًا: معالجة الحجب عبر التنبؤ القائم على الفيزياء (الحفاظ على المسار عندما يحجب لاعبٌ الكرة)، وإزالة الالتباس متعدد الأجسام (لاعبان متداخلان يُميَّزان بملفّاتهما الحركية، وليس بالمظهر فقط)، وتعويض حركة الكاميرا (فصل تحريك الكاميرا الأفقي عن حركة الجسم باستخدام القيود العَطالية).
هذا هو بالضبط السيناريو الذي تكون فيه للقيود الفيزيائية أعلى تأثير. تكسر انتقالات العُقد المصنّفات المدفوعة بالبيانات لأن بيانات التدريب من العُقدة القديمة. تتغير التواقيع البصرية: مواد جديدة، وهندسات جديدة، وأنماط حفرٍ جديدة. لكن فيزياء تصوير العيوب لا تتغير بنفس المعدل. الحفرة الحقيقية لا تزال تشتت الضوء بناءً على عمقها وزاوية جدارها الجانبي. الجزيء لا يزال يُظهر اختلاف منظرٍ بين زوايا الفحص بناءً على ارتفاعه فوق السطح. بقايا العملية لا تزال لها ملف انعكاسيةٍ تحدده تركيبتها المادية. نبني مصنّفات عيوبٍ تستخدم هذه السمات القائمة على الفيزياء إلى جانب السمات البصرية. أثناء انتقالات العُقد، تظل السمات الفيزيائية تمييزيةً حتى عندما تفقد السمات البصرية قدرتها التنبؤية. الجدول الزمني العملي: 2-3 أسابيع لتدقيق فيزياء المجال لتوصيف فيزياء تصوير العُقدة الجديدة، و12-16 أسبوعًا لبناء المصنّف بما في ذلك التحقق مقابل مكتبة عيوبك من العُقدة الجديدة.
كل نموذجٍ فيزيائي هو تقريب. يفترض ترشيح Kalman ديناميكا نيوتنية، تنهار للأجسام ذات الديناميكا الهوائية المعقدة (الكرة المتموّجة تنحرف بشكلٍ غير متوقَّع بسبب انفصال تدفق الهواء المضطرب). يفترض نموذج الهندسة فوق القطبية أسطحًا صلبة، تنهار للمواد المرنة. نتعامل مع هذا بثلاث طرق. أولًا، لكل بوابةٍ عتبة ثقةٍ قابلة للتهيئة. إذا كانت مسافة Mahalanobis حديّةً (بين 3 و5 سيغما)، تُعلَّم عملية الكشف للتحقق منها لاحقًا بدلًا من رفضها بشكلٍ قاطع. ثانيًا، نستخدم ترشيح Kalman اللاعطري (UKF) بدلًا من ترشيح Kalman الممتد (EKF) للديناميكا غير الخطية. يُمرّر UKF نقاط سيغما عبر الدالة اللاخطية الفعلية بدلًا من التخطيط الخطي، ما يعالج اللاخطية المعتدلة (الدوران، السحب، الأسطح غير المستوية) دون خطأ تقريب سلسلة Taylor الخاص بـEKF. ثالثًا، للفيزياء المعقدة فعلًا (التدفق المضطرب، المواد الجديدة)، نستخدم PINNs لتعلّم المعادلات الحاكمة من البيانات مع تقييد فضاء الحل. النموذج الفيزيائي ليس قفصًا صلبًا. إنه حاجزٌ واقٍ ينثني عند الحواف لكنه يمنع الأخطاء الكارثية في المركز.
استكشف الأسس التقنية وراء منهجيتنا للرؤية المقيّدة بالفيزياء.
استكشافٌ تقنيٌّ عميق لسبب فشل الرؤية الحاسوبية العامة في بيئات الإنتاج، وكيف تسدّ البُنى المقيّدة بالفيزياء (مرشّحات Kalman، التدفق الضوئي، PINNs) الفجوة بين الكشف والفهم.
اقرأ الورقة البيضاءتستهلك الحالات الحدّية 80% من وقت الهندسة، و90% من تكاليف الدعم، و100% من التعرض للمسؤولية.
نظام رؤية مقيّد بالفيزياء لا يلغي الحالات الحدّية. إنه يلغي الحالات الحدّية المستحيلة فيزيائيًّا، وهي معظمها. وقت الهندسة الذي تنفقه في تصحيح الإيجابيات الكاذبة، وإعادة التدريب للانحراف، ومراجعة العيوب المُزعجة يذهب إلى بناء الميزات بدلًا من ذلك.