<جانبا الطبقة = "tldr">
TL;DR. يقتبس موردو الكشف عن الأجهزة الصلبة mAP@0. 5 أرقام مثل 0. 92 كما لو أن ذلك أثبت أي شيء. لا. ما يهم في موقع المقاول السعودي هو الدقة عند عتبة التشغيل (عادةً IoU 0. 5، الثقة 0. 65)، المعدل الإيجابي الكاذب لكل ساعة كاميرا، وكيف يمكن مقارنة هذه التكلفة بالانتهاك الفائت. يرشد هذا الدليل مديري البيئة والصحة والسلامة عبر المقاييس بلغة واضحة ويعرض الجداول الثلاثة التي يجب أن تكون في كل مقترح رؤية للذكاء الاصطناعي قبل التوقيع عليه.
سبب أهمية ذلك بالنسبة للبيئة والصحة والسلامة، وليس فقط لعلم البيانات
يُطلب بشكل متزايد من مديري البيئة والصحة والسلامة في المملكة العربية السعودية التوقيع على أنظمة رؤية الذكاء الاصطناعي حيث يتم تقديم الأدلة الفنية بلغة مصممة لمهندسي تعلم الآلة. شيئين يتبعان. أولاً، يقتبس البائعون مقاييس مفضلة؛ لا أحد يدفع إلى الوراء. ثانيًا، عندما يكون أداء النظام ضعيفًا في الميدان، فإن البيئة والصحة والسلامة هي التي تمتلك النتيجة.
الحل هو الإصرار على ثلاثة أرقام، جميعها مثبتة في حل الكشف عن معدات الوقاية الشخصية ومدى دقة إجابة الكشف عن معدات الوقاية الشخصية:
- الدقة عند عتبة التشغيل — ما هي نسبة الإنذارات التي تمثل انتهاكات حقيقية.
- الاستدعاء عند عتبة التشغيل — ما هي نسبة الانتهاكات الحقيقية التي تم اكتشافها.
- معدل الإيجابية الكاذبة لكل ساعة كاميرا — مدى ارتفاع صوت النظام عمليًا.
كل شيء آخر يدعم السياق.
IoU بلغة واضحة
IoU (تقاطع فوق الاتحاد) يقيس مدى تداخل المربع المحيط المتوقع مع المربع المحيط بالحقيقة الأرضية. إن IoU بقيمة 1.0 يعد تطابقًا مثاليًا؛ IoU بقيمة 0.0 لا يوجد تداخل.
بالنسبة لعمل معدات الوقاية الشخصية، فإن الاتفاقية هي:
- IoU 0.5 — يتداخل المربع المتوقع بنسبة 50% على الأقل مع الحقيقة الأساسية. معيار للكشف عن القبعة الصلبة.
- IoU 0.75 — أكثر صرامة، وتستخدم للمعايير الأكاديمية. نادرا ما تكون عتبة التشغيل في عمليات النشر الصناعية.
عندما يقتبس البائع "mAP@0.5"، فهذا يعني أن متوسط الدقة تم تقييمه عند IoU 0.5. وهذا رقم واحد في مجموعة تحقق واحدة، وليس ضمانًا على موقعك.
ما الذي تخبرك به mAP وما لا تخبرك به
mAP (متوسط الدقة) هو مقياس فردي يلخص منحنى استرجاع الدقة عبر عتبات وفئات ثقة متعددة. نقاط قوته وضعفه:
| ماذا تخبرك خريطة MAP | ما يخفيه MAP |
|--------------------|-----------------|
| الجودة الشاملة للنموذج على مجموعة تحمل علامة | السلوك في موقعك |
| مفيد لمقارنة النماذج في نفس المهمة | الحساسية للتحول الديموغرافي والإضاءة |
| وكيل معقول لـ "هل يعمل هذا النموذج" | توزيع لكل فئة |
| قابلة للمقارنة عبر إصدارات نفس البائع | يمكن مقارنته عبر البائعين الذين لديهم نفس مجموعة الاختبار فقط |
أرقام mAP@0.5 الأعلى من 0.85 شائعة في عام 2026؛ يجب التعامل مع الأرقام التي تزيد عن 0.95 بعين الشك حتى يتم الكشف عن مجموعة الاختبار.
الدقة والتذكر – الزوج المرتبط بالبيئة والصحة والسلامة
هذان هما المقياسان اللذان يجب على مديري البيئة والصحة والسلامة أن يرتكزوا عليهما:
- الدقة = من بين جميع الاكتشافات التي أثارها النظام، كم عدد الاكتشافات الحقيقية. الدقة العالية تعني القليل من الإنذارات الكاذبة.
- استدعاء = من بين جميع الانتهاكات الحقيقية، كم عدد ضبط النظام. الاستدعاء العالي يعني القليل من الأخطاء.
إن المقايضة هنا مباشرة: إن خفض عتبة الثقة يؤدي إلى زيادة القدرة على الاسترجاع ولكنه يقلل من الدقة، والعكس صحيح. الهدف هو اختيار حد يوازن بين ثقة المشرف (الدقة) وتغطية السلامة (الاستدعاء) لملف تعريف المخاطر الخاص بموقعك.
بالنسبة للنشر الثابت على بوابة مقاول أرامكو، فإن نقاط التشغيل النموذجية لعام 2026 هي:
- الدقة ≥ 0.92 عند IoU 0.5، الثقة 0.65
- الاستدعاء ≥ 0.88 عند نفس نقطة التشغيل [VERIFY-SME]
وتحت هذه الأرقام، تتآكل ثقة المشرف ويتوقف استخدام النظام.
مصفوفة الارتباك وماذا نقرأ فيها
تحدد مصفوفة الارتباك الإيجابيات الحقيقية والإيجابيات الكاذبة والسلبيات الحقيقية والسلبيات الكاذبة. بالنسبة للكشف الصعب في مجموعة اختبار مكونة من 10000 إطار، يبدو التقرير الذي يمكن الدفاع عنه كما يلي:
| | توقع: انتهاك | متوقع: متوافق |
|-|---------------------|----------------------|
| الفعلي: انتهاك | 880 (تب) | 120 (الجبهة الوطنية) |
| الفعلي: متوافق | 75 (ف ب) | 8,925 (تن) |
وهذا يعطي الدقة 0.92، والتذكير 0.88، ومعدل الإيجابية الكاذبة 0.83% لكل إطار. راجع مدخلات مسرد مصفوفة الارتباك، والدقة، واستدعاء للحصول على التعريفات.
معادلة التكلفة الإيجابية الكاذبة
الرقم الذي يحدد ما إذا كان النظام سيستمر في الإنتاج هو الإيجابيات الكاذبة لكل ساعة كاميرا. ينتج التدفق الساذج بمعدل 5 إطارات في الثانية 18000 إطارًا في الساعة لكل كاميرا. حتى المعدل الإيجابي الكاذب بنسبة 0.1% لكل إطار ينتج عنه 18 تنبيهًا مزعجًا لكل كاميرا في الساعة - مضروبًا في 200 كاميرا ويتخلى المشرف عن النظام في غضون أسبوع.
ثلاثة ضوابط هندسية تعمل على خفض هذا إلى مستويات مقبولة من الناحية التشغيلية:
- قاعدة الثبات: يتم تفعيل الانتهاك فقط إذا كان مسار العامل نفسه يحمل الانتهاك لمدة 3 إطارات متتالية بمعدل 5 إطارات في الثانية.
- بوابة المنطقة: يتم تقييم القواعد الصارمة فقط في المناطق التي يكون فيها ارتداء الخوذات إلزاميًا؛ مرتبط بـ حل مراقبة المحيط.
- المنع مع العلم بالتصريح: يتم استبعاد المناطق الضيقة ومناطق المكاتب الداخلية.
بعد هذه الضوابط، يصل نظام 2026 الذي تم ضبطه جيدًا في موقع مقاول في المملكة العربية السعودية إلى حوالي 1-3 تنبيهات مزعجة لكل كاميرا في كل نوبة عمل، وهو أمر مقبول من الناحية التشغيلية.
ما يجب المطالبة به في عرض البائع
يعرض مقترح البائع الذي يمكن الدفاع عنه ثلاثة جداول بشكل صريح:
- الدقة/الاستدعاء لكل فئة عند مستوى IoU التشغيلي والثقة - وليس مجرد خريطة mAP المجمعة.
- التفاصيل حسب الحالة — ضوء النهار، الغسق، الليل، حدث الغبار، في الأماكن المغلقة.
- معدل الإيجابية الكاذبة لكل ساعة كاميرا بعد الثبات وبوابة المنطقة.
إذا لم يتضمن الاقتراح هذه الجداول، فأرسله مرة أخرى. تحدد القائمة المختصرة لأفضل 10 منصات الموردين المتوقع أن يقدموا هذا المستوى من الإفصاح.
الحيل الشائعة لمقاييس البائع
أنماط 2024-2026 المتكررة التي يجب مراقبتها:
- تسرب مجموعة الاختبار — يتم تقييم النموذج على إطارات مشابهة لبيانات التدريب. اطلب مجموعة التحقق من صحة المملكة العربية السعودية. 2. ماب@0. 5 فقط — بدون منحنى الاسترجاع الدقيق، لا يمكنك اختيار حد التشغيل. 3. الأرقام المجمعة فقط — 0. 9 mAP يمكن أن يخفي 0. 6 استدعاء على المآزر FRC. 4. "دقة 99%" — الدقة في مجموعة اختبار غير متوازنة بشكل كبير (معظم الإطارات ليس بها أي انتهاك) هي رقم لا معنى له.
للحصول على مقارنات صادقة، راجع مركز المقارنات.
كيفية التحقق من صحة موقعك الخاص
بروتوكول التحقق لمدة أسبوعين:
- التقط 4 ساعات من اللقطات في وضح النهار والغسق والليل من كل كاميرا مرشحة.
- قم بتسمية مجموعة فرعية مكونة من 1000 إطار يدويًا مقابل قائمة فئات معدات الوقاية الشخصية الخاصة بك.
- قم بتشغيل نموذج البائع على نفس المجموعة وحساب الدقة/الاستدعاء لكل فئة.
- اطلب اختيار حد التشغيل مقابل مجموعة الاختبار الخاصة بك، وليس مجموعة البائع.
قم بإرساء ذلك في دليل مقاولي الكشف عن معدات الوقاية الشخصية ودليل امتثال أرامكو للبيئة والصحة والسلامة.
الخطوات التالية
إذا كنت تقوم بفحص نطاق نظام الكشف عن معدات الوقاية الشخصية أو تدقيقه في عام 2026، فابدأ بـ حل اكتشاف معدات الوقاية الشخصية، ومدى دقة إجابة اكتشاف معدات الوقاية الشخصية، وقائمة التحقق من امتثال PDPL. رابط مشترك إلى مسرد مصطلحات استنتاج الحافة وإلى إدخال اكتشاف الكائنات للأوليات الأساسية.
احجز مراجعة الدقة من جانب البيئة والصحة والسلامة وسنقوم بإعداد تقرير استدعاء دقيق للقطات الخاصة بك في غضون أسبوعين.