مقارنة فنية بين YOLOX و PP-YOLOE+
يعد اختيار نموذج الكشف عن الكائنات الأمثل قرارًا بالغ الأهمية يوازن بين الدقة والسرعة والتكلفة الحسابية. توفر هذه الصفحة مقارنة فنية مفصلة بين YOLOX و PP-YOLOE+، وهما نموذجان مؤثران بدون مرساة ساهما بشكل كبير في مجال رؤية الكمبيوتر. سوف نتعمق في بنيتيهما ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اتخاذ خيار مستنير لمشاريعك.
YOLOX: كشف عالي الأداء للأجسام بدون نقاط ارتكاز
YOLOX، الذي قدمته Megvii في عام 2021، هو نموذج عالي الأداء للكشف عن الأجسام وخالٍ من المرساة يهدف إلى تبسيط تصميم سلسلة YOLO مع تحقيق أحدث النتائج. لقد تم تصميمه لسد الفجوة بين البحث الأكاديمي والتطبيقات الصناعية من خلال تقديم بنية مبسطة وفعالة.
تفاصيل فنية:
- المؤلفون: Zheng Ge و Songtao Liu و Feng Wang و Zeming Li و Jian Sun
- المنظمة: Megvii
- التاريخ: 2021-07-18
- رابط Arxiv: https://arxiv.org/abs/2107.08430
- رابط GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- رابط المستندات: https://yolox.readthedocs.io/en/latest/
البنية والميزات الرئيسية
قدم YOLO العديد من الابتكارات الرئيسية لعائلة YOLO، مبتعدًا عن الطرق التقليدية القائمة على المرساة.
- تصميم بدون نقاط ارتكاز: من خلال إلغاء مربعات الارتكاز المعرفة مسبقًا، يعمل YOLOX على تبسيط مسار الاكتشاف، ويقلل من عدد المعلمات الفائقة التي يجب ضبطها، ويمكن أن يحسن التعميم عبر أحجام الكائنات ونسب العرض إلى الارتفاع المختلفة.
- رأس منفصل: على عكس نماذج YOLO السابقة التي استخدمت رأسًا مقترنًا، يستخدم YOLOX رؤوسًا منفصلة لمهام التصنيف والتوطين. يمكن أن يؤدي هذا الفصل إلى تقارب أسرع وتحسين الدقة.
- استراتيجيات التدريب المتقدمة: تشتمل YOLOX على تقنيات متقدمة مثل SimOTA (Simplified Optimal Transport Assignment) لتعيين التصنيفات الديناميكي أثناء التدريب. كما تستفيد من طرق تقوية البيانات القوية مثل MixUp لتعزيز قوة النموذج.
نقاط القوة والضعف
نقاط القوة:
- دقة عالية: يحقق YOLOX درجات mAP قوية، خاصة مع متغيراته الأكبر مثل YOLOX-x، مما يجعله خيارًا تنافسيًا للمهام التي تتطلب دقة عالية.
- بساطة بدون مرساة: يقلل النهج الخالي من الإرساء من التعقيد المرتبط بتكوين وضبط مربع الإرساء.
- نموذج راسخ: باعتباره نموذجًا متاحًا منذ عام 2021، فإنه يتمتع بقدر جيد من موارد المجتمع وأمثلة النشر المتاحة.
نقاط الضعف:
- سرعة الاستدلال: على الرغم من كفاءتها، إلا أن سرعة الاستدلال الخاصة بها يمكن أن تتجاوزها النماذج الأحدث والمحسّنة للغاية، خاصة في متغيرات النماذج الأصغر.
- النظام البيئي الخارجي: لا يتكامل YOLOX أصلاً مع نظام Ultralytics البيئي، ممّا قد يتطلب جهدًا إضافيًا لنشره ودمجه مع أدوات مثل Ultralytics HUB.
- تنوع المهام: يركز بشكل أساسي على اكتشاف الكائنات ويفتقر إلى الدعم المدمج لمهام الرؤية الأخرى مثل تقسيم المثيلات أو تقدير الوضع الموجود في أطر العمل الأحدث والأكثر تنوعًا.
حالات الاستخدام
يعتبر YOLOX مناسبًا تمامًا لمجموعة متنوعة من التطبيقات، بما في ذلك:
- الكشف العام عن الكائنات: مثالي للسيناريوهات التي تحتاج إلى توازن قوي بين الدقة والسرعة، كما هو الحال في أنظمة الأمان.
- خط الأساس للبحث: تعتبر أساسًا ممتازًا للباحثين الذين يستكشفون طرق الكشف الخالية من المرساة وتقنيات التدريب المتقدمة.
- التطبيقات الصناعية: يمكن نشرها لمهام مثل مراقبة الجودة حيث تكون دقة الاكتشاف العالية ضرورية.
PP-YOLOE+: التميّز بدون نقاط ارتكاز من Baidu
PP-YOLOE+، نسخة محسنة من PP-YOLOE، تم تطويرها بواسطة Baidu وتم إصدارها في أبريل 2022 كجزء من إطار عمل PaddlePaddle الخاص بهم. إنه كاشف أحادي المرحلة وخالي من المرساة مصمم لتحقيق دقة وكفاءة عالية، مع التركيز بشكل خاص على التطبيقات الصناعية.
تفاصيل فنية:
- المؤلفون: PaddlePaddle Authors
- المنظمة: Baidu
- التاريخ: 2022-04-02
- رابط Arxiv: https://arxiv.org/abs/2203.16250
- رابط GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- رابط المستندات: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
البنية والميزات الرئيسية
يعتمد PP-YOLOE+ على النموذج الخالي من المرساة مع العديد من الميزات البارزة المصممة لدفع حدود الأداء.
- تصميم بدون نقاط ارتكاز: على غرار YOLOX، فإنه يتجنب مربعات الارتكاز المعرفة مسبقًا، مما يبسط مسار الاكتشاف. يمكنك معرفة المزيد حول أجهزة الكشف الخالية من نقاط الارتكاز في مسرد المصطلحات الخاص بنا.
- مكونات فعالة: تستخدم الهندسة المعمارية عمودًا فقريًا من نوع ResNet ورقبة Path Aggregation Network (PAN) لدمج الميزات متعددة النطاقات بشكل فعال.
- تعلم محاذاة المهام (TAL): الابتكار الرئيسي هو استخدام TAL، وهي دالة فقدان متخصصة تعمل على تحسين مواءمة مهام التصنيف والتوطين، مما يؤدي إلى تحسينات كبيرة في دقة الكشف.
نقاط القوة والضعف
نقاط القوة:
- دقة استثنائية: تقدم نماذج PP-YOLOE+، وخاصة المتغيرات الأكبر، دقة فائقة على المعايير القياسية مثل COCO.
- كفاءة عالية: تم تصميم النماذج لتكون فعالة، وتحقق توازنًا رائعًا بين الدقة وعدد المعلمات و FLOPs.
- نظام PaddlePaddle البيئي: إنه متكامل ومحسن بشكل جيد داخل إطار عمل التعلم العميق PaddlePaddle.
نقاط الضعف:
- الاعتماد على إطار عمل: يمكن أن يكون تحسينه الأساسي لإطار عمل PaddlePaddle عائقًا أمام المطورين الذين يعملون مع أنظمة بيئية أخرى مثل PyTorch.
- الوصول إلى المجتمع: على الرغم من أنها مدعومة من Baidu، إلا أن دعمها المجتمعي وتوافر الموارد قد يكون أقل شمولاً مقارنة بالنماذج الأكثر اعتمادًا على مستوى العالم.
حالات الاستخدام
PP-YOLOE+ هو خيار ممتاز للتطبيقات الصعبة، مثل:
- فحص الجودة الصناعية: دقته العالية مفيدة للغاية للكشف عن العيوب في خطوط الإنتاج.
- البيع بالتجزئة الذكي: مفيد للمهام عالية الدقة مثل إدارة المخزون وتحليلات العملاء.
- الحوسبة الطرفية: تسمح البنية الفعالة للمتغيرات الأصغر بالنشر على الأجهزة المحمولة والمدمجة.
مقارنة مباشرة: YOLOX ضد PP-YOLOE+
يعتبر كل من YOLOX و PP-YOLOE+ من أجهزة الكشف القوية الخالية من نقاط الارتكاز، لكنهما يظهران اختلافات رئيسية في الأداء والكفاءة. يقدم الجدول أدناه مقارنة مفصلة بناءً على مجموعة بيانات COCO.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
من البيانات، يمكننا استخلاص عدة استنتاجات:
- الدقة (mAP): يتفوق PP-YOLOE+ باستمرار على YOLOX عبر جميع أحجام النماذج القابلة للمقارنة. يحقق أكبر نموذج، PP-YOLOE+x، 54.7٪ mAP ملحوظة، وهي أعلى بكثير من 51.1٪ لـ YOLOX-x.
- الكفاءة (المعلمات و FLOPs): نماذج PP-YOLOE+ أكثر كفاءة بشكل عام. على سبيل المثال، تحقق PP-YOLOE+l خريطة mAP أعلى من YOLOX-x مع استخدام ما يقرب من نصف المعلمات و FLOPs، مما يدل على تصميم معماري فائق.
- سرعة الاستدلال: النماذج تنافسية للغاية من حيث السرعة. في حين أن نماذج YOLOX الأصغر تظهر تفوقًا طفيفًا، فإن نماذج PP-YOLOE+ الأكبر تكون أسرع، مما يشير إلى قابلية تطوير أفضل لعمليات النشر عالية الأداء.
الخلاصة: أي نموذج يجب أن تختاره؟
يعتبر كل من YOLOX و PP-YOLOE+ منافسين قويين في مجال الكشف عن الأجسام. يعتبر YOLOX نموذجًا راسخًا وموثوقًا به، مما يجعله نقطة انطلاق رائعة للعديد من المشاريع. ومع ذلك، بالنسبة للتطبيقات التي تتطلب أعلى دقة وكفاءة، يُظهر PP-YOLOE+ ميزة واضحة، بشرط أن تكون مرتاحًا للعمل داخل نظام PaddlePaddle البيئي.
بالنسبة للمطورين والباحثين الذين يبحثون عن حل أكثر شمولية وسهولة في الاستخدام، نوصي باستكشاف نماذج Ultralytics YOLO. تقدم نماذج مثل YOLOv8 وأحدث YOLO11 مزيجًا مقنعًا من الأداء والتنوع وسهولة الاستخدام.
إليك سبب تميز نماذج Ultralytics:
- سهولة الاستخدام: واجهة برمجة تطبيقات Python مبسطة، وتوثيق شامل، وعدد كبير من الدروس التعليمية تجعل البدء سريعًا وسهلاً.
- نظام بيئي مُدار بشكل جيد: استفد من التطوير النشط، ودعم مجتمعي قوي على GitHub، وأدوات متكاملة مثل Ultralytics HUB لإدارة المشاريع الشاملة.
- موازنة الأداء: تم تصميم نماذج Ultralytics لتوفير توازن ممتاز بين السرعة والدقة، مما يجعلها مناسبة لكل من عمليات النشر الطرفية في الوقت الفعلي والحلول السحابية عالية الدقة.
- تنوع الاستخدامات: على عكس النماذج التي تركز فقط على الكشف، تدعم نماذج Ultralytics YOLO مهام متعددة خارج الصندوق، بما في ذلك تجزئة المثيلات، وتقدير الوضعية، والتصنيف.
- كفاءة التدريب: بفضل عمليات التدريب الفعالة، ومتطلبات الذاكرة الأقل، والأوزان المُدرَّبة مسبقًا المتاحة بسهولة، يمكنك تطوير نماذج مخصصة بشكل أسرع.
لمعرفة كيف تقارن نماذج Ultralytics مع غيرها، قد تجد صفحات المقارنة الأخرى الخاصة بنا مفيدة، مثل YOLO11 مقابل YOLOX أو PP-YOLOE+ مقابل YOLOv10.