مقارنة تقنية: YOLOX مقابل YOLOX مقابل YOLOv6.0 لاكتشاف الأجسام
يعد اختيار النموذج الصحيح لاكتشاف الأجسام أمرًا بالغ الأهمية لمشاريع الرؤية الحاسوبية. تقدم هذه الصفحة مقارنة تقنية بين نموذجين شائعين وفعالين: YOLOX و YOLOv6-3.0. سنستكشف اختلافاتهما المعمارية ومعايير الأداء والتطبيقات المناسبة لمساعدتك في اتخاذ قرار مستنير.
قبل الغوص في التفاصيل، دعنا نتصور نظرة عامة على أداء كلا الطرازين إلى جانب الطرازات الأخرى:
يولوكس: التميز الخالي من المرساة
يتميز YOLOX، الذي قدمه Megvii(Zheng Ge وSongtao Liu وFeng Wang وZeming Li وJian Sun - 2021-07-18)، بتصميمه الخالي من المراسي، مما يبسط التعقيد المرتبط بنماذج YOLO التقليدية. ويهدف إلى سد الفجوة بين التطبيقات البحثية والصناعية بفضل قدراته الفعالة والدقيقة في اكتشاف الأجسام.
البنية والمميزات الرئيسية
تتبنى YOLOX نهجًا مبسطًا من خلال التخلص من مربعات الارتكاز، مما يبسط عملية التدريب ويقلل من عدد المعلمات الفائقة. تشمل الابتكارات المعمارية الرئيسية ما يلي:
- الكشف بدون مرساة: يزيل الحاجة إلى نقاط ارتكاز محددة مسبقًا، مما يقلل من تعقيد التصميم ويحسن التعميم، مما يجعله قابلاً للتكيف مع مختلف أحجام الأجسام ونسب الأبعاد.
- الرأس المنفصل: يفصل بين مهمتي التصنيف والتوطين في فرعين منفصلين، مما يؤدي إلى تحسين الأداء، خاصةً في الدقة.
- تعيين تسمية SimOTA: يستخدم استراتيجية تعيين التسمية المتقدمة SimOTA، والتي تقوم بتعيين الأهداف ديناميكيًا بناءً على النتائج المتوقعة نفسها، مما يعزز كفاءة التدريب ودقته.
- التدريب المختلط الدقة: يستفيد من الدقة المختلطة لتسريع كل من التدريب والاستدلال، وتحسين الكفاءة الحسابية.
مقاييس الأداء
تحقق نماذج YOLOX دقة فائقة بين أجهزة الكشف عن الأجسام في الوقت الحقيقي مع الحفاظ على سرعات استدلال تنافسية. راجع جدول المقارنة أدناه للاطلاع على المقاييس التفصيلية.
حالات الاستخدام
- تطبيقات تتطلب دقة عالية: مثالية للسيناريوهات التي تكون فيها الدقة أمرًا بالغ الأهمية، مثل تحليل الصور الطبية أو تحليل صور الأقمار الصناعية، حيث يمكن أن يكون لفقدان الأجسام الحرجة عواقب وخيمة.
- البحث والتطوير: نظرًا لبنيته الواضحة والمبسطة، فإن YOLOX مناسب تمامًا لأغراض البحث والتطوير الإضافي في منهجيات الكشف عن الأجسام.
- مهام كشف الأجسام متعددة الاستخدامات: قابل للتطبيق عبر طيف واسع من مهام الكشف عن الأجسام، بدءًا من البحث الأكاديمي إلى النشر الصناعي، مستفيدًا من تصميمه القوي ودقته العالية.
نقاط القوة والضعف
نقاط القوة:
- دقة عالية: يحقق درجات mAP ممتازة، مما يجعله مناسبًا للتطبيقات التي تتطلب الكشف الدقيق عن الكائنات.
- تصميم خالٍ من المرساة: يبسّط البنية ويقلل من المعلمات الفائقة ويسهّل التنفيذ.
- متعدد الاستخدامات: قابلة للتكيف مع مجموعة واسعة من مهام اكتشاف الأجسام.
نقاط الضعف:
- سرعة الاستدلال: قد تكون أبطأ قليلاً من النماذج المحسّنة للغاية مثل YOLOv6-3.0، خاصةً على الأجهزة المتطورة.
- حجم النموذج: يمكن لبعض المتغيرات الأكبر حجمًا أن يكون لها أحجام نماذج كبيرة، وهو ما قد يكون مصدر قلق لعمليات النشر المحدودة الموارد.
YOLOv6-3.0: مُحسَّن للسرعة والكفاءة
تم تصميم YOLOOv6-3.0، الذي طورته شركة Meituan(Chuyi Li وLulu Li وYifei Geng وHongliang Jiang وMeng Cheng وBo Zhang وZaidan Ke وXiaoming Xu وXiangxiang Chu - 2023-01-13)، للاستدلال عالي السرعة والكفاءة، ويستهدف بشكل خاص التطبيقات الصناعية والنشر على الحافة. يمثل الإصدار 3.0 ترقية كبيرة تركز على تعزيز كل من السرعة والدقة.
البنية والمميزات الرئيسية
يعطي YOLOv6-3.0 الأولوية لسرعة الاستدلال من خلال تحسينات معمارية دون المساس بالدقة بشكل كبير. تتضمن الميزات الرئيسية ما يلي:
- العمود الفقري الفعال لإعادة المعرفات: يوظف عمودًا فقريًا معاد المعلمات لتسريع سرعة الاستدلال من خلال دمج طبقات التلافيف والتطبيع الدفعي.
- الكتلة الهجينة: يستخدم تصميم كتلة الشبكة الهجينة الذي يوازن بين الدقة والكفاءة، ويحسن الأداء على منصات الأجهزة المختلفة.
- تصميم الشبكة العصبية الواعية بالأجهزة: تم تصميمها مع وضع كفاءة الأجهزة في الاعتبار، مما يجعلها مناسبة بشكل خاص للنشر على الأجهزة محدودة الموارد مثل Raspberry Pi و NVIDIA Jetson.
- استراتيجية التدريب المحسّنة: تتضمن تقنيات تدريب محسّنة لتحسين التقارب والأداء العام.
مقاييس الأداء
تتفوق YOLOv6-3.0 في سرعة الاستدلال، حيث تحقق إطارات رائعة في الثانية (إطارات في الثانية) مع الحفاظ على نتائج تنافسية في MAP. راجع الجدول أدناه للاطلاع على مقاييس الأداء التفصيلية.
حالات الاستخدام
- الكشف عن الأجسام في الوقت الحقيقي: مثالي للتطبيقات التي يكون فيها زمن الاستجابة المنخفض والمعالجة السريعة أمرًا بالغ الأهمية، مثل أنظمة الإنذار الأمني وتجارة التجزئة الذكية والمركبات ذاتية القيادة.
- نشر الأجهزة الطرفية: مُحسّن للنشر على الأجهزة الطرفية ذات الموارد الحاسوبية المحدودة نظرًا لتصميمه الفعال وأحجام النماذج الأصغر.
- التطبيقات الصناعية: مصممة خصيصًا للتطبيقات الصناعية العملية والواقعية التي تحتاج إلى اكتشاف سريع وفعال للأجسام في التصنيع والمراقبة والأتمتة.
نقاط القوة والضعف
نقاط القوة:
- سرعة استنتاج عالية: يتفوق في السرعة، مما يجعله مثاليًا لمهام اكتشاف الأجسام في الوقت الحقيقي.
- تصميم فعال: أحجام النماذج الأصغر والبنية المحسّنة مثالية للأجهزة محدودة الموارد.
- التركيز الصناعي: مصممة خصيصًا للتطبيقات العملية في الصناعات التي تتطلب اكتشاف الأجسام بسرعة وكفاءة.
نقاط الضعف:
- مقايضة الدقة: قد تُظهر دقة أقل قليلاً مقارنةً بنماذج مثل YOLOX، خاصةً في مجموعات البيانات المعقدة حيث تكون الأولوية للدقة على السرعة.
- المرونة: ربما تكون أقل قابلية للتكيف مع المهام البحثية عالية التخصص مقارنةً بالبنى الأكثر مرونة المصممة لتطبيقات بحثية أوسع نطاقاً.
تعرف على المزيد حول YOLOv6-3.0
جدول مقارنة النماذج
الطراز | الحجم (بكسل) |
مافال 50-95 |
السرعة CPU ONNX (مللي ثانية) |
السرعة T4 T4TensorRT10 (مللي ثانية) |
بارامز (م) |
(ب) |
---|---|---|---|---|---|---|
يولوكسنانو | 416 | 25.8 | - | - | 0.91 | 1.08 |
يولوكستيني | 416 | 32.8 | - | - | 5.06 | 6.45 |
يولوكس | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
يولوكسم | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
يولوكسل | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
يولوكس | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOV6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOV6-3.0 م | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOV6-3.0L | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
الخاتمة
يعد كل من YOLOX و YOLOX و YOLOv6-3.0 كاشفين قويين للأجسام ذات المرحلة الواحدة، يلبي كل منهما أولويات مختلفة. يتفوق YOLOX في الدقة والبساطة المعمارية، مما يجعله خيارًا قويًا للأبحاث والتطبيقات التي تتطلب دقة عالية. يولي YOLOv6-3.0 الأولوية للسرعة والكفاءة، مما يجعله مناسبًا بشكل استثنائي للتطبيقات الصناعية في الوقت الفعلي وعمليات النشر على الحافة.
بالنسبة للمستخدمين الذين يبحثون عن خيارات أخرى، تقدم Ultralytics مجموعة من النماذج المتطورة. فكر في استكشاف Ultralytics YOLOv8 للحصول على توازن بين الأداء والمرونة، أو YOLOv10 باعتباره أحدث تكرار في الكشف في الوقت الحقيقي، أو حتى YOLO11 للحصول على أحدث الميزات. بدلاً من ذلك، للتطبيقات في الوقت الحقيقي RT-DETR تقدم بنية مقنعة للتحقق منها.