مقارنة تفصيلية بين YOLOv6-3.0 و EfficientDet
يُعد اختيار نموذج الكشف عن الكائنات الأمثل قرارًا بالغ الأهمية لمشاريع الرؤية الحاسوبية. تقدم هذه الصفحة مقارنة فنية بين YOLOv6-3.0 من Meituan و EfficientDet من Google، وهما نموذجان رائدان في مجال الكشف عن الكائنات. سوف نتعمق في تصميماتهما المعمارية ومعايير الأداء والتطبيقات المناسبة لمساعدتك في اتخاذ خيار مستنير لاحتياجاتك الخاصة.
نظرة عامة على YOLOv6-3.0
YOLOv6-3.0، الذي طورته Meituan، هو إطار عمل للكشف عن الكائنات من مرحلة واحدة مصمم للتطبيقات الصناعية، مع التركيز على التوازن بين الأداء العالي والكفاءة. وهو يعتمد على إرث YOLO من خلال تقديم تصميم شبكة عصبية مدركة للأجهزة.
التفاصيل:
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المنظمة: Meituan
- التاريخ: 2023-01-13
- Arxiv: https://arxiv.org/abs/2301.05586
- GitHub: https://github.com/meituan/YOLOv6
- المستندات: https://docs.ultralytics.com/models/yolov6/
البنية والميزات الرئيسية
تتضمن الميزات المعمارية الرئيسية لـ YOLOv6-3.0 عمودًا فقريًا لإعادة المعلمات بكفاءة يعمل على تحسين هيكل الشبكة بعد التدريب لتسريع سرعة الاستدلال و كتل هجينة توازن بين الدقة والكفاءة في طبقات استخراج الميزات. هذا التصميم يجعله فعالاً بشكل خاص للتطبيقات في الوقت الفعلي.
الأداء وحالات الاستخدام
يعتبر YOLOv6-3.0 مناسبًا بشكل خاص لمهام اكتشاف الأجسام في الوقت الفعلي حيث تكون السرعة والدقة في غاية الأهمية. يسمح تصميمه الفعال بأوقات استدلال سريعة، مما يجعله مثاليًا لتطبيقات مثل:
- الأتمتة الصناعية: مراقبة جودة التصنيع ومراقبة العمليات.
- المراقبة الآنية: أنظمة الأمان و إدارة حركة المرور.
- تطبيقات الذكاء الاصطناعي الطرفية: النشر على الأجهزة ذات الموارد الحسابية المحدودة مثل NVIDIA Jetson.
نقاط قوة YOLOv6-3.0
- سرعة استدلال عالية: مُحسَّن للأداء السريع، مما يجعله مناسبًا للاحتياجات الصناعية.
- دقة جيدة: يقدم درجات mAP تنافسية، خاصة في متغيرات النموذج الأكبر.
- التركيز الصناعي: مصمم خصيصًا لسيناريوهات النشر الصناعي العملي.
نقاط ضعف YOLOv6-3.0
- تنوع محدود: يركز بشكل أساسي على اكتشاف الكائنات، ويفتقر إلى الدعم الأصلي لمهام أخرى مثل التجزئة أو تقدير الوضعية.
- النظام البيئي: على الرغم من أنه مفتوح المصدر، إلا أن نظامه البيئي ليس شاملاً مثل نظام Ultralytics، مما قد يعني دعمًا مجتمعيًا أقل وتحديثات أبطأ.
تعرف على المزيد حول YOLOv6-3.0
نظرة عامة على EfficientDet
يشتهر EfficientDet، الذي قدمته Google، بكفاءته وقابليته للتوسع في الكشف عن الكائنات، حيث يحقق دقة عالية مع عدد أقل من المعلمات مقارنة بالعديد من النماذج السابقة.
التفاصيل:
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المنظمة: Google
- التاريخ: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- المستندات: https://github.com/google/automl/tree/master/efficientdet#readme
البنية والميزات الرئيسية
يعتمد تصميم EfficientDet على ابتكارين رئيسيين:
- BiFPN (شبكة الهرم المميز ثنائية الاتجاه): شبكة هرم مميز ثنائية الاتجاه مرجحة تتيح دمج الميزات متعددة المقاييس بكفاءة وفعالية. على عكس شبكات FPN التقليدية، تستخدم BiFPN اتصالات ثنائية الاتجاه عبر المقاييس ودمج الميزات المرجحة لتدفق معلومات أفضل.
- EfficientNet Backbone: تستخدم سلسلة EfficientNet كـ شبكة العمود الفقري الخاصة بها. تم تطوير نماذج EfficientNet من خلال البحث عن البنية العصبية (NAS)، وتحقيق توازن ممتاز بين الأداء والكفاءة.
تستخدم EfficientDet طريقة قياس مركبة لتوسيع عرض الشبكة وعمقها ودقتها، مما يخلق مجموعة من الكاشفات من D0 إلى D7 لميزانيات حسابية مختلفة.
الأداء وحالات الاستخدام
تشتهر نماذج EfficientDet بدقتها العالية، مما يجعلها مناسبة للتطبيقات التي تكون فيها الدقة هي الأولوية القصوى، ولكن الموارد الحسابية لا تزال عاملاً. تتضمن حالات الاستخدام النموذجية ما يلي:
- تحليل الصور عالي الدقة: تحليل الصور الطبية و تحليل صور الأقمار الصناعية.
- فهم تفصيلي للمشهد: الروبوتات و القيادة الذاتية التي تتطلب التعرف الدقيق على الكائنات.
نقاط القوة في EfficientDet
- دقة عالية: يحقق mAP حديثًا مع هياكل فعالة نسبيًا مقارنةً بأدوات الكشف القديمة ذات المرحلتين.
- قابلية التوسع: يقدم مجموعة واسعة من النماذج (D0-D7) لتناسب الاحتياجات الحسابية المختلفة.
- دمج ميزات فعال: إن BiFPN فعال للغاية في دمج الميزات متعددة المقاييس، مما يعزز دقة الكشف.
نقاط ضعف EfficientDet
- سرعة الاستدلال: أبطأ بشكل عام من كاشفات المرحلة الواحدة مثل YOLOv6-3.0، وخاصة المتغيرات الأكبر، مما يجعله أقل ملاءمة للتطبيقات في الوقت الفعلي.
- التعقيد: البنية الأساسية، وخاصةً BiFPN، أكثر تعقيدًا من الكاشفات أحادية المرحلة الأبسط.
تعرف على المزيد حول EfficientDet
مقارنة الأداء: YOLOv6-3.0 مقابل EfficientDet
تكشف معايير الأداء على مجموعة بيانات COCO عن مقايضة واضحة بين السرعة والدقة. تُظهر نماذج YOLOv6-3.0 ميزة كبيرة في زمن انتقال الاستدلال، خاصةً عند تسريعها باستخدام TensorRT على وحدة معالجة الرسومات (GPU). على سبيل المثال، تحقق YOLOv6-3.0l قيمة 52.8 mAP مع وقت استدلال يبلغ 8.95 مللي ثانية فقط، في حين أن EfficientDet-d6 المماثل يصل إلى 52.6 mAP مماثل ولكنه أبطأ بحوالي 10 مرات عند 89.29 مللي ثانية. في حين أن أكبر نموذج EfficientDet-d7 يحقق أعلى دقة عند 53.7 mAP، إلا أن سرعة الاستدلال البطيئة للغاية تجعله غير عملي لمعظم عمليات النشر في العالم الحقيقي. في المقابل، تقدم YOLOv6-3.0 توازنًا أكثر عملية، مما يوفر دقة قوية مع السرعات العالية اللازمة للأنظمة الصناعية والأنظمة في الوقت الفعلي.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
الخلاصة
يعتبر كل من YOLOv6-3.0 و EfficientDet من نماذج الكشف عن الأجسام القوية، لكنهما يلبيان أولويات مختلفة. يتفوق EfficientDet في السيناريوهات التي يكون فيها تحقيق أعلى دقة ممكنة أمرًا بالغ الأهمية، ويكون زمن الوصول للاستدلال مصدر قلق ثانوي. إن BiFPN المتطور والهندسة المعمارية القابلة للتطوير تجعله منافسًا قويًا للتحليل دون الاتصال بالإنترنت للمشاهد المعقدة. ومع ذلك، بالنسبة للغالبية العظمى من التطبيقات الصناعية والعالمية الحقيقية، يوفر YOLOv6-3.0 حلاً أكثر عملية وفعالية نظرًا لتوازنه الفائق بين السرعة والدقة.
بالنسبة للمطورين والباحثين الذين يبحثون عن نموذج يتجاوز حدود الأداء والتنوع وسهولة الاستخدام، فإن التوصية الواضحة هي التوجه نحو نظام Ultralytics البيئي. تقدم نماذج مثل Ultralytics YOLOv8 الشهير وأحدث YOLO11 المتطورة مزايا كبيرة:
- موازنة الأداء: تشتهر نماذج Ultralytics YOLO بتوازنها الاستثنائي بين السرعة والدقة، وغالبًا ما تتفوق على المنافسين في كلا المقياسين لحجم نموذج معين.
- تنوع الاستخدامات: على عكس YOLOv6 و EfficientDet، اللذين يستخدمان بشكل أساسي للكشف عن الكائنات، فإن نماذج Ultralytics هي أطر عمل متعددة المهام تدعم تجزئة المثيلات، وتقدير الوضعية، وتصنيف الصور، والمزيد، وكل ذلك ضمن حزمة موحدة واحدة.
- سهولة الاستخدام: تم تصميم إطار Ultralytics لتجربة مستخدم مبسطة مع واجهة برمجة تطبيقات Python بسيطة و توثيق شامل والعديد من الدروس التعليمية.
- نظام بيئي مُدار بشكل جيد: يستفيد المستخدمون من التطوير النشط، ودعم مجتمعي قوي، والتحديثات المتكررة، والتكامل السلس مع أدوات مثل Ultralytics HUB لـ MLOps شامل.
- كفاءة التدريب: نماذج Ultralytics فعالة من حيث التدريب، وغالبًا ما تتطلب ذاكرة ووقتًا أقل، وتأتي مع أوزان مُدرَّبة مسبقًا متاحة بسهولة على مجموعة بيانات COCO لتسريع المشاريع المخصصة.
استكشف نماذج أخرى
إذا كنت تستكشف خيارات تتجاوز YOLOv6-3.0 و EfficientDet، ففكر في نماذج أخرى حديثة موثقة بواسطة Ultralytics. قد تجد مقارنات تفصيلية مع نماذج مثل YOLOv8 و YOLOv7 و YOLOX و RT-DETR القائمة على المحولات مفيدة لمشروعك.