EfficientDet ضد YOLOv6-3.0: مقارنة مفصلة
يُعد اختيار نموذج الكشف عن الكائنات الأمثل قرارًا بالغ الأهمية يؤثر بشكل مباشر على أداء وكفاءة تطبيقات الرؤية الحاسوبية. تقدم هذه الصفحة مقارنة فنية مفصلة بين نموذجين مؤثرين: EfficientDet، الذي طورته Google، و YOLOv6-3.0، من Meituan. في حين أن كلاهما من أدوات الكشف عن الكائنات القوية، إلا أنهما ينبعان من فلسفات تصميم مختلفة. تعطي EfficientDet الأولوية للكفاءة والدقة القابلة للتطوير من خلال التحجيم المركب، في حين أن YOLOv6-3.0 هو كاشف أحادي المرحلة مصمم للتطبيقات الصناعية عالية السرعة. سوف نتعمق في هياكلهما ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اتخاذ خيار مستنير.
نظرة عامة على EfficientDet
EfficientDet عبارة عن مجموعة من نماذج الكشف عن الكائنات القابلة للتطوير والفعالة التي قدمها فريق Google Brain. وهي مشهورة بتحقيق دقة عالية مع الحفاظ على الكفاءة الحسابية عن طريق توسيع نطاق بنية النموذج بشكل منهجي.
التفاصيل:
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المنظمة: Google
- التاريخ: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- المستندات: https://github.com/google/automl/tree/master/efficientdet#readme
البنية والميزات الرئيسية
يرتكز تصميم EfficientDet على تحسين كل من الدقة والكفاءة. تشمل الابتكارات الأساسية ما يلي:
- EfficientNet Backbone: تستخدم EfficientNet عالية الكفاءة كعمود فقري لها لاستخراج الميزات. يتم توسيع نطاق نماذج EfficientNet باستخدام طريقة مركبة توازن بشكل موحد عمق الشبكة وعرضها ودقتها.
- BiFPN (شبكة الهرم المميز ثنائية الاتجاه): لدمج الميزات، يقدم EfficientDet شبكة BiFPN، وهي بنية عنق مبتكرة. على عكس شبكات FPN التقليدية من أعلى إلى أسفل، تتيح BiFPN دمج الميزات متعددة المقاييس بسهولة وسرعة عن طريق دمج اتصالات مرجحة تتعلم أهمية ميزات الإدخال المختلفة.
- التحجيم المركب: أحد المبادئ الأساسية في EfficientDet هو طريقة التحجيم المركب الخاصة به. تعمل هذه الإستراتيجية على توسيع نطاق العمق والعرض والدقة للعمود الفقري وشبكة الميزات (BiFPN) ورأس الاكتشاف بشكل مشترك، مما يسمح بتكييف النموذج ليناسب قيود الموارد المختلفة، من EfficientDet-D0 إلى D7.
نقاط القوة في EfficientDet
- دقة عالية: تُعرف نماذج EfficientDet بدقتها الممتازة، وغالبًا ما تتفوق على النماذج الأخرى ذات عدد المعلمات المماثل أو حتى الأكبر.
- قابلية التوسع: توفر عائلة النماذج مجموعة واسعة من الأحجام (D0-D7)، مما يوفر مرونة للنشر عبر مختلف الأجهزة ذات ميزانيات الحوسبة المختلفة.
- الكفاءة مقابل الدقة: يحقق توازنًا قويًا بين الدقة والتكلفة الحسابية (العمليات الحسابية)، مما يجعله بنية فعالة للغاية.
نقاط ضعف EfficientDet
- سرعة الاستدلال: أبطأ بشكل عام من كاشفات المرحلة الواحدة مثل YOLOv6-3.0، وخاصة المتغيرات الأكبر. يمكن أن يكون هذا قيدًا على التطبيقات في الوقت الفعلي.
- التعقيد: البنية الأساسية، وخاصةً BiFPN، أكثر تعقيدًا من الكاشفات أحادية المرحلة الأبسط، مما قد يجعل تعديل النموذج أو فهمه أكثر صعوبة.
- خاصية المهمة: تم تصميم EfficientDet في الأساس لاكتشاف الأجسام ويفتقر إلى التنوع المدمج للمهام الأخرى مثل تقسيم الصور أو تقدير الوضعيات الموجودة في الأطر الحديثة مثل Ultralytics YOLO.
تعرف على المزيد حول EfficientDet
نظرة عامة على YOLOv6-3.0
YOLOv6-3.0، الذي طورته Meituan، هو إطار عمل للكشف عن الكائنات من مرحلة واحدة مصمم للتطبيقات الصناعية، مع التركيز على التوازن بين الأداء العالي والكفاءة. كجزء من عائلة YOLO الموثقة على موقعنا، تتم مقارنته غالبًا بنماذج أخرى مثل Ultralytics YOLOv8 و YOLOv5.
التفاصيل:
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المنظمة: Meituan
- التاريخ: 2023-01-13
- Arxiv: https://arxiv.org/abs/2301.05586
- GitHub: https://github.com/meituan/YOLOv6
- المستندات: https://docs.ultralytics.com/models/yolov6/
البنية والميزات الرئيسية
يركز YOLOv6-3.0 على تحسين سرعة الاستدلال دون المساس بالدقة بشكل كبير. تتضمن الجوانب المعمارية الرئيسية ما يلي:
- هيكل خلفي فعال: يستخدم هيكل إعادة برمجة فعال لتسريع سرعة الاستدلال.
- كتلة هجينة: توازن بين الدقة والكفاءة في طبقات استخراج الميزات.
- استراتيجية تدريب مُحسَّنة: تستخدم تقنيات تدريب محسّنة لتقارب أسرع وأداء مُحسَّن.
يوفر YOLOv6-3.0 أحجام نماذج مختلفة (n, s, m, l) لتلبية سيناريوهات النشر المختلفة، من الأجهزة الطرفية ذات الموارد المحدودة إلى الخوادم عالية الأداء.
نقاط قوة YOLOv6-3.0
- سرعة استدلال عالية: مُحسَّن للاستدلال السريع، مما يجعله مناسبًا جدًا لتطبيقات الوقت الفعلي.
- Good Accuracy: Achieves competitive mAP, especially in larger model sizes.
- التركيز الصناعي: مصمم للنشر الصناعي العملي مع دعم جيد للقياس الكمي.
نقاط ضعف YOLOv6-3.0
- الدقة مقابل النماذج الأحدث: في حين أنها قوية، غالبًا ما توفر النماذج الأحدث مثل Ultralytics YOLO11 توازنًا أفضل بين الدقة والسرعة.
- تنوع محدود: يركز بشكل أساسي على اكتشاف الكائنات، ويفتقر إلى الدعم الأصلي لمهام الرؤية الأخرى مثل تجزئة المثيلات، و التصنيف، و تقدير الوضعية التي تعتبر قياسية في نظام Ultralytics.
- النظام البيئي والدعم: على الرغم من أنه مفتوح المصدر، إلا أن نظامه البيئي ليس شاملاً أو نشطًا مثل منصة Ultralytics، التي تقدم وثائق شاملة وبرامج تعليمية وتكاملًا سلسًا مع أدوات مثل Ultralytics HUB.
تعرف على المزيد حول YOLOv6-3.0
الأداء والمعايير
عند مقارنة EfficientDet و YOLOv6-3.0، فإن المقايضة الأساسية هي بين الدقة والسرعة.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
كما يوضح الجدول، تُظهر نماذج YOLOv6-3.0 سرعات استنتاج أسرع بشكل ملحوظ على GPU مع TensorRT، مما يجعلها الخيار الواضح للتطبيقات ذات متطلبات زمن الوصول الصارمة. على سبيل المثال، تحقق YOLOv6-3.0l درجة 52.8 mAP مع وقت استنتاج يبلغ 8.95 مللي ثانية فقط، في حين أن EfficientDet-d6 المماثلة تصل إلى 52.6 mAP ولكنها تستغرق 89.29 مللي ثانية - أي أبطأ بحوالي 10 مرات.
من ناحية أخرى، يمكن لـ EfficientDet تحقيق خريطة متوسطة للدقة عالية جدًا (53.7 لـ D7)، ولكن زمن الوصول للاستدلال الخاص به أعلى بكثير، مما يجعله أقل ملاءمة لمعالجة الفيديو في الوقت الفعلي. ومع ذلك، بالنسبة لمهام المعالجة دون اتصال بالإنترنت حيث تكون الدقة القصوى هي الهدف ولا يمثل زمن الوصول مصدر قلق، فإن نماذج EfficientDet الأكبر حجمًا تعد خيارًا قويًا. تُظهر نماذج EfficientDet الأصغر أيضًا كفاءة ممتازة من حيث المعلمات و FLOPs لدقتها المحددة.
حالات الاستخدام المثالية
EfficientDet
تعتبر EfficientDet هي الأنسب للتطبيقات التي تكون فيها الدقة ذات أهمية قصوى ويمكن إجراء الاستدلال في وضع عدم الاتصال أو على أجهزة قوية بدون قيود صارمة في الوقت الفعلي.
- تحليل التصوير الطبي: الكشف عن الأورام أو التشوهات في الفحوصات الطبية عالية الدقة حيث تكون الدقة بالغة الأهمية.
- صور الأقمار الصناعية: تحديد الأجسام أو التغييرات في صور الأقمار الصناعية للمراقبة البيئية أو الاستخبارات.
- مراقبة الجودة عالية الدقة: في التصنيع، لمهام الفحص التفصيلي حيث تكون السرعة ثانوية للإمساك بكل عيب.
YOLOv6-3.0
يتفوق YOLOv6-3.0 في السيناريوهات التي تتطلب الكشف السريع والفعال عن الكائنات.
- المراقبة الآنية: مراقبة بث الفيديو لـ أنظمة الأمان أو إدارة حركة المرور.
- الأتمتة الصناعية: مراقبة الجودة السريعة على خطوط الإنتاج ومراقبة العمليات.
- الروبوتات والذكاء الاصطناعي المتطرف: الكشف عن الكائنات للملاحة والتفاعل على الأجهزة ذات الموارد الحسابية المحدودة مثل NVIDIA Jetson.
الخلاصة والتوصية
يعتبر كل من EfficientDet و YOLOv6-3.0 من نماذج الكشف عن الأجسام ذات القدرات العالية، لكنهما يخدمان احتياجات مختلفة. يوفر EfficientDet دقة وقابلية تطوير ممتازة، مما يجعله خيارًا رائعًا للمهام غير الآنية ذات الأهمية للدقة. يوفر YOLOv6-3.0 سرعة رائعة، مما يجعله مثاليًا للتطبيقات الصناعية والآنية.
ومع ذلك، بالنسبة للمطورين والباحثين الذين يبحثون عن حل حديث يجمع بين الأداء العالي وتعدد الاستخدامات وتجربة مستخدم استثنائية، نوصي باستكشاف النماذج من سلسلة Ultralytics YOLO، مثل أحدث Ultralytics YOLO11.
تقدم نماذج Ultralytics العديد من المزايا الرئيسية:
- توازن أداء فائق: تحقق YOLO11 مقايضة حديثة بين السرعة والدقة، وغالبًا ما تتفوق على النماذج الأخرى في كلا المقياسين.
- تنوع لا مثيل له: على عكس نماذج المهام الفردية، يدعم YOLO11 اكتشاف الكائنات، وتجزئة المثيلات، وتقدير الوضعية، والتصنيف، والمربعات المحيطة الموجهة ضمن إطار عمل موحد واحد.
- سهولة الاستخدام: بفضل واجهة برمجة تطبيقات Python بسيطة و وثائق شاملة والعديد من الدروس التعليمية، فإن البدء في استخدام نماذج Ultralytics أمر مباشر.
- نظام بيئي مُدار بشكل جيد: استفد من التطوير النشط والمجتمع القوي والتحديثات المتكررة والتكامل السلس مع أدوات MLOps مثل Ultralytics HUB للتدريب والنشر المبسط.
- كفاءة التدريب: صُممت نماذج Ultralytics لتدريب فعال، وغالبًا ما تتطلب ذاكرة ووقتًا أقل للوصول إلى نقطة التقارب، مع أوزان مُدرَّبة مسبقًا متاحة بسهولة على مجموعة بيانات COCO.
في حين أن YOLOv6-3.0 منافس قوي للسرعة، و EfficientDet للدقة، فإن Ultralytics YOLO11 يوفر حلاً أكثر شمولية وقوة للغالبية العظمى من مشاريع رؤية الكمبيوتر الحديثة.
استكشف نماذج أخرى
لمزيد من القراءة، قد تكون مهتمًا بمقارنات أخرى تتضمن هذه النماذج:
- YOLOv8 ضد EfficientDet
- YOLO11 ضد EfficientDet
- YOLOv5 ضد YOLOv6
- YOLOv7 ضد YOLOv6
- RT-DETR مقابل EfficientDet