DAMO-YOLO مقابل YOLOv5: مقارنة فنية مفصلة
يُعد اختيار نموذج الكشف عن الأجسام المناسب قرارًا بالغ الأهمية يوازن بين الدقة والسرعة وسهولة التنفيذ. تقدم هذه الصفحة مقارنة فنية مفصلة بين DAMO-YOLO، وهو نموذج يركز على الدقة من مجموعة Alibaba، و Ultralytics YOLOv5، وهو نموذج قياسي في الصناعة يشتهر بمزيجه الاستثنائي من الأداء وسهولة الاستخدام. سوف نتعمق في الاختلافات المعمارية ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار أفضل نموذج لمشروع الرؤية الحاسوبية الخاص بك.
DAMO-YOLO: كشف يركز على الدقة
المؤلفون: شيانزه شو، يي تشي جيانغ، ويهوا تشن، ييلون هوانغ، يوان تشانغ، وشيو يو صن
المنظمة: مجموعة علي بابا
التاريخ: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
التوثيق: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
DAMO-YOLO هو نموذج للكشف عن الأجسام تم تطويره بواسطة مجموعة علي بابا. تم تقديمه في أواخر عام 2022، ويركز على تحقيق توازن فائق بين الدقة العالية والاستدلال الفعال من خلال دمج العديد من التقنيات المبتكرة في بنيته.
البنية والميزات الرئيسية
يقدم DAMO-YOLO العديد من المكونات المبتكرة المصممة لتوسيع حدود دقة الكشف:
- العمود الفقري لـ NAS: تستخدم البحث عن بنية الشبكة العصبية (NAS) لاكتشاف وتنفيذ شبكات العمود الفقري عالية الكفاءة والمصممة خصيصًا للكشف عن الكائنات.
- RepGFPN الفعال: يستخدم النموذج شبكة هرم ميزات التدرج المعاد تهيئتها، وهي وحدة عنق متقدمة لتحسين دمج الميزات عبر مقاييس مختلفة.
- ZeroHead: يتميز برأس كشف مفصول مصمم لتقليل النفقات الحسابية مع الحفاظ على الأداء العالي.
- AlignedOTA: تضمن استراتيجية تعيين التسميات الجديدة هذه، وهي تعيين النقل الأمثل المحاذي، مواءمة أفضل بين التنبؤات والتسميات الحقيقية أثناء التدريب، ممّا يؤدي إلى تحسين الدقة.
- تحسين التقطير: يستفيد النموذج من تقطير المعرفة لنقل المعرفة من نموذج معلم أكبر وأكثر قوة إلى نموذج الطالب الأصغر، مما يعزز أدائه.
نقاط القوة
- دقة عالية: يحقق DAMO-YOLO درجات mAP قوية، مما يشير إلى دقة اكتشاف ممتازة، خاصة مع متغيرات النموذج الأكبر.
- تقنيات مبتكرة: يتيح تكامل الأساليب الجديدة مثل AlignedOTA و RepGFPN تحسين الأداء بما يتجاوز البنى القياسية.
نقاط الضعف
- تعقيد التكامل: قد يكون دمج DAMO-YOLO في مهام سير العمل الحالية أكثر تعقيدًا، خاصةً عند مقارنته بالتجربة المبسطة التي يوفرها نظام Ultralytics البيئي.
- دعم النظام البيئي: قد يكون التوثيق ودعم المجتمع الخاص به، على الرغم من توفره، أقل شمولاً من دعم YOLOv5 الراسخة والتي يتم صيانتها بنشاط.
- تنوع المهام: يركز DAMO-YOLO بشكل أساسي على اكتشاف الكائنات، وقد يفتقر إلى الدعم المدمج للمهام الأخرى مثل تقسيم الصور أو التصنيف الموجود في نماذج Ultralytics.
حالات الاستخدام
يعتبر DAMO-YOLO مناسبًا تمامًا للتطبيقات التي تكون فيها دقة الكشف العالية هي الشرط الأساسي:
- تطبيقات عالية الدقة: تحليل الصور التفصيلي، كما هو الحال في التصوير الطبي والبحث العلمي.
- سيناريوهات معقدة: بيئات بها كائنات محجوبة بشدة أو تلك التي تتطلب فهمًا عميقًا للمشهد.
- البحث والتطوير: أداة قيمة للباحثين الذين يستكشفون بنى وتقنيات متقدمة لاكتشاف العناصر.
Ultralytics YOLOv5: معيار الصناعة المعمول به
المؤلف: جلين جوتشر
المنظمة: Ultralytics
التاريخ: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
التوثيق: https://docs.ultralytics.com/models/yolov5/
سرعان ما أصبح Ultralytics YOLOv5 معيارًا صناعيًا بعد إطلاقه، ويُحتفى به لتوازنه الاستثنائي بين السرعة والدقة وسهولة الاستخدام الرائعة. يتميز YOLOv5، الذي تم تطويره بالكامل في PyTorch، ببنية قوية تجمع بين عمود فقري CSPDarknet53 مع عنق PANet لتجميع الميزات الفعال. تتيح قابليته للتوسع، التي يتم توفيرها من خلال أحجام النماذج المختلفة (n, s, m, l, x)، للمطورين تحديد المقايضة المثالية لمتطلباتهم الحسابية ومتطلبات الأداء المحددة.
نقاط القوة
- سرعة وكفاءة استثنائيتان: تم تحسين YOLOv5 بشكل كبير للاستدلال السريع، مما يجعله الخيار الأفضل لـ تطبيقات الوقت الفعلي على نطاق واسع من الأجهزة، بدءًا من وحدات معالجة الرسوميات السحابية القوية (GPUs) إلى الأجهزة الطرفية ذات الموارد المحدودة.
- سهولة الاستخدام: إحدى الميزات الرئيسية لـ YOLOv5 هي تجربة المستخدم المبسطة. فهي توفر واجهات Python و CLI بسيطة، و وثائق شاملة، وعملية إعداد مباشرة.
- نظام بيئي مُدار بشكل جيد: يتم دعم YOLOv5 من خلال نظام Ultralytics البيئي القوي، والذي يتضمن التطوير النشط، ومجتمع كبير ومفيد، والتحديثات المتكررة، والتكامل السلس مع أدوات مثل Ultralytics HUB للتدريب بدون تعليمات برمجية و MLOps.
- موازنة الأداء: يحقق توازنًا ممتازًا بين سرعة الاستدلال ودقة الكشف، مما يجعله عمليًا للغاية لمختلف سيناريوهات النشر في العالم الحقيقي.
- تعدد الاستخدامات: بالإضافة إلى اكتشاف الأجسام، يدعم YOLOv5 تجزئة المثيلات و تصنيف الصور، مما يوفر حلاً متعدد الأغراض.
- كفاءة التدريب: يوفر YOLOv5 عمليات تدريب فعالة، وأوزان مُدرَّبة مسبقًا متاحة بسهولة، ويتطلب عمومًا ذاكرة أقل من العديد من البنى المنافسة.
نقاط الضعف
- الدقة: على الرغم من دقتها العالية، إلا أن النماذج الأحدث قد تجاوزت درجات mAP الخاصة بـ YOLOv5 على المعايير القياسية مثل COCO.
- يعتمد على المربعات المحورية (Anchor-Based): قد يتطلب اعتماده على مربعات محورية محددة مسبقًا ضبطًا إضافيًا لمجموعات البيانات ذات نسب العرض إلى الارتفاع غير التقليدية للكائنات مقارنةً بالطرق الخالية من المربعات المحورية.
حالات الاستخدام
يتفوق YOLOv5 في السيناريوهات التي تكون فيها السرعة والكفاءة وسهولة النشر أمرًا بالغ الأهمية:
- أنظمة الأمان: المراقبة في الوقت الفعلي لتطبيقات مثل منع السرقة واكتشاف الحالات الشاذة.
- الروبوتات: تمكين الروبوتات من إدراك بيئتها والتفاعل معها في الوقت الفعلي، وهو أمر بالغ الأهمية للملاحة والتلاعب المستقلين.
- الأتمتة الصناعية: مراقبة الجودة والكشف عن العيوب في عمليات التصنيع، مما يعزز كفاءة إعادة التدوير ومراقبة خط الإنتاج.
- نشر الذكاء الاصطناعي الطرفي: تشغيل فعال لاكتشاف الكائنات على الأجهزة محدودة الموارد مثل Raspberry Pi و NVIDIA Jetson للمعالجة على الجهاز.
مقارنة الأداء
عند مقارنة DAMO-YOLO و YOLOv5، يظهر مقايضة واضحة بين الدقة والسرعة. تحقق نماذج DAMO-YOLO عمومًا درجات mAP أعلى، مما يدل على قوتها في دقة الكشف الخالصة. ومع ذلك، توفر نماذج YOLOv5، وخاصة المتغيرات الأصغر، سرعات استدلال أسرع بشكل ملحوظ، خاصة على أجهزة CPU. وهذا يجعل YOLOv5 خيارًا أكثر عملية للتطبيقات في الوقت الفعلي حيث يكون الكمون المنخفض ضروريًا.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
الخلاصة
يعد كل من DAMO-YOLO و Ultralytics YOLOv5 من نماذج الكشف عن الكائنات القوية، لكنهما يلبيان أولويات مختلفة. DAMO-YOLO هو خيار ممتاز للتطبيقات التي يكون فيها تحقيق أعلى دقة ممكنة هو الهدف الرئيسي، وحيث يكون المطورون على استعداد للتعامل مع تكامل أكثر تعقيدًا.
ومع ذلك، بالنسبة للغالبية العظمى من المطورين وتطبيقات العالم الحقيقي، يقدم Ultralytics YOLOv5 حلاً أكثر إقناعًا وعملية. إن توازنه الاستثنائي بين السرعة والدقة، جنبًا إلى جنب مع سهولة الاستخدام التي لا مثيل لها، يجعله في متناول الجميع بشكل لا يصدق. يوفر النظام البيئي الذي تتم صيانته جيدًا ميزة كبيرة، حيث يقدم وثائق قوية ودعمًا مجتمعيًا نشطًا وأدوات قوية مثل Ultralytics HUB. إن كفاءة التدريب و تعدد استخدامات YOLOv5 عبر مهام رؤية متعددة تجعله خيارًا فعالاً للغاية وسهل الاستخدام للمطورين للمشاريع التي تتراوح من النماذج الأولية السريعة إلى نشر الإنتاج.
بالنسبة للمهتمين بأحدث التطورات، فإن نماذج Ultralytics الأحدث مثل YOLOv8 و YOLO11 تعتمد على نقاط قوة YOLOv5، مما يوفر أداءً أفضل وميزات أكثر.
مقارنات النماذج الأخرى
للمزيد من الاستكشاف، ضع في اعتبارك هذه المقارنات التي تتضمن DAMO-YOLO و YOLOv5 ونماذج أخرى ذات صلة:
- DAMO-YOLO ضد YOLOv8
- YOLOv5 مقارنة بـ YOLOv7
- YOLOv5 مقارنة بـ YOLOv8
- YOLOv5 مقارنة بـ YOLOv9
- RT-DETR ضد YOLOv5
- EfficientDet مقابل YOLOv5
- استكشف أحدث النماذج مثل YOLOv10 و YOLO11.