YOLOv5 ضد DAMO-YOLO: مقارنة تقنية تفصيلية
يعد اختيار نموذج الكشف عن الكائنات المناسب قرارًا حاسمًا يوازن بين الحاجة إلى الدقة والسرعة وسهولة النشر. تقدم هذه الصفحة مقارنة فنية مفصلة بين نموذجين قويين: Ultralytics YOLOv5، وهو معيار صناعي معروف بكفاءته وسهولة استخدامه، و DAMO-YOLO، وهو نموذج من مجموعة Alibaba يدفع حدود دقة الكشف.
في حين أن كلا النموذجين قد قدما مساهمات كبيرة، يبرز YOLOv5 بنظامه البيئي الناضج والذي تتم صيانته جيدًا وتوازنه الاستثنائي في الأداء، مما يجعله خيارًا عمليًا للغاية لمجموعة واسعة من التطبيقات الواقعية. سوف نتعمق في بنياتها ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك على اتخاذ قرار مستنير لمشروعك التالي في مجال الرؤية الحاسوبية.
Ultralytics YOLOv5: معيار الصناعة المعمول به
المؤلف: جلين جوتشر
المنظمة: Ultralytics
التاريخ: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
المستندات: https://docs.ultralytics.com/models/yolov5/
تم إصدار Ultralytics YOLOv5 في عام 2020، وسرعان ما أصبح أحد أكثر نماذج الكشف عن الكائنات شيوعًا في العالم. يعتمد نجاحه على أساس من السرعة الاستثنائية والدقة الموثوقة وسهولة الاستخدام التي لا مثيل لها. تم تطوير YOLOv5 في PyTorch، وهو مصمم للتدريب السريع والاستدلال القوي والنشر المباشر، مما يجعله حلاً مناسبًا للمطورين والباحثين على حد سواء.
البنية والميزات الرئيسية
يتكون هيكل YOLOv5 من العمود الفقري CSPDarknet53، وعنق PANet لتجميع الميزات، ورأس كشف قائم على المرساة. هذا التصميم فعال وقابل للتطوير بدرجة كبيرة، ويتم تقديمه بأحجام مختلفة (n, s, m, l, x) لتناسب الميزانيات الحسابية المختلفة واحتياجات الأداء. تكمن قوة النموذج الرئيسية ليس فقط في هيكله ولكن في النظام البيئي المحيط الذي بنته Ultralytics.
نقاط القوة
- سرعة وكفاءة استثنائيتان: تم تحسين YOLOv5 بشكل كبير للاستدلال السريع، مما يجعله مثاليًا للتطبيقات في الوقت الفعلي على نطاق واسع من الأجهزة، بدءًا من وحدات معالجة الرسوميات القوية (GPUs) إلى الأجهزة الطرفية ذات الموارد المحدودة.
- سهولة الاستخدام: يشتهر YOLOv5 بتجربة المستخدم المبسطة، ويوفر واجهات Python و CLI بسيطة، و وثائق شاملة، وعملية إعداد سريعة.
- نظام بيئي مُدار بشكل جيد: يتم دعم YOLOv5 من خلال نظام Ultralytics البيئي الشامل، والذي يتضمن التطوير النشط، ومجتمع كبير ومفيد، والتحديثات المتكررة، والأدوات القوية مثل Ultralytics HUB للتدريب والنشر بدون تعليمات برمجية.
- موازنة الأداء: يحقق توازنًا ممتازًا بين سرعة الاستدلال ودقة الكشف، مما يجعله خيارًا عمليًا وموثوقًا به لمختلف سيناريوهات النشر في العالم الحقيقي.
- تعدد الاستخدامات: بالإضافة إلى اكتشاف الأجسام، يدعم YOLOv5 تجزئة المثيلات و تصنيف الصور، مما يوفر حلاً مرنًا لمهام رؤية متعددة.
- كفاءة التدريب: يتميز YOLOv5 بعملية تدريب فعالة، وأوزان مُدرَّبة مسبقًا متاحة بسهولة، ويتطلب عمومًا ذاكرة أقل من العديد من البنى المنافسة، مما يتيح دورات تطوير أسرع.
نقاط الضعف
- الدقة: على الرغم من دقتها العالية في وقتها، يمكن للنماذج الأحدث مثل DAMO-YOLO تحقيق درجات mAP أعلى في المعايير القياسية مثل COCO، خاصة مع متغيرات النماذج الأكبر.
- يعتمد على المربعات المحورية (Anchor-Based): اعتماده على مربعات محورية محددة مسبقًا قد يتطلب أحيانًا المزيد من الضبط لمجموعات البيانات ذات الأشكال غير التقليدية للكائنات مقارنةً بالطرق الخالية من المربعات المحورية.
حالات الاستخدام
تتفوق YOLOv5 في سيناريوهات الكشف عن الكائنات في الوقت الفعلي، بما في ذلك:
- أنظمة الأمان: المراقبة في الوقت الفعلي لتطبيقات مثل منع السرقة واكتشاف الحالات الشاذة.
- الروبوتات: تمكين الروبوتات من إدراك بيئتها والتفاعل معها في الوقت الفعلي، وهو أمر بالغ الأهمية للملاحة والتلاعب المستقلين.
- الأتمتة الصناعية: مراقبة الجودة والكشف عن العيوب في عمليات التصنيع، مما يعزز كفاءة إعادة التدوير ومراقبة خط الإنتاج.
- نشر الذكاء الاصطناعي الطرفي: تشغيل فعال لاكتشاف الكائنات على الأجهزة محدودة الموارد مثل Raspberry Pi و NVIDIA Jetson للمعالجة على الجهاز.
DAMO-YOLO: كشف يركز على الدقة
المؤلفون: شيانزه شو، ييكي جيانغ، وي هوا تشين، ييلون هوانغ، يوان تشانغ، و شيويو صن
المنظمة: مجموعة علي بابا
التاريخ: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
المستندات: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
DAMO-YOLO هو نموذج للكشف عن الكائنات تم تطويره بواسطة مجموعة Alibaba. تم تقديمه في أواخر عام 2022، وهو يركز على تحقيق توازن بين الدقة العالية والاستدلال الفعال من خلال دمج العديد من التقنيات الجديدة في بنيته.
البنية والميزات الرئيسية
يقدم DAMO-YOLO العديد من المكونات المبتكرة:
- الأعمدة الفقرية NAS: تستخدم البحث عن البنية العصبية (NAS) لتحسين الشبكة الأساسية.
- RepGFPN الفعال: يستخدم شبكة هرم ميزات التدرج المعاد تهيئتها لتحسين دمج الميزات.
- ZeroHead: رأس كشف منفصل مصمم لتقليل الحمل الحسابي.
- AlignedOTA: يتميز باستراتيجية تعيين النقل الأمثل المحاذي لتحسين تعيين التسميات أثناء التدريب.
- تحسين التقطير: تتضمن تقنيات تقطير المعرفة لتعزيز الأداء.
نقاط القوة
- دقة عالية: يحقق mAP قويًا، مما يشير إلى دقة كشف ممتازة، خاصة مع متغيرات النموذج الأكبر.
- تقنيات مبتكرة: يتضمن أساليب جديدة مثل AlignedOTA و RepGFPN تهدف إلى تحسين الأداء بما يتجاوز البنى القياسية.
نقاط الضعف
- تعقيد التكامل: قد يتطلب المزيد من الجهد للاندماج في مهام سير العمل الحالية، خاصة بالمقارنة مع التجربة المبسطة داخل نظام Ultralytics البيئي.
- دعم النظام البيئي: قد يكون التوثيق ودعم المجتمع أقل شمولاً مقارنة بـ YOLOv5 الراسخة والتي يتم صيانتها بنشاط.
- تنوع المهام: يركز بشكل أساسي على اكتشاف الكائنات، وقد يفتقر إلى الدعم المدمج للمهام الأخرى مثل تقسيم الصور أو التصنيف الموجود في نماذج Ultralytics اللاحقة.
حالات الاستخدام
يعتبر DAMO-YOLO مناسبًا تمامًا للتطبيقات التي تكون فيها دقة الكشف العالية ذات أهمية قصوى:
- تطبيقات عالية الدقة: تحليل الصور التفصيلي، التصوير الطبي، والبحث العلمي.
- سيناريوهات معقدة: بيئات بها كائنات محجوبة أو تتطلب فهمًا تفصيليًا للمشهد.
- البحث والتطوير: استكشاف معماريات متقدمة للكشف عن الأجسام.
تحليل الأداء: السرعة مقابل الدقة
يقارن الجدول التالي أداء نماذج YOLOv5 و DAMO-YOLO على مجموعة بيانات COCO val2017. يُظهر YOLOv5 توازنًا استثنائيًا، حيث يقدم YOLOv5n سرعة لا مثيل لها على كل من CPU و GPU، بينما تظل النماذج الأكبر حجمًا تنافسية للغاية.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
في حين أن نماذج DAMO-YOLO تحقق mAP عالية، فإن YOLOv5 يوفر مقايضة أكثر عملية بين السرعة والدقة، خاصة بالنسبة للتطبيقات في الوقت الفعلي. إن توفر معايير وحدة المعالجة المركزية لوحدة YOLOv5 يسلط الضوء أيضًا على ملاءمتها للنشر على مجموعة واسعة من منصات الأجهزة حيث قد لا تتوفر وحدة معالجة الرسومات.
الخلاصة: أي نموذج يجب أن تختاره؟
يعتبر كل من YOLOv5 و DAMO-YOLO من نماذج الكشف عن الأجسام الهائلة، لكنهما يخدمان أولويات مختلفة.
-
DAMO-YOLO هو خيار ممتاز للباحثين والمطورين الذين يركزون على تحقيق أحدث دقة، خاصة في المشاهد المعقدة. توفر بنيته المبتكرة أساسًا قويًا للاستكشاف الأكاديمي والتطبيقات التي تكون فيها الدقة هي الأولوية القصوى.
-
Ultralytics YOLOv5، مع ذلك، لا يزال الخيار الأفضل للغالبية العظمى من التطبيقات العملية والواقعية. إن توازنه المذهل بين السرعة والدقة، جنبًا إلى جنب مع سهولة الاستخدام، و كفاءة التدريب، و تنوعه، يجعله فعالاً للغاية. إن العامل الرئيسي المميز هو النظام البيئي Ultralytics الذي تتم صيانته جيدًا، والذي يوفر دعمًا قويًا ووثائق شاملة وتجربة مستخدم سلسة من التدريب إلى النشر. هذا يقلل بشكل كبير من وقت التطوير والتعقيد.
بالنسبة للمطورين الذين يبحثون عن نموذج موثوق وعالي الأداء وسهل الدمج، فإن YOLOv5 هو الفائز الواضح. بالنسبة لأولئك الذين يتطلعون إلى البناء على هذا الأساس بميزات أكثر تقدمًا، تقدم نماذج Ultralytics الأحدث مثل YOLOv8 و YOLO11 المزيد من التحسينات في الدقة وتعدد الاستخدامات مع الحفاظ على نفس المبادئ سهلة الاستخدام.
استكشف مقارنات أخرى لترى كيف تتنافس هذه النماذج مع غيرها في هذا المجال: