YOLO11 مقابل YOLOv5: تطور تقني في مجال الكشف عن الأجسام
يُعد اختيار نموذج الكشف عن الأجسام المناسب قرارًا بالغ الأهمية يوازن بين الحاجة إلى الدقة والسرعة وسهولة النشر. تقدم هذه الصفحة مقارنة فنية شاملة بين نموذجين بارزين من Ultralytics: أحدث Ultralytics YOLO11 و Ultralytics YOLOv5 المعتمد على نطاق واسع. في حين أن YOLOv5 قد وضع معيارًا صناعيًا لأدائه وسهولة استخدامه، إلا أن YOLO11 يمثل الخطوة التطورية التالية، حيث يقدم دقة فائقة وتعدد استخدامات محسّن وأحدث الابتكارات المعمارية، وكل ذلك ضمن نظام Ultralytics البيئي القوي وسهل الاستخدام.
Ultralytics YOLO11: أحدث ما توصلت إليه التكنولوجيا
YOLO11، من تأليف Glenn Jocher و Jing Qiu، هو أحدث وأكثر النماذج تقدمًا في سلسلة Ultralytics YOLO. تم إصداره في عام 2024، وهو يعتمد على الأساس القوي للإصدارات السابقة مثل YOLOv8 لوضع معيار جديد في الأداء والكفاءة. إنه مصمم ليس فقط للكشف عن الأجسام ولكن كإطار عمل شامل لعدد كبير من مهام رؤية الكمبيوتر.
- المؤلفون: Glenn Jocher و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- المستندات: https://docs.ultralytics.com/models/yolo11/
البنية والميزات الرئيسية
تقدم YOLO11 تحسينات معمارية كبيرة، بما في ذلك رأس كشف خالٍ من المرساة وهيكل شبكة مُحسَّن. يبسط هذا الاختيار التصميمي الحديث عملية التدريب عن طريق إلغاء الحاجة إلى تحديد مربعات المرساة مسبقًا، مما يؤدي إلى تعميم أفضل على مجموعات البيانات المتنوعة. يحقق النموذج متوسط دقة أعلى (mAP) من YOLOv5 مع عدد أقل من المعلمات والمتطلبات الحسابية (FLOPs) في كثير من الحالات، مما يدل على كفاءة فائقة.
إحدى الميزات البارزة في YOLO11 هي تنوعها. إنه إطار عمل موحد يدعم أصلاً اكتشاف الكائنات، و تجزئة المثيلات، و تصنيف الصور، و تقدير الوضعية، و الصناديق المحيطة الموجهة (OBB). هذه القدرة متعددة المهام تجعلها أداة قوية ومرنة بشكل لا يصدق لأنظمة الذكاء الاصطناعي المعقدة.
نقاط القوة
- دقة هي الأحدث على مستوى التقنية: تقدم نتائج mAP أعلى بشكل ملحوظ مقارنةً بـ YOLOv5، مما يرسخ معيار أداء جديدًا.
- كفاءة عالية: يحقق دقة أفضل بهندسة معمارية أكثر كفاءة، وغالبًا ما يتطلب عددًا أقل من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs).
- تصميم بدون مربعات ارتكاز (Anchor-Free): يبسط التدريب ويحسن الأداء عن طريق إزالة الاعتماد على تكوين مربع الارتكاز.
- تعدد استخدامات المهام المتعددة: إطار عمل واحد لمجموعة واسعة من مهام الرؤية، وتبسيط التطوير للتطبيقات متعددة الأوجه.
- نظام بيئي مُدار بشكل جيد: يستفيد من التطوير المستمر، و توثيق شامل، ودعم مجتمعي قوي، والتكامل السلس مع أدوات مثل Ultralytics HUB لـ MLOps.
- كفاءة التدريب: يوفر عمليات تدريب فعالة مع أوزان مُدرَّبة مسبقًا متاحة بسهولة ويتطلب عمومًا استخدامًا أقل للذاكرة من البنى الأكثر تعقيدًا مثل المحولات.
نقاط الضعف
- باعتباره نموذجًا متطورًا، يمكن أن تكون المتغيرات الأكبر من YOLO11 مكثفة حسابيًا، وتتطلب أجهزة GPU حديثة لتحقيق الأداء الأمثل.
حالات الاستخدام المثالية
تعتبر YOLO11 الخيار الأمثل للمشاريع الجديدة التي تتطلب أعلى مستويات الدقة والمرونة:
- الروبوتات المتقدمة: للتفاعل الدقيق مع الأجسام والملاحة في البيئات الديناميكية.
- الأتمتة الصناعية: مراقبة الجودة واكتشاف العيوب بدقة عالية.
- الرعاية الصحية: المساعدة في تحليل الصور الطبية لمهام مثل الكشف عن الأورام.
- المدن الذكية: تشغيل أنظمة معقدة لـ إدارة حركة المرور والسلامة العامة.
YOLOv5: الحصان الرابح المعروف والمتعدد الاستخدامات
تم إصدار YOLOv5 في عام 2020 بواسطة Glenn Jocher في Ultralytics، وسرعان ما أصبح أحد أكثر نماذج الكشف عن الكائنات شيوعًا في العالم. يُحتفى به لتوازنه الاستثنائي بين السرعة والدقة وسهولة الاستخدام والتنفيذ القوي والموثق جيدًا في PyTorch.
- المؤلف: جلين جوتشر
- المنظمة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- المستندات: https://docs.ultralytics.com/models/yolov5/
البنية والميزات الرئيسية
تستخدم YOLOv5 بنية تعتمد على هيكل CSPDarknet53 و PANet لتجميع الميزات بشكل فعال. رأس الكشف الخاص به قائم على المرساة، والذي كان نهجًا قياسيًا وفعالًا في وقت إصداره. تتمثل إحدى أعظم نقاط قوة YOLOv5 في قابليتها للتطوير، حيث تقدم مجموعة من النماذج من الإصدار الصغير 'n' (nano) إلى الإصدار الكبير 'x' (كبير جدًا)، مما يسمح للمطورين بالمفاضلة بسهولة بين السرعة والدقة.
نقاط القوة
- سرعة استدلال استثنائية: مُحسَّنة للغاية للأداء في الوقت الفعلي، مما يجعلها خيارًا مفضلًا للتطبيقات على الأجهزة الطرفية مثل NVIDIA Jetson.
- سهولة الاستخدام: يشتهر بواجهة برمجة التطبيقات البسيطة والبرامج التعليمية الشاملة وسير عمل التدريب والنشر المبسط.
- نظام بيئي ناضج: مدعوم بمجتمع ضخم، وسنوات من التطوير النشط، وعمليات نشر لا حصر لها في العالم الحقيقي، مما يضمن الاستقرار والموثوقية.
- المرونة: النطاق الواسع لأحجام النماذج يجعله قابلاً للتكيف مع أي قيود للأجهزة تقريبًا.
نقاط الضعف
- دقة أقل: على الرغم من أنها لا تزال قوية، إلا أن دقتها تتجاوزها النماذج الأحدث مثل YOLO11.
- اكتشاف قائم على المرساة: يعتمد على مربعات مرساة محددة مسبقًا، والتي يمكن أن تتطلب في بعض الأحيان ضبطًا يدويًا لتحقيق الأداء الأمثل على مجموعات البيانات المخصصة مقارنةً بـ أجهزة الكشف الحديثة الخالية من المرساة.
حالات الاستخدام المثالية
تظل YOLOv5 خيارًا ممتازًا لسيناريوهات محددة:
- الحوسبة الطرفية: النشر على الأجهزة ذات الموارد المحدودة مثل Raspberry Pi حيث تكون سرعة الاستدلال هي الأولوية القصوى.
- النماذج الأولية السريعة: بساطته وسرعته تجعله مثاليًا لإنشاء واختبار تطبيقات إثبات المفهوم بسرعة.
- الأنظمة القديمة: الحفاظ على أو تحديث المشاريع الحالية المبنية على إطار عمل YOLOv5.
- المراقبة الآنية: تشغيل أنظمة الأمان حيث يكون معدل الإطارات العالي في الثانية (FPS) أمرًا بالغ الأهمية.
الأداء والمعايير: YOLO11 ضد YOLOv5
توضح مقاييس الأداء بوضوح التطور من YOLOv5 إلى YOLO11. على مجموعة بيانات COCO، تحقق نماذج YOLO11 باستمرار درجات mAP أعلى من نظيراتها في YOLOv5 ذات الحجم المماثل. على سبيل المثال، تصل YOLO11m إلى 51.5 mAP، متفوقة بشكل كبير على 45.4 mAP لـ YOLOv5m. علاوة على ذلك، غالبًا ما تفعل YOLO11 ذلك بكفاءة حسابية أكبر. والجدير بالذكر أن أصغر نموذج، YOLO11n، أسرع على وحدة المعالجة المركزية (CPU) من YOLOv5n مع تقديم زيادة هائلة قدرها 11.5 نقطة في mAP.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
الخلاصة: أي نموذج يجب أن تختاره؟
يعتمد الاختيار بين YOLO11 و YOLOv5 على الاحتياجات المحددة لمشروعك.
YOLOv5 هو نموذج مثبت وموثوق وسريع بشكل لا يصدق. ولا يزال خيارًا رائعًا للتطبيقات التي تكون فيها السرعة هي الأولوية المطلقة، خاصة على الأجهزة القديمة أو محدودة الموارد. يوفر نضجه ودعم المجتمع الواسع أساسًا ثابتًا للعديد من المشاريع.
ومع ذلك، بالنسبة لجميع المشاريع الجديدة تقريبًا، يعد YOLO11 الخيار الواضح والموصى به. إنه يمثل قفزة كبيرة إلى الأمام، حيث يقدم دقة متطورة وكفاءة فائقة وتعدد استخدامات لا مثيل له. إن بنيته الخالية من المرساة ودعمه الأصلي لمهام الرؤية المتعددة يجعله حلاً أكثر قوة ومرونة ومضمونًا للمستقبل. من خلال اختيار YOLO11، يستفيد المطورون من أحدث التطورات في الذكاء الاصطناعي لبناء تطبيقات رؤية الكمبيوتر أكثر قدرة ودقة، كل ذلك مع الاستفادة من نظام Ultralytics البيئي المبسّط والذي تتم صيانته جيدًا.
استكشف مقارنات النماذج الأخرى
إذا كنت مهتمًا بمعرفة كيف تقارن هذه النماذج بالبنى الرائدة الأخرى، فراجع صفحات المقارنة الأخرى الخاصة بنا:
- YOLO11 مقارنة بـ YOLOv8
- YOLO11 مقابل YOLOv10
- YOLOv5 مقارنة بـ YOLOv8
- YOLOv5 مقارنة بـ YOLOv7
- YOLOv5 مقارنة بـ YOLOv9