YOLOv9 مقابل YOLO11: مقارنة فنية
يتطور مجال اكتشاف الكائنات في الوقت الفعلي باستمرار، حيث تدفع النماذج الجديدة حدود ما هو ممكن. تقدم هذه الصفحة مقارنة فنية متعمقة بين متنافسين قويين: YOLOv9، وهو نموذج معروف بابتكاراته المعمارية، و Ultralytics YOLO11، أحدث نموذج متطور من Ultralytics. سنقوم بتحليل بنياتها ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار النموذج الأمثل لمشاريع رؤية الكمبيوتر الخاصة بك.
YOLOv9: تعزيز الدقة مع بنية جديدة
تم تقديم YOLOv9 كخطوة كبيرة إلى الأمام في الكشف عن الأجسام، مع التركيز بشكل أساسي على حل مشكلة فقدان المعلومات في الشبكات العصبية العميقة. تهدف مكوناته المعمارية الجديدة إلى تحقيق دقة أعلى من خلال الحفاظ على المزيد من البيانات في جميع أنحاء النموذج.
تفاصيل فنية:
- المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
- التاريخ: 2024-02-21
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- المستندات: https://docs.ultralytics.com/models/yolov9/
البنية والميزات الرئيسية
الابتكارات الأساسية في YOLOv9 هي معلومات التدرج القابلة للبرمجة (PGI) و شبكة تجميع الطبقات الفعالة المعممة (GELAN). تم تصميم PGI لتوفير معلومات إدخال كاملة لوظيفة الخسارة، مما يخفف من مشكلة عنق الزجاجة المعلوماتي التي يمكن أن تقلل من الأداء في الشبكات العميقة جدًا. GELAN عبارة عن بنية شبكة خفيفة الوزن وفعالة تعمل على تحسين استخدام المعلمات والكفاءة الحسابية. تسمح هذه الميزات مجتمعة لـ YOLOv9 بتعيين معايير دقة عالية على مجموعات البيانات مثل COCO.
نقاط القوة
- دقة عالية: يحقق نتائج حديثة في مجموعة بيانات COCO، حيث يصل أكبر متغير له، YOLOv9-E، إلى mAP عالي.
- الحفاظ على المعلومات: يعالج PGI بشكل فعال مشكلة عنق الزجاجة المعلوماتي، وهو أمر بالغ الأهمية لتدريب النماذج العميقة والمعقدة.
- تصميم فعال: توفر بنية GELAN نسبة قوية بين الدقة وعدد المعلمات.
نقاط الضعف
- تنوع المهام: يركز بحث YOLOv9 الأصلي بشكل أساسي على اكتشاف الكائنات. ويفتقر إلى الدعم المدمج والموحد لمهام أخرى مثل تقسيم المثيلات وتقدير الوضع والتصنيف وهو معيار في نماذج Ultralytics.
- النظام البيئي وسهولة الاستخدام: كنموذج من مجموعة بحثية منفصلة، فإن نظامه البيئي أقل نضجًا. يمكن أن يكون التكامل في مهام سير العمل الإنتاجية أكثر تعقيدًا، ويفتقر إلى تجربة المستخدم المبسطة و الوثائق الشاملة والدعم المجتمعي النشط الذي توفره Ultralytics.
- موارد التدريب: كما هو مذكور في وثائقه، قد يكون تدريب YOLOv9 أكثر استهلاكًا للموارد ويستغرق وقتًا أطول مقارنة بالنماذج المحسّنة للغاية مثل تلك الخاصة بـ Ultralytics.
Ultralytics YOLO11: قمة الأداء وسهولة الاستخدام
Ultralytics YOLO11 هو أحدث نموذج رائد من Ultralytics، تم تصميمه لتقديم توازن استثنائي بين السرعة والدقة والتنوع. بناءً على نجاح سابقاتها مثل YOLOv8، تم تصميم YOLO11 لمجموعة واسعة من التطبيقات الواقعية وتم تحسينه لسهولة الاستخدام والنشر عبر منصات الأجهزة المختلفة.
تفاصيل فنية:
- المؤلفون: Glenn Jocher و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- المستندات: https://docs.ultralytics.com/models/yolo11/
البنية والميزات الرئيسية
تعمل YOLO11 على تحسين البنية المثبتة لنماذج Ultralytics السابقة، ودمج استخراج الميزات المتقدم وتصميم الشبكة المبسط. ينتج عن هذا دقة أعلى مع عدد أقل من المعلمات والمتطلبات الحسابية. لا تكمن الميزة الرئيسية لـ YOLO11 في أدائها فحسب، بل في تكاملها في نظام Ultralytics البيئي الشامل. يوفر هذا العديد من المزايا الرئيسية:
- سهولة الاستخدام: تعمل واجهة برمجة تطبيقات Python و CLI بسيطة وسهلة الاستخدام على تسهيل تدريب النماذج والتحقق منها ونشرها لكل من المبتدئين والخبراء.
- نظام بيئي مُدار بشكل جيد: يتم دعم YOLO11 من خلال التطوير النشط، والتحديثات المتكررة، والدعم المجتمعي القوي. يتكامل بسلاسة مع أدوات مثل Ultralytics HUB للتدريب بدون تعليمات برمجية و MLOps.
- تنوع الاستخدامات: يعتبر YOLO11 نموذجًا متعدد المهام يدعم اكتشاف الكائنات، وتقسيم الحالات، وتصنيف الصور، وتقدير الوضعيات، والصناديق المحيطة الموجهة (OBB) ضمن إطار عمل موحد.
- كفاءة التدريب والذاكرة: تم تحسين YOLO11 بدرجة كبيرة من أجل التدريب الفعال، مع توفر أوزان مُدرَّبة مسبقًا بسهولة. يتطلب عادةً ذاكرة أقل للتدريب والاستنتاج مقارنةً بأنواع النماذج الأخرى، وخاصةً النماذج الكبيرة القائمة على المحولات.
نقاط القوة
- توازن أداء ممتاز: يوفر توازنًا فائقًا بين السرعة والدقة، مما يجعله مثاليًا للاستدلال في الوقت الفعلي.
- دعم المهام المتعددة: يمكن لنموذج واحد التعامل مع مجموعة واسعة من مهام رؤية الكمبيوتر، مما يزيد من فائدته ويقلل من تعقيد التطوير.
- تحسين الأجهزة: مُحسَّن للنشر على أجهزة متنوعة، من الأجهزة الطرفية إلى الخوادم السحابية، مع أداء ممتاز على كل من وحدة المعالجة المركزية (CPU) ووحدة معالجة الرسوميات (GPU).
- قوي وناضج: يستفيد من سنوات من البحث والتطوير، مما يضمن الاستقرار والموثوقية لبيئات الإنتاج.
نقاط الضعف
- باعتباره كاشفًا أحادي المرحلة، قد يواجه تحديات مع الأجسام الصغيرة جدًا أو المزدحمة مقارنةً ببعض الكواشف ثنائية المرحلة المتخصصة.
- لا تزال نماذج YOLO11 الأكبر، على الرغم من كفاءتها، تتطلب قوة حسابية كبيرة لتحقيق أقصى قدر من الأداء.
مقارنة أداء مباشرة: YOLOv9 ضد YOLO11
عند مقارنة الأداء، من الواضح أن كلا النموذجين يتمتعان بقدرات عالية. يحقق YOLOv9-E أعلى mAP على مجموعة بيانات COCO، ولكن هذا يأتي على حساب زيادة زمن الوصول. في المقابل، توفر عائلة Ultralytics YOLO11 مجموعة أكثر توازناً وعملية من الخيارات. على سبيل المثال، يحقق YOLO11l نسبة mAP مماثلة لـ YOLOv9c ولكن مع سرعة استدلال GPU أسرع. علاوة على ذلك، توفر النماذج الأصغر مثل YOLO11n و YOLO11s أداءً استثنائيًا في الوقت الفعلي، مما يجعلها أكثر ملاءمة للتطبيقات ذات الموارد المحدودة.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
حالات الاستخدام المثالية
YOLOv9
يعد YOLOv9 هو الأنسب للمشاريع التي تركز على البحث أو التطبيقات التي يكون فيها تحقيق أقصى دقة ممكنة للكشف هو الهدف الأساسي، وتكون عوامل مثل سهولة الاستخدام ووظائف المهام المتعددة ووقت التدريب ثانوية.
- بحث متقدم: استكشاف حدود هياكل التعلم العميق.
- الأنظمة عالية الدقة: تطبيقات مثل القيادة الذاتية أو تحليل الصور الطبية المتخصصة حيث يكون متوسط الدقة (mAP) من الدرجة الأولى أمرًا بالغ الأهمية.
Ultralytics YOLO11
تعتبر YOLO11 الخيار الأمثل للغالبية العظمى من التطبيقات الواقعية، من النماذج الأولية السريعة إلى نشر الإنتاج على نطاق واسع. إن الجمع بين الأداء والتنوع وسهولة الاستخدام يجعلها حلاً شاملاً فائقًا.
- المدن الذكية: إدارة حركة المرور في الوقت الفعلي ومراقبة السلامة العامة.
- الأتمتة الصناعية: مراقبة الجودة واكتشاف العيوب على خطوط الإنتاج.
- تحليلات البيع بالتجزئة: إدارة المخزون وتحليل سلوك العملاء.
- الزراعة: مراقبة صحة المحاصيل والحصاد الآلي.
الخلاصة: لماذا YOLO11 هو الخيار الموصى به
في حين أن YOLOv9 هو نموذج جدير بالثناء يقدم مفاهيم أكاديمية مهمة، يبرز Ultralytics YOLO11 باعتباره الخيار الأكثر عملية وقوة وتنوعًا للمطورين والباحثين.
إن تركيز YOLOv9 على الدقة الخالصة مثير للإعجاب، ولكن YOLO11 يقدم أداءً تنافسيًا للغاية مع توفير تجربة مستخدم فائقة، وقدرات متعددة المهام، ونظام بيئي قوي ومدعوم جيدًا. بالنسبة للمشاريع التي تحتاج إلى الانتقال من المفهوم إلى الإنتاج بكفاءة، فإن سير عمل YOLO11 المبسّط والوثائق الشاملة والمجتمع النشط يوفر ميزة لا مثيل لها. يضمن نهجه المتوازن للسرعة والدقة أنه يمكنك العثور على النموذج المثالي لأي تطبيق، بدءًا من الأجهزة الطرفية خفيفة الوزن وحتى خوادم الحوسبة السحابية القوية.
لهذه الأسباب، يعد Ultralytics YOLO11 هو الخيار النهائي لبناء الجيل التالي من حلول رؤية الكمبيوتر المدعومة بالذكاء الاصطناعي.
استكشف نماذج أخرى
إذا كنت مهتمًا بمعرفة كيف تتم مقارنة YOLO11 و YOLOv9 بنماذج أخرى في النظام البيئي، فتأكد من الاطلاع على صفحات المقارنة الأخرى الخاصة بنا. تقدم نماذج مثل YOLOv10 و RT-DETR مقايضات مختلفة في الأداء والبنية قد تكون ذات صلة باحتياجاتك الخاصة. استكشف صفحة مقارنة النماذج الرئيسية الخاصة بنا للحصول على نظرة عامة كاملة.