YOLOv8 مقابل YOLO11: مقارنة تقنية
تكشف المقارنة بين نموذجي Ultralytics YOLOv8 و YOLO11 لاكتشاف الأجسام عن تطورات في الرؤية الحاسوبية في الوقت الحقيقي. تم تصميم كلا النموذجين، اللذين طورتهما شركة Ultralytics من أجل السرعة والدقة، ولكنهما يلبيان احتياجات مختلفة قليلاً ويعتمدان على خيارات معمارية متميزة. تقدم هذه الصفحة مقارنة تقنية مفصلة لمساعدة المستخدمين على فهم الاختلافات الرئيسية بينهما والتطبيقات المثالية.
نظرة عامة على YOLOv8
YOLOv8الذي قدمته شركة Ultralytics في 2023-01-10، يمثل تكرارًا مهمًا في سلسلة YOLO . يركّز YOLOv8 الذي ألّفه كل من جلين جوتشر، وأيوش تشوراسيا، وجينغ تشيو، على تعدد الاستخدامات وسهولة الاستخدام عبر مجموعة من مهام الرؤية بما في ذلك اكتشاف الأجسام، والتجزئة، والتصنيف، وتقدير الوضعية. وهو مبني على بنيات YOLO السابقة ولكنه يتضمن تحسينات لتحسين الأداء والمرونة. تؤكد وثائقYOLOv8 على سهولة استخدامه، مما يجعله في متناول كل من المبتدئين والممارسين ذوي الخبرة في مجال اكتشاف الأجسام.
البنية والمميزات الرئيسية:
يحافظ YOLOv8 على نموذج اكتشاف أحادي المرحلة وخالٍ من الارتكاز، مما يبسّط بنية النموذج ويبسّط عملية التدريب. تشمل الميزات المعمارية الرئيسية ما يلي:
- العمود الفقري: يستخدم عمودًا فقريًا محسنًا لشبكة CSPDarknet، تم تحسينه لتحقيق كفاءة استخراج الميزات.
- الرقبة: توظف شبكة جزئية عبر مراحل C2f في الرقبة لتحسين دمج الميزات، وتحسين تدفق المعلومات وانتشار التدرج.
- الرأس: يفصل رأس الكشف المنفصل بين مهمتي التصنيف والانحدار، مما يساهم في تحسين الدقة وتقارب أسرع.
مقاييس الأداء:
يُحقّق YOLOv8 أحدث أداء في مختلف أحجام النماذج. بالنسبة لاكتشاف الكائنات على مجموعة بيانات COCO، يصل YOLOv8x وهو أكبر متغير، إلى 53.9 ميجابايت في 50-95، بينما يحقق الإصدار النانوي، YOLOv8n 37.3 ميجابايت في 50-95، مما يحقق التوازن بين الدقة والسرعة. وتتراوح سرعات الاستدلال من 80.4 مللي ثانية على CPU ONNX لـ YOLOv8n إلى 479.1 مللي ثانية لـ YOLOv8x مما يوفر خيارات لمختلف القيود الحسابية. استكشف مقاييس أداءYOLOv8 التفصيلية.
حالات الاستخدام:
إن تعدد استخدامات YOLOv8 يجعله مناسبًا لمجموعة واسعة من التطبيقات، بدءًا من أنظمة الإنذار الأمني وعمليات نشر المدن الذكية إلى التطبيقات المتقدمة في مجال الرعاية الصحية والتصنيع. إن أداءه المتوازن يجعله خيارًا قويًا للمشاريع التي تتطلب مزيجًا من الدقة والسرعة.
نقاط القوة:
- دعم المهام المتنوعة: يتعامل مع الكشف، والتجزئة، والتصنيف، وتقدير الوضعية.
- دقة وسرعة عالية: يوفر توازناً جيداً بين الدقة والسرعة في الاستدلال.
- سهل الاستخدام: موثق بشكل جيد وسهل الاستخدام مع Ultralytics Python و CLI واجهات.
- مجتمع نشط: Benefits from a large community and continuous updates from Ultralytics.
نقاط الضعف:
- كثيفة الموارد: تتطلب النماذج الأكبر حجماً موارد حاسوبية كبيرة للتدريب والنشر.
- احتياجات التحسين: قد يتطلب المزيد من التحسين للبيئات ذات الموارد المحدودة للغاية.
نظرة عامة على YOLO11
YOLO11هو أحدث نموذج من Ultralytics الذي تم إصداره في 2024-09-27، وهو من تأليف جلين جوشر وجينغ تشيو، وهو يعتمد على سلسلة YOLO ويهدف إلى تحقيق المزيد من التقدم في الكفاءة والأداء. بينما يشترك YOLO11 في الفلسفة الأساسية المتمثلة في السرعة والدقة، يقدم YOLO11 تحسينات معمارية مصممة لتحسين سرعة الاستدلال دون المساس بالدقة بشكل كبير. تسلط وثائقYOLO11 الضوء على طبيعتها المتطورة وملاءمتها للتطبيقات في الوقت الحقيقي.
البنية والمميزات الرئيسية:
يتبنى YOLO11 أيضًا نهجًا أحادي المرحلة وخاليًا من الارتكاز، مع التركيز على التصميم المبسط والحساب الفعال. تشمل الجوانب المعمارية الرئيسية ما يلي:
- عمود فقري فعال: يستخدم بنية عمود فقري محسّنة تقلل من النفقات الحسابية مع الحفاظ على قدرات استخراج الميزات.
- تصميم الرقبة: يتميز ببنية عنق محسنة تعزز تجميع الميزات بمعلمات أقل، مما يساهم في سرعة الاستدلال.
- الرأس المحسّن: صُمم رأس الاكتشاف لتحقيق الحد الأدنى من زمن الاستجابة، مع إعطاء الأولوية للسرعة في طبقات التنبؤ النهائية.
مقاييس الأداء:
يُظهر YOLO11 أداءً تنافسيًا مع التركيز على تحسينات السرعة. بالنسبة لاكتشاف الكائنات على مجموعة بيانات COCO، يحقق YOLO11x سرعة mAPval50-95 أعلى قليلاً من YOLOv8x تبلغ 54.7 مقارنةً ب YOLOv8x مع الحفاظ على سرعات استدلال أسرع على CPU وتحقيق سرعات مماثلة على GPU. يُحقق نموذج YOLO11n 39.5 mAPval50-95، مما يُظهر تحسينات على YOLOv8n. كما أن سرعات الاستدلال أسرع بشكل ملحوظ على CPU المركزية، حيث تبلغ سرعة YOLO11n 56.1 مللي ثانية و YOLO11x 462.8 مللي ثانية، مما يجعله مناسبًا للتطبيقات CPU. ارجع إلى مقاييس أداءYOLO11 للاطلاع على مقاييس الأداء التفصيلية.
حالات الاستخدام:
يعد YOLO11 مناسبًا بشكل خاص للتطبيقات التي تكون فيها سرعة الاستدلال أمرًا بالغ الأهمية، مثل تحليل الفيديو في الوقت الحقيقي والروبوتات والأجهزة المتطورة ذات الموارد الحاسوبية المحدودة. كما أن كفاءته تجعله مثاليًا للنشر في السيناريوهات التي تتطلب الكشف السريع عن الأشياء دون التضحية بالدقة. تشمل التطبيقات إدارة النفايات والحفاظ على البيئة وحلول السيارات.
نقاط القوة:
- سرعة استدلال فائقة: مصمم للاستدلال الأسرع، خاصةً على CPU.
- دقة تنافسية: تحافظ على دقة عالية، وغالبًا ما تتجاوز YOLOv8 في أحجام النماذج الأصغر.
- بنية فعالة: مُحسّنة للبيئات محدودة الموارد والنشر على الحافة.
- أحدث طراز Ultralytics : الاستفادة من أحدث التطورات والدعم المقدم من Ultralytics.
نقاط الضعف:
- مكاسب هامشية في الدقة في النماذج الأكبر حجمًا: لا تُظهر نماذج YOLO11 الأكبر حجمًا سوى تحسينات طفيفة في الدقة مقارنةً بنماذج YOLOv8 بينما لا تزال تتطلب الكثير من العمليات الحسابية.
- الطراز الأحدث: نظرًا لكونه أحدث، فقد يكون لديه مجتمع أصغر وعدد أقل من عمليات التكامل مع الجهات الخارجية مقارنةً بـ YOLOv8.
جدول مقارنة النماذج
الطراز | الحجم (بكسل) |
مافال 50-95 |
السرعة CPU ONNX (مللي ثانية) |
السرعة T4 T4TensorRT10 (مللي ثانية) |
بارامز (م) |
(ب) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
يولو 11 ن | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
يولو 11 م | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
يولو 11ل | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
يولو11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
الخاتمة
يعتمد الاختيار بين YOLOv8 و YOLO11 على متطلبات التطبيق المحددة. يوفر YOLOv8 حلاً قويًا ومتعدد الاستخدامات ومناسبًا لمجموعة واسعة من المهام، ويوازن بين الدقة والسرعة بفعالية. إنه نموذج ناضج ومدعوم جيدًا ومثالي لاحتياجات اكتشاف الأجسام للأغراض العامة. من ناحية أخرى، تم تصميم YOLO11 من أجل تحسين السرعة، مما يجعله خيارًا متفوقًا عندما يكون وقت الاستدلال أمرًا بالغ الأهمية، خاصةً في سيناريوهات الحوسبة CPU أو الحوسبة المتطورة. بالنسبة للتطبيقات التي تتطلب أسرع أداء ممكن في الوقت الحقيقي مع دقة تنافسية، فإن YOLO11 هو الخيار المفضل.
كما يمكن للمستخدمين المهتمين باستكشاف نماذج أخرى أن يفكروا في:
- YOLOv5: لنموذج راسخ ومستخدم على نطاق واسع مع مجتمع كبير. مقارنة بينYOLOv5 و YOLOv8 .
- YOLOv9: للنماذج التي تركز على تحسينات الدقة والابتكارات المعمارية. وثائق YOLOv9.
- FastSAM: لمهام التجزئة السريعة للغاية. وثائقFastSAM .