YOLOv10 مقابل YOLO11: مقارنة فنية للكشف عن الكائنات
يعد اختيار نموذج الكشف عن الكائنات الأمثل قرارًا بالغ الأهمية يوازن بين الدقة والسرعة وقيود النشر. توفر هذه الصفحة مقارنة فنية شاملة بين YOLOv10، وهو نموذج يركز على الكفاءة الشاملة، و Ultralytics YOLO11، أحدث نموذج متطور من Ultralytics، المشهور بتنوعه وأدائه وسهولة استخدامه. سوف نتعمق في الاختلافات المعمارية ومعايير الأداء والتطبيقات المثالية لمساعدتك في اتخاذ خيار مستنير.
YOLOv10: دفع حدود الكفاءة
المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
المنظمة: جامعة Tsinghua
التاريخ: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
المستندات: https://docs.ultralytics.com/models/yolov10/
YOLOv10، الذي تم تقديمه في مايو 2024، هو نموذج لاكتشاف الكائنات يعطي الأولوية للأداء الشامل في الوقت الفعلي. يتمثل ابتكاره الأساسي في إلغاء التثبيط غير الأقصى (NMS) أثناء المعالجة اللاحقة، والذي يضاف تقليديًا إلى زمن انتقال الاستدلال. يتم تحقيق ذلك من خلال إستراتيجية تدريب جديدة تسمى التعيينات المزدوجة المتسقة.
البنية والميزات الرئيسية
يستند تصميم YOLOv10 إلى نهج شامل لتحقيق أقصى قدر من الكفاءة والدقة. يقدم العديد من التحسينات المعمارية لتقليل التكرار الحسابي وتحسين قدرة النموذج. تتضمن الميزات الرئيسية رأس تصنيف خفيف الوزن واستراتيجية أخذ عينات متباعدة مكانية وقناة مفصولة للحفاظ على المعلومات بشكل أكثر فعالية. من خلال إزالة خطوة NMS، يهدف YOLOv10 إلى تبسيط خط أنابيب النشر وتقليل زمن الوصول، مما يجعله كاشفًا شاملاً حقيقيًا.
نقاط القوة
- كفاءة محسنة: يظهر أداءً مذهلاً في المفاضلات بين زمن الوصول والدقة وحجم النموذج والدقة، خاصةً في البيئات ذات الموارد المحدودة.
- تصميم خالٍ من NMS: يؤدي إلغاء خطوة المعالجة اللاحقة NMS إلى تبسيط النشر وتقليل وقت الاستدلال الشامل.
- بحث متطور: يمثل مساهمة أكاديمية كبيرة في الكشف عن الأجسام في الوقت الفعلي من خلال معالجة الاختناقات في مرحلة ما بعد المعالجة.
نقاط الضعف
- نموذج أحدث: باعتباره إصدارًا حديثًا من فريق بحث جامعي، لديه مجتمع أصغر وعدد أقل من عمليات تكامل الطرف الثالث مقارنة بنظام Ultralytics البيئي الراسخ.
- تخصص المهمة: يركز YOLOv10 بشكل أساسي على اكتشاف الأجسام. يفتقر إلى المرونة المدمجة لمهام الرؤية الأخرى مثل التجزئة والتصنيف وتقدير الوضع الأصلية في YOLO11.
- تكامل النظام البيئي: على الرغم من أنه مبني على إطار Ultralytics، إلا أنه قد يتطلب جهدًا إضافيًا للاندماج في سير عمل MLOps الشامل مقارنة بالنماذج التي تم تطويرها وصيانتها مباشرةً بواسطة Ultralytics.
حالات الاستخدام المثالية
YOLOv10 مناسب بشكل خاص للتطبيقات التي تكون فيها زمن الوصول المنخفض والكفاءة الحسابية على رأس الأولويات:
- Edge AI: مثالي للنشر على الأجهزة ذات القدرة الحاسوبية المحدودة، مثل الهواتف المحمولة والأنظمة المدمجة على NVIDIA Jetson أو Raspberry Pi.
- معالجة عالية السرعة: مناسبة للتطبيقات التي تتطلب استدلالًا سريعًا جدًا، مثل الطائرات بدون طيار ذاتية القيادة و الروبوتات.
- تحليلات في الوقت الفعلي: مثالي للبيئات سريعة الخطى التي تحتاج إلى الكشف الفوري عن العناصر، مثل إدارة حركة المرور.
Ultralytics YOLO11: قمة التطور في التنوع والأداء
المؤلفون: جلين جوتشر، جينغ تشيو
المنظمة: Ultralytics
التاريخ: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
المستندات: https://docs.ultralytics.com/models/yolo11/
Ultralytics YOLO11 هو أحدث تطور في سلسلة YOLO من Ultralytics، بناءً على نجاح النماذج الشائعة للغاية مثل YOLOv8. تم تصميمه لتقديم دقة متطورة وتوازن أداء فائق، مع كونه سهل الاستخدام والدمج بشكل لا يصدق. YOLO11 ليس مجرد كاشف للكائنات؛ بل هو إطار عمل شامل للرؤية الاصطناعية.
البنية والميزات الرئيسية
يتميز YOLO11 ببنية مُحسَّنة للغاية مع استخلاص ميزات متقدم وتصميم شبكة مبسط. ينتج عن هذا دقة أعلى، غالبًا مع عدد معلمات أقل مقارنة بأسلافه. إحدى الميزات الرئيسية في YOLO11 هي تنوعه. يدعم أصلاً مجموعة واسعة من المهام، بما في ذلك اكتشاف الكائنات، و تقسيم المثيلات، و تصنيف الصور، و تقدير الوضعية، والمربعات المحيطة الموجهة (OBB).
هذه المرونة مدعومة بنظام بيئي تتم صيانته جيدًا. توفر Ultralytics تجربة مستخدم مبسطة مع Python API بسيط و CLI، و وثائق شاملة، وتكامل سلس مع أدوات مثل Ultralytics HUB للتدريب والنشر بدون تعليمات برمجية. يستفيد النموذج من عمليات تدريب فعالة، وأوزان مُدرَّبة مسبقًا متاحة بسهولة، وتطوير نشط، ودعم مجتمعي قوي. علاوة على ذلك، تم تصميم نماذج YOLO11 لتحقيق الكفاءة، وتتطلب ذاكرة أقل أثناء التدريب والاستدلال مقارنة بالعديد من البنى الأخرى، وخاصة النماذج المستندة إلى المحولات.
نقاط القوة
- أداء هو الأفضل على الإطلاق: يحقق أعلى مستويات درجات mAP مع توازن ممتاز بين السرعة والدقة.
- متعدد الاستخدامات ومتعدد المهام: يمكن لإطار عمل نموذج واحد التعامل مع الاكتشاف والتجزئة والتصنيف والوضع و OBB، مما يوفر مرونة لا مثيل لها للمشاريع المعقدة.
- سهولة الاستخدام: واجهة برمجة تطبيقات بسيطة وسهلة الاستخدام ووثائق شاملة تجعلها في متناول كل من المبتدئين والخبراء.
- نظام بيئي قوي: يستفيد من التطوير النشط والتحديثات المتكررة ودعم المجتمع القوي والتكامل السلس مع أدوات MLOps مثل Ultralytics HUB.
- كفاءة التدريب والنشر: يوفر مهام سير عمل تدريب فعالة ومتطلبات ذاكرة أقل، وهو مُحسَّن لمجموعة واسعة من الأجهزة، من الأجهزة الطرفية إلى الخوادم السحابية.
نقاط الضعف
- باعتباره كاشفًا أحادي المرحلة، قد يواجه تحديات مع الأجسام الصغيرة للغاية مقارنةً ببعض الكواشف ثنائية المرحلة المتخصصة.
- تتطلب النماذج الأكبر، على الرغم من دقتها العالية، موارد حسابية كبيرة للتدريب والنشر.
حالات الاستخدام المثالية
إن مزيج YOLO11 من الأداء العالي والتنوع وسهولة الاستخدام يجعله الخيار الأمثل لمجموعة واسعة من التطبيقات الواقعية:
- الأتمتة الصناعية: لـ مراقبة الجودة عالية الدقة ومراقبة العمليات في التصنيع.
- الرعاية الصحية: في تحليل الصور الطبية لمهام مثل الكشف عن الأورام أو تقسيم الخلايا.
- الأمن والمراقبة: تشغيل أنظمة الأمان المتقدمة مع الكشف عن التهديدات وتتبعها في الوقت الفعلي.
- تحليلات البيع بالتجزئة: تحسين إدارة المخزون وتحليل سلوك العملاء.
- مشاريع المهام المتعددة: مثالية للتطبيقات التي تتطلب الكشف عن الكائنات والتجزئة وتقدير الوضع في وقت واحد، مثل أنظمة مساعدة السائق المتقدمة.
مقارنة أداء مباشرة: YOLOv10 ضد YOLO11
عند مقارنة النماذج مباشرة، نلاحظ مفاضلات متميزة. تم تصميم نماذج YOLOv10، وخاصة المتغيرات الأصغر، لتحقيق كفاءة قصوى، وغالبًا ما يكون لديها عدد أقل من المعلمات و FLOPs. هذا يجعلها منافسًا قويًا للمهام الهامة من حيث زمن الوصول.
ومع ذلك، يُظهر YOLO11 ملف تعريف أداء أكثر قوة وتوازنًا. فهو يحقق معدل mAP أعلى قليلاً عبر معظم أحجام النماذج ويُظهر سرعات استدلال أسرع بشكل ملحوظ على كل من وحدة المعالجة المركزية CPU ووحدة معالجة الرسومات GPU (T4 TensorRT). إن هذا التوازن الفائق بين السرعة والدقة، جنبًا إلى جنب مع قدراته متعددة المهام ونظامه البيئي الناضج، يجعل YOLO11 خيارًا أكثر عملية وقوة لمعظم سيناريوهات التطوير والنشر.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
الخلاصة: أي نموذج يجب أن تختاره؟
يعتبر كل من YOLOv10 و YOLO11 من النماذج القوية التي تدفع حدود الكشف عن الأجسام.
YOLOv10 هو خيار ممتاز للباحثين والمطورين الذين يركزون على التطبيقات المتخصصة والحساسة لوقت الاستجابة حيث توفر البنية الخالية من NMS ميزة واضحة. تصميمها البسيط يجعلها مثالية للنشر على أجهزة الحافة المقيدة للغاية.
ومع ذلك، بالنسبة للغالبية العظمى من المطورين والباحثين والتطبيقات التجارية، يعد Ultralytics YOLO11 الخيار الموصى به. توفر ميزته الطفيفة في الدقة وسرعة الاستدلال الفائقة توازنًا أفضل في الأداء العام. والأهم من ذلك، أن تعدد استخدامات YOLO11 الذي لا مثيل له عبر مهام رؤية متعددة، جنبًا إلى جنب مع سهولة استخدامه ونظام Ultralytics البيئي القوي والذي تتم صيانته جيدًا، يسرع بشكل كبير من التطوير ويبسط النشر. إن المجتمع النشط والوثائق الشاملة والتكامل السلس مع أدوات مثل Ultralytics HUB تجعل YOLO11 ليس مجرد نموذج، بل حلاً كاملاً لبناء تطبيقات الذكاء الاصطناعي المتقدمة للرؤية.
إذا كنت تستكشف نماذج أخرى، ففكر في إلقاء نظرة على المقارنات بين YOLOv9 مقابل YOLO11 أو YOLOv8 مقابل YOLO11 لفهم التطور والعثور على النموذج المثالي لمشروعك.