YOLO11 YOLOv10: جسر بين التطور والثورة في الكشف عن الأجسام في الوقت الفعلي
يتميز مجال الرؤية الحاسوبية بالتكرار السريع والقفزات الرائدة. YOLO11 و YOLOv10 يمثلان فلسفتين متميزتين في هذا التطور. في حين أن YOLO11 Ultralytics الراسخة والقوية لتحقيق أقصى قدر من التنوع والاستعداد للإنتاج، فإن YOLOv10 مفاهيم ثورية مثل التدريب NMS الذي أثر منذ ذلك الحين على النماذج الأحدث مثل YOLO26.
تستكشف هذه المقارنة الشاملة القرارات المعمارية ومقاييس الأداء وحالات الاستخدام المثالية لكلا النموذجين لمساعدة المطورين على اختيار الأداة المناسبة لمشروع الرؤية الحاسوبية التالي.
نظرة عامة على مقاييس الأداء
يقدم كلا النموذجين قدرات مذهلة، لكنهما يعطيان الأولوية لجوانب مختلفة من مسار الاستدلال. يوضح الجدول أدناه إحصائيات الأداء الرئيسية على مجموعات البيانات القياسية.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
نظرة معمارية متعمقة
YOLO11: القوة المتعددة الاستخدامات
YOLO11، الذي أطلقته Ultralytics سبتمبر 2024، مبني على إرث من الاختبارات المكثفة في العالم الحقيقي. وهو يستخدم بنية محسنة للعمود الفقري والرقبة مصممة لتوفير ثراء في الميزات، مما يتيح له التفوق ليس فقط في اكتشاف الكائنات، ولكن أيضًا في المهام المعقدة النهائية مثل تقسيم الحالات وتقدير الوضع.
تشمل الميزات المعمارية الرئيسية ما يلي:
- كتلة C3k2: نسخة محسنة من كتلة عنق الزجاجة CSP التي تعمل على تحسين تدفق التدرج وكفاءة المعلمات.
- تحسين الانتباه المكاني: يعزز قدرة النموذج على التركيز على الأجسام الصغيرة أو المغطاة جزئيًا، وهو مطلب أساسي لتحليل الصور الجوية.
- تصميم بدون مرساة: يقلل من تعقيد ضبط المعلمات الفائقة ويحسن التعميم عبر مجموعات البيانات المتنوعة.
YOLOv10: الرائد الشامل
YOLOv10، الذي طوره باحثون في جامعة تسينغهوا، تصدر عناوين الأخبار بتركيزه على إزالة خطوة المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). يعالج هذا التغيير في البنية مشكلة طويلة الأمد في خطوط الإنتاج حيث يمكن أن يتغير NMS بشكل غير متوقع بناءً على عدد الكائنات المكتشفة.
تشمل الابتكارات الرئيسية ما يلي:
- تدريبNMS: يتيح استخدام المهام المزدوجة المتسقة أثناء التدريب للنموذج التنبؤ بدقة بعلبة واحدة لكل كائن، مما يلغي الحاجة إلى NMS .
- تصميم شامل للكفاءة والدقة: تشتمل البنية على رؤوس تصنيف خفيفة الوزن وتقليل الدقة المكانية المنفصلة عن القناة لتقليل الحمل الحسابي.
- تصميم الكتل الموجه بالرتبة: يعمل على تحسين مراحل النموذج لتقليل التكرار، مما يقلل من FLOPs دون التضحية بالدقة.
النظام البيئي وسهولة الاستخدام
على الرغم من أهمية المقاييس الأولية، غالبًا ما تحدد تجربة المطور نجاح المشروع.
ميزة Ultralytics
YOLO11 مواطن أصلي في Ultralytics ، ويوفر مزايا كبيرة لعمليات سير العمل في المؤسسات والأبحاث:
- واجهة برمجة تطبيقات موحدة: تدعم نفس Python الكشف والتجزئة والتصنيف و OBB وتقدير الوضع. التبديل بين المهام سهل مثل تغيير ملف النموذج.
- تكامل المنصة: اتصل بسلاسة Ultralytics لإدارة مجموعات البيانات وتصور عمليات التدريب ونشرها على الأجهزة الطرفية.
- مرونة التصدير: دعم مدمج للتصدير إلى ONNXو TensorRTو CoreML و OpenVINO تشغيل نموذجك بكفاءة على أي جهاز.
سير عمل مبسط
استخدام Ultralytics يعني أنك تقضي وقتًا أقل في كتابة التعليمات البرمجية النمطية وتخصص وقتًا أطول لحل المشكلات الخاصة بالمجال. كل ما يتطلبه الأمر هو بضع أسطر من التعليمات البرمجية لتدريب نموذج متطور.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset with minimal configuration
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
YOLOv10
YOLOv10 دعم YOLOv10 أيضًا ضمن Ultralytics مما يتيح للمستخدمين الاستفادة من نفس الصيغة الملائمة. ومع ذلك، كإسهام أكاديمي، قد لا يتلقى نفس تكرار التحديثات الخاصة بالمهام (مثل OBB أو تحسينات التتبع) مقارنة Ultralytics الأساسية. وهو خيار ممتاز لمهام الكشف البحتة حيث توفر البنية NMS ميزة زمن انتقال محددة.
تطبيقات عملية في أرض الواقع
غالبًا ما يعتمد الاختيار بين هذه النماذج على القيود المحددة لبيئة النشر لديك.
السيناريوهات المثالية لـ YOLO11
تعد YOLO11 الخيار المفضل للتطبيقات المعقدة والمتعددة الأوجه بفضل تعدد استخداماتها:
- التجزئة الذكية: track (Pose) ومراقبة مخزون الرفوف (Detection) في وقت واحد لتحسين تخطيط المتجر والمخزون.
- الروبوتات المستقلة: استخدم الصناديق المحددة الموجهة (OBB) لمساعدة الروبوتات على إمساك الأشياء التي ليست محاذاة أفقياً بشكل مثالي.
- الزراعة: استخدام نماذج التجزئة لتحديد أمراض المحاصيل على الأوراق بدقة، حيث لا تكفي المربعات المحددة البسيطة.
السيناريوهات المثالية لـ YOLOv10
YOLOv10 في البيئات التي يمثل فيها زمن انتقال المعالجة اللاحقة عقبة حاسمة:
- عدّ الحشود عالية الكثافة: في السيناريوهات التي تحتوي على مئات الكائنات، NMS يصبح NMS بطيئًا. يحافظ تصميم YOLOv10 الشامل على سرعة ثابتة بغض النظر عن عدد الكائنات.
- الأنظمة المدمجة: بالنسبة للأجهزة ذات CPU المحدودة للمعالجة اللاحقة، فإن إزالة NMS موارد قيّمة.
الخلاصة: أي نموذج يجب أن تختاره؟
YOLO11 لا يزال هو الأكثر قوة وتعدداً في الاستخدامات بالنسبة لغالبية المطورين. إن توازنه بين السرعة والدقة ودعمه لمهام الرؤية المتعددة — مدعومًا Ultralytics الشاملة — يجعله خيارًا آمنًا وقويًا للنشر التجاري.
YOLOv10 يقدم بديلاً مقنعاً لعمليات الكشف المحددة فقط، خاصةً عندما NMS التخلص من NMS فائدة ملموسة في استقرار زمن الاستجابة.
ومع ذلك، بالنسبة لأولئك الذين يبحثون عن أحدث التقنيات، نوصي باستكشاف YOLO26. تم إصدار YOLO26 في يناير 2026، وهو يدمج بشكل فعال أفضل ما في العالمين: فهو يعتمد التصميم الشامل NMS الذي ابتكرته YOLOv10 الاحتفاظ بثراء الميزات وتنوع المهام ودعم النظام البيئي لـ YOLO11. بفضل التحسينات مثل تدريب MuSGD وإزالة DFL، يوفر YOLO26 أداءً فائقًا لكل من عمليات النشر على الحافة والسحابة.
نماذج أخرى للاستكشاف
- YOLO26: أحدث نموذج متطور من Ultralytics يناير 2026)، يتميز بهيكل NMS CPU .
- YOLOv8: معيار صناعي معتمد على نطاق واسع ومعروف بموثوقيته وتوافقه الواسع.
- RT-DETR: كاشف قائم على المحولات يوفر دقة عالية، وهو مثالي للسيناريوهات التي تتوفر فيها GPU بكثرة.
- SAM : نموذج Meta's Segment Anything Model، مثالي لمهام التجزئة بدون تدريب حيث تكون بيانات التدريب نادرة.