YOLO11 مقابل YOLOv10: مقارنة فنية شاملة لكاشفات الكائنات في الوقت الفعلي
يتطور مشهد الرؤية الحاسوبية في الوقت الفعلي باستمرار، حيث تدفع البنى الجديدة حدود ما هو ممكن على كل من أجهزة الحافة والبنية التحتية السحابية. في هذا التحليل الفني المفصل، نستكشف الفروق الدقيقة بين نموذجين محوريين في هذا المجال: Ultralytics YOLO11 وYOLOv10. يمثل كلاهما قفزات كبيرة في قدرات اكتشاف الكائنات، ومع ذلك فإنهما يتبنيان فلسفات معمارية مختلفة جذرياً لتحقيق أدائهما.
كشف النقاب عن بنية YOLO11
تفاصيل YOLO11:
- المؤلفون: Glenn Jocher و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 27-09-2024
- GitHub: https://github.com/ultralytics/ultralytics
- المستندات: https://docs.ultralytics.com/models/yolo11/
تم تقديم YOLO11 كقوة متعددة الاستخدامات، وهو يعتمد على سنوات من الأبحاث الأساسية في الرؤية الحاسوبية والذكاء الاصطناعي. تتمحور فلسفة التصميم الأساسية لـ YOLO11 حول ثراء الميزات وتعدد الاستخدامات الشديد عبر مهام الرؤية الحاسوبية المتعددة.
أحد التحسينات البارزة في YOLO11 هو تنفيذ C3k2 Block. تعمل وحدة الاختناق المحسنة هذه على تحسين تدفق التدرج في جميع أنحاء الشبكة، مما يؤدي إلى تحسين كفاءة المعلمات بشكل كبير مع الحفاظ على دقة عالية. بالإضافة إلى ذلك، يستخدم YOLO11 آلية انتباه مكاني محسنة، وهي ضرورية لتحديد العناصر الصغيرة أو المحجوبة جزئياً. وهذا يجعله خياراً استثنائياً لـ حالات استخدام الصور الجوية وتحليل الصور الطبية المفصل.
يستخدم YOLO11 تصميماً خالياً من المراسي (anchor-free) يقلل من تعقيد ضبط المعلمات الفائقة، مما يسمح بتعميم قوي عبر مجموعة واسعة من مجموعات البيانات المخصصة. علاوة على ذلك، فإن متطلبات الذاكرة أثناء التدريب أقل بكثير مقارنة بالبنى القائمة على Transformer، مما يسمح للباحثين بتدريب نماذج كبيرة بكفاءة على أجهزة المستهلك القياسية.
استكشاف بنية YOLOv10
تفاصيل YOLOv10:
- المؤلفون: Ao Wang، Hui Chen، Lihao Liu، وآخرون.
- المؤسسة: جامعة تسينغوا
- التاريخ: 23-05-2024
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- المستندات: https://docs.ultralytics.com/models/yolov10/
تم تطوير YOLOv10 بواسطة باحثين في جامعة تسينغوا، وقد أحدث ضجة كرائد شامل (end-to-end) في عائلة YOLO. السمة المميزة لـ YOLOv10 هي منهجية التدريب الخالي من NMS. من خلال استخدام تعيينات مزدوجة متسقة خلال مرحلة التدريب، يتنبأ النموذج بشكل طبيعي بصندوق إحاطة واحد بالضبط لكل كائن. هذا الاختراق يلغي تماماً الحاجة إلى كبت غير الأعظم (NMS) أثناء الاستدلال، وهي خطوة معالجة لاحقة كانت تاريخياً تسبب اختناقات في زمن الوصول في خطوط أنابيب النشر.
تقدم البنية أيضاً استراتيجية تصميم شمولية للكفاءة والدقة. فهي تتضمن أخذ عينات فرعية مفصولة مكانياً وقناة، وتصميمات كتل موجهة بالرتبة تقلل بشكل انتقائي من التكرار في مراحل الشبكة. وينتج عن ذلك عدد أقل من FLOPs وتقليل الحمل الحسابي دون التضحية بشكل كبير بـ متوسط دقة متوسط (mAP). بالنسبة للتطبيقات في الوقت الفعلي حيث يكون كل ميلي ثانية مهماً، توفر إزالة NMS رسماً بيانياً للاستدلال حتمياً مناسباً جداً لـ أجهزة الذكاء الاصطناعي على الحافة.
مقاييس الأداء والمعايير
عند تقييم هذين النموذجين، ننظر إلى توازن الدقة وعدد المعلمات والسرعة. يوضح الجدول التالي كيفية مقارنتها عبر نطاقات مختلفة على مجموعة بيانات COCO.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
كما لوحظ في مقاييس أداء YOLO، يحقق YOLO11 عموماً درجات mAP أعلى قليلاً عبر متغيراته، خاصة في النماذج الأكبر. يضمن التصميم الخالي من NMS لـ YOLOv10 أوقات استدلال شاملة ومستقرة للغاية، لكن YOLO11 لا يزال يحقق إنتاجية استثنائية عند تحسينه باستخدام TensorRT على أجهزة NVIDIA.
عند إعداد نماذجك للنشر، يعد التصدير إلى تنسيقات محسنة أمراً بالغ الأهمية. يمكن تصدير كل من YOLO11 وYOLOv10 بسلاسة إلى تنسيقات مثل ONNX وTensorRT باستخدام إطار عمل Ultralytics. راجع دليلنا حول خيارات نشر النماذج للحصول على تعليمات خطوة بخطوة.
ميزة نظام Ultralytics البيئي
في حين أن مقاييس الأداء المستقلة مهمة، فإن الإطار المحيط يحدد النجاح العملي لمشروع تعلم الآلة. وهنا يتألق YOLO11 حقاً، كمواطن أصلي في نظام Ultralytics البيئي.
توفر منصة Ultralytics تجربة مستخدم مبسطة بشكل لا يصدق. باستخدام Python API بسيط وموحد، يمكن للمطورين التعامل مع مهام تتجاوز صناديق الإحاطة الأساسية. يدعم YOLO11 بشكل أصلي تجزئة المثيلات، تقدير الوضع، تصنيف الصور، وصندوق الإحاطة الموجه (OBB) خارج الصندوق. غالباً ما يفتقر هذا التنوع الهائل إلى مستودعات الأبحاث المتخصصة.
علاوة على ذلك، يتم دعم النظام البيئي من خلال توثيق شامل ودعم مجتمعي نشط. تم دمج عمليات التكامل مع أدوات مثل Weights & Biases لتتبع التجارب، وOpenVINO لتحسين أجهزة Intel، مباشرة في المكتبة. يتطلب تدريب النموذج حداً أدنى من الكود القياسي ويستفيد من عمليات تدريب عالية الكفاءة تتطلب ذاكرة CUDA أقل من نماذج Transformer الثقيلة مثل RT-DETR.
مثال برمجي عملي
تم تصميم التدريب وتشغيل الاستدلال باستخدام Ultralytics ليكون بديهياً قدر الإمكان. تتعامل نفس الـ API مع كل من YOLO11 وYOLOv10 دون عناء.
from ultralytics import YOLO
# Initialize the model (YOLO11n or YOLOv10n)
model = YOLO("yolo11n.pt")
# Train the model efficiently on a custom dataset
# Ultralytics automatically handles hyperparameters and memory optimization
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Run inference on an image
inference_results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected objects
inference_results[0].show()حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLO11 وYOLOv10 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار YOLO11
يعد YOLO11 خياراً قوياً لـ:
- نشر الحافة في الإنتاج: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA Jetson حيث الموثوقية والصيانة النشطة أمران بالغ الأهمية.
- تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب اكتشاف، تجزئة، تقدير وضع، وOBB ضمن إطار عمل واحد موحد.
- النماذج الأولية السريعة والنشر: الفرق التي تحتاج إلى التحرك بسرعة من جمع البيانات إلى الإنتاج باستخدام Python API المبسط من Ultralytics.
متى تختار YOLOv10
يُنصح بـ YOLOv10 لـ:
- اكتشاف الوقت الفعلي الخالي من NMS: التطبيقات التي تستفيد من الاكتشاف الشامل دون Non-Maximum Suppression، مما يقلل من تعقيد النشر.
- موازنة مقايضات السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الاكتشاف عبر مختلف مقاييس النماذج.
- Consistent-Latency Applications: Deployment scenarios where predictable inference times are critical, such as robotics or autonomous systems.
متى تختار Ultralytics (YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطورين:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
الجيل القادم: YOLO26
في حين قدم YOLOv10 نموذجاً ثورياً خالياً من NMS وأتقن YOLO11 تعدد المهام، فإن مجال الذكاء الاصطناعي يتحرك بسرعة. للمطورين الذين يبدأون عمليات نشر إنتاجية جديدة اليوم، نوصي بشدة باستكشاف Ultralytics YOLO26.
تم إصداره في يناير 2026، يدمج YOLO26 أفضل ما في العالمين. فهو يتبنى أصلاً تصميم NMS-Free الشامل الذي ابتكره YOLOv10، مما يبسط خط أنابيب النشر بشكل جذري ويضمن زمن وصول متسق. علاوة على ذلك، يدمج YOLO26 تحسينات حوسبة الحافة المتخصصة. من خلال تنفيذ إزالة DFL (إزالة توزيع فقدان التركيز)، تضمن البنية سهولة أكبر في التصدير وتحقق استدلالاً أسرع لوحدة المعالجة المركزية بنسبة تصل إلى 43% مقارنة بالنماذج القديمة، مما يجعله الخيار الأول لأجهزة IoT منخفضة الطاقة وتطبيقات الهاتف المحمول.
يجلب YOLO26 أيضاً استقرار تدريب نموذج اللغة الكبير (LLM) إلى الرؤية الحاسوبية عبر MuSGD Optimizer المبتكر، وهو هجين مستوحى من أبحاث الذكاء الاصطناعي المتطورة. إلى جانب وظائف الخسارة ProgLoss + STAL، يقدم YOLO26 دقة لا تضاهى على الكائنات الصغيرة، وهو أمر ضروري لـ اكتشاف فيديو المرور المفصل والأتمتة الروبوتية المعقدة.
خاتمة
يعتمد اختيار نموذج الرؤية المناسب على قيودك التشغيلية المحددة. يمثل YOLOv10 علامة فارقة مهمة في الأوساط الأكاديمية، مما يثبت أنه يمكن إزالة NMS بشكل فعال من خط أنابيب الاكتشاف. ومع ذلك، للحصول على توازن متفوق بين الأداء وتعدد مهام شامل وأدوات نشر سلسة، يقدم YOLO11 حلاً قوياً وجاهزاً للمؤسسات.
للمهندسين الذين يريدون أحدث التقنيات - التي تجمع بين البساطة الشاملة والأداء السريع على الحافة - فإن الهجرة إلى أحدث YOLO26 هي التوصية النهائية. من خلال الاستفادة من منصة Ultralytics الشاملة، فإنك تضمن بناء مشاريعك على أساس جيد الصيانة وعالي الكفاءة ومستقبلي.