YOLO11 YOLOv10: مقارنة تقنية شاملة بين أجهزة الكشف عن الأجسام في الوقت الفعلي
يتطور مجال الرؤية الحاسوبية في الوقت الفعلي باستمرار، حيث توسع البنى الجديدة حدود الإمكانيات المتاحة على كل من الأجهزة الطرفية والبنية التحتية السحابية. في هذا التحليل التقني المفصل، نستكشف الفروق الدقيقة بين نموذجين محوريين في هذا المجال: Ultralytics YOLO11 و YOLOv10. كلاهما يمثل قفزة كبيرة في قدرات اكتشاف الأجسام ، لكنهما يعتمدان فلسفتين معماريتين مختلفتين تمامًا لتحقيق أدائهما.
تفكيك YOLO11
YOLO11 :
- المؤلفون: جلين جوشر وجينغ تشيو
- المنظمة: Ultralytics
- التاريخ: 2024-09-27
- GitHub: ultralytics
- المستندات: yolo11
تم تقديم YOLO11 باعتباره محركًا متعدد الاستخدامات، YOLO11 على سنوات من الأبحاث الأساسية في مجال الرؤية الحاسوبية والذكاء الاصطناعي. YOLO11 فلسفة التصميم الأساسية لـ YOLO11 حول ثراء الميزات والتنوع الشديد في العديد من مهام الرؤية الحاسوبية.
أحد التحسينات البارزة في YOLO11 تطبيق C3k2 Block. تعمل هذه الوحدة المطورة على تحسين تدفق التدرج في جميع أنحاء الشبكة، مما يؤدي إلى تحسين كفاءة المعلمات بشكل كبير مع الحفاظ على دقة عالية. بالإضافة إلى ذلك، YOLO11 آلية انتباه مكاني محسنة، وهي أمر بالغ الأهمية لتحديد العناصر الصغيرة أو المغطاة جزئيًا. وهذا يجعله خيارًا استثنائيًا لحالات استخدام الصور الجوية وتحليل الصور الطبية التفصيلية.
YOLO11 تصميمًا خاليًا من المراسي يقلل من تعقيد ضبط المعلمات الفائقة، مما يسمح بتعميم قوي عبر مجموعة واسعة من مجموعات البيانات المخصصة. علاوة على ذلك، فإن متطلبات الذاكرة أثناء التدريب أقل بكثير مقارنة بالبنى القائمة على المحولات، مما يسمح للباحثين بتدريب النماذج الكبيرة بكفاءة على الأجهزة الاستهلاكية القياسية.
استكشاف YOLOv10
YOLOv10 :
- المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
- المنظمة: جامعة تسينغهوا
- التاريخ: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- المستندات: ultralytics
طور باحثون في جامعة تسينغهوا YOLOv10 ضجة كبيرة باعتباره رائدًا شاملاً في YOLO . YOLOv10 بمنهجية التدريبNMS. من خلال استخدام مهام مزدوجة متسقة خلال مرحلة التدريب، يتنبأ النموذج بشكل طبيعي بمربع حدود واحد لكل كائن. هذا الاختراق يلغي تمامًا الحاجة إلى Non-Maximum Suppression (NMS) أثناء الاستدلال، وهي خطوة ما بعد المعالجة التي أدت تاريخيًا إلى ظهور اختناقات في زمن الاستجابة في خطوط أنابيب النشر.
تقدم هذه البنية أيضًا استراتيجية تصميم شاملة تجمع بين الكفاءة والدقة. فهي تدمج تصميمات التخفيض التدريجي للفصل بين القنوات المكانية والتصميمات الموجهة بالترتيب التي تقلل بشكل انتقائي من التكرار في مراحل الشبكة. وينتج عن ذلك عدد أقل من عمليات FLOPs وتقليل العبء الحسابي دون التضحية بشكل كبير بمتوسط الدقة (mAP). بالنسبة للتطبيقات في الوقت الفعلي حيث كل مللي ثانية مهمة، NMS إزالة NMS رسمًا بيانيًا استدلاليًا حتميًا مناسبًا جدًا لأجهزة الذكاء الاصطناعي المتطورة.
مقاييس ومعايير الأداء
عند تقييم هذين النموذجين، ننظر إلى التوازن بين الدقة وعدد المعلمات والسرعة. يوضح الجدول التالي كيفية مقارنتهما عبر مختلف المقاييس في COCO .
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
كما لوحظ في مقاييسYOLO ، يحقق YOLO11 mAP أعلى قليلاً عبر متغيراته، لا سيما في النماذج الأكبر حجمًا. YOLOv10 تصميم YOLOv10 NMS أوقات استدلال شديدة الاستقرار من البداية إلى النهاية، لكن YOLO11 يحقق إنتاجية استثنائية عند تحسينه باستخدام TensorRT على NVIDIA .
التصدير للإنتاج
عند إعداد النماذج الخاصة بك للنشر، من الضروري التصدير إلى تنسيقات محسّنة. YOLOv10 تصدير كل من YOLO11 YOLOv10 بسلاسة إلى تنسيقات مثل ONNX TensorRT Ultralytics . راجع دليلنا حول خيارات نشر النماذج للحصول على إرشادات تفصيلية.
ميزة النظام البيئي لـ Ultralytics
على الرغم من أهمية مقاييس الأداء المستقلة، إلا أن الإطار المحيط هو الذي يحدد النجاح العملي لمشروع التعلم الآلي. وهنا يبرز YOLO11 باعتباره جزءًا أساسيًا من Ultralytics .
توفر Ultralytics تجربة مستخدم مبسطة للغاية. بفضل Python بسيطة وموحدة، يمكن للمطورين التعامل مع مهام تتجاوز المربعات المحددة الأساسية. YOLO11 تقسيم المثيلات الأصلية وتقدير الوضع وتصنيف الصور واكتشاف المربعات المحددة الموجهة (OBB) بشكل فوري. غالبًا ما تفتقر مستودعات الأبحاث المتخصصة إلى هذه المرونة الهائلة.
علاوة على ذلك، فإن النظام البيئي مدعوم بوثائق شاملة ودعم مجتمعي نشط. التكامل مع أدوات مثل Weights & Biases لتتبع التجارب، و OpenVINO لتحسين Intel مدمجة مباشرة في المكتبة. يتطلب تدريب النموذج الحد الأدنى من الكود النمطي ويستفيد من عمليات تدريب عالية الكفاءة تتطلب CUDA أقل من نماذج المحولات الثقيلة مثل RT-DETR.
مثال عملي على الكود
Ultralytics تصميم التدريب وتشغيل الاستدلال باستخدام Ultralytics ليكون بديهيًا قدر الإمكان. تعالج واجهة برمجة التطبيقات (API) المتطابقة كلاً من YOLO11 YOLOv10 .
from ultralytics import YOLO
# Initialize the model (YOLO11n or YOLOv10n)
model = YOLO("yolo11n.pt")
# Train the model efficiently on a custom dataset
# Ultralytics automatically handles hyperparameters and memory optimization
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Run inference on an image
inference_results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected objects
inference_results[0].show()
حالات الاستخدام والتوصيات
YOLOv10 الاختيار بين YOLO11 YOLOv10 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار YOLO11
YOLO11 خيار قوي لـ:
- نشر حافة الإنتاج: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA حيث الموثوقية والصيانة النشطة أمران بالغا الأهمية.
- تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب الكشف والتجزئة وتقدير الوضع و OBB ضمن إطار موحد واحد.
- النماذج الأولية السريعة والنشر: الفرق التي تحتاج إلى الانتقال بسرعة من جمع البيانات إلى الإنتاج باستخدام Python Ultralytics Python المبسطة.
متى تختار YOLOv10
يوصى YOLOv10 في الحالات التالية:
- الكشف في الوقت الفعليNMS: تطبيقات تستفيد من الكشف الشامل بدون قمع غير أقصى، مما يقلل من تعقيد النشر.
- التوازن بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر نماذج مختلفة.
- تطبيقات ذات زمن انتقال ثابت: سيناريوهات النشر التي يكون فيها زمن الاستدلال المتوقع أمرًا بالغ الأهمية، مثل الروبوتات أو الأنظمة المستقلة.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
الجيل القادم: YOLO26
بينما YOLOv10 نموذجًا ثوريًا NMS YOLO11 تعدد المهام، فإن مجال الذكاء الاصطناعي يتطور بسرعة. بالنسبة للمطورين الذين يبدأون اليوم في نشر منتجات جديدة، نوصي بشدة باستكشاف Ultralytics .
تم إصدار YOLO26 في يناير 2026، وهو يجمع بين أفضل ما في العالمين. فهو يعتمد بشكل أساسي التصميم الشامل NMS الذي ابتكرته YOLOv10، مما يبسط بشكل كبير عملية النشر ويضمن زمن انتقال ثابت. علاوة على ذلك، يدمج YOLO26 تحسينات متخصصة في الحوسبة الطرفية. من خلال تنفيذ إزالة DFL (إزالة خسارة التركيز التوزيعي)، تضمن البنية سهولة التصدير وتحقق CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنة بالنماذج القديمة، مما يجعلها الخيار الأول لأجهزة إنترنت الأشياء ذات الطاقة المنخفضة والتطبيقات المحمولة.
يوفر YOLO26 أيضًا استقرارًا في تدريب نموذج اللغة الكبيرة (LLM) للرؤية الحاسوبية من خلال مُحسِّن MuSGD المبتكر، وهو نموذج هجين مستوحى من أحدث الأبحاث في مجال الذكاء الاصطناعي. إلى جانب وظائف الخسارة ProgLoss + STAL، يوفر YOLO26 دقة لا مثيل لها في التعرف على الأجسام الصغيرة، وهو أمر ضروري للكشف التفصيلي عن مقاطع الفيديو الخاصة بحركة المرور والأتمتة الروبوتية المعقدة.
الخلاصة
يعتمد اختيار نموذج الرؤية المناسب على القيود التشغيلية الخاصة بك. YOLOv10 علامة فارقة مهمة في الأوساط الأكاديمية، حيث يثبت أنه NMS التخلص من NMS بشكل فعال من خط أنابيب الكشف. ومع ذلك، للحصول على توازن فائق بين الأداء وتعدد المهام الشامل وأدوات النشر السلس، YOLO11 يوفر حلاً قويًا وجاهزًا للاستخدام في المؤسسات.
بالنسبة للمهندسين الذين يرغبون في الحصول على أحدث التقنيات - التي تجمع بين البساطة الشاملة والأداء الفائق السرعة - فإن الترحيل إلى أحدث إصدار YOLO26 هو التوصية المثلى. من خلال الاستفادة من Ultralytics الشاملة، يمكنك ضمان أن مشاريعك مبنية على أساس جيد الصيانة وعالي الكفاءة ومستعد للمستقبل.