تخطي إلى المحتوى

YOLOv10 YOLO11: نظرة متعمقة على بنى الكشف عن الأجسام في الوقت الفعلي

يتطور مجال الرؤية الحاسوبية باستمرار، حيث توسع البنى الجديدة حدود ما هو ممكن في المعالجة في الوقت الفعلي. بالنسبة للمطورين والباحثين الذين يعملون في هذا المجال سريع التطور، من الضروري فهم الفروق الدقيقة بين النماذج المتطورة. تستكشف هذه المقارنة التفصيلية الاختلافات التقنية والمفاضلات في الأداء وحالات الاستخدام المثالية لـ YOLOv10 و Ultralytics YOLO11، وهما إطاران عاليان الأداء لاكتشاف الأجسام.

على الرغم من أن كلا النموذجين يحققان نتائج رائعة في مجموعات البيانات المعيارية، إلا أن فلسفات التصميم الأساسية وتكاملات النظام البيئي تختلف بشكل كبير. من خلال فحص هياكلهما، يمكننا تحديد الحل الذي يتوافق بشكل أفضل مع قيود النشر وأهداف المشروع.

YOLOv10: رائد في مجال الكشف الشامل NMS

صدر YOLOv10 في ربيع عام 2024، YOLOv10 نهجًا جديدًا لخط أنابيب الكشف عن الكائنات التقليدي من خلال معالجة مباشرة للزمن المستغرق المرتبط بالمعالجة اللاحقة.

الابتكار البارز في YOLOv10 استراتيجيته الثنائية المتسقة، التي تتيح التدريب NMS. تعتمد أجهزة الكشف عن الأجسام التقليدية بشكل كبير على تقنية Non-Maximum Suppression (NMS) لتصفية التنبؤات الزائدة عن الحاجة للمربعات المحيطة. من خلال إزالة هذه الخطوة، YOLOv10 كشفًا حقيقيًا من البداية إلى النهاية، مما يقلل من زمن الاستدلال ويبسط النشر على مسرعات الأجهزة مثل وحدات المعالجة العصبية (NPUs) حيث يصعب تحسين NMS المخصصة.

تعرف على المزيد حول YOLOv10

YOLO11: تنوع وأداء مدفوعان بالنظام البيئي

تم إطلاق YOLO11 في وقت لاحق من نفس العام، YOLO11 التحسين المستمر لعائلة Ultralytics مع التركيز على التوازن الأمثل بين السرعة والدقة وتجربة المطور.

YOLO11 تصميم YOLO11 للإنتاج. على الرغم من أنه يتفوق في الكشف عن المربعات المحيطة القياسية، إلا أن قوته الحقيقية تكمن في تنوعه. على عكس YOLOv10 الذي يركز بشكل أساسي على اكتشاف الكائنات، يدعم YOLO11 مهام تقسيم المثيلات وتقدير الوضع وتصنيف الصور والمربعات المحددة الموجهة (OBB) باستخدام بنية موحدة. يتميز بمتطلبات ذاكرة منخفضة بشكل ملحوظ أثناء التدريب، مما يجعله سهل الوصول للغاية للفرق التي تعمل باستخدام وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين مقارنة بالبنى الأثقل القائمة على المحولات.

تعرف على المزيد حول YOLO11

مقارنة الأداء والمقاييس

عند مقارنة هذه النماذج جنبًا إلى جنب، من الضروري النظر إلى أدائها عبر متغيرات مختلفة على معايير قياسية مثل COCO .

يوضح الجدول أدناه الاختلافات في الأداء. YOLO11 يتفوق YOLO11 على YOLOv10 mAP معظم فئات الحجم مع الحفاظ على تنافسية عالية TensorRT .

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

تسريع الأجهزة

لإعادة إنتاج سرعات الاستدلال السريعة هذه محليًا، تأكد من تصدير نماذجك إلى تنسيقات محسّنة مثل OpenVINOIntel أو TensorRT NVIDIA .

نظرة معمارية متعمقة

منهجية التدريب وكفاءته

تركز بنية YOLOv10 على تقليل التكرار الحسابي. من خلال تحسين تصميمات العمود الفقري والرقبة باستخدام استراتيجية شاملة تعتمد على الكفاءة والدقة، تمكن المؤلفون من جامعة تسينغهوا من خفض عدد المعلمات بشكل كبير في النماذج متوسطة المستوى (مثل YOLOv10m) مقارنة بالإصدارات السابقة.

ومع ذلك، كفاءة التدريب هي سمة رئيسية Ultralytics . YOLO11 ultralytics Python ، التي تستبعد التعقيدات ضبط المعلمات الفائقة. يتعامل هذا الإطار تلقائيًا مع عمليات زيادة البيانات المتقدمة، وجدولة معدل التعلم، والتدريبGPU بشكل فوري. كما تتميز بنية YOLO11 بتدفق تدرجي ممتاز، مما يؤدي إلى تقارب أسرع واستخدام أقل لذاكرة VRAM أثناء مرحلة التدريب.

سهولة الاستخدام وميزة النظام البيئي

يعد النظام البيئي الجيد الصيانة عاملاً حاسماً في اعتماد المؤسسات له. غالباً ما تصبح مستودعات الأبحاث، على الرغم من طابعها الرائد، خاملة بعد النشر الأولي للورقة البحثية. يوفر Ultralytics الذي يدعم YOLO11 تجربة مطور سلسة وشاملة.

التكامل السلس مع أدوات مثل Weights & Biases لتتبع التجارب و Roboflow لإدارة مجموعات البيانات، YOLO11 الانتقال من النموذج الأولي إلى الإنتاج. تتجلى سهولة الاستخدام في واجهة برمجة التطبيقات (API) المبسطة، التي تتيح للمطورين تدريب النماذج وتصديرها باستخدام بضع أسطر من التعليمات البرمجية.

from ultralytics import YOLO

# Initialize the YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model efficiently with optimized memory handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="0")

# Export to ONNX format for deployment flexibility
model.export(format="onnx")

حالات الاستخدام والتوصيات

YOLO11 الاختيار بين YOLOv10 YOLO11 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار YOLOv10

YOLOv10 خيار قوي لـ:

  • الكشف في الوقت الفعليNMS: تطبيقات تستفيد من الكشف الشامل بدون قمع غير أقصى، مما يقلل من تعقيد النشر.
  • التوازن بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر نماذج مختلفة.
  • تطبيقات ذات زمن انتقال ثابت: سيناريوهات النشر التي يكون فيها زمن الاستدلال المتوقع أمرًا بالغ الأهمية، مثل الروبوتات أو الأنظمة المستقلة.

متى تختار YOLO11

YOLO11 في الحالات التالية:

  • نشر حافة الإنتاج: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA حيث الموثوقية والصيانة النشطة أمران بالغا الأهمية.
  • تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب الكشف والتجزئة وتقدير الوضع و OBB ضمن إطار موحد واحد.
  • النماذج الأولية السريعة والنشر: الفرق التي تحتاج إلى الانتقال بسرعة من جمع البيانات إلى الإنتاج باستخدام Python Ultralytics Python المبسطة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

استكشاف هياكل أخرى

على الرغم من YOLO11 YOLOv10 YOLO11 يار YOLO11 حالتك الاستخدامية المحددة قد تستفيد من بنى أخرى متوفرة في الوثائق. بالنسبة للاستدلال القائم على التسلسل، يمكن أن تكون نماذج المحولات مثل RT-DETR توفر دقة عالية، على الرغم من أنها تتطلب عادةً متطلبات ذاكرة أعلى. على العكس من ذلك، إذا كنت بحاجة إلى قدرات zero-shot لتحديد فئات جديدة دون إعادة التدريب، فإن YOLO يقدم نهجًا مفتوحًا للمفردات مدفوعًا بمطالبات اللغة الطبيعية.

الجيل القادم: YOLO26

بالنسبة للفرق التي تبحث عن أحدث التقنيات، يجمع Ultralytics الذي تم إصداره مؤخرًا بين أفضل ميزات كلا الطرازين المذكورين أعلاه. تم إصدار YOLO26 في يناير 2026، وهو التوصية المثلى لسيناريوهات النشر الحديثة.

بناءً على أسس سابقاتها، تدمج YOLO26 بشكل أصلي تصميمًا شاملاً NMS، مما يزيل بشكل فعال اختناقات ما بعد المعالجة التي عالجتها YOLOv10 ، ولكنها تفعل ذلك ضمن Ultralytics القوي. علاوة على ذلك، تتميز YOLO26 بإزالة DFL (خسارة التركيز التوزيعي)، مما يبسط بشكل كبير رسوم تصدير النموذج ويعزز التوافق مع أجهزة إنترنت الأشياء المتطورة ومنخفضة الطاقة.

كما شهدت استقرار التدريب قفزة جيلية مع إدخال MuSGD Optimizer، وهو نهج هجين مستوحى من منهجيات تدريب LLM التي تضمن تقاربًا سريعًا للغاية. إلى جانب وظائف الخسارة المتقدمة مثل ProgLoss + STAL، يقدم YOLO26 تحسينات ملحوظة في التعرف على الأجسام الصغيرة. للنشر على الأجهزة الطرفية القياسية، تؤدي هذه التحسينات المعمارية إلى CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعل YOLO26 خيارًا لا مثيل له في جميع مهام الرؤية الحاسوبية.


تعليقات