YOLOv10 YOLO11: نظرة متعمقة على بنى الكشف عن الأجسام في الوقت الفعلي

يتطور مجال الرؤية الحاسوبية باستمرار، حيث توسع البنى الجديدة حدود ما هو ممكن في المعالجة في الوقت الفعلي. بالنسبة للمطورين والباحثين الذين يعملون في هذا المجال سريع التطور، من الضروري فهم الفروق الدقيقة بين النماذج المتطورة. تستكشف هذه المقارنة التفصيلية الاختلافات التقنية والمفاضلات في الأداء وحالات الاستخدام المثالية لـ YOLOv10 و Ultralytics YOLO11، وهما إطاران عاليان الأداء لاكتشاف الأجسام.

على الرغم من أن كلا النموذجين يحققان نتائج رائعة في مجموعات البيانات المعيارية، إلا أن فلسفات التصميم الأساسية وتكاملات النظام البيئي تختلف بشكل كبير. من خلال فحص هياكلهما، يمكننا تحديد الحل الذي يتوافق بشكل أفضل مع قيود النشر وأهداف المشروع.

YOLOv10: رائد في مجال الكشف الشامل NMS

صدر YOLOv10 في ربيع عام 2024، YOLOv10 نهجًا جديدًا لخط أنابيب الكشف عن الكائنات التقليدي من خلال معالجة مباشرة للزمن المستغرق المرتبط بالمعالجة اللاحقة.

المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
المؤسسة:جامعة تسينغ - هوا
التاريخ: 23 مايو 2024
ورقة بحثية:arXiv:2405.14458
الكود المصدري:THU-MIG/yolov10 على GitHub
التوثيق:وثائق YOLOv10

الابتكار البارز في YOLOv10 استراتيجيته الثنائية المتسقة، التي تتيح التدريب NMS. تعتمد أجهزة الكشف عن الأجسام التقليدية بشكل كبير على تقنية Non-Maximum Suppression (NMS) لتصفية التنبؤات الزائدة عن الحاجة للمربعات المحيطة. من خلال إزالة هذه الخطوة، YOLOv10 كشفًا حقيقيًا من البداية إلى النهاية، مما يقلل من زمن الاستدلال ويبسط النشر على مسرعات الأجهزة مثل وحدات المعالجة العصبية (NPUs) حيث يصعب تحسين NMS المخصصة.

تعرف على المزيد حول YOLOv10

YOLO11: تنوع وأداء مدفوعان بالنظام البيئي

تم إطلاق YOLO11 في وقت لاحق من نفس العام، YOLO11 التحسين المستمر لعائلة Ultralytics مع التركيز على التوازن الأمثل بين السرعة والدقة وتجربة المطور.

المؤلفون: غلين جوشر وجينغ تشيو
المؤسسة:Ultralytics
التاريخ: 27 سبتمبر 2024
الكود المصدري:Ultralytics على GitHub
تكامل المنصة:منصة Ultralytics

YOLO11 تصميم YOLO11 للإنتاج. على الرغم من أنه يتفوق في الكشف عن المربعات المحيطة القياسية، إلا أن قوته الحقيقية تكمن في تنوعه. على عكس YOLOv10 الذي يركز بشكل أساسي على اكتشاف الكائنات، يدعم YOLO11 مهام تقسيم المثيلات وتقدير الوضع وتصنيف الصور والمربعات المحددة الموجهة (OBB) باستخدام بنية موحدة. يتميز بمتطلبات ذاكرة منخفضة بشكل ملحوظ أثناء التدريب، مما يجعله سهل الوصول للغاية للفرق التي تعمل باستخدام وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين مقارنة بالبنى الأثقل القائمة على المحولات.

تعرف على المزيد حول YOLO11

مقارنة الأداء والمقاييس

عند مقارنة هذه النماذج جنبًا إلى جنب، من الضروري النظر إلى أدائها عبر متغيرات مختلفة على معايير قياسية مثل COCO .

يوضح الجدول أدناه الاختلافات في الأداء. YOLO11 يتفوق YOLO11 على YOLOv10 mAP معظم فئات الحجم مع الحفاظ على تنافسية عالية TensorRT .

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

تسريع الأجهزة

لإعادة إنتاج سرعات الاستدلال السريعة هذه محليًا، تأكد من تصدير نماذجك إلى تنسيقات محسّنة مثل OpenVINOIntel أو TensorRT NVIDIA .

نظرة معمارية متعمقة

منهجية التدريب وكفاءته

تركز بنية YOLOv10 على تقليل التكرار الحسابي. من خلال تحسين تصميمات العمود الفقري والرقبة باستخدام استراتيجية شاملة تعتمد على الكفاءة والدقة، تمكن المؤلفون من جامعة تسينغهوا من خفض عدد المعلمات بشكل كبير في النماذج متوسطة المستوى (مثل YOLOv10m) مقارنة بالإصدارات السابقة.

ومع ذلك، كفاءة التدريب هي سمة رئيسية Ultralytics . YOLO11 ultralytics Python ، التي تستبعد التعقيدات ضبط المعلمات الفائقةيتعامل هذا الإطار تلقائيًا مع توسيع البيانات المتقدم، وجدولة معدل التعلم، والتدريب الموزع متعدد الـ GPU بشكل جاهز. تظهر هندسة YOLO11 أيضًا تدفق تدرج ممتازًا، مما يؤدي إلى تقارب أسرع واستخدام أقل لذاكرة VRAM أثناء مرحلة التدريب.

سهولة الاستخدام وميزة النظام البيئي

يُعد النظام البيئي المُصان جيدًا عاملًا حاسمًا لاعتماد الشركات. فغالبًا ما تصبح مستودعات الأبحاث، رغم ريادتها، خاملة بعد النشر الأولي للورقة البحثية. يوفر نظام Ultralytics البيئي، الذي يدعم YOLO11، تجربة تطوير سلسة وشاملة.

التكامل السلس مع أدوات مثل Weights & Biases لتتبع التجارب و Roboflow لإدارة مجموعات البيانات، YOLO11 الانتقال من النموذج الأولي إلى الإنتاج. تتجلى سهولة الاستخدام في واجهة برمجة التطبيقات (API) المبسطة، التي تتيح للمطورين تدريب النماذج وتصديرها باستخدام بضع أسطر من التعليمات البرمجية.

from ultralytics import YOLO

# Initialize the YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model efficiently with optimized memory handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="0")

# Export to ONNX format for deployment flexibility
model.export(format="onnx")

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLOv10 و YOLO11 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLOv10

YOLOv10 خيار قوي لـ:

detect في الوقت الفعلي خالٍ من NMS: التطبيقات التي تستفيد من detect الشامل دون التثبيط غير الأقصى، مما يقلل من تعقيد النشر.
مقايضات متوازنة بين السرعة والدقة: المشاريع التي تتطلب توازنًا قويًا بين سرعة الاستدلال ودقة الكشف عبر مقاييس النماذج المختلفة.
تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال المتوقعة حاسمة، مثل الروبوتات أو الأنظمة المستقلة.

متى تختار YOLO11

YOLO11 في الحالات التالية:

النشر الإنتاجي على الحافة: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA Jetson حيث الموثوقية والصيانة النشطة أمران بالغا الأهمية.
تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب الكشف (detect)، والـsegmentation، وتقدير الوضعية (pose estimation)، وOBB ضمن إطار عمل موحد واحد.
النماذج الأولية والنشر السريع: الفرق التي تحتاج إلى الانتقال بسرعة من جمع البيانات إلى الإنتاج باستخدام واجهة برمجة تطبيقات Ultralytics Python المبسطة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

استكشاف هياكل أخرى

على الرغم من YOLO11 YOLOv10 YOLO11 يار YOLO11 حالتك الاستخدامية المحددة قد تستفيد من بنى أخرى متوفرة في الوثائق. بالنسبة للاستدلال القائم على التسلسل، يمكن أن تكون نماذج المحولات مثل RT-DETR توفر دقة عالية، على الرغم من أنها تتطلب عادةً متطلبات ذاكرة أعلى. على العكس من ذلك، إذا كنت بحاجة إلى قدرات zero-shot لتحديد فئات جديدة دون إعادة التدريب، فإن YOLO يقدم نهجًا مفتوحًا للمفردات مدفوعًا بمطالبات اللغة الطبيعية.

الجيل القادم: YOLO26

بالنسبة للفرق التي تبحث عن أحدث التقنيات، يجمع Ultralytics الذي تم إصداره مؤخرًا بين أفضل ميزات كلا الطرازين المذكورين أعلاه. تم إصدار YOLO26 في يناير 2026، وهو التوصية المثلى لسيناريوهات النشر الحديثة.

بناءً على أسس أسلافه، يدمج YOLO26 بشكل أصلي تصميمًا خاليًا من NMS من البداية إلى النهاية، مما يلغي بشكل فعال اختناقات المعالجة اللاحقة التي عالجها YOLOv10 لأول مرة، ولكن يفعل ذلك ضمن إطار عمل Ultralytics القوي. علاوة على ذلك، يتميز YOLO26 بـ إزالة DFL (خسارة التركيز التوزيعي)، مما يبسّط بشكل كبير رسوم بيانية تصدير النموذج ويعزز التوافق مع أجهزة الحافة وأجهزة إنترنت الأشياء منخفضة الطاقة.

كما شهدت استقرار التدريب قفزة جيلية مع إدخال MuSGD Optimizer، وهو نهج هجين مستوحى من منهجيات تدريب LLM التي تضمن تقاربًا سريعًا للغاية. إلى جانب وظائف الخسارة المتقدمة مثل ProgLoss + STAL، يقدم YOLO26 تحسينات ملحوظة في التعرف على الأجسام الصغيرة. للنشر على الأجهزة الطرفية القياسية، تؤدي هذه التحسينات المعمارية إلى CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعل YOLO26 خيارًا لا مثيل له في جميع مهام الرؤية الحاسوبية.