Meet YOLO26: next-gen vision AI.

Link to this sectionمقارنة بين YOLOv10 و YOLO11#

يشهد مجال الرؤية الحاسوبية تطوراً مستمراً، حيث تدفع البنى التحتية الجديدة حدود ما هو ممكن في المعالجة الفورية. وبالنسبة للمطورين والباحثين الذين يعملون في هذا المجال سريع الخطى، يعد فهم الفروق الدقيقة بين النماذج المتطورة أمراً بالغ الأهمية. تستعرض هذه المقارنة المفصلة الاختلافات التقنية، والمقايضات في الأداء، وحالات الاستخدام المثالية لكل من YOLOv10 و Ultralytics YOLO11، وهما إطاران عاليان الكفاءة للكشف عن الأجسام.

على الرغم من أن كلا النموذجين يحققان نتائج مذهلة في مجموعات بيانات القياس المرجعي، إلا أن فلسفات التصميم الأساسية وتكامل النظام البيئي يختلفان بشكل كبير. من خلال فحص بنياتهما، يمكننا تحديد الحل الذي يتوافق بشكل أفضل مع قيود النشر وأهداف المشروع الخاصة بك.

Link to this sectionYOLOv10: ريادة الكشف الشامل (End-to-End) بدون NMS#

تم إصدار YOLOv10 في ربيع عام 2024، وقدم نهجاً جديداً لخط أنابيب الكشف عن الأجسام التقليدي من خلال المعالجة المباشرة لتأخير الوقت المرتبط بمرحلة ما بعد المعالجة.

الابتكار البارز في YOLOv10 هو استراتيجية التعيينات المزدوجة المتسقة، والتي تتيح التدريب بدون NMS. تعتمد كاشفات الأجسام التقليدية بشكل كبير على Non-Maximum Suppression (NMS) لتصفية تنبؤات مربعات الإحاطة الزائدة. ومن خلال إزالة هذه الخطوة، يحقق YOLOv10 كشفاً شاملاً (End-to-End) حقيقياً، مما يقلل من زمن وصول الاستدلال ويبسط النشر على مسرعات الأجهزة مثل Neural Processing Units (NPUs) حيث يصعب تحسين عمليات NMS المخصصة.

تعرف على المزيد حول YOLOv10

Link to this sectionYOLO11: تعدد الاستخدامات والأداء المدفوع بالنظام البيئي#

تم إطلاق YOLO11 في وقت لاحق من نفس العام، وهو يمثل التطوير المستمر لعائلة نماذج Ultralytics، مع التركيز على التوازن الأمثل بين السرعة والدقة وتجربة المطور.

تم تصميم YOLO11 للإنتاج. وفي حين أنه يتفوق في الكشف القياسي عن مربعات الإحاطة، تكمن قوته الحقيقية في تعدد استخداماته. على عكس YOLOv10، الذي يركز بشكل أساسي على الكشف عن الأجسام، يدعم YOLO11 محلياً مهام تجزئة الأجسام، وتقدير الوضعية، وتصنيف الصور، ومربعات الإحاطة الموجهة (OBB) باستخدام بنية موحدة. كما يتميز بـ متطلبات ذاكرة منخفضة بشكل ملحوظ أثناء التدريب، مما يجعله سهل الوصول للغاية للفرق التي تعمل باستخدام GPUs المخصصة للمستهلكين مقارنة بالبنى الأثقل المعتمدة على Transformer.

تعرف على المزيد حول YOLO11

Link to this sectionمقارنة الأداء والمقاييس#

عند مقارنة هذه النماذج جنباً إلى جنب، من الضروري النظر في كيفية أدائها عبر متغيرات الحجم المختلفة على معايير قياسية مثل COCO dataset.

يسلط الجدول أدناه الضوء على اختلافات الأداء. يتفوق YOLO11 غالباً على YOLOv10 في مقياس mAP عبر معظم فئات الحجم مع الحفاظ على سرعات استدلال تنافسية للغاية باستخدام TensorRT.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
تسريع الأجهزة

لإعادة إنتاج سرعات الاستدلال السريعة هذه محلياً، تأكد من تصدير نماذجك إلى تنسيقات محسّنة مثل OpenVINO لمعالجات Intel أو TensorRT لمعالجات NVIDIA الرسومية (GPUs).

Link to this sectionغوص معمق في البنية#

Link to this sectionمنهجية التدريب والكفاءة#

تؤكد بنية YOLOv10 على تقليل التكرار الحسابي. من خلال تحسين تصميمات العمود الفقري (backbone) والعنق (neck) باستخدام استراتيجية شاملة قائمة على كفاءة الأداء والدقة، تمكن المؤلفون من جامعة تسينغوا من خفض عدد المعلمات بشكل كبير في النماذج متوسطة المستوى (مثل YOLOv10m) مقارنة بالتكرارات السابقة.

ومع ذلك، تعد كفاءة التدريب سمة رئيسية لنماذج Ultralytics. يستخدم YOLO11 حزمة ultralytics بلغة Python عالية التطور، والتي تجرد تعقيدات ضبط المعلمات الفائقة. يتعامل هذا الإطار تلقائياً مع زيادات البيانات المتقدمة، وجدولة معدل التعلم، والتدريب الموزع عبر وحدات GPU متعددة بشكل جاهز. كما تظهر بنية YOLO11 تدفقاً ممتازاً للتدرج، مما يؤدي إلى تقارب أسرع واستخدام أقل لذاكرة VRAM أثناء مرحلة التدريب.

Link to this sectionسهولة الاستخدام وميزة النظام البيئي#

يعد النظام البيئي المُصان جيداً عاملاً حاسماً لاعتماد المؤسسات. فمستودعات الأبحاث، رغم كونها رائدة، غالباً ما تصبح غير نشطة بعد نشر الورقة البحثية الأولية. يوفر نظام Ultralytics البيئي، الذي يدعم YOLO11، تجربة مطور سلسة وشاملة.

من خلال التكامل السلس مع أدوات مثل Weights & Biases لتتبع التجارب و Roboflow لإدارة مجموعات البيانات، يسرع YOLO11 الانتقال من النموذج الأولي إلى الإنتاج. وتتجلى سهولة الاستخدام في واجهة برمجة التطبيقات (API) المبسطة، مما يسمح للمطورين بتدريب وتصدير النماذج ببضعة أسطر من التعليمات البرمجية فقط.

from ultralytics import YOLO

# Initialize the YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model efficiently with optimized memory handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="0")

# Export to ONNX format for deployment flexibility
model.export(format="onnx")

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv10 و YOLO11 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv10#

يعد YOLOv10 خياراً قوياً لـ:

  • الكشف الفوري بدون NMS: التطبيقات التي تستفيد من الكشف الشامل (end-to-end) بدون تقنية Non-Maximum Suppression، مما يقلل من تعقيد النشر.
  • الموازنة بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر مختلف أحجام النماذج.
  • تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال القابلة للتنبؤ أمراً بالغ الأهمية، مثل الروبوتات أو الأنظمة ذاتية القيادة.

Link to this sectionمتى تختار YOLO11#

يوصى بـ YOLO11 لـ:

  • نشر الإنتاج عند الحافة: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA Jetson حيث تكون الموثوقية والصيانة النشطة أمراً بالغ الأهمية.
  • تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب اكتشافاً، وتجزئة، وتقدير وضعية، وOBB ضمن إطار عمل واحد موحد.
  • النماذج الأولية السريعة والنشر: الفرق التي تحتاج إلى التحرك بسرعة من جمع البيانات إلى الإنتاج باستخدام Ultralytics Python API الانسيابي.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionاستكشاف بنيات أخرى#

في حين أن YOLOv10 و YOLO11 خيارات ممتازة، قد تستفيد حالة الاستخدام الخاصة بك من بنيات أخرى متاحة في التوثيق. بالنسبة للاستدلال القائم على التسلسل، توفر نماذج Transformer مثل RT-DETR دقة عالية، على الرغم من أنها تتطلب عادةً متطلبات ذاكرة أعلى. وعلى العكس من ذلك، إذا كنت بحاجة إلى قدرات التعلم بدون أمثلة سابقة (zero-shot) لتحديد فئات جديدة دون إعادة تدريب، فإن YOLO-World يقدم نهجاً مفتوح المفردات مدفوعاً بمطالبات اللغة الطبيعية.

Link to this sectionالجيل القادم: YOLO26#

بالنسبة للفرق التي تبحث عن أحدث ما توصلت إليه التكنولوجيا، يجمع Ultralytics YOLO26 الذي تم إصداره مؤخراً أفضل ميزات النموذجين اللذين تمت مناقشتهما أعلاه. تم إطلاق YOLO26 في يناير 2026، وهو التوصية النهائية لسيناريوهات النشر الحديثة.

بناءً على أسس سابقيه، يدمج YOLO26 أصلاً تصميم NMS-Free الشامل (End-to-End)، مما يلغي بفعالية اختناقات ما بعد المعالجة التي عالجها YOLOv10 لأول مرة، ولكن ضمن إطار عمل Ultralytics القوي. علاوة على ذلك، يتميز YOLO26 بـ إزالة DFL (Distribution Focal Loss)، مما يبسط بشكل كبير رسوم التصدير الخاصة بالنموذج ويعزز التوافق مع أجهزة الحافة وأجهزة إنترنت الأشياء (IoT) منخفضة الطاقة.

شهد استقرار التدريب أيضاً قفزة جيلية مع إدخال مُحسّن MuSGD، وهو نهج هجين مستوحى من منهجيات تدريب النماذج اللغوية الكبيرة (LLM) يضمن تقارباً سريعاً للغاية. وإلى جانب وظائف الخسارة المتقدمة مثل ProgLoss + STAL، يقدم YOLO26 تحسينات ملحوظة في التعرف على الأجسام الصغيرة. بالنسبة للنشر على أجهزة الحافة القياسية، تؤدي هذه التحسينات الهيكلية إلى سرعة استدلال على وحدة المعالجة المركزية (CPU) أسرع بنسبة تصل إلى 43%، مما يجعل YOLO26 خياراً لا مثيل له عبر جميع مهام الرؤية الحاسوبية.

التعليقات