تخطي إلى المحتوى

YOLO26 مقابل YOLOv10: مقارنة نماذج الكشف عن الكائنات من البداية إلى النهاية

يتطور مجال الرؤية الحاسوبية باستمرار، مدفوعًا بالطلب على نماذج أسرع وأكثر دقة وكفاءة. يقدم هذا الدليل مقارنة تقنية شاملة بين بنتيتين رائدتين في مجال الكشف عن الكائنات في الوقت الفعلي: YOLO26 و YOLOv10. من خلال تحليل هندستهما ومقاييس أدائهما وقدراتهما على النشر، نهدف إلى مساعدة المطورين والباحثين على اختيار النموذج الأمثل لتطبيقات الرؤية الخاصة بهم.

تطور البنى الهندسية NMS

لسنوات عديدة، اعتمدت عائلة YOLO You Only Look Once) بشكل كبير على تقنية Non-Maximum Suppression (NMS) لتصفية المربعات المحددة الزائدة أثناء المعالجة اللاحقة. على الرغم من فعالية NMS تأخيرًا في الاستدلال وتعقّد عملية النشر على الأجهزة الطرفية مثل Raspberry Pi أو وحدات المعالجة العصبية المتخصصة (NPUs).

YOLOv10 طرح YOLOv10 تحولاً جذرياً من خلال ريادته لتصميم شامل NMS. وبناءً على هذا الإنجاز الأساسي، قامت Ultralytics بتحسين البنية الهندسية لبيئات الإنتاج، محققةً كفاءة وسهولة استخدام غير مسبوقة في مجموعة واسعة من المهام.

عقبة ما بعد المعالجة

إزالة NMS خطوة المعالجة اللاحقة الديناميكية المعتمدة على البيانات والتي كانت تعيق تقليديًا تحسين نماذج الرؤية الحاسوبية على مسرعات الأجهزة مثل TensorRT و OpenVINO.

YOLOv10: ريادة اكتشاف NMS-Free

التاريخ: 2024-05-23
المؤلفون: Ao Wang، Hui Chen، Lihao Liu، وآخرون.
المنظمة:جامعة تسينغهوا
الموارد:ورقة ArXiv | مستودع GitHub

طور باحثون في جامعة تسينغهوا YOLOv10 استراتيجية مزدوجة التخصيص متسقة للتخلص من الحاجة إلى NMS. من خلال استخدام تصميم نموذج شامل قائم على الكفاءة والدقة، قلل من التكرار الحسابي مع الحفاظ على mAP متوسط الدقة) قوي.

نقاط القوة:

  • بنيةNMS: الرائد الأصلي للتصميم NMS في YOLO مما يقلل بشكل كبير من زمن الاستجابة للتطبيقات في الوقت الفعلي.
  • الكفاءة: يوفر توازنًا قويًا بين عدد المعلمات وسرعة الاستدلال مقارنةً بنماذج الجيل السابق.

نقاط الضعف:

  • دعم مهام محدود: يركز بشكل أساسي على الكشف عن الكائنات القياسية، ويفتقر إلى الدعم الأصلي الجاهز للمهام المتقدمة مثل التجزئة أو تقدير الوضع.
  • التركيز الأكاديمي: على الرغم من قوة قاعدة الكود، إلا أنها تميل أكثر نحو البحث بدلاً من النشر الإنتاجي المبسط على مستوى المؤسسات.

تعرف على المزيد حول YOLOv10

YOLO26: المعيار الجديد للحافة والسحابة

التاريخ: 2026-01-14
المؤلفون: Glenn Jocher و Jing Qiu
المنظمة:Ultralytics
الموارد:مستودع GitHub | Ultralytics

صدر كخلف لـ YOLO11، ويأخذ مفهوم NMS إلى أقصى درجات التحقيق. وهو يدمج بشكل أصلي الكشف الشامل في Ultralytics عالية التحسين، مما يوفر مجموعة كاملة من الأدوات لخط أنابيب التعلم الآلي الحديث.

يقدم YOLO26 العديد من الابتكارات المعمارية:

  • إزالة DFL: تمت إزالة فقدان بؤرة التوزيع (Distribution Focal Loss) بالكامل. وهذا يبسط عملية تصدير النموذج بشكل كبير ويحسن التوافق مع الأجهزة المتطورة والأجهزة منخفضة الطاقة.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : بفضل إزالة DFL والتحسينات الهيكلية، أصبح YOLO26 أسرع بشكل ملحوظ على وحدات المعالجة المركزية، مما يجعله مثاليًا لتطبيقات إنترنت الأشياء والأجهزة المحمولة.
  • MuSGD Optimizer: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (LLM) (مثل Kimi K2 من Moonshot AI)، يستخدم YOLO26 مزيجًا من SGD Muon. وهذا يوفر استقرارًا لا مثيل له في التدريب وتقاربًا أسرع للرؤية الحاسوبية.
  • ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية بالنسبة للصور الجوية والمراقبة الأمنية باستخدام الطائرات بدون طيار.
  • تحسينات خاصة بالمهام: YOLO26 ليس مجرد كاشف. فهو يتميز بفقدان التجزئة الدلالية وبروتو متعدد المقاييس للتجزئة، وتقدير احتمالية السجل المتبقي (RLE) لتقدير الوضع، وفقدان الزاوية المتخصص للمربعات المحددة الاتجاه (OBB).

تعرف على المزيد حول YOLO26

تحليل الأداء والمقاييس

يقارن الجدول التالي أداء COCO YOLOv10 YOLO26 و YOLOv10 . لاحظ كيف يحقق YOLO26 دقة فائقة مع الحفاظ على كفاءة استثنائية للمعلمات.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Ultralytics : كفاءة التدريب والذاكرة

عند نشر النماذج في الإنتاج، تكون متطلبات الذاكرة وكفاءة التدريب بنفس أهمية سرعة الاستدلال. تم تحسين Ultralytics ولا سيما YOLO26، بشكل كبير لتقليل استخدام CUDA أثناء التدريب. وهذا يتيح للمطورين استخدام أحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين، مما يقلل بشكل كبير من وقت التدريب وتكاليف الحوسبة. على العكس من ذلك، فإن البنى المعقدة أو نماذج المحولات الثقيلة مثل RT-DETR غالبًا ما تتطلب أجهزة باهظة الثمن وعالية الجودة للتدريب بفعالية.

التكامل المستمر والنظام البيئي

واحدة من أكبر مزايا اختيار YOLO26 هي تكامله مع Ultralytics الذي يتم صيانته جيدًا. من تعليق البيانات إلى تتبع التجارب، توفر المنصة كل ما يحتاجه مهندس التعلم الآلي تحت سقف واحد موحد.

التنفيذ العملي: مثال على الكود

Ultralytics بسهولة الاستخدام الرائدة في المجال. بفضل Python البديهية، أصبح من السهل الترحيل من نموذج قديم مثل YOLOv8 إلى YOLO26 المتطور يتطلب تحديث سطر واحد فقط من التعليمات البرمجية.

فيما يلي مثال قابل للتشغيل بنسبة 100٪ يوضح كيفية التدريب والاستدلال باستخدام YOLO26:

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

حالات الاستخدام والتوصيات

YOLOv10 الاختيار بين YOLO26 و YOLOv10 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار YOLO26

YOLO26 هو خيار قوي لـ:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

متى تختار YOLOv10

يوصى YOLOv10 في الحالات التالية:

  • الكشف في الوقت الفعليNMS: تطبيقات تستفيد من الكشف الشامل بدون قمع غير أقصى، مما يقلل من تعقيد النشر.
  • التوازن بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر نماذج مختلفة.
  • تطبيقات ذات زمن انتقال ثابت: سيناريوهات النشر التي يكون فيها زمن الاستدلال المتوقع أمرًا بالغ الأهمية، مثل الروبوتات أو الأنظمة المستقلة.

الخلاصة

بينما YOLOv10 مساهمات كبيرة للمجتمع الأكاديمي من خلال إدخال نموذج NMS فإن YOLO26 يرفع هذه التكنولوجيا إلى مستوى الجاهزية على مستوى المؤسسات. بفضل زيادة CPU بنسبة 43٪، ومُحسِّن MuSGD المبتكر، وتعدد الاستخدامات الذي لا مثيل له في مهام الرؤية، يبرز YOLO26 كخيار مثالي لكل من الحوسبة المتطورة ونشر السحابة على نطاق واسع.

بالنسبة للفرق التي تعطي الأولوية للمجتمع النشط والوثائق الشاملة وتجربة المطورين السلسة، فإن Ultralytics لا مثيل له. إذا كنت تستكشف نماذج لسيناريوهات متخصصة، فقد ترغب أيضًا في استكشاف YOLO لاكتشاف المفردات المفتوحة بدون تدريب. ومع ذلك، بالنسبة للغالبية العظمى من حالات الاستخدام في العالم الحقيقي، فإن YOLO26 هو التوصية النهائية.


تعليقات