تخطي إلى المحتوى

YOLO26 مقابل YOLOv10: مقارنة نماذج الكشف عن الكائنات من البداية إلى النهاية

يتطور مجال الرؤية الحاسوبية باستمرار، مدفوعًا بالطلب على نماذج أسرع وأكثر دقة وكفاءة. يقدم هذا الدليل مقارنة تقنية شاملة بين بنتيتين رائدتين في مجال الكشف عن الكائنات في الوقت الفعلي: YOLO26 و YOLOv10. من خلال تحليل هندستهما ومقاييس أدائهما وقدراتهما على النشر، نهدف إلى مساعدة المطورين والباحثين على اختيار النموذج الأمثل لتطبيقات الرؤية الخاصة بهم.

تطور البنى الهندسية NMS

لسنوات عديدة، اعتمدت عائلة YOLO You Only Look Once) بشكل كبير على تقنية Non-Maximum Suppression (NMS) لتصفية المربعات المحددة الزائدة أثناء المعالجة اللاحقة. على الرغم من فعالية NMS تأخيرًا في الاستدلال وتعقّد عملية النشر على الأجهزة الطرفية مثل Raspberry Pi أو وحدات المعالجة العصبية المتخصصة (NPUs).

YOLOv10 طرح YOLOv10 تحولاً جذرياً من خلال ريادته لتصميم شامل NMS. وبناءً على هذا الإنجاز الأساسي، قامت Ultralytics بتحسين البنية الهندسية لبيئات الإنتاج، محققةً كفاءة وسهولة استخدام غير مسبوقة في مجموعة واسعة من المهام.

عقبة ما بعد المعالجة

إزالة NMS خطوة المعالجة اللاحقة الديناميكية المعتمدة على البيانات والتي كانت تعيق تقليديًا تحسين نماذج الرؤية الحاسوبية على مسرعات الأجهزة مثل TensorRT و OpenVINO.

YOLOv10: ريادة اكتشاف NMS-Free

التاريخ: 2024-05-23
المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
المنظمة:جامعة تسينغهوا
الموارد:ورقة بحثية على ArXiv | مستودع GitHub

طور باحثون في جامعة تسينغهوا YOLOv10 استراتيجية مزدوجة التخصيص متسقة للتخلص من الحاجة إلى NMS. من خلال استخدام تصميم نموذج شامل قائم على الكفاءة والدقة، قلل من التكرار الحسابي مع الحفاظ على mAP متوسط الدقة) قوي.

نقاط القوة:

  • بنية خالية من NMS: الرائد الأصلي للتصميم الخالي من NMS في سلسلة YOLO، مما يقلل بشكل كبير من زمن الوصول للتطبيقات في الوقت الفعلي.
  • الكفاءة: يوفر توازنًا قويًا بين عدد المعلمات وسرعة الاستدلال مقارنة بنماذج الأجيال السابقة.

نقاط الضعف:

  • دعم محدود للمهام: يركز بشكل أساسي على اكتشاف الكائنات القياسي، ويفتقر إلى الدعم الأصلي الجاهز للاستخدام للمهام المتقدمة مثل segment أو تقدير الوضعية.
  • التركيز الأكاديمي: قاعدة التعليمات البرمجية، على الرغم من قوتها، تميل أكثر نحو البحث بدلاً من النشر الإنتاجي المبسّط على مستوى المؤسسات.

تعرف على المزيد حول YOLOv10

YOLO26: المعيار الجديد للحافة والسحابة

التاريخ: 2026-01-14
المؤلفون: Glenn Jocher و Jing Qiu
المنظمة:Ultralytics
الموارد:مستودع GitHub | منصة Ultralytics

صدر كخلف لـ YOLO11، ويأخذ مفهوم NMS إلى أقصى درجات التحقيق. وهو يدمج بشكل أصلي الكشف الشامل في Ultralytics عالية التحسين، مما يوفر مجموعة كاملة من الأدوات لخط أنابيب التعلم الآلي الحديث.

يقدم YOLO26 العديد من الابتكارات المعمارية:

  • إزالة DFL: تمت إزالة خسارة التركيز التوزيعي بالكامل. وهذا يبسط بشكل كبير عملية تصدير النموذج ويحسن التوافق مع الأجهزة الطرفية ومنخفضة الطاقة.
  • استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): بفضل إزالة DFL والتحسينات الهيكلية، يعد YOLO26 أسرع بكثير على وحدات CPU، مما يجعله مثاليًا لعمليات النشر في إنترنت الأشياء والأجهزة المحمولة.
  • مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغات الكبيرة (LLM) (مثل Kimi K2 من Moonshot AI)، يستخدم YOLO26 هجينًا من SGD و Muon. وهذا يجلب استقرارًا تدريبيًا لا مثيل له وتقاربًا أسرع للرؤية الحاسوبية.
  • ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لـالتصوير الجوي والمراقبة الأمنية القائمة على الطائرات بدون طيار.
  • تحسينات خاصة بالمهام: YOLO26 ليس مجرد كاشف. يتميز بفقدان التجزئة الدلالية ونموذج أولي متعدد المقاييس لـ التجزئة، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لـ تقدير الوضعية، وخسارة زاوية متخصصة لـ الصناديق المحيطة الموجهة (OBB).

تعرف على المزيد حول YOLO26

تحليل الأداء والمقاييس

يقارن الجدول التالي أداء COCO YOLOv10 YOLO26 و YOLOv10 . لاحظ كيف يحقق YOLO26 دقة فائقة مع الحفاظ على كفاءة استثنائية للمعلمات.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Ultralytics : كفاءة التدريب والذاكرة

عند نشر النماذج في الإنتاج، تكون متطلبات الذاكرة وكفاءة التدريب بنفس أهمية سرعة الاستدلال. تم تحسين Ultralytics ولا سيما YOLO26، بشكل كبير لتقليل استخدام CUDA أثناء التدريب. وهذا يتيح للمطورين استخدام أحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين، مما يقلل بشكل كبير من وقت التدريب وتكاليف الحوسبة. على العكس من ذلك، فإن البنى المعقدة أو نماذج المحولات الثقيلة مثل RT-DETR غالبًا ما تتطلب أجهزة باهظة الثمن وعالية الجودة للتدريب بفعالية.

التكامل المستمر والنظام البيئي

واحدة من أكبر مزايا اختيار YOLO26 هي تكامله مع Ultralytics الذي يتم صيانته جيدًا. من تعليق البيانات إلى تتبع التجارب، توفر المنصة كل ما يحتاجه مهندس التعلم الآلي تحت سقف واحد موحد.

التنفيذ العملي: مثال على الكود

Ultralytics بسهولة الاستخدام الرائدة في المجال. بفضل Python البديهية، أصبح من السهل الترحيل من نموذج قديم مثل YOLOv8 إلى YOLO26 المتطور يتطلب تحديث سطر واحد فقط من التعليمات البرمجية.

فيما يلي مثال قابل للتشغيل بنسبة 100٪ يوضح كيفية التدريب والاستدلال باستخدام YOLO26:

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLO26 و YOLOv10 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLO26

YOLO26 هو خيار قوي لـ:

  • نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
  • بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

متى تختار YOLOv10

يوصى YOLOv10 في الحالات التالية:

  • detect في الوقت الفعلي خالٍ من NMS: التطبيقات التي تستفيد من detect الشامل دون التثبيط غير الأقصى، مما يقلل من تعقيد النشر.
  • مقايضات متوازنة بين السرعة والدقة: المشاريع التي تتطلب توازنًا قويًا بين سرعة الاستدلال ودقة الكشف عبر مقاييس النماذج المختلفة.
  • تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال المتوقعة حاسمة، مثل الروبوتات أو الأنظمة المستقلة.

الخلاصة

بينما YOLOv10 مساهمات كبيرة للمجتمع الأكاديمي من خلال إدخال نموذج NMS فإن YOLO26 يرفع هذه التكنولوجيا إلى مستوى الجاهزية على مستوى المؤسسات. بفضل زيادة CPU بنسبة 43٪، ومُحسِّن MuSGD المبتكر، وتعدد الاستخدامات الذي لا مثيل له في مهام الرؤية، يبرز YOLO26 كخيار مثالي لكل من الحوسبة المتطورة ونشر السحابة على نطاق واسع.

بالنسبة للفرق التي تعطي الأولوية للمجتمع النشط والوثائق الشاملة وتجربة المطورين السلسة، فإن Ultralytics لا مثيل له. إذا كنت تستكشف نماذج لسيناريوهات متخصصة، فقد ترغب أيضًا في استكشاف YOLO لاكتشاف المفردات المفتوحة بدون تدريب. ومع ذلك، بالنسبة للغالبية العظمى من حالات الاستخدام في العالم الحقيقي، فإن YOLO26 هو التوصية النهائية.


تعليقات