YOLO26 مقابل YOLOv10: مقارنة نماذج اكتشاف الكائنات الشاملة (End-to-End)

يشهد مجال الرؤية الحاسوبية تطوراً مستمراً، مدفوعاً بالطلب على نماذج أسرع وأكثر دقة وكفاءة. يقدم هذا الدليل مقارنة تقنية شاملة بين بنِيَتَيْن رائدتَيْن في مجال اكتشاف الكائنات في الوقت الفعلي: YOLO26 و YOLOv10. من خلال تحليل بنيتهما ومقاييس الأداء وإمكانات النشر، نهدف إلى مساعدة المطورين والباحثين على اختيار النموذج الأمثل لتطبيقات الرؤية لديهم.

تطور البنى الخالية من NMS

لسنوات عديدة، اعتمدت عائلة YOLO (You Only Look Once) بشكل كبير على Non-Maximum Suppression (NMS) لتصفية صناديق الإحاطة الزائدة أثناء المعالجة اللاحقة. وعلى الرغم من فعاليتها، فإن NMS تقدم تأخيراً في الاستدلال وتُعقّد النشر على أجهزة الحافة مثل Raspberry Pi أو وحدات المعالجة العصبية المتخصصة (NPUs).

مثّل تقديم YOLOv10 تحولاً نموذجياً من خلال ريادة تصميم شامل (end-to-end) خالٍ من NMS. وبالبناء على هذا الاختراق الجوهري، قامت Ultralytics YOLO26 بتحسين البنية لبيئات الإنتاج، محققة كفاءة غير مسبوقة وسهولة في الاستخدام عبر مجموعة واسعة من المهام.

عنق زجاجة المعالجة اللاحقة

إن إزالة NMS تقضي على خطوة المعالجة اللاحقة الديناميكية المعتمدة على البيانات، والتي كانت تعيق تقليدياً تحسين نماذج الرؤية الحاسوبية على مسرعات الأجهزة مثل TensorRT و OpenVINO.

YOLOv10: ريادة الاكتشاف الخالي من NMS

التاريخ: 23-05-2024
المؤلفون: Ao Wang, Hui Chen, Lihao Liu, وآخرون.
المؤسسة: Tsinghua University
الموارد: ArXiv Paper | GitHub Repository

طوّر باحثون في جامعة تسينغوا نموذج YOLOv10، الذي قدّم استراتيجية تعيين مزدوج ثابتة للقضاء على الحاجة إلى NMS. ومن خلال توظيف تصميم نموذج شامل قائم على الكفاءة والدقة، تم تقليل التكرار الحسابي مع الحفاظ على مستوى عالٍ من mAP (mean Average Precision).

نقاط القوة:

  • بنية خالية من NMS: الرائد الأصلي لتصميم الخلو من NMS في سلسلة YOLO، مما يقلل التأخير بشكل كبير للتطبيقات ذات الوقت الفعلي.
  • الكفاءة: يوفر توازناً قوياً بين عدد المعلمات وسرعة الاستدلال مقارنة بنماذج الجيل السابق.

نقاط الضعف:

  • دعم محدود للمهام: يركز بشكل أساسي على اكتشاف الكائنات القياسي، ويفتقر إلى دعم أصلي جاهز للمهام المتقدمة مثل التقسيم (segmentation) أو تقدير الوضع (pose estimation).
  • تركيز أكاديمي: قاعدة الكود، رغم متانتها، تميل نحو البحث أكثر من كونها جاهزة لنشر الإنتاج على مستوى المؤسسات.

اعرف المزيد عن YOLOv10

YOLO26: المعيار الجديد للحافة والسحابة

التاريخ: 14-01-2026
المؤلفون: Glenn Jocher و Jing Qiu
المؤسسة: Ultralytics
الموارد: GitHub Repository | Ultralytics Platform

تم إطلاق YOLO26 كخليفة لـ YOLO11، وهو يرتقي بمفهوم الخلو من NMS إلى أقصى درجات تحققه. فهو يدمج أصلياً الاكتشاف الشامل في Ultralytics Platform المحسنة للغاية، مما يوفر مجموعة كاملة من الأدوات لخط أنابيب التعلم الآلي الحديث.

يقدم YOLO26 العديد من الاختراقات المعمارية:

  • إزالة DFL: تمت إزالة Distribution Focal Loss بالكامل. وهذا يبسط عملية تصدير النموذج بشكل كبير ويحسن التوافق مع أجهزة الحافة والأجهزة منخفضة الطاقة.
  • سرعة استدلال على CPU تصل إلى 43%: بفضل إزالة DFL والتحسينات الهيكلية، أصبح YOLO26 أسرع بشكل ملحوظ على وحدات المعالجة المركزية (CPUs)، مما يجعله مثالياً لعمليات نشر إنترنت الأشياء (IoT) والأجهزة المحمولة.
  • محسن MuSGD: مستوحى من تقنيات تدريب النماذج اللغوية الكبيرة (LLM) (مثل Kimi K2 من Moonshot AI)، يستخدم YOLO26 مزيجاً هجيناً من SGD و Muon. وهذا يجلب استقراراً لا مثيل له في التدريب وتقارباً أسرع في الرؤية الحاسوبية.
  • ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية لـ الصور الجوية و المراقبة الأمنية القائمة على الطائرات بدون طيار.
  • تحسينات خاصة بالمهام: YOLO26 ليس مجرد كاشف. فهو يتميز بخسارة التقسيم الدلالي (Semantic Segmentation) و multi-scale proto لـ التقسيم، و Residual Log-Likelihood Estimation (RLE) لـ تقدير الوضع، وخسارة الزاوية المتخصصة لـ Oriented Bounding Boxes (OBB).

اعرف المزيد عن YOLO26

تحليل الأداء والمقاييس

يقارن الجدول التالي أداء اكتشاف COCO لنماذج YOLO26 و YOLOv10. لاحظ كيف يحقق YOLO26 دقة فائقة مع الحفاظ على كفاءة استثنائية في المعلمات.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

ميزة Ultralytics: كفاءة التدريب والذاكرة

When deploying models into production, memory requirements and training efficiency are just as crucial as inference speed. Ultralytics models, particularly YOLO26, are highly optimized to reduce CUDA memory usage during training. This allows developers to use larger batch sizes on consumer-grade GPUs, drastically cutting down training time and computational costs. Conversely, complex architectures or heavy transformer models like RT-DETR often require expensive, high-end hardware to train effectively.

التكامل المستمر والنظام البيئي

من أكبر فوائد اختيار YOLO26 هو تكامله مع نظام Ultralytics الذي يحظى بصيانة جيدة. فمن تسمية البيانات إلى تتبع التجارب، توفر المنصة كل ما يحتاجه مهندس التعلم الآلي تحت سقف واحد موحد.

التنفيذ العملي: مثال برمجي

العلامة المميزة لـ Ultralytics هي سهولة الاستخدام الرائدة في الصناعة. بفضل واجهة برمجة تطبيقات Python بديهية، يتطلب الانتقال من نموذج قديم مثل YOLOv8 إلى YOLO26 المتطور تحديث سطر واحد فقط من الكود.

إليك مثال قابل للتشغيل بنسبة 100% يوضح كيفية التدريب والاستدلال باستخدام YOLO26:

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLO26 و YOLOv10 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLO26

يعتبر YOLO26 خياراً قوياً لـ:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

متى تختار YOLOv10

يُنصح بـ YOLOv10 لـ:

  • اكتشاف الوقت الفعلي الخالي من NMS: التطبيقات التي تستفيد من الاكتشاف الشامل دون Non-Maximum Suppression، مما يقلل من تعقيد النشر.
  • موازنة مقايضات السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الاكتشاف عبر مختلف مقاييس النماذج.
  • Consistent-Latency Applications: Deployment scenarios where predictable inference times are critical, such as robotics or autonomous systems.

خاتمة

بينما قدم YOLOv10 مساهمات كبيرة للمجتمع الأكاديمي من خلال تقديم نموذج الخلو من NMS، فإن YOLO26 يرتقي بهذه التكنولوجيا إلى مستوى جاهزية المؤسسات. بفضل زيادته الملحوظة بنسبة 43% في سرعة CPU، ومحسن MuSGD المبتكر، وتعدد الاستخدامات الذي لا مثيل له عبر مهام الرؤية، يبرز YOLO26 كخيار نهائي لكل من حوسبة الحافة وعمليات النشر السحابية واسعة النطاق.

للفرق التي تعطي الأولوية لمجتمع نشط، وتوثيق شامل، وتجربة مطور سلسة، فإن نظام Ultralytics لا مثيل له. إذا كنت تستكشف نماذج لسيناريوهات متخصصة، فقد ترغب أيضاً في التحقق من YOLO-World للاكتشاف بدون تدريب مسبق (zero-shot). ومع ذلك، بالنسبة للغالبية العظمى من حالات الاستخدام الواقعية، YOLO26 هو التوصية النهائية.

تعليقات