تخطي إلى المحتوى

YOLO26 مقابل YOLO11: مقارنة فنية لمهندسي رؤية الكمبيوتر

يتطور مشهد اكتشاف الكائنات في الوقت الفعلي ورؤية الكمبيوتر بسرعة مستمرة. تبقى Ultralytics في طليعة هذا التطور، دافعةً باستمرار حدود السرعة والدقة وسهولة الاستخدام. تتعمق هذه المقارنة الفنية في التطورات المعمارية ومقاييس الأداء وحالات الاستخدام المثالية لـ YOLO26 وYOLO11، لمساعدة المطورين والباحثين في اختيار النموذج الأمثل لاحتياجات النشر الخاصة بهم.

ملخص تنفيذي

YOLO26، الذي صدر في يناير 2026، يمثل أحدث ما توصلت إليه التكنولوجيا (SOTA) في عائلة YOLO. إنه يقدم بنية شاملة (NMS-free) بشكل أصلي، مبسطة للنشر على الأجهزة الطرفية ومحسّنة لأداء الـ CPU. بينما يظل YOLO11، سلفه من سبتمبر 2024، خيارًا قويًا ومتينًا، إلا أن YOLO26 يتفوق عليه في سرعة الاستدلال (inference)، خاصة على الأجهزة غير المزودة بـ GPU، وفي بساطة البنية.

بالنسبة لمعظم المشاريع الجديدة، يُعد YOLO26 الخيار الموصى به نظرًا لموازنته المتفوقة بين السرعة والدقة ومسار النشر المبسّط.

التطور المعماري

يتضمن الانتقال من YOLO11 إلى YOLO26 تغييرات هيكلية كبيرة تهدف إلى تقليل زمن الاستجابة والتعقيد مع الحفاظ على دقة عالية.

YOLO26: مبسط وشامل (End-to-End)

يمثل YOLO26 تحولًا نموذجيًا من خلال اعتماد تصميم شامل (end-to-end) بشكل أصلي. على عكس نماذج YOLO التقليدية التي تعتمد على Non-Maximum Suppression (NMS) لتصفية الصناديق المحيطة المتداخلة، يلغي YOLO26 هذه الخطوة تمامًا. هذا الإنجاز، الذي كان رائدًا لأول مرة في YOLOv10، يبسط مسار النشر ويقلل من زمن استجابة الاستدلال (inference latency)، مما يجعله مفيدًا بشكل خاص لـ التطبيقات في الوقت الفعلي.

تشمل الابتكارات المعمارية الرئيسية في YOLO26 ما يلي:

  • إزالة DFL: تمت إزالة وحدة Distribution Focal Loss (DFL). يعزز هذا التبسيط التوافق مع الأجهزة الطرفية ويسرع التصدير إلى تنسيقات مثل ONNX وTensorRT عن طريق إزالة العمليات الرياضية المعقدة التي يمكن أن تعيق المعالجات منخفضة الطاقة.
  • مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (LLM)، يستخدم YOLO26 مُحسِّنًا هجينًا يجمع بين SGD وMuon (من Kimi K2 لـ Moonshot AI). يؤدي هذا إلى ديناميكيات تدريب أكثر استقرارًا وتقارب أسرع.
  • ProgLoss + STAL: يعمل كل من موازنة الفقدان التدريجي (ProgLoss) وتخصيص التسميات المدرك للأهداف الصغيرة (STAL) على تحسين الأداء بشكل كبير على الكائنات الصغيرة، وهو عامل حاسم لصور الطائرات بدون طيار والاستشعار عن بعد.

تعرف على المزيد حول YOLO26

YOLO11: السلف القوي

يعتمد YOLO11 على كتلة C3k2 ووحدات SPPF (تجميع الهرم المكاني - السريع) لتقديم كفاءة عالية. ويستخدم كتلة C2PSA محسّنة مع آليات الانتباه لتعزيز استخلاص الميزات. وعلى الرغم من فعاليته العالية، فإن اعتماده على معالجة NMS اللاحقة يضيف عبئاً حسابياً طفيفاً أثناء الاستدلال مقارنةً بنهج YOLO26 الشامل.

تعرف على المزيد حول YOLO11

لماذا يعتبر النهج الشامل مهماً

يعني إزالة NMS في YOLO26 أن مخرجات النموذج تتطلب قدراً أقل من تعليمات برمجية ما بعد المعالجة. وهذا يقلل من مخاطر أخطاء النشر ويضمن زمن استجابة ثابتاً، حيث لا يتقلب وقت الاستدلال بناءً على عدد الكائنات المكتشفة.

معايير الأداء

يوضح الجدول التالي اختلافات الأداء بين النموذجين على مجموعة بيانات COCO. يُظهر YOLO26 مزايا واضحة في كل من الدقة (mAP) وسرعة الاستدلال على CPU.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

تحليل المقاييس

  1. سرعة الاستدلال على CPU: يُعد YOLO26n أسرع بنسبة 43% تقريباً على CPU مقارنةً بـ YOLO11n (38.9 مللي ثانية مقابل 56.1 مللي ثانية). وهذا يجعل YOLO26 الخيار الأمثل لعمليات النشر على Raspberry Pi والأجهزة المحمولة ووحدات CPUs القياسية.
  2. الدقة (mAP): عبر جميع المقاييس، يحقق YOLO26 باستمرار متوسط دقة أعلى (Mean Average Precision). يشهد نموذج 'nano' قفزة كبيرة من 39.5 إلى 40.9 mAP، مما يوفر جودة كشف أفضل بسرعات أعلى.
  3. كفاءة النموذج: يتطلب YOLO26 عادةً عدداً أقل من المعلمات وعمليات FLOPs للحصول على أداء أفضل، مما يوضح مكاسب الكفاءة الناتجة عن التقليم المعماري وإزالة رأس DFL.

التدريب والتحسين

يستفيد كلا النموذجين من نظام Ultralytics البيئي القوي، مما يجعل التدريب متاحاً وفعالاً.

  • سهولة الاستخدام: يتشارك كل من YOLO26 وYOLO11 نفس واجهة برمجة تطبيقات Python الموحدة و واجهة CLI. التبديل بينهما بسيط مثل تغيير سلسلة النموذج من yolo11n.pt إلى yolo26n.pt.
  • كفاءة التدريب: يساعد مُحسِّن MuSGD الخاص بـ YOLO26 على استقرار عمليات التدريب، مما قد يقلل من عدد الحقب اللازمة للوصول إلى التقارب. وهذا يوفر في تكاليف الحوسبة والوقت، خاصة لمجموعات البيانات الكبيرة مثل ImageNet.
  • متطلبات الذاكرة: تشتهر نماذج Ultralytics ببصمتها المنخفضة للذاكرة مقارنة بالبدائل القائمة على المحولات. يعمل YOLO26 على تحسين ذلك بشكل أكبر عن طريق إزالة عمليات حساب الرأس الزائدة، مما يسمح بأحجام دفعات أكبر على وحدات GPUs ذات الفئة الاستهلاكية.

مثال تدريبي

إليك كيفية تدريب أحدث نموذج YOLO26 باستخدام حزمة Ultralytics Python:

from ultralytics import YOLO

# Load the YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

تعدد استخدامات المهام وحالات الاستخدام

تدعم كلتا عائلتي النماذج مجموعة واسعة من مهام رؤية الكمبيوتر، بما في ذلك الكشف، التجزئة، التصنيف، تقدير الوضعيات، والكشف عن الكائنات الموجهة (obb).

حالات الاستخدام المثالية لـ YOLO26

  • الحوسبة الطرفية: مع سرعات CPU أسرع بنسبة تصل إلى 43%، يُعد YOLO26 مثالياً لـأجهزة إنترنت الأشياء، والكاميرات الذكية، وتطبيقات الهاتف المحمول حيث لا تتوفر موارد GPU.
  • الكشف عن الكائنات الصغيرة: بفضل ProgLoss وSTAL، يتفوق YOLO26 في سيناريوهات مثل المراقبة الجوية، فحص الجودة، والتصوير الطبي حيث يُعد الكشف عن التفاصيل الدقيقة أمراً بالغ الأهمية.
  • الروبوتات في الوقت الفعلي: يضمن التصميم الخالي من NMS زمن استجابة محدداً، وهو أمر بالغ الأهمية لحلقات التحكم في الملاحة الذاتية والمناورة الروبوتية.

حالات الاستخدام المثالية لـ YOLO11

  • الأنظمة القديمة: لسير العمل المحسّن بالفعل لمعماريات YOLO11 أو حيث تكون خطوط أنابيب ما بعد المعالجة محددة مسبقاً حول مخرجات NMS، يظل YOLO11 خياراً مستقراً ومدعوماً.
  • الاستدلال العام على GPU: على وحدات GPUs القوية في مراكز البيانات (مثل T4)، يقدم YOLO11 أداءً تنافسياً، مما يجعله مناسباً للمعالجة الدفعية من جانب الخادم حيث يكون زمن استجابة CPU أقل أهمية.

النظام الإيكولوجي والدعم

إحدى أقوى مزايا استخدام نماذج Ultralytics هي النظام البيئي المحيط بها. تم دمج كل من YOLO26 وYOLO11 بالكامل في منصة Ultralytics، مما يتيح إدارة النماذج وتصورها ونشرها بسلاسة.

  • الوثائق: تغطي الأدلة الشاملة كل شيء بدءاً من تسمية البيانات وحتى تصدير النموذج.
  • المجتمع: يضمن مجتمع نابض بالحياة على GitHub وDiscord حصول المطورين على الدعم والمعرفة المشتركة.
  • التكاملات: يدعم كلا النموذجين التصدير السهل إلى تنسيقات مثل ONNX وOpenVINO وTensorRT، مما يسهل النشر عبر بيئات الأجهزة المتنوعة.

الخلاصة

بينما يظل YOLO11 نموذجًا عالي الكفاءة، يمثل YOLO26 قفزة نوعية كبيرة في الكفاءة والبساطة المعمارية. إن تصميمه الشامل (من البداية إلى النهاية)، وتقليل زمن الاستجابة لوحدة المعالجة المركزية (CPU)، والدقة المحسنة على الكائنات الصغيرة، يجعله الخيار الأمثل لتطبيقات الرؤية الحاسوبية الحديثة. سواء كنت تقوم بالنشر على الأجهزة الطرفية أو التدريب على السحابة، يقدم YOLO26 أفضل توازن بين الأداء وسهولة الاستخدام المتاح اليوم.

تفاصيل النموذج

YOLO26 المؤلف: Glenn Jocher و Jing Qiu
المنظمة: Ultralytics
التاريخ: 2026-01-14
GitHub | الوثائق

YOLO11 المؤلف: Glenn Jocher و Jing Qiu
المنظمة: Ultralytics
التاريخ: 2024-09-27
GitHub | الوثائق

قد يستكشف المطورون الباحثون عن خيارات أخرى أيضًا YOLOv10 للمفاهيم الشاملة (من البداية إلى النهاية) السابقة أو YOLO-World لمهام الكشف ذات المفردات المفتوحة.


تعليقات