YOLO11 YOLO26: تطور الكشف عن الكائنات في الوقت الفعلي
يتغير مشهد الرؤية الحاسوبية باستمرار، حيث تدفع كل نسخة جديدة من النموذج حدود السرعة والدقة وسهولة الاستخدام. وهناك معلمان هامان في هذه الرحلة هما YOLO11 و YOLO26 الرائد. في حين أن YOLO11 معيارًا قويًا لنشره في المؤسسات في أواخر عام 2024، يمثل YOLO26 تحولًا جذريًا بفضل بنيته الأصلية الشاملة وتصميمه CPU.
يقدم هذا الدليل مقارنة تقنية شاملة لمساعدة المطورين والباحثين والمهندسين على اختيار الأداة المناسبة لتطبيقات الرؤية الحاسوبية الخاصة بهم.
ملخص تنفيذي: الاختلافات الرئيسية
على الرغم من أن كلا النموذجين مبنيان على المبادئ الأساسية لعائلة YOLO You Only Look Once)، إلا أنهما يختلفان بشكل كبير في فلسفتهما المعمارية.
- YOLO11: مصمم للتنوع وتكامل النظام البيئي. يعتمد على طرق المعالجة اللاحقة التقليدية مثل Non-Maximum Suppression (NMS) ولكنه يوفر إطار عمل مستقر للغاية ومدعوم جيدًا لمجموعة متنوعة من المهام.
- YOLO26: مصمم للحافة ومستقبلية. يقدم تصميمًا أصليًا شاملاً NMS مما يلغي خطوات المعالجة اللاحقة المعقدة. كما يتميز بمحسن MuSGD المبتكر ومصمم خصيصًا CPU ، مما يجعله أسرع بنسبة تصل إلى 43٪ على أجهزة مثل Raspberry Pi.
تحليل الأداء التفصيلي
غالبًا ما تُقاس الفجوة في الأداء بين الأجيال بالمللي ثانية ونقاط النسبة المئوية لمتوسط الدقة (mAP). يوضح الجدول أدناه التحسينات في السرعة والدقة. لاحظ الانخفاض الكبير في وقت CPU لـ YOLO26، وهو مقياس مهم لنشر الذكاء الاصطناعي المتطور.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
YOLO11: المعيار المتعدد الاستخدامات
YOLO11
المؤلفون: جلين جوشر وجينغ تشيو
المنظمة: Ultralytics
التاريخ: 2024-09-27
GitHub: Ultralytics
YOLO11 تحسينًا كبيرًا في YOLO حيث يركز على كفاءة استخراج الميزات. وقد تم تحسينه على YOLOv8 من خلال تحسين كتلة C3k2 وإدخال تحسينات SPPF.
نقاط القوة:
- متانة مثبتة: مستخدم على نطاق واسع في الصناعة، مع مكونات إضافية ودعم مجتمعي واسع النطاق.
- GPU : كفاءة عالية على NVIDIA (T4، A100) باستخدام TensorRT، مما يجعله ممتازًا للاستدلال القائم على السحابة.
- تنوع المهام: أداء قوي في الكشف والتقسيم وتقدير الوضع.
نقاط الضعف:
- NMS : يتطلب معالجة لاحقة لـ Non-Maximum Suppression، مما قد يؤدي إلى تباين في زمن الاستجابة وتعقيد عمليات النشر.
- FLOPs أعلى: تكلفة حسابية أعلى قليلاً من أحدث البنى.
YOLO26: المبتكر الرائد في مجال الحواف
YOLO26
المؤلفون: Glenn Jocher و Jing Qiu
المنظمة: Ultralytics
التاريخ: 2026-01-14
GitHub: Ultralytics
YOLO26 هي بنية مستقبلية تضع الكفاءة على الأجهزة التجارية في مقدمة أولوياتها. من خلال التخلص من الحاجة إلى NMS سين مجموعات CPU ، فإنها تطلق العنان للأداء في الوقت الفعلي على الأجهزة التي كانت تعتبر في السابق بطيئة جدًا بالنسبة للذكاء الاصطناعي الحديث.
الابتكارات الرئيسية:
- NMS من البداية إلى النهاية: من خلال التنبؤ بالمطابقات الفردية مباشرةً، يزيل YOLO26 NMS . وهذا يبسط عملية التصدير إلى ONNX أو CoreML .
- إزالة DFL: تعمل إزالة Distribution Focal Loss على تبسيط رأس الإخراج، مما يعزز التوافق مع الأجهزة الطرفية منخفضة الطاقة.
- MuSGD Optimizer: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (LLM) (وبالتحديد Kimi K2 من Moonshot AI)، يجمع هذا المحسن الهجين بين SGD مع Muon لتحقيق تقارب واستقرار أسرع.
- ProgLoss + STAL: وظائف الخسارة الجديدة تحسن من كشف الأجسام الصغيرة، وهو مطلب أساسي للتصوير الجوي والروبوتات.
نظرة معمارية متعمقة
التحول من YOLO11 YOLO26 لا يتعلق فقط بعدد المعلمات؛ إنه تغيير جوهري في كيفية تعلم النموذج وتوقعه.
منهجيات التدريب والكفاءة
إحدى الميزات البارزة Ultralytics هي كفاءة التدريب. يستفيد كلا النموذجين من Ultralytics المتكاملة، التي تتيح إدارة سلسة لمجموعات البيانات والتدريب السحابي.
ومع ذلك، يقدم YOLO26 مُحسّن MuSGD، الذي يُكيّف تحديثات الزخم للتعامل مع مشاهد الخسارة المعقدة لنماذج الرؤية بشكل أكثر فعالية من AdamW SGD القياسيين. وينتج عن ذلك نماذج تتقارب بشكل أسرع، مما يوفر ساعات GPU قيّمة ويقلل من البصمة الكربونية للتدريب.
بالإضافة إلى ذلك، يستخدم YOLO26 خسائر محسّنة خاصة بالمهام:
- التجزئة: تحسين خسارة التجزئة الدلالية ووحدات البروتو متعددة المقاييس.
- الوضع: تقدير احتمالية السجل المتبقية (RLE) لتحديد مواقع النقاط الرئيسية بدقة أكبر.
- OBB: زاوية متخصصة لحل حالات عدم الاستمرارية في الحدود في مهام Oriented Bounding Box.
متطلبات الذاكرة
تشتهرYOLO Ultralytics YOLO بانخفاض استهلاكها للذاكرة مقارنة بالبنى القائمة على المحولات مثل RT-DETR أو SAM .
تحسين الذاكرة
تم تصميم كل من YOLO11 YOLO26 للتدريب على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين (مثل NVIDIA 3060 أو 4070). على عكس نماذج المحولات الضخمة التي تتطلب ذاكرة VRAM بسعة 24 جيجابايت أو أكثر، يمكن في كثير من الأحيان ضبط YOLO الفعالة على أجهزة ذات ذاكرة VRAM بسعة 8 جيجابايت فقط باستخدام أحجام دفعات مناسبة.
حالات الاستخدام في العالم الحقيقي
غالبًا ما يعتمد الاختيار بين YOLO11 YOLO26 على أجهزة النشر الخاصة بك واحتياجات التطبيق المحددة.
السيناريوهات المثالية لـ YOLO11
- خدمات واجهة برمجة التطبيقات السحابية: حيث تتوفر وحدات معالجة رسومات قوية، ويكون الإنتاجية العالية (المعالجة المجمعة) أكثر أهمية من زمن استجابة الصورة الواحدة.
- التكاملات القديمة: الأنظمة التي تم إنشاؤها بالفعل حول خطوط الأنابيب NMS حيث لا يمكن تغيير منطق المعالجة اللاحقة.
- التحليلات العامة: خرائط الحرارة للبيع بالتجزئة أو عد العملاء حيث يتم استخدام GPU القياسية.
السيناريوهات المثالية لـ YOLO26
- أجهزة إنترنت الأشياء والأجهزة الطرفية: تشغيل خاصية الكشف عن الكائنات على Raspberry Pi أو NVIDIA Nano أو الهواتف المحمولة. إن CPU بنسبة 43% تعد تغييراً جذرياً في هذا المجال.
- الروبوتات: تباين زمن الاستجابة أمر قاتل بالنسبة لدورات التحكم. يضمن التصميم NMS أوقات استدلال حتمية، وهو أمر بالغ الأهمية للملاحة الذاتية.
- المسح الجوي: تعزز وظيفة ProgLoss بشكل كبير التعرف على الأجسام الصغيرة، مما يجعل YOLO26 متفوقة في تحليل لقطات الطائرات بدون طيار.
- الأنظمة المدمجة: أجهزة ذات قدرات حوسبة محدودة لا تستطيع تحمل عبء فرز آلاف الصناديق المرشحة أثناء NMS.
تنفيذ التعليمات البرمجية
يتمتع كلا النموذجين بنفس سهولة الاستخدام التي تميز Ultralytics . يتطلب التبديل من YOLO11 YOLO26 تغيير سلسلة النموذج فقط.
from ultralytics import YOLO
# Load the latest YOLO26 model (NMS-free, CPU optimized)
model = YOLO("yolo26n.pt")
# Run inference on a local image
results = model("path/to/image.jpg")
# Process results
for result in results:
result.show() # Display to screen
result.save(filename="result.jpg") # Save to disk
تضمن واجهة برمجة التطبيقات الموحدة هذه أن يتمكن المطورون من تجربة بنى مختلفة دون الحاجة إلى إعادة كتابة كامل قاعدة الكود الخاصة بهم.
الخلاصة
توضح كلتا البنيتين سبب Ultralytics الصدارة في مجال الرؤية الحاسوبية مفتوحة المصدر. YOLO11 حلًا ناضجًا ومتعدد الاستخدامات GPU ومثاليًا لمراكز بيانات المؤسسات. أما YOLO26، فهو يمثل مستقبل الذكاء الاصطناعي المتطور، حيث يوفر CPU فائق السرعة CPU وخط إنتاج مبسطًا من البداية إلى النهاية يزيل العقبات التقليدية.
بالنسبة لمعظم المشاريع الجديدة — خاصة تلك التي تتضمن نشر الحافة أو التطبيقات المحمولة أو الروبوتات — يُعدYOLO26 هو الخيار الموصى به نظرًا لنسبة السرعة إلى الدقة الفائقة والتصميم المعماري الحديث.
نماذج أخرى للاستكشاف
- YOLOv10: رائد النهج NMS في YOLO .
- RT-DETR: كاشف يعتمد على محول ويوفر دقة عالية في الحالات التي تكون فيها السرعة عاملاً ثانوياً.
- YOLOv8: كلاسيكي موثوق للغاية، لا يزال يستخدم على نطاق واسع لمكتبة موارده الواسعة.