YOLO26 مقابل YOLOv5: مقارنة بين البنية والسرعة وحالات الاستخدام
لقد كان تطور نماذج اكتشاف الكائنات سريعًا وتحويليًا. في هذه المقارنة، نستكشف الخصائص المميزة لـ Ultralytics YOLO26 و Ultralytics YOLOv5، وندرس كيف شكلت التطورات في البنية ومنهجيات التدريب قدراتهما. بينما يظل YOLOv5 ركيزة أساسية في مجتمع رؤية الكمبيوتر، يقدم YOLO26 الذي تم إصداره حديثًا كفاءات رائدة مصممة للنشر على الحافة من الجيل التالي والاستدلال عالي السرعة.
نظرة عامة على النموذج
يمثل كلا النموذجين معالم مهمة في تاريخ بنية YOLO (You Only Look Once). يتشاركان الالتزام بالأداء في الوقت الفعلي وسهولة الاستخدام، ومع ذلك فإنهما يخدمان حقبتين مختلفتين قليلاً من تطوير الذكاء الاصطناعي.
Ultralytics YOLO26
YOLO26 هو أحدث إصدار من Ultralytics، تم إطلاقه في يناير 2026. يمثل تحولًا نحو البنى الشاملة (end-to-end) الأصلية التي تلغي الحاجة إلى المعالجة اللاحقة لقمع الحد الأقصى غير الأقصى (NMS). صُمم مع مراعاة الحوسبة الطرفية، فهو يبسط النشر مع دفع حدود الدقة.
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2026-01-14
- الوثائق:وثائق YOLO26
- الابتكار الرئيسي: اكتشاف شامل خالٍ من NMS، وإزالة DFL، ومُحسِّن MuSGD.
Ultralytics YOLOv5
YOLOv5 تم إصداره في منتصف عام 2020 وسرعان ما أصبح المعيار الصناعي لتوازنه بين السرعة والدقة والهندسة سهلة الاستخدام. لقد قدم نظام PyTorch البيئي لملايين المطورين ولا يزال يستخدم على نطاق واسع في بيئات الإنتاج حيث تعتبر الاستقرار ودعم الأنظمة القديمة أمرًا بالغ الأهمية.
- المؤلف: جلين جوتشر
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- الوثائق:وثائق YOLOv5
- الابتكار الرئيسي: تطبيق PyTorch سهل الاستخدام، وتكبير الفسيفساء (mosaic augmentation)، وآليات التثبيت التلقائي (auto-anchor).
الاختلافات المعمارية
يتضمن الانتقال من YOLOv5 إلى YOLO26 تغييرات جوهرية في كيفية اكتشاف الكائنات وكيفية تحسين النموذج أثناء التدريب.
من البداية إلى النهاية مقابل المعالجة اللاحقة
يعتمد YOLOv5 على قمع الحد الأقصى غير الأقصى (NMS) لتصفية مربعات الإحاطة المكررة. على الرغم من فعاليته، فإن NMS هو عملية استدلالية يمكن أن تشكل عنق زجاجة أثناء الاستدلال، خاصة على الأجهزة الطرفية ذات دورات CPU المحدودة. إنه يقدم معلمات فائقة مثل عتبات IoU التي يجب ضبطها لمجموعات بيانات محددة.
على النقيض، YOLO26 شامل بطبيعته (end-to-end). من خلال تبني تصميم تم ابتكاره لأول مرة في YOLOv10، يتنبأ YOLO26 بالمجموعة الدقيقة من الكائنات مباشرة من مخرجات الشبكة دون الحاجة إلى NMS. وهذا يبسط مسار النشر بشكل كبير، حيث أن مخرجات النموذج هي النتيجة النهائية.
بساطة النشر
تعني إزالة NMS في YOLO26 أنك لم تعد بحاجة إلى تجميع خطوات معالجة لاحقة معقدة عند التصدير إلى تنسيقات مثل CoreML أو TensorRT. مخرجات النموذج الخام جاهزة للاستخدام، مما يقلل من زمن الاستجابة وتعقيد التكامل.
دوال الخسارة والتحسين
يقدم YOLO26 ProgLoss (موازنة الخسارة التدريجية) و STAL (تخصيص التسميات الواعي للأهداف الصغيرة). تستهدف هذه الابتكارات على وجه التحديد نقاط الضعف الشائعة في اكتشاف الكائنات، مثل صعوبة اكتشاف الكائنات الصغيرة في الصور الجوية أو المشاهد المزدحمة. يقوم ProgLoss بضبط وزن مكونات الخسارة المختلفة ديناميكيًا أثناء التدريب لتحقيق استقرار التقارب.
علاوة على ذلك، يستخدم YOLO26 مُحسِّن MuSGD، وهو مزيج من SGD ومُحسِّن Muon المستوحى من تقنيات تدريب نماذج اللغة الكبيرة (LLM). وهذا يجلب استقرار تدريب LLM إلى رؤية الكمبيوتر، مما يؤدي إلى تقارب أسرع وأوزان أكثر قوة.
بنية رأس مبسطة
تغيير رئيسي في YOLO26 هو إزالة Distribution Focal Loss (DFL). بينما ساعد DFL في دقة المربعات في الإصدارات السابقة مثل YOLOv8، فقد أضاف عبئًا حسابيًا وتعقيدًا أثناء التصدير. من خلال تحسين خسارة الانحدار، يحقق YOLO26 دقة عالية بدون DFL، مما يجعله أسرع بنسبة تصل إلى 43% على وحدات CPU مقارنة بالأجيال السابقة، وهو مقياس حاسم لتطبيقات الذكاء الاصطناعي الطرفي.
مقارنة مقاييس الأداء
يقارن الجدول التالي أداء YOLO26 و YOLOv5 على مجموعة بيانات COCO. يُظهر YOLO26 مكاسب كبيرة في كل من الدقة (mAP) وسرعة الاستدلال، خاصة على أجهزة CPU حيث تتألق تحسيناته المعمارية.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
النقاط الرئيسية
- قفزة في الدقة: يحقق YOLO26n (Nano) قيمة 40.9 mAP، متفوقًا بشكل كبير على YOLOv5n الذي يحقق 28.0 mAP. يتيح ذلك للمستخدمين نشر نماذج أصغر دون التضحية بجودة الاكتشاف.
- كفاءة CPU: تؤدي التبسيطات المعمارية في YOLO26 إلى استدلال أسرع بكثير على CPU. على سبيل المثال، يعمل YOLO26n بسرعة ~39 مللي ثانية على CPU، مقارنة بـ ~74 مللي ثانية لـ YOLOv5n، مما يجعله مثاليًا لعمليات النشر على Raspberry Pi أو الأجهزة المحمولة.
- كفاءة المعلمات: يحقق YOLO26 دقة أعلى بعدد أقل من المعلمات في العديد من الحالات (على سبيل المثال، يحتوي YOLO26l على 24.8 مليون معلمة مقابل 53.2 مليون معلمة في YOLOv5l)، مما يقلل من استهلاك الذاكرة أثناء التدريب والاستدلال.
التدريب والنظام البيئي
يستفيد كلا النموذجين من نظام Ultralytics البيئي القوي، لكن YOLO26 يستفيد من أدوات أحدث وتكاملات أعمق.
سهولة الاستخدام و API
يستخدم كلا النموذجين حزمة ultralytics python الموحدة (كان YOLOv5 في الأصل مستقلاً ولكنه الآن مدمج). وهذا يضمن أن التبديل بينهما بسيط مثل تغيير سلسلة اسم النموذج.
from ultralytics import YOLO
# Load YOLO26 for state-of-the-art performance
model_26 = YOLO("yolo26n.pt")
model_26.train(data="coco8.yaml", epochs=100)
# Load YOLOv5 for legacy comparison
model_v5 = YOLO("yolov5nu.pt")
model_v5.train(data="coco8.yaml", epochs=100)
ميزات التدريب المتقدمة
يدعم YOLO26 استراتيجيات توسيع البيانات المحسّنة والمُحسِّن الجديد MuSGD، الذي يساعد في الهروب من النهايات الصغرى المحلية بشكل أكثر فعالية من SGD القياسي المستخدم في YOLOv5. بالإضافة إلى ذلك، يقدم YOLO26 تحسينات خاصة بالمهام، مثل تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لـ تقدير الوضعيات وخسائر الزاوية المتخصصة لمهام صندوق الإحاطة الموجه (OBB)، وهي ميزات كانت إما غائبة أو أقل تطوراً في عصر YOLOv5.
يمكن للمستخدمين أيضاً الاستفادة من منصة Ultralytics لإدارة مجموعات البيانات، وتدريب النماذج في السحابة، والنشر إلى نقاط نهاية مختلفة بسلاسة.
حالات الاستخدام المثالية
متى تختار YOLO26
يُعد YOLO26 الخيار الموصى به لجميع المشاريع الجديدة تقريباً نظراً لنسبة الدقة إلى زمن الاستجابة المتفوقة.
- الذكاء الاصطناعي الحافي وإنترنت الأشياء: مع إزالة DFL والاستدلال الخالي من NMS، يُعد YOLO26 مثالياً للأجهزة مثل NVIDIA Jetson، و Raspberry Pi، أو الهواتف المحمولة حيث تكون كفاءة CPU/NPU حاسمة.
- اكتشاف الأجسام الصغيرة: بفضل STAL، يتفوق YOLO26 في سيناريوهات مثل صور الطائرات بدون طيار أو اكتشاف العيوب في التصنيع، حيث تكون الأهداف غالباً صغيرة جداً مقارنة بحجم الصورة.
- تحليلات الفيديو في الوقت الفعلي: تسمح تحسينات السرعة بمعالجة معدلات إطارات أعلى، وهو أمر ضروري لـ مراقبة حركة المرور أو تحليلات الرياضة.
متى تختار YOLOv5
على الرغم من كونه أقدم، لا يزال لـ YOLOv5 مكانته الخاصة:
- الأنظمة القديمة: قد تجد خطوط الأنابيب الحالية المبنية بشكل صارم حول هيكل مستودع YOLOv5 من عصر 2020 أنه من الأسهل الحفاظ على النموذج الأقدم بدلاً من الترحيل.
- أوسع دعم للأجهزة: لكونه أقدم، تم نقل YOLOv5 إلى كل منصة يمكن تصورها تقريباً، بما في ذلك وحدات التحكم الدقيقة الغامضة جداً التي قد لا يكون لديها دعم محسن للهياكل الأحدث بعد.
الخلاصة
بينما أرسى YOLOv5 الأساس لاكتشاف الأجسام الحديث بفضل سهولة الوصول إليه وموثوقيته، يمثل YOLO26 قفزة كبيرة إلى الأمام. من خلال تبني تصميم خالٍ من NMS من البداية إلى النهاية، وتحسينه لأجهزة الحافة، ودمج تقنيات تدريب متقدمة مثل MuSGD و ProgLoss، يقدم YOLO26 ترقية مقنعة للمطورين الذين يسعون للحصول على أفضل أداء.
بالنسبة لمعظم المستخدمين، الخيار واضح: يوفر YOLO26 السرعة والدقة والتنوع اللازمين لتطبيقات رؤية الكمبيوتر المتطلبة اليوم.
استكشف نماذج أخرى
إذا كنت مهتماً باستكشاف معماريات أخرى، فراجع YOLO11، السلف المباشر لـ YOLO26، أو YOLO-World لقدرات اكتشاف المفردات المفتوحة.