YOLO26 مقابل YOLOv5: قفزة جيلية في اكتشاف الكائنات
لقد تحدد تطور الرؤية الحاسوبية بالسعي الحثيث نحو السرعة والدقة وسهولة الوصول. يُعد اختيار البنية الصحيحة أمراً حاسماً لنجاح أي مشروع في مجال الذكاء الاصطناعي. في هذا الدليل الشامل، نقارن بين إصدارين عظيمين من Ultralytics: YOLOv5 الرائد و YOLO26 المبتكر. وبينما كان لكليهما تأثير كبير على مشهد اكتشاف الكائنات في الوقت الفعلي، فإن تقنياتهما الأساسية تعكس تحولاً جذرياً في كيفية معالجة الشبكات العصبية للبيانات المرئية.
نظرة عامة على النموذج
قبل الغوص في التفاصيل المعمارية، دعونا نضع التفاصيل الأساسية لكلا النموذجين.
تفاصيل YOLO26:
- المؤلفون: Glenn Jocher و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 2026-01-14
- GitHub: https://github.com/ultralytics/ultralytics
- التوثيق: توثيق YOLO26
تفاصيل YOLOv5:
- المؤلفون: Glenn Jocher
- المنظمة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- التوثيق: توثيق YOLOv5
الابتكارات المعمارية
تمثل الفجوة التي تبلغ ست سنوات بين YOLOv5 و YOLO26 قفزة هائلة في أبحاث التعلم العميق. لقد ساهم YOLOv5 في نشر الاستخدام الواسع لـ PyTorch لنماذج الرؤية، مقدماً آلية اكتشاف محسنة للغاية تعتمد على الارتكاز (anchor-based) وأصبحت معيار الصناعة. ومع ذلك، فقد اعتمد بشكل كبير على Non-Maximum Suppression (NMS) أثناء المعالجة اللاحقة، مما قد يسبب اختناقات في وقت الاستجابة على الأجهزة ذات الموارد المحدودة.
يعيد YOLO26 تصور مسار الاستدلال بالكامل من خلال تصميم خالي من NMS من الطرف إلى الطرف. ومن خلال التخلص من الحاجة إلى معالجة NMS اللاحقة، يوفر YOLO26 منطق نشر أسرع وأبسط بكثير، وهو مفهوم تم تقديمه لأول مرة في YOLOv10 ولكن تم إتقانه هنا. علاوة على ذلك، يتميز YOLO26 بخاصية إزالة DFL (توزيع خسارة التركيز)، مما يبسط رأس المخرجات بشكل كبير. وهذا يجعل تصدير النموذج إلى تنسيقات مثل ONNX و TensorRT سلسًا للغاية، مما يضمن توافقاً ممتازاً مع الأجهزة الطرفية والأجهزة منخفضة الطاقة.
أثناء التدريب، يستخدم YOLO26 مُحسِّن MuSGD المتطور، وهو مزيج من SGD و Muon مستوحى من Moonshot AI's Kimi K2. يجلب هذا ابتكارات تدريب النماذج اللغوية الكبيرة (LLM) إلى مجال الرؤية الحاسوبية، مما يضمن تدريباً مستقراً للغاية وتقارباً أسرع بكثير مقارنة بمُحسِّنات SGD أو AdamW التقليدية المستخدمة في YOLOv5.
الأداء والمقاييس
عند تقييم النماذج، فإن التوازن بين mean Average Precision (mAP) وسرعة الاستدلال يحدد الجدوى في العالم الحقيقي. تم تحسين YOLO26 محلياً لكل من وحدات معالجة الرسومات (GPUs) عالية الأداء ووحدات المعالجة المركزية (CPUs) الطرفية.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
تكشف المعايير عن تحسن مذهل. على سبيل المثال، يحقق YOLO26n قيمة mAP تبلغ 40.9 مقارنة بـ 28.0 لـ YOLOv5n، بينما يوفر في الوقت نفسه استدلالاً أسرع بـ 43% على وحدة المعالجة المركزية. وهذا يجعل YOLO26 متفوقاً بشكل كبير لعمليات النشر المضمنة مثل Raspberry Pi أو الأجهزة المحمولة. وبينما يتمتع YOLOv5 بتفوق طفيف في سرعة TensorRT GPU على نطاق Nano، فإن المقايضة في الدقة تميل بقوة لصالح YOLO26.
نظام التدريب وسهولة الاستخدام
يستفيد كلا النموذجين بشكل كبير من نظام Ultralytics المدار جيداً. إنها توفر تجربة "من الصفر إلى الاحتراف" مع واجهة برمجة تطبيقات Python مبسطة، وتوثيق شامل، ودعم مجتمعي نشط. ومع ذلك، يرتقي YOLO26 بكفاءة التدريب إلى مستوى جديد.
تتطلب نماذج Ultralytics باستمرار ذاكرة CUDA أقل بكثير أثناء التدريب مقارنة بالبدائل المعتمدة بكثافة على المحولات (transformer). يعزز YOLO26 ذلك من خلال دوال الخسارة ProgLoss + STAL. تحقق هذه التطورات تحسينات ملحوظة في التعرف على الكائنات الصغيرة دون زيادة العبء على الذاكرة.
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Train the model with the MuSGD optimizer (default for YOLO26)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Run fast, NMS-free inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()يسمح هذا البرنامج النصي البسيط للمطورين بالتكرار بسرعة على مجموعات بيانات مخصصة، والانتقال بسلاسة من استيعاب البيانات إلى نموذج جاهز للإنتاج.
باستخدام منصة Ultralytics، يمكنك تصدير نماذج YOLO26 المدربة تلقائياً إلى تنسيقات مثل CoreML أو TensorFlow Lite دون كتابة سطر واحد من كود التحويل.
تعدد الاستخدامات وحالات الاستخدام المثالية
متى تستخدم YOLOv5
يظل YOLOv5 خياراً موثوقاً للأنظمة القديمة. إذا كان لديك مسار عمل صناعي حالي مرتبط بشدة بالمخرجات القائمة على الارتكاز، أو إذا كنت تقوم بتشغيل الاستدلال على أجهزة NVIDIA Jetson قديمة ذات مجموعات TensorRT ثابتة وناضجة، فإن YOLOv5 يوفر حلاً مستقراً وموثقاً للغاية.
متى تستخدم YOLO26
يعد YOLO26 الخيار النهائي لمشاريع الرؤية الحاسوبية الحديثة. تعدد استخداماته يتفوق بكثير على سابقه. بينما يركز YOLOv5 بشكل أساسي على الاكتشاف (مع إضافات تجزئة لاحقة)، يوفر YOLO26 دعماً أصلياً وعميقاً لـ تجزئة الكائنات، و تقدير الوضعية، و تصنيف الصور، و صناديق التحديد الموجهة (OBB).
يقدم YOLO26 تحسينات خاصة بالمهمة، مثل خسارة تجزئة دلالية متخصصة، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) للنقاط الرئيسية للوضعية فائقة الدقة، وخسارة زاوية متقدمة لـ OBB لحل مشاكل الحدود الصعبة.
- إنترنت الأشياء الطرفي والروبوتات: تجعل البنية الخالية من NMS والاستدلال الأسرع بـ 43% على وحدة المعالجة المركزية YOLO26 مثالياً للملاحة الروبوتية في الوقت الفعلي وكاميرات المنازل الذكية.
- الصور الجوية: تجعل تحسينات ProgLoss + STAL اكتشاف الكائنات الصغيرة من الطائرات بدون طيار—مثل المركبات في مواقف السيارات أو المحاصيل في الحقول الزراعية—أكثر موثوقية بشكل كبير.
- تحليلات الفيديو في الوقت الفعلي: سواء كنت تتبع الرياضيين في البث الرياضي أو تراقب تدفقات حركة المرور، يضمن توازن الأداء في YOLO26 استدعاءً عالياً دون إسقاط الإطارات.
في النهاية، يضمن التزام Ultralytics بنظام بيئي متاح وعالي الأداء أن الانتقال من YOLOv5 إلى YOLO26 يتم بسلاسة، مما يفتح قدرات متطورة للباحثين والمطورين على حد سواء.