YOLOv5 مقابل YOLO26: تطور detect الكائنات في الوقت الفعلي
تطور اكتشاف الأجسام تميز بخطوات كبيرة في السرعة والدقة وسهولة الاستخدام. هذه المقارنة تتعمق في YOLOv5، النموذج الأسطوري الذي أدى إلى تعميم استخدام الذكاء الاصطناعي في مجال الرؤية، و YOLO26، أحدث بنية متطورة من Ultralytics لتحقيق كفاءة متطورة من الجيل التالي وأداء شامل.
يمثل كلا النموذجين لحظات محورية في تاريخ الرؤية الحاسوبية. في حين أن YOLOv5 معيارًا للاستخدامية واعتماد المجتمع في عام 2020، فإن YOLO26 يعيد تعريف المشهد في عام 2026 بهيكلية شاملة NMS وتحسين مستوحى من LLM، CPU لا مثيل لها.
YOLOv5: المفضل لدى المجتمع
YOLOv5 في يونيو 2020 من Ultralytics، مما يمثل تحولًا نحو التطوير PyTorch. وقد اشتهر ليس فقط بأدائه، ولكن أيضًا بسهولة استخدامه التي لا مثيل لها، مما جعل الرؤية الحاسوبية المتقدمة في متناول المطورين والباحثين في جميع أنحاء العالم.
- المؤلفون: Glenn Jocher
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- GitHub:https://github.com/ultralytics/yolov5
- الوثائق:https://docs.ultralytics.com/models/yolov5/
الهيكلة ونقاط القوة
YOLOv5 بنية مبسطة تركز على "تجربة المستخدم" للذكاء الاصطناعي. واستخدمت بنية أساسية CSP-Darknet53 وشبكة تجميع المسارات (PANet)، مما أدى إلى تحسين انتشار الميزات عبر مستويات مختلفة.
تشمل الميزات الرئيسية ما يلي:
- زيادة بيانات الفسيفساء: تقنية تدريب تجمع أربع صور في صورة واحدة، مما يحسن بشكل كبير من قدرة النموذج على detect الأجسام detect وتعميمها على سياقات جديدة.
- مربعات الربط للتعلم التلقائي: يتعلم النموذج تلقائيًا الأبعاد المثلى لمربعات الربط لمجموعة البيانات المخصصة الخاصة بك قبل بدء التدريب.
- سهولة النشر: دعم التصدير الأصلي إلى تنسيقات مثل ONNXو CoreMLو TFLite جعلته الخيار المفضل للتطبيقات المحمولة والتطبيقات المتطورة.
YOLO26: المعيار الجديد للكفاءة
تم إصدار YOLO26 في يناير 2026، وهو يعتمد على إرث سابقيه ولكنه يقدم تغييرات جذرية في البنية. وقد تم تصميمه ليكون النموذج النهائي "الذي يركز على الحافة"، حيث يعطي الأولوية لسرعة CPU دون التضحية بمكاسب الدقة التي تحققت في السنوات الأخيرة.
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2026-01-14
- GitHub:https://github.com/ultralytics/ultralytics
- المستندات:ultralytics
ميزات مبتكرة
يجمع YOLO26 بين العديد من الابتكارات المتطورة التي تميزه عن YOLOv5 الكلاسيكية:
- نظام متكامل أصليًا (NMS): على عكس YOLOv5 الذي يتطلب استخدام تقنية Non-Maximum Suppression (NMS) لتصفية المربعات المتداخلة أثناء المعالجة اللاحقة، فإن YOLO26 هو نظام متكامل أصليًا. وهذا يزيل التباين في زمن الاستجابة الناتج عن NMS مما يضمن اتساق أوقات الاستدلال، وهو أمر بالغ الأهمية لأنظمة التحكم في الوقت الفعلي في مجال الروبوتات والقيادة الذاتية.
- مُحسِّن MuSGD: مستوحى من استقرار تدريب نماذج اللغة الكبيرة (LLMs) مثل Kimi K2 من Moonshot AI، يستخدم YOLO26 مُحسِّنًا هجينًا يجمع SGD Muon. وهذا يضفي خصائص تقارب LLM على مهام الرؤية.
- إزالة DFL: من خلال إزالة Distribution Focal Loss (فقدان بؤرة التوزيع)، يتم تبسيط بنية النموذج، مما يؤدي إلى تصدير أنظف وتوافق أفضل مع الأجهزة الطرفية منخفضة الطاقة والمسرعات مثل Coral Edge TPU.
- ProgLoss + STAL: توفر وظائف الخسارة الجديدة (ProgLoss و STAL) تحسينات كبيرة في التعرف على الأجسام الصغيرة، وهي نقطة ضعف تقليدية للعديد من أجهزة الكشف في الوقت الفعلي.
موازنة الأداء
يحقق YOLO26 توازنًا رائعًا، حيث يوفر CPU أسرع بنسبة تصل إلى 43٪ مقارنةً بالأجيال السابقة مع الحفاظ على دقة أعلى. وهذا يجعله مثاليًا للأجهزة التي تكون فيها GPU نادرة أو غير متوفرة.
مقارنة تقنية: مقاييس الأداء
يوضح الجدول التالي الفروق في الأداء بين YOLOv5 YOLO26. في حين أن YOLOv5 نموذجًا قادرًا، فإن YOLO26 يظهر كفاءة ودقة فائقتين في جميع نطاقات النماذج.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
ملاحظة: يعود السبب في الزيادة الهائلة في سرعة YOLO26 على CPU ONNX) إلى بنيته المبسطة وإزالة خطوات المعالجة اللاحقة المعقدة.
منهجيات التدريب والنظام البيئي
من المزايا الرئيسية لاختيار Ultralytics النظام البيئي المشترك. الانتقال من YOLOv5 YOLO26 سلس للغاية لأن كلاهما مدعوم من قبل ultralytics Python و منصة Ultralytics.
سهولة الاستخدام و API
يستفيد كلا النموذجين من واجهة برمجة تطبيقات موحدة تعمل على تبسيط دورة حياة الذكاء الاصطناعي بأكملها. سواء كنت تستخدم CLI Python تظل صيغة البرمجة بديهية.
from ultralytics import YOLO
# Load a model (YOLOv5 or YOLO26)
model = YOLO("yolo26n.pt") # Switch to 'yolov5s.pt' seamlessly
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate performance
metrics = model.val()
كفاءة التدريب
YOLOv5 وضع معايير التدريب الفعال، حيث أدخل ميزات مثل "AutoBatch" لتعظيم GPU . ويأخذ YOLO26 هذا الأمر إلى أبعد من ذلك مع MuSGD Optimizer. من خلال تثبيت ديناميكيات التدريب، غالبًا ما يتقارب YOLO26 بشكل أسرع، مما يتطلب عددًا أقل من الدورات للوصول إلى أقصى دقة. وهذا يترجم إلى انخفاض تكاليف الحوسبة السحابية ودورات تكرار أسرع للباحثين.
علاوة على ذلك، تسمح متطلبات الذاكرة المخفضة لـ YOLO26 بحجم دفعات أكبر على الأجهزة الاستهلاكية مقارنة بالبنى الثقيلة المحولات مثل RT-DETR.
تطبيقات عملية في أرض الواقع
غالبًا ما يعتمد الاختيار بين هذه النماذج على أجهزة النشر ومتطلبات حالة الاستخدام المحددة.
الحوسبة الطرفية وIoT
بالنسبة للتطبيقات التي تعمل على Raspberry Pi أو الهواتف المحمولة، فإن YOLO26 هو الفائز الواضح. إن CPU الأسرع بنسبة تصل إلى 43٪ وإزالة NMS سريع الاستجابة بشكل لا يصدق لمهام مثل إدارة مواقف السيارات الذكية أو مسح المخزون باليد. كما أن إزالة Distribution Focal Loss (DFL) تبسط التحويل إلى تكمية عددية للميكروكونترولر.
الروبوتات والأنظمة المستقلة
في مجال الروبوتات، يعد اتساق زمن الاستجابة أمراً أساسياً. يضمن التصميم الشامل NMS لـ YOLO26 أن يكون وقت الاستدلال حتمياً، مما يتجنب زمن المعالجة المتغير الذي يسببه NMS تصبح المشاهد مزدحمة. هذه الموثوقية أمر بالغ الأهمية لأنظمة الملاحة الذاتية وتجنب الاصطدام.
دعم الأنظمة القديمة
YOLOv5 لا يزال خيارًا قويًا للأنظمة القديمة حيث تم تحديد مسار النشر بشكل صارم حول YOLOv5 (على سبيل المثال، tensor المحددة المتوقعة من تدفقات البتات FPGA القديمة). إن الدعم الهائل من المجتمع وسنوات من الاختبارات الميدانية تعني أن الحلول لأي حالة استثنائية تقريبًا متاحة بسهولة في المنتديات وقضايا GitHub.
تعدد الاستخدامات: ما وراء الكشف
بينما YOLOv5 لدعم التجزئة في الإصدارات اللاحقة (v7.0)، تم تصميم YOLO26 من الألف إلى الياء كمتعلم متعدد المهام.
- تجزئة الحالات: يتضمن YOLO26 تحسينات خاصة بالمهام مثل فقدان التجزئة الدلالية ووحدات البروتو متعددة المقاييس، مما يعزز جودة القناع لمهام مثل تحليل الصور الطبية.
- تقدير الوضع: باستخدام تقدير الاحتمالية اللوغاريتمية المتبقية (RLE)، يوفر YOLO26 دقة فائقة في تحديد النقاط الرئيسية لتقدير وضع الإنسان في تحليلات الرياضة.
- مربعات الحدود الموجهة (OBB): بالنسبة للصور الجوية وبيانات الأقمار الصناعية، تعمل خسارة الزاوية المتخصصة في YOLO26 على حل مشكلات الحدود الشائعة في اكتشاف الأجسام المدورة، مما يجعلها متفوقة في مهام OBB.
الخلاصة
يُجسد كل من YOLOv5 YOLO26 Ultralytics بجعل الذكاء الاصطناعي سهلاً وسريعًا ودقيقًا. YOLOv5 لا يزال YOLO26 يمثل أداة عمل كلاسيكية وموثوقة لها حضور كبير في هذا المجال. ومع ذلك، بالنسبة للمشاريع الجديدة في عام 2026، يوفر YOLO26 مسار ترقية مقنعًا.
بفضل تصميمهNMS ومُحسّن MuSGD CPU الاستثنائي، لا يُعد YOLO26 مجرد تحديث تدريجي، بل هو قفزة إلى الأمام في مجال الذكاء الاصطناعي المتطور. من خلال توحيد الكشف والتجزئة والوضع والتصنيف في إطار عمل واحد فعال، Ultralytics للمطورين الحصول على أفضل الأدوات لحل تحديات الرؤية الحاسوبية المستقبلية اليوم.
بالنسبة للمطورين المهتمين باستكشاف هياكل حديثة أخرى، فإن YOLO11 أداءً ممتازًا، على الرغم من أن YOLO26 هو الخيار الموصى به بفضل توازنه بين السرعة وميزات الجيل التالي.