YOLOv5 مقابل YOLO26: قفزة جيلية في الكشف عن الكائنات في الوقت الفعلي
لقد تم تحديد تطور رؤية الكمبيوتر من خلال السعي المستمر لنماذج أسرع وأكثر دقة وسهولة في الوصول. عند مقارنة Ultralytics YOLOv5 بنموذج Ultralytics YOLO26 المتطور، فإننا ننظر إلى تحول نموذجي يسد الفجوة بين الأنظمة القديمة القوية وأحدث تقنيات نشر الذكاء الاصطناعي الحديثة.
يوفر هذا الدليل تحليلاً تقنياً شاملاً لكلا البنيتين، مع تسليط الضوء على مقاييس أدائهما، والاختلافات الهيكلية، وسيناريوهات النشر المثالية.
نظرة عامة على النماذج
YOLOv5: حصان العمل في الصناعة
تم إطلاق YOLOv5 في عام 2020، وأحدث ثورة في سهولة الوصول إلى الكشف عن الكائنات. من خلال نقل البنية أصلياً إلى إطار عمل PyTorch، وفر للمطورين تجربة "من الصفر إلى الاحتراف" غير مسبوقة.
- المؤلفون: Glenn Jocher
- المنظمة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- المستندات: YOLOv5 Documentation
أرسى YOLOv5 الأساس لنظام Ultralytics البيئي الذي يتم صيانته بشكل كبير. قدم تقنيات قوية لزيادة البيانات، وحلقات تدريب فعالة، ومسارات تصدير محسنة للغاية لتنسيقات الحافة مثل CoreML وONNX. إن سهولة استخدامه ومتطلبات الذاكرة المنخفضة أثناء التدريب جعلته عنصراً أساسياً للشركات الناشئة والباحثين في جميع أنحاء العالم.
YOLO26: معيار الجيل التالي لرؤية الذكاء الاصطناعي
بالانتقال إلى يناير 2026، يمثل Ultralytics YOLO26 قمة رؤية الذكاء الاصطناعي في الوقت الفعلي. فهو يدمج أصلياً الدروس المستفادة من الأجيال المتداخلة مثل YOLOv8 وYOLO11، مع تقديم اختراقات هائلة مستوحاة من تدريب نماذج اللغات الكبيرة (LLM).
- المؤلفون: Glenn Jocher و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 2026-01-14
- GitHub: https://github.com/ultralytics/ultralytics
- التوثيق: توثيق YOLO26
يضع YOLO26 معياراً جديداً لتوازن الأداء، حيث يقدم دقة متطورة بينما تم تصميمه صراحةً ليتفوق في سيناريوهات الحوسبة الطرفية (Edge Computing).
إذا كنت تقوم بترحيل قاعدة تعليمات برمجية قديمة، فقد تكون مهتماً أيضاً بمقارنة YOLOv5 مع YOLO11، وهو نموذج الجيل السابق الذي قدم دعماً أولياً لمهام متنوعة مثل تقدير الوضعية (Pose Estimation) وصناديق الإحاطة الموجهة (OBB).
الاختراقات الهيكلية في YOLO26
بينما يعتمد YOLOv5 على رؤوس كشف تستند إلى الركائز (Anchors) ووظائف خسارة قياسية، يقوم YOLO26 بإصلاح الآليات الداخلية بالكامل للقضاء على اختناقات النشر.
- تصميم بدون NMS من البداية إلى النهاية: الفرق الأكثر أهمية هو بنية YOLO26 الأصلية من البداية إلى النهاية. على عكس YOLOv5، الذي يتطلب كبح غير الحد الأقصى (NMS) يدوياً لتصفية صناديق الإحاطة الزائدة، يلغي YOLO26 خطوة المعالجة اللاحقة هذه تماماً. هذا يضمن زمن استجابة استنتاجي حتمي ويبسط بشكل كبير التكامل في C++ أو الأجهزة المدمجة.
- إزالة DFL: يزيل YOLO26 خسارة التركيز التوزيعية (Distribution Focal Loss - DFL). هذا الاختيار الهيكلي يبسط تصدير النموذج بشكل كبير ويعزز التوافق مع أجهزة الحافة منخفضة الطاقة والمتحكمات الدقيقة التي غالباً ما تعاني من المشغلين المعقدين.
- مُحسن MuSGD: مستلهماً من Kimi K2 لشركة Moonshot AI، يستخدم YOLO26 مُحسن MuSGD، وهو مزيج من SGD وMuon. هذا يجلب الاستقرار والتقارب السريع الذي يظهر في تدريب نماذج اللغات الكبيرة (LLM) إلى رؤية الكمبيوتر، مما يؤدي إلى انخفاض استخدام الذاكرة ودورات تدريب أسرع مقارنة بالنماذج الثقيلة التي تعتمد على Transformer.
- ProgLoss + STAL: يستخدم YOLO26 وظائف ProgLoss وSTAL المتطورة، مما يحسن بشكل كبير قدرته على اكتشاف الكائنات الصغيرة والكثيفة—وهو تحدٍ تاريخي واجهه YOLOv5.
مقارنة الأداء
عند مقارنة النماذج على مجموعة بيانات COCO، يعرض YOLO26 تحسينات هائلة في الدقة (mAP) مع تقليل أعداد المعاملات وسرعات استنتاج CPU في نفس الوقت.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
ملاحظة: يحقق YOLO26 Nano (YOLO26n) نسبة mAP مذهلة تبلغ 40.9 مقارنة بنسبة 28.0 mAP لـ YOLOv5n، مع توفير استنتاج CPU أسرع بنسبة تصل إلى 43% بسبب إزالة DFL والرأس الذي لا يحتاج إلى NMS.
تعدد الاستخدامات ودعم المهام
يشتهر YOLOv5 في المقام الأول بـ الكشف عن الكائنات. بينما قدمت التحديثات اللاحقة تجزئة أساسية، تم بناء YOLO26 من الصفر ليكون محركاً موحداً متعدد المهام.
يدعم YOLO26 بطبيعته:
- تجزئة الكائنات (Instance Segmentation): يتميز ببروتوز متعدد المقاييس خاص بالمهمة وخسارة تجزئة دلالية.
- تقدير الوضعية (Pose Estimation): يستخدم تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لاكتشاف النقاط الرئيسية بدقة عالية.
- صناديق الإحاطة الموجهة (OBB): بما في ذلك خسارة الزاوية المتخصصة لحل مشاكل انقطاع الحدود، وهو أمر بالغ الأهمية لـ تحليل صور الأقمار الصناعية.
- تصنيف الصور: تصنيف قياسي للصورة الكاملة.
يستفيد كلا النموذجين من منصة Ultralytics، مما يوفر تعليقاً توضيحياً سلسًا للبيانات، وضبطاً آلياً للمعاملات الفائقة، ونشراً سحابياً بنقرة واحدة. ومع ذلك، يستفيد YOLO26 بالكامل من هياكل API الحديثة.
الاستخدام وأمثلة التعليمات البرمجية
تجعل واجهة برمجة تطبيقات Python الخاصة بـ Ultralytics التبديل بين النماذج بسيطاً للغاية. نظراً لأن كلا النموذجين يشتركان في نفس النظام البيئي الذي يتم صيانته جيداً، فإن تحديث خط أنابيب YOLOv5 قديم إلى YOLO26 يتطلب فقط تغيير ملف الأوزان.
مثال Python
from ultralytics import YOLO
# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")
# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=32, # YOLO26's low memory footprint allows larger batch sizes
)
# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()مثال CLI
يمكنك نشر YOLO26 مباشرة عبر سطر الأوامر باستخدام تكامل TensorRT للحصول على أقصى إنتاجية لـ GPU:
# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine
# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4حالات الاستخدام المثالية
متى تختار YOLO26
بالنسبة لأي مشروع رؤية كمبيوتر حديث، فإن YOLO26 هو التوصية التي لا جدال فيها.
- ذكاء الحافة وIoT: استنتاج CPU أسرع بنسبة 43% وإزالة DFL يجعله مثالياً للنشر على Raspberry Pi أو الأجهزة المحمولة.
- خطوط الأنابيب عالية السرعة: تضمن البنية الخالية من NMS زمن استجابة مستقراً ومتوقعاً، وهو أمر بالغ الأهمية للروبوتات المستقلة وأنظمة الإنذار الأمني في الوقت الفعلي.
- السيناريوهات المعقدة: إذا كان تطبيقك يتطلب تتبع كائنات صغيرة (مثل مراقبة الطائرات بدون طيار) أو كائنات دوارة (OBB)، فإن وظائف الخسارة المتقدمة في YOLO26 (ProgLoss + STAL) توفر ميزة دقة هائلة.
متى تختار YOLOv5
- الأنظمة القديمة: إذا كانت بيئة الإنتاج لديك تحتوي على تبعيات مشفرة في YOLOv5 تتعلق بإنشاء الركائز (Anchors) المحددة أو منطق تحليل NMS، فقد يتطلب الترحيل فترة إعادة هيكلة قصيرة.
- خطوط الأساس الأكاديمية المحددة: يستخدم الباحثون غالباً YOLOv5 كخط أساس كلاسيكي لإظهار التقدم التاريخي لـ بنى الكشف عن الكائنات.
ملخص
إن الانتقال من YOLOv5 إلى YOLO26 ليس مجرد تحديث تكراري؛ بل هو قفزة أساسية في كيفية تدريب ونشر نماذج الكشف عن الكائنات. من خلال الاستفادة من مُحسن MuSGD، وإسقاط المعالجة اللاحقة المعقدة عبر تصميم خالٍ من NMS، وتسريع سرعات CPU بشكل هائل، يقدم Ultralytics YOLO26 توازناً لا يضاهى بين السرعة والدقة.
بينما سيظل YOLOv5 دائماً في الذاكرة كالنموذج الذي جعل الذكاء الاصطناعي للرؤية متاحاً للجميع، يجب على المطورين الذين يتطلعون إلى بناء تطبيقات قوية وجاهزة للإنتاج ومستقبلية أن يبنوا بثقة على YOLO26.