YOLOv5 YOLO26: قفزة جيلية في الكشف عن الكائنات في الوقت الفعلي
تم تحديد تطور الرؤية الحاسوبية من خلال السعي المستمر نحو نماذج أسرع وأكثر دقة وسهولة في الوصول إليها. عند مقارنة Ultralytics YOLOv5 مع أحدث إصدار Ultralytics نلاحظ حدوث تحول جذري يسد الفجوة بين الأنظمة القديمة القوية وأحدث ما توصلت إليه تقنية الذكاء الاصطناعي الحديثة.
يقدم هذا الدليل تحليلاً تقنياً شاملاً لكلا البنيتين، مع تسليط الضوء على مقاييس أدائهما والاختلافات الهيكلية بينهما وسيناريوهات النشر المثالية.
نظرات عامة على النموذج
YOLOv5: العمود الفقري للصناعة
YOLOv5 ، التي تم إصدارها في عام 2020، YOLOv5 إمكانية الوصول إلى اكتشاف الكائنات. من خلال ترحيل البنية الأصلية إلى PyTorch ، فقد وفرت للمطورين تجربة "من الصفر إلى القمة" لم يسبق لها مثيل.
- المؤلفون: Glenn Jocher
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- GitHub:https://github.com/ultralytics/yolov5
- الوثائق:وثائق YOLOv5
YOLOv5 الأساس Ultralytics الذي يتم صيانته بشكل كبير. وقد أدخلت تقنيات توسيع البيانات القوية، وحلقات التدريب الفعالة، ومسارات التصدير المُحسّنة بشكل كبير إلى تنسيقات الحافة مثل CoreML و ONNX. سهولة استخدامه ومتطلباته المنخفضة من الذاكرة أثناء التدريب جعلته أداة أساسية للشركات الناشئة والباحثين في جميع أنحاء العالم.
YOLO26: معيار الذكاء الاصطناعي للرؤية من الجيل التالي
بالانتقال سريعًا إلى يناير 2026، يمثل Ultralytics قمة الذكاء الاصطناعي للرؤية في الوقت الفعلي. وهو يدمج بشكل أصلي الدروس المستفادة من الأجيال المتداخلة مثل YOLOv8 و YOLO11، مع تقديم اختراقات هائلة مستوحاة من تدريب نموذج اللغة الكبيرة (LLM).
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2026-01-14
- GitHub:https://github.com/ultralytics/ultralytics
- الوثائق:وثائق YOLO26
تضع YOLO26 معيارًا جديدًا لتوازن الأداء، حيث توفر دقة متطورة في الوقت الذي تم تصميمها خصيصًا للسيطرة على سيناريوهات الحوسبة المتطورة.
Ultralytics الأخرى
إذا كنت تقوم بترحيل قاعدة كود قديمة، فقد تكون مهتمًا أيضًا بمقارنة YOLOv5 YOLO11، وهو نموذج الجيل السابق الذي قدم الدعم الأولي لمهام متنوعة مثل تقدير الوضع ومربعات الحدود الموجهة (OBB).
الإنجازات المعمارية في YOLO26
بينما YOLOv5 على رؤوس الكشف القائمة على المراسي ووظائف الخسارة القياسية، فإن YOLO26 يعمل على إصلاح الآليات الداخلية بالكامل للتخلص من عوائق النشر.
- تصميم شامل NMS: الفرق الأكثر أهمية هو بنية YOLO26 الشاملة أصلاً. على عكس YOLOv5 الذي يتطلب قمع غير أقصى يدوي (NMS) لتصفية المربعات المحددة الزائدة، يلغي YOLO26 هذه الخطوة اللاحقة للمعالجة تماماً. وهذا يضمن زمن استدلال حتمي ويبسط بشكل كبير التكامل في C++ أو الأجهزة المدمجة.
- إزالة DFL: يزيل YOLO26 فقدان التركيز التوزيعي (DFL). هذا الاختيار المعماري يبسط بشكل كبير تصدير النموذج ويعزز التوافق مع الأجهزة الطرفية منخفضة الطاقة والميكروكونترولرات التي غالبًا ما تواجه صعوبات مع المشغلات المعقدة.
- MuSGD Optimizer: مستوحى من Kimi K2 من Moonshot AI، يستخدم YOLO26 MuSGD Optimizer، وهو مزيج من SGD Muon. وهذا يوفر الاستقرار والتقارب السريع الذي يشهده تدريب LLM للرؤية الحاسوبية، مما يؤدي إلى انخفاض استخدام الذاكرة ودورات تدريب أسرع مقارنة بالنماذج الثقيلة المحولة.
- ProgLoss + STAL: يستخدم YOLO26 وظائف ProgLoss و STAL المتطورة، مما يحسن بشكل كبير من قدرته على detect الأجسام detect والكثيفة — وهو تحدٍ تاريخي لـ YOLOv5.
مقارنة الأداء
عند مقارنة النماذج في COCO يُظهر YOLO26 تحسينات هائلة في الدقة (mAP) مع تقليل عدد المعلمات وسرعات CPU في الوقت نفسه.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
ملاحظة: يحقق YOLO26 Nano (YOLO26n) معدل دقة مذهل يبلغ 40.9 mAP بـ 28.0 mAP لـ YOLOv5n، مع توفير CPU أسرع CPU تصل إلى 43٪ بفضل إزالة DFL والرأس NMS.
التنوع ودعم المهام
YOLOv5 في المقام الأول بقدراته في اكتشاف الأجسام. في حين أدخلت التحديثات اللاحقة إمكانية التجزئة الأساسية، تم تصميم YOLO26 من الألف إلى الياء ليكون محركًا موحدًا متعدد المهام.
يدعم YOLO26 بشكل أساسي:
- تجزئة الحالات: تتميز ببروتوس متعدد المقاييس خاص بالمهام وفقدان التجزئة الدلالية.
- تقدير الوضع: استخدام تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) للكشف عن النقاط الرئيسية بدقة عالية.
- مربعات الحدود الموجهة (OBB): بما في ذلك فقدان الزاوية المتخصص لحل مشكلات انقطاع الحدود، وهو أمر بالغ الأهمية لتحليل صور الأقمار الصناعية.
- تصنيف الصور: تصنيف قياسي للصور الكاملة.
تكامل النظام الإيكولوجي
يستفيد كلا النموذجين من Ultralytics توفر تعليقات سلسة على البيانات، وضبط تلقائي للمعلمات الفائقة، ونشر سحابي بنقرة واحدة. ومع ذلك، يستفيد YOLO26 استفادة كاملة من هياكل واجهة برمجة التطبيقات الحديثة.
أمثلة على الاستخدام والرموز
تجعلPython Ultralytics Python التبديل بين النماذج أمرًا في غاية السهولة. نظرًا لأن كلا النموذجين يشتركان في نفس النظام البيئي الذي يتم صيانته جيدًا، فإن تحديث YOLOv5 القديم إلى YOLO26 لا يتطلب سوى تغيير ملف الأوزان.
مثال python
from ultralytics import YOLO
# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")
# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=32, # YOLO26's low memory footprint allows larger batch sizes
)
# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
مثال CLI
يمكنك نشر YOLO26 مباشرة عبر سطر الأوامر باستخدام TensorRT لتحقيق أقصى GPU :
# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine
# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4
حالات الاستخدام المثالية
متى تختار YOLO26
بالنسبة لأي مشروع حديث في مجال الرؤية الحاسوبية، فإن YOLO26 هو الخيار الموصى به بلا منازع.
- Edge AI و IoT: بفضل سرعة CPU التي تزيد بنسبة 43٪ وإزالة DFL، فإنه مثالي للنشر على Raspberry Pi أو الأجهزة المحمولة.
- خطوط الأنابيب عالية السرعة: تضمن البنية NMS زمن انتقال مستقرًا ويمكن التنبؤ به، وهو أمر بالغ الأهمية للروبوتات المستقلة وأنظمة الإنذار الأمني في الوقت الفعلي.
- سيناريوهات معقدة: إذا كان تطبيقك يتطلب تتبع كائنات صغيرة (مثل مراقبة الطائرات بدون طيار) أو كائنات دوارة (OBB)، فإن وظائف الخسارة المتقدمة في YOLO26 (ProgLoss + STAL) توفر ميزة دقة هائلة.
متى تختار YOLOv5
- الأنظمة القديمة: إذا كانت بيئة الإنتاج الخاصة بك تعتمد بشكل ثابت على إنشاء مرساة YOLOv5 المحددة أو منطق NMS فقد تتطلب عملية الترحيل فترة إعادة هيكلة قصيرة.
- أساسيات أكاديمية محددة: غالبًا ما يستخدم الباحثون YOLOv5 كلاسيكي لإظهار التقدم التاريخي لهياكل الكشف عن الكائنات.
ملخص
الانتقال من YOLOv5 YOLO26 ليس مجرد تحديث متكرر؛ إنه قفزة جوهرية في كيفية تدريب ونشر نماذج الكشف عن الكائنات. من خلال الاستفادة من مُحسّن MuSGD، والتخلي عن المعالجة اللاحقة المعقدة عبر تصميم NMS وتسريع CPU بشكل كبير، يوفر Ultralytics توازنًا لا مثيل له بين السرعة والدقة.
في حين أن YOLOv5 دائمًا في الذاكرة باعتباره النموذج الذي أدى إلى ديمقراطية الذكاء الاصطناعي البصري، فإن المطورين الذين يسعون إلى بناء تطبيقات قوية وجاهزة للإنتاج ومستقبلية يجب أن يعتمدوا بثقة على YOLO26.