YOLOv5 YOLO26: قفزة جيلية في الكشف عن الكائنات في الوقت الفعلي
تم تحديد تطور الرؤية الحاسوبية من خلال السعي المستمر نحو نماذج أسرع وأكثر دقة وسهولة في الوصول إليها. عند مقارنة Ultralytics YOLOv5 مع أحدث إصدار Ultralytics نلاحظ حدوث تحول جذري يسد الفجوة بين الأنظمة القديمة القوية وأحدث ما توصلت إليه تقنية الذكاء الاصطناعي الحديثة.
يقدم هذا الدليل تحليلاً تقنياً شاملاً لكلا البنيتين، مع تسليط الضوء على مقاييس أدائهما والاختلافات الهيكلية بينهما وسيناريوهات النشر المثالية.
نظرات عامة على النموذج
YOLOv5: العمود الفقري للصناعة
YOLOv5 ، التي تم إصدارها في عام 2020، YOLOv5 إمكانية الوصول إلى اكتشاف الكائنات. من خلال ترحيل البنية الأصلية إلى PyTorch ، فقد وفرت للمطورين تجربة "من الصفر إلى القمة" لم يسبق لها مثيل.
- المؤلفون: Glenn Jocher
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- GitHub:https://github.com/ultralytics/yolov5
- الوثائق:وثائق YOLOv5
YOLOv5 الأساس Ultralytics الذي يتم صيانته بشكل كبير. وقد أدخلت تقنيات توسيع البيانات القوية، وحلقات التدريب الفعالة، ومسارات التصدير المُحسّنة بشكل كبير إلى تنسيقات الحافة مثل CoreML و ONNX. سهولة استخدامه ومتطلباته المنخفضة من الذاكرة أثناء التدريب جعلته أداة أساسية للشركات الناشئة والباحثين في جميع أنحاء العالم.
YOLO26: معيار الذكاء الاصطناعي للرؤية من الجيل التالي
بالانتقال سريعًا إلى يناير 2026، يمثل Ultralytics قمة الذكاء الاصطناعي للرؤية في الوقت الفعلي. وهو يدمج بشكل أصلي الدروس المستفادة من الأجيال المتداخلة مثل YOLOv8 و YOLO11، مع تقديم اختراقات هائلة مستوحاة من تدريب نموذج اللغة الكبيرة (LLM).
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2026-01-14
- GitHub:https://github.com/ultralytics/ultralytics
- الوثائق:وثائق YOLO26
تضع YOLO26 معيارًا جديدًا لتوازن الأداء، حيث توفر دقة متطورة في الوقت الذي تم تصميمها خصيصًا للسيطرة على سيناريوهات الحوسبة المتطورة.
Ultralytics الأخرى
إذا كنت تقوم بترحيل قاعدة كود قديمة، فقد تكون مهتمًا أيضًا بمقارنة YOLOv5 YOLO11، وهو نموذج الجيل السابق الذي قدم الدعم الأولي لمهام متنوعة مثل تقدير الوضع ومربعات الحدود الموجهة (OBB).
إنجازات معمارية في YOLO26
بينما YOLOv5 على رؤوس الكشف القائمة على المراسي ووظائف الخسارة القياسية، فإن YOLO26 يعمل على إصلاح الآليات الداخلية بالكامل للتخلص من عوائق النشر.
- تصميم شامل خالٍ من NMS: الفرق الأكثر أهمية هو بنية YOLO26 الشاملة بطبيعتها. على عكس YOLOv5، الذي يتطلب قمع غير الأقصى (NMS) اليدوي لتصفية مربعات الإحاطة الزائدة، يلغي YOLO26 هذه الخطوة من المعالجة اللاحقة بالكامل. وهذا يضمن زمن انتقال استدلال حتمي ويبسط بشكل كبير التكامل في C++ أو الأجهزة المدمجة.
- إزالة DFL: يزيل YOLO26 Distribution Focal Loss (DFL). يبسط هذا الاختيار المعماري تصدير النموذج بشكل كبير ويعزز التوافق مع الأجهزة الطرفية منخفضة الطاقة ووحدات التحكم الدقيقة التي غالباً ما تواجه صعوبة مع العمليات المعقدة.
- مُحسِّن MuSGD: مستلهمًا من Kimi K2 من Moonshot AI، يستخدم YOLO26 مُحسِّن MuSGD، وهو مزيج هجين من SGD و Muon. وهذا يجلب الاستقرار والتقارب السريع الذي شوهد في تدريب نماذج LLM إلى الرؤية الحاسوبية، مما يؤدي إلى استخدام أقل للذاكرة ودورات تدريب أسرع مقارنة بالنماذج التي تعتمد بشكل كبير على المحولات.
- ProgLoss + STAL: يستخدم YOLO26 دوال ProgLoss و STAL المتطورة، مما يحسن بشكل كبير قدرته على detect الأجسام الصغيرة والكثيفة — وهو تحدٍ تاريخي لـ YOLOv5.
مقارنة الأداء
عند مقارنة النماذج في COCO يُظهر YOLO26 تحسينات هائلة في الدقة (mAP) مع تقليل عدد المعلمات وسرعات CPU في الوقت نفسه.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
ملاحظة: يحقق YOLO26 Nano (YOLO26n) معدل دقة مذهل يبلغ 40.9 mAP بـ 28.0 mAP لـ YOLOv5n، مع توفير CPU أسرع CPU تصل إلى 43٪ بفضل إزالة DFL والرأس NMS.
التنوع ودعم المهام
YOLOv5 في المقام الأول بقدراته في اكتشاف الأجسام. في حين أدخلت التحديثات اللاحقة إمكانية التجزئة الأساسية، تم تصميم YOLO26 من الألف إلى الياء ليكون محركًا موحدًا متعدد المهام.
يدعم YOLO26 بشكل أساسي:
- تجزئة الكائنات: تتميز بنماذج أولية متعددة المقاييس خاصة بالمهام وخسارة تجزئة دلالية.
- تقدير الوضعيات: استخدام تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لاكتشاف النقاط الرئيسية بدقة عالية.
- صناديق الإحاطة الموجهة (OBB): بما في ذلك دالة خسارة زاوية متخصصة لحل مشكلات عدم استمرارية الحدود، وهو أمر بالغ الأهمية لـ تحليل صور الأقمار الصناعية.
- تصنيف الصور: تصنيف الصور الكاملة القياسي.
تكامل النظام الإيكولوجي
يستفيد كلا النموذجين من منصة Ultralytics، مما يوفر ترميزًا سلسًا للبيانات، وضبطًا تلقائيًا للمعلمات الفائقة، ونشرًا سحابيًا بنقرة واحدة. ومع ذلك، يستفيد YOLO26 بالكامل من هياكل API الحديثة.
أمثلة على الاستخدام والرموز
تجعلPython Ultralytics Python التبديل بين النماذج أمرًا في غاية السهولة. نظرًا لأن كلا النموذجين يشتركان في نفس النظام البيئي الذي يتم صيانته جيدًا، فإن تحديث YOLOv5 القديم إلى YOLO26 لا يتطلب سوى تغيير ملف الأوزان.
مثال python
from ultralytics import YOLO
# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")
# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=32, # YOLO26's low memory footprint allows larger batch sizes
)
# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
مثال CLI
يمكنك نشر YOLO26 مباشرة عبر سطر الأوامر باستخدام TensorRT لتحقيق أقصى GPU :
# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine
# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4
حالات الاستخدام المثالية
متى تختار YOLO26
بالنسبة لأي مشروع حديث في مجال الرؤية الحاسوبية، فإن YOLO26 هو الخيار الموصى به بلا منازع.
- الذكاء الاصطناعي الحافة وإنترنت الأشياء: استدلاله الأسرع بنسبة 43% على CPU وإزالة DFL يجعله مثاليًا للنشر على Raspberry Pi أو الأجهزة المحمولة.
- خطوط الأنابيب عالية السرعة: تضمن البنية الخالية من NMS زمن استجابة مستقرًا وقابلاً للتنبؤ به، وهو أمر بالغ الأهمية للروبوتات المستقلة وأنظمة إنذار الأمان في الوقت الفعلي.
- سيناريوهات معقدة: إذا كان تطبيقك يتطلب تتبع الكائنات الصغيرة (مثل مراقبة الطائرات بدون طيار) أو الكائنات الدوارة (obb)، فإن دوال الخسارة المتقدمة في YOLO26 (ProgLoss + STAL) توفر ميزة دقة هائلة.
متى تختار YOLOv5
- الأنظمة القديمة: إذا كانت بيئة الإنتاج لديك تحتوي على تبعيات مبرمجة بشكل ثابت على توليد نقاط الارتكاز (anchor) الخاصة بـ YOLOv5 أو منطق تحليل NMS، فقد يتطلب الترحيل فترة قصيرة لإعادة الهيكلة.
- الأسس الأكاديمية المحددة: غالبًا ما يستخدم الباحثون YOLOv5 كخط أساس كلاسيكي لإظهار التطور التاريخي لـ بنى اكتشاف الكائنات.
ملخص
الانتقال من YOLOv5 YOLO26 ليس مجرد تحديث متكرر؛ إنه قفزة جوهرية في كيفية تدريب ونشر نماذج الكشف عن الكائنات. من خلال الاستفادة من مُحسّن MuSGD، والتخلي عن المعالجة اللاحقة المعقدة عبر تصميم NMS وتسريع CPU بشكل كبير، يوفر Ultralytics توازنًا لا مثيل له بين السرعة والدقة.
في حين أن YOLOv5 دائمًا في الذاكرة باعتباره النموذج الذي أدى إلى ديمقراطية الذكاء الاصطناعي البصري، فإن المطورين الذين يسعون إلى بناء تطبيقات قوية وجاهزة للإنتاج ومستقبلية يجب أن يعتمدوا بثقة على YOLO26.