YOLO11 مقابل YOLOv5: مقارنة تقنية شاملة لبنيات Ultralytics
يعد اختيار بنية الشبكة العصبية المناسبة قراراً محورياً لأي مبادرة في مجال الرؤية الحاسوبية. ومع تطور مشهد الذكاء الاصطناعي، تتطور أيضاً الأدوات المتاحة للمطورين والباحثين. يقدم هذا الدليل الشامل مقارنة تقنية متعمقة بين نموذجين بارزين من نظام Ultralytics البيئي: نموذج YOLOv5 الشهير ونموذج YOLO11 المتقدم.
سواء كنت تقوم بنشر نماذج خفيفة الوزن لتطبيقات الذكاء الاصطناعي على الحافة أو معالجة تدفقات فيديو عالية الدقة على وحدات معالجة الرسومات السحابية، فإن فهم الفروق الدقيقة في البنية، ومقاييس الأداء، وحالات الاستخدام المثالية لهذه النماذج سيضمن لك اتخاذ خيار يعتمد على البيانات لمتطلبات النشر الخاصة بك.
نسل النموذج والتفاصيل التقنية
يعكس كلا النموذجين التزام Ultralytics بالتعاون مفتوح المصدر، والأداء القوي، وسهولة الاستخدام التي لا مثيل لها، مما يجعلهما مفضلين للغاية من قبل مجتمع تعلم الآلة العالمي.
تفاصيل YOLO11
- المؤلفون: Glenn Jocher و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 27-09-2024
- GitHub: ultralytics/ultralytics
- المستندات: توثيق YOLO11
تفاصيل YOLOv5
- المؤلفون: Glenn Jocher
- المنظمة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: ultralytics/yolov5
- المستندات: توثيق YOLOv5
الاختلافات المعمارية
يقدم التطور من YOLOv5 إلى YOLO11 العديد من التحولات الهيكلية العميقة المصممة لتحسين الدقة وكفاءة المعلمات.
كان YOLOv5 رائداً في نظام PyTorch البيئي، حيث قدم هيكلاً أساسياً محسناً للغاية من نوع CSPNet (شبكة جزئية متقاطعة المراحل) وعنق PANet (شبكة تجميع المسارات). اعتمد النموذج على الكشف القائم على المرساة، والذي يتطلب صناديق مرساة محددة مسبقاً للتنبؤ بحدود الكائنات. ورغم كونه فعالاً للغاية، إلا أن ضبط هذه المراسي لمجموعات بيانات الرؤية الحاسوبية المخصصة قد يكون مرهقاً.
In contrast, YOLO11 transitions to a more modern, anchor-free detection paradigm. This eliminates the need for manual anchor box tuning, streamlining the training process and improving generalization across diverse datasets like the COCO dataset. Additionally, YOLO11 features a decoupled head, meaning classification and bounding box regression tasks are processed in separate branches. This separation significantly improves convergence speed and mean Average Precision (mAP), particularly for complex object detection scenarios.
مقاييس الأداء والمعايير
يقارن الجدول أدناه المقاييس الرئيسية عبر أحجام النماذج المختلفة. تشتهر نماذج Ultralytics بمتطلبات الذاكرة الخاصة بها، حيث تستهلك عادةً ذاكرة CUDA أقل أثناء التدريب مقارنة بالبدائل الثقيلة القائمة على Transformer، مما يقلل بشكل كبير من حاجز الدخول للأجهزة.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
كما لوحظ، يحقق YOLO11 توازناً ممتازاً في الأداء، حيث يقدم باستمرار درجات mAP أعلى مع أعداد معلمات مماثلة لنظيراتها من YOLOv5.
منهجيات التدريب وسهولة الاستخدام
أحد المبادئ الأساسية لفلسفة Ultralytics هو سهولة الاستخدام الاستثنائية، مدعومة بنظام بيئي تتم صيانته جيداً ودعم مجتمعي واسع النطاق.
اعتمد YOLOv5 تاريخياً على نصوص واجهة سطر الأوامر (CLI) القوية (train.py, detect.py) للتنفيذ. ورغم قوتها، فإن دمج هذه النصوص مباشرة في تطبيقات Python المخصصة كان يتطلب غالباً حلولاً بديلة.
أحدث YOLO11 ثورة في هذا من خلال تقديم حزمة Python المبسطة ultralytics. تتعامل واجهة برمجة التطبيقات الموحدة هذه مع كل شيء بدءاً من التدريب وحتى تصدير النماذج بتنسيقات مثل ONNX وOpenVINO وTensorRT بشكل أصلي.
لتجربة خالية تماماً من البرمجة، يمكن للمطورين الاستفادة من منصة Ultralytics لتعليق البيانات، وتدريب النماذج في السحابة، ونشرها على أجهزة الحافة بسلاسة.
مقارنة الكود
أصبح تدريب نموذج Ultralytics اليوم فعالاً للغاية. إليك كيفية تدريب YOLO11 باستخدام واجهة برمجة تطبيقات Python الأصلية الخاصة به:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Export the model to ONNX for deployment
model.export(format="onnx")بالنسبة للأنظمة القديمة التي تستخدم YOLOv5، يبدو التدريب عبر CLI كما يلي:
# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt
python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.ptحالات الاستخدام المثالية والتطبيقات الواقعية
يتمتع كلا النموذجين بنقاط قوة مميزة مصممة لبيئات تشغيل مختلفة.
متى تستخدم YOLOv5
على الرغم من الجيل الأحدث، يظل YOLOv5 قوة كبيرة. يوصى به بشدة من أجل:
- تكامل الأنظمة القديمة: البيئات المتكاملة بعمق مع هياكل موترات YOLOv5 المحددة أو خطوط أنابيب النشر التي لا يمكن إعادة صياغتها بسهولة.
- الأسس الأكاديمية: الباحثون الذين يحتاجون إلى أسس ثابتة وطويلة الأمد لدراسات أكاديمية قابلة للتكرار في تحليل الصور الطبية.
متى تستخدم YOLO11
يمثل YOLO11 الخيار المثالي لخطوط الإنتاج الحديثة نظراً لتعدد استخداماته المذهل:
- بيئات المهام المتعددة: على عكس YOLOv5، الذي يعد في الأساس كاشفاً (مع إضافات تجزئة لاحقة)، يدعم YOLO11 بشكل أصلي تجزئة المثيلات، وتصنيف الصور، وتقدير الوضع، واكتشاف صندوق محيط موجه (OBB) بشكل مباشر.
- تحليلات الفيديو عالية الكثافة: مثالي لأنظمة المرور الذكية أو إدارة مخزون التجزئة حيث يعد استخراج أقصى درجات الدقة من المشاهد المعقدة أمراً بالغ الأهمية.
نتطلع إلى المستقبل: بنية YOLO26
بينما يظل YOLO11 معياراً استثنائياً، تستمر حدود الرؤية الحاسوبية في التقدم بسرعة. يجب على المطورين الذين يسعون للحصول على قمة الكفاءة النظر أيضاً في أحدث Ultralytics YOLO26 (الذي تم إصداره في يناير 2026).
يمثل YOLO26 قفزة نوعية هائلة، صُمم خصيصاً لتحسين الحافة ومقياس المؤسسات. تشمل الابتكارات الرئيسية ما يلي:
- تصميم طرفي إلى طرفي خالٍ من NMS: YOLO26 هو نموذج أصلي من طرف إلى طرف، مما يلغي المعالجة اللاحقة للقمع غير الأقصى (NMS) من أجل نشر أسرع وأبسط.
- إزالة DFL: تمت إزالة توزيع Focal Loss لتبسيط تصدير النماذج وتعزيز التوافق مع الأجهزة ذات الطاقة المنخفضة.
- مُحسّن MuSGD: مزيج ثوري من SGD وMuon، مما يجلب استقرار تدريب LLM إلى الرؤية الحاسوبية لتقارب أسرع.
- استدلال أسرع على وحدة المعالجة المركزية بنسبة تصل إلى 43%: تم تحسينه بشكل كبير لنشر IoT والأجهزة التي لا تحتوي على وحدات معالجة رسومات مخصصة.
- ProgLoss + STAL: وظائف خسارة محسنة بشكل كبير توفر تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو أمر حيوي لصور الطائرات بدون طيار.
ملخص
يعتمد الاختيار بين YOLO11 وYOLOv5 في النهاية على مرحلة دورة حياة مشروعك. لا يمكن إنكار إرث YOLOv5، حيث يوفر استقراراً فائقاً ودعماً مجتمعياً هائلاً. ومع ذلك، بالنسبة لأي مشروع جديد، يوصى بشدة بـ YOLO11 على الأجيال القديمة. فهو يجمع بين دقة متطورة، وواجهة برمجة تطبيقات Python أنيقة للغاية، وتكاليف ذاكرة تدريب أقل، مما يعزز مكانة Ultralytics في طليعة ابتكارات الذكاء الاصطناعي. بالنسبة لأولئك الذين يدفعون الحدود إلى أبعد من ذلك، فإن استكشاف YOLO26 المتطور على منصة Ultralytics سيحقق نتائج لا مثيل لها.