YOLO11 YOLOv5: مقارنة تقنية شاملة بين Ultralytics
يعد اختيار بنية الشبكة العصبية المناسبة قرارًا محوريًا لأي مبادرة في مجال الرؤية الحاسوبية. مع تطور مجال الذكاء الاصطناعي ، تتطور أيضًا الأدوات المتاحة للمطورين والباحثين. يقدم هذا الدليل الشامل مقارنة تقنية متعمقة بين نموذجين بارزين من Ultralytics : النموذج الشهير YOLOv5 المتقدم YOLO11.
سواء كنت تقوم بنشر نماذج خفيفة الوزن لتطبيقات الذكاء الاصطناعي المتطورة أو معالجة تدفقات الفيديو عالية الدقة على وحدات معالجة الرسومات السحابية، فإن فهم الفروق الدقيقة في البنية ومقاييس الأداء وحالات الاستخدام المثالية لهذه النماذج سيضمن لك اتخاذ قرار قائم على البيانات لقيود النشر الخاصة بك.
سلسلة الطرازات والتفاصيل الفنية
يعكس كلا الطرازين التزام Ultralytics بالتعاون المفتوح المصدر والأداء القوي وسهولة الاستخدام التي لا مثيل لها، مما يجعلهما مفضلين للغاية من قبل مجتمع التعلم الآلي العالمي.
YOLO11
- المؤلفون: جلين جوشر وجينغ تشيو
- المنظمة: Ultralytics
- التاريخ: 2024-09-27
- GitHub: ultralytics
- المستندات: YOLO11
YOLOv5
- المؤلفون: جلين جوشر
- المنظمة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: yolov5
- المستندات: YOLOv5
الاختلافات المعمارية
YOLO11 التطور من YOLOv5 YOLO11 عدة تغييرات عميقة في البنية الهندسية بهدف تحسين الدقة وكفاءة المعلمات.
YOLOv5 رائدًا في PyTorch ، حيث قدمت شبكة أساسية CSPNet (شبكة جزئية متعددة المراحل) عالية التحسين وشبكة PANet (شبكة تجميع المسارات). اعتمدت على الكشف القائم على المراسي، والذي يتطلب مربعات مراسي محددة مسبقًا للتنبؤ بحدود الكائنات. على الرغم من فعاليتها العالية، إلا أن ضبط هذه المراسي لمجموعات بيانات الرؤية الحاسوبية المخصصة قد يكون أمرًا مرهقًا.
في المقابل، YOLO11 إلى نموذج كشف أكثر حداثة وخالي من المراسي. وهذا يلغي الحاجة إلى ضبط مربع المرسى يدويًا، مما يبسط عملية التدريب ويحسن التعميم عبر مجموعات بيانات متنوعة مثل COCO . بالإضافة إلى ذلك، YOLO11 برأس منفصل، مما يعني أن مهام التصنيف وانحدار مربع الحدود تتم معالجتها في فروع منفصلة. هذا الفصل يحسن بشكل كبير سرعة التقارب ومتوسط الدقة (mAP)، خاصة في سيناريوهات الكشف عن الكائنات المعقدة.
مقاييس ومعايير الأداء
يُقارن الجدول أدناه المقاييس الرئيسية عبر أحجام النماذج المختلفة. تشتهر Ultralytics بمتطلباتها من الذاكرة، حيث تستهلك عادةً CUDA أقل أثناء التدريب مقارنةً بالبدائل الثقيلة القائمة على المحولات، مما يقلل بشكل كبير من حاجز الأجهزة للدخول.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
كما لوحظ، YOLO11 توازنًا عاليًا في الأداء، حيث يقدم باستمرار mAP أعلى عند عدد معلمات مماثلة YOLOv5 .
منهجيات التدريب وسهولة الاستخدام
أحد المبادئ الأساسية Ultralytics هو سهولة الاستخدام الاستثنائية، المدعومة بنظام بيئي جيد الصيانة ودعم مجتمعي واسع النطاق.
اعتمد YOLOv5 على نصوص برمجية قوية لواجهة سطر الأوامر (CLI) (train.py, detect.py) للتنفيذ. على الرغم من قوتها، إلا أن دمج هذه البرامج النصية مباشرة في Python المخصصة غالبًا ما يتطلب حلولًا بديلة.
YOLO11 في هذا المجال من خلال تقديمها لنظام مبسط ultralytics Python . تتولى واجهة برمجة التطبيقات الموحدة هذه كل شيء بدءًا من التدريب وحتى تصدير النماذج تنسيقات مثل ONNX, OpenVINO، و TensorRT بشكل أصلي.
نشر مبسط مع Ultralytics
للحصول على تجربة خالية تمامًا من الكود، يمكن للمطورين استخدام Ultralytics لتعليق البيانات وتدريب النماذج في السحابة ونشرها على الأجهزة الطرفية بسلاسة.
مقارنة التعليمات البرمجية
أصبح تدريب Ultralytics اليوم فعالاً للغاية. إليك كيفية تدريب YOLO11 Python الأصلية الخاصة به:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Export the model to ONNX for deployment
model.export(format="onnx")
بالنسبة للأنظمة القديمة التي تستخدم YOLOv5، CLI التدريب عبر CLI كما يلي:
# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt
python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.pt
حالات الاستخدام المثالية والتطبيقات الواقعية
كلا الطرازين يتمتعان بمزايا مميزة مصممة خصيصًا لتناسب بيئات تشغيلية مختلفة.
متى تستخدم YOLOv5
على الرغم من ظهور الجيل الأحدث، YOLOv5 قوة لا يستهان بها. يوصى به بشدة في الحالات التالية:
- تكامل الأنظمة القديمة: البيئات المتكاملة بشكل عميق مع tensor المحددة YOLOv5 أو خطوط أنابيب النشر التي لا يمكن إعادة هيكلتها بسهولة.
- الأسس الأكاديمية: الباحثون الذين يحتاجون إلى أسس راسخة وطويلة الأمد لإجراء دراسات أكاديمية قابلة للتكرار في مجال تحليل الصور الطبية.
متى تستخدم YOLO11
YOLO11 الخيار المثالي لخطوط الإنتاج الحديثة بفضل تنوعه المذهل:
- بيئات متعددة المهام: على عكس YOLOv5، الذي هو في الأساس كاشف (مع إضافات لاحقة للتجزئة)، يدعم YOLO11 تجزئة الحالات وتصنيف الصور وتقدير الوضع وكشف الصندوق المحيط الموجه (OBB) بشكل فوري.
- تحليلات الفيديو عالية الكثافة: مثالية لأنظمة المرور الذكية أو إدارة مخزون البيع بالتجزئة حيث يكون استخراج أقصى دقة من المشاهد المعقدة أمرًا بالغ الأهمية.
التطلع إلى المستقبل: بنية YOLO26
في حين أن YOLO11 معيارًا استثنائيًا، فإن مجال الرؤية الحاسوبية يواصل تقدمه السريع. يجب على المطورين الذين يسعون إلى تحقيق أعلى مستويات الكفاءة أن يأخذوا في الاعتبار أحدث إصدار من Ultralytics (الذي تم إصداره في يناير 2026).
يمثل YOLO26 قفزة هائلة إلى الأمام، وهو مصمم خصيصًا لتحسين الأداء على الحافة وعلى نطاق المؤسسات. وتشمل الابتكارات الرئيسية ما يلي:
- تصميم شامل NMS: YOLO26 هو نظام شامل بطبيعته، مما يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS) من أجل نشر أسرع وأبسط.
- إزالة DFL: تمت إزالة فقدان بؤرة التوزيع لتبسيط تصدير النموذج وتحسين توافق الأجهزة منخفضة الطاقة.
- MuSGD Optimizer: مزيج مبتكر من SGD Muon، يوفر استقرار تدريب LLM للرؤية الحاسوبية من أجل تقارب أسرع.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : مُحسّن بشكل كبير لنشرات إنترنت الأشياء والأجهزة التي لا تحتوي على وحدات معالجة رسومات مخصصة.
- ProgLoss + STAL: وظائف خسارة محسّنة بشكل كبير تؤدي إلى تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر حيوي لصور الطائرات بدون طيار.
ملخص
يعتمد الاختيار بين YOLO11 YOLOv5 على مرحلة دورة حياة مشروعك. لا يمكن إنكار إرث YOLOv5 يوفر استقرارًا فائقًا ودعمًا هائلاً من المجتمع. ومع ذلك، بالنسبة لأي مشروع جديد، YOLO11 بشدة على الأجيال القديمة. فهو يجمع بين الدقة المتطورة Python الأنيقة للغاية وتكلفة ذاكرة تدريب أقل، مما يعزز مكانة Ultralytics في طليعة الابتكار في مجال الذكاء الاصطناعي. بالنسبة لأولئك الذين يتخطون الحدود إلى أبعد من ذلك، فإن استكشاف أحدث إصدار YOLO26 على Ultralytics سيحقق نتائج لا مثيل لها.