YOLOv5 مقابل YOLO11: مقارنة فنية شاملة
عند اختيار بنية الرؤية الحاسوبية المناسبة لمشروع جديد، من الضروري فهم تطور النماذج الحديثة. يسلط التقدم من البنى السابقة إلى الأطر الموحدة الحديثة الضوء على قفزات كبيرة في كفاءة الخوارزميات وتجربة المطورين. يقدم هذا الدليل مقارنة تقنية متعمقة بين نموذجين بارزين طورتهما Ultralytics: النموذج الرائد YOLOv5 المتطور YOLO11.
مقدمة إلى النماذج
يمثل كلا المعماريتين إنجازات هامة في مجال اكتشاف الكائنات في الوقت الفعلي، وتقدمان مزايا مميزة اعتمادًا على بيئة النشر ومتطلبات الأنظمة القديمة لديك.
YOLOv5: العمود الفقري للصناعة
صدر YOLOv5 في صيف عام 2020، YOLOv5 أصبح معيارًا صناعيًا بفضل قدراته الأصلية PyTorch الأصلي، مما خفض بشكل كبير حاجز الدخول للتدريب والنشر. ابتعد عن أطر عمل Darknet C المعقدة لأسلافه، مقدمًا نهجًا Pythonic لبناء النماذج.
- المؤلفون: Glenn Jocher
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- GitHub:ultralytics/yolov5
- الوثائق:وثائق YOLOv5
YOLOv5 أساسًا قويًا لسهولة الاستخدام وقدم منهجيات تدريب قوية، بما في ذلك زيادة البيانات الفسيفسائية المتقدمة والتثبيت التلقائي. ولا يزال يحظى بشعبية كبيرة بين الباحثين الذين يعتمدون على قاعدة بيانات موثقة جيدًا ومختبرة بشكل مكثف.
YOLO11: إطار الرؤية الموحد
بناءً على سنوات من الملاحظات والبحث المعماري، تم تقديم YOLO11 كجزء من إطار عمل موحد قادر على التعامل مع مهام رؤية متعددة بشكل أصيل. متجاوزًا مجرد صناديق الإحاطة، تم تصميمه من الألف إلى الياء لتحقيق أقصى درجات التنوع والكفاءة.
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2024-09-27
- GitHub:ultralytics/ultralytics
- المستندات:توثيق YOLO11
YOLO11 تجربة مستخدم مبسطة من خلال ultralytics Python ، تتميز بواجهة برمجة تطبيقات بسيطة توحد اكتشاف الكائنات، تجزئة الكائنات (instance segmentation)، التصنيف، تقدير الوضعيات (pose estimation)، وصناديق الإحاطة الموجهة (OBB). يحقق هذا توازنًا إيجابيًا للغاية بين السرعة والدقة، مما يجعله مثاليًا لسيناريوهات النشر المتنوعة في العالم الحقيقي.
منصة متكاملة
يستفيد كلا النموذجين من النظام البيئي الذي توفره منصة Ultralytics والذي يتميز بصيانة جيدة. تعمل هذه البيئة المتكاملة على تبسيط عملية إضافة التعليقات التوضيحية لمجموعات البيانات، والتدريب السحابي، وتصدير النماذج عبر أهداف الأجهزة المختلفة.
مقارنة الأداء والمقاييس
تكشف مقارنة مباشرة لهذه النماذج كيف تترجم التحسينات المعمارية إلى مكاسب أداء ملموسة. يوضح الجدول أدناه متوسط الدقة المتوسطة (mAP) المقيم على مجموعة بيانات COCO، إلى جانب سرعات الاستدلال على CPU و GPU وعدد المعلمات.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
تحليل النتائج
تسلط المقاييس الضوء على قفزة واضحة في توازن الأداء الذي حققه YOLO11. على سبيل المثال، يحقق نموذج YOLO11n (نانو) معدل mAP بنسبة 39.5٪ mAP بـ 28.0٪ لنموذج YOLOv5n، مع تقليل وقت CPU عند التصدير عبر ONNX. علاوة على ذلك، YOLO11 متطلبات ذاكرة أقل بشكل ملحوظ أثناء التدريب مقارنة بالنماذج الثقيلة القائمة على المحولات، مما يجعله سهل الوصول إليه للانتشار على الأجهزة الاستهلاكية والأجهزة الطرفية.
الاختلافات المعمارية
YOLO11 تحسينات الأداء في YOLO11 من عدة تطورات معمارية رئيسية. في حين YOLOv5 شبكة CSPNet قياسية مع وحدات C3، YOLO11 كتل استخراج ميزات أكثر كفاءة مثل C2f ولاحقًا C3k2، والتي تعمل على تحسين تدفق التدرج وتقليل الأعباء الحسابية.
يتميز YOLO11 برأس مُحسّن بشكل كبير. بعيدًا عن التصميم القائم على المثبتات في الموديلات القديمة، تتبنى Ultralytics الأحدث نهجًا خاليًا من المثبتات. وهذا يقلل من عدد تنبؤات الصندوق، ويبسط خط أنابيب المعالجة اللاحقة، ويحسن قدرة النموذج على التعميم عبر نطاقات ونسب عرض إلى ارتفاع مختلفة. بالإضافة إلى ذلك، تتميز هذه النماذج بكفاءة تدريب فائقة وأوزان مسبقة التدريب متاحة بسهولة تعمل على تسريع تقارب مجموعات البيانات المضبوطة بدقة.
التنفيذ وأمثلة على الكود
إحدى الميزات البارزة Ultralytics هي بساطته. في حين أن YOLOv5 استخدام torch.hub للاستدلال السريع، YOLO11 خطوة إلى الأمام مع الموحد ultralytics Python .
التدريب مع YOLO11
يتطلب تحميل النموذج وتدريبه والتحقق من صحته الحد الأدنى من التعليمات البرمجية النمطية. تتولى واجهة برمجة التطبيقات ضبط المعلمات الفائقة وإدارة النموذج بسلاسة.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11s.pt")
# Train on a custom dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
# Easily export the model to TensorRT for hardware acceleration
model.export(format="engine")
الاستدلال التراثي باستخدام YOLOv5
إذا كنت تقوم بصيانة خط أنابيب قديم، YOLOv5 مباشرة مع آلية التحميل الأصلية PyTorch مما يجعل من السهل إدراجه في نصوص الاستدلال الحالية.
import torch
# Load a custom or pretrained YOLOv5 model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Perform inference on an image URL
results = model("https://ultralytics.com/images/zidane.jpg")
# Print prediction details to the console
results.print()
مرونة النشر
يدعم كلا النموذجين تنسيقات تصدير واسعة النطاق. سواء كنت تستهدف NVIDIA Jetson باستخدام TensorRT أو تطبيق iOS باستخدام CoreML، فإن عملية النشر موثقة بالكامل ومدعومة من قبل المجتمع.
حالات الاستخدام المثالية
يعتمد الاختيار بين هذه النماذج بشكل كبير على مرحلة دورة حياة مشروعك ومتطلباته المحددة.
متى تختار YOLOv5
- الحفاظ على قواعد التعليمات البرمجية القديمة: إذا كانت بيئة الإنتاج الخاصة بك مُخصصة بشكل كبير حول بنية مستودع YOLOv5 أو تقنيات تطور المعلمات الفائقة المحددة.
- الأسس الأكاديمية: عند نشر بحث يتطلب مقارنة معيارية مباشرة بمعايير رؤية الكمبيوتر الراسخة للفترة 2020-2022.
متى تختار YOLO11
- مشاريع متعددة المهام: عندما يتطلب تطبيقك مزيجًا من المهام مثل تقدير الوضعية (pose estimation) وتجزئة الكائنات (instance segmentation) باستخدام واجهة برمجة تطبيقات (API) موحدة واحدة.
- عمليات النشر على الحافة: لسيناريوهات الحوسبة الحافة حيث يكون استخلاص أقصى mAP لميزانية حاسوبية معينة (FLOPs) أمرًا بالغ الأهمية.
- حلول الذكاء الاصطناعي التجارية: مثالية لتطبيقات الشركات في قطاعي التجزئة والأمن، بالاستفادة من الدعم القوي لمنصة Ultralytics Platform.
الجيل القادم: Ultralytics
بينما YOLO11 توازنًا رائعًا بين السرعة والدقة، فإن مجال الذكاء الاصطناعي يتطور بسرعة. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة اليوم، نوصي بشدة باستكشاف أحدث المعايير في مجال الذكاء الاصطناعي البصري: Ultralytics .
صدر YOLO26 في يناير 2026، ويقدم تطورات تغير النموذج المصممة خصيصًا لتلبية احتياجات النشر الحديثة:
- تصميم شامل خالٍ من NMS: استنادًا إلى المفاهيم التي تم ابتكارها لأول مرة في YOLOv10، يتميز YOLO26 بتصميم شامل أصيل. فهو يلغي الحاجة إلى معالجة ما بعد التثبيط غير الأقصى (NMS)، مما يبسط بشكل كبير مسارات النشر ويقلل من زمن الانتقال.
- مُحسِّن MuSGD: مستوحى من ابتكارات تدريب نماذج اللغة الكبيرة (LLM) من نماذج مثل Kimi K2 من Moonshot AI، يضمن هذا الهجين من SGD و Muon تدريبًا مستقرًا بشكل لا يصدق وتقاربًا أسرع بشكل كبير.
- سرعة CPU غير مسبوقة: عن طريق إزالة Distribution Focal Loss (DFL)، يحقق YOLO26 سرعة استدلال على CPU أسرع بنسبة تصل إلى 43%، مما يجعله الخيار الأفضل على الإطلاق للأجهزة الطرفية والبيئات التي لا تحتوي على GPUs مخصصة.
- دوال الخسارة المتقدمة: يحقق دمج ProgLoss و STAL تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لتحليلات الطائرات بدون طيار، وإنترنت الأشياء، والروبوتات.
- تحسينات خاصة بالمهام: تقدم تحسينات متخصصة، مثل تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) للوضعية، وخسارة زاوية متخصصة لـ الصناديق المحيطة الموجهة، مما يضمن أداءً فائقًا عبر جميع مهام الرؤية الحاسوبية.
بالنسبة للمستخدمين المهتمين بالبنى المتخصصة التي تتجاوز الكشف القياسي عن الكائنات، يمكنكم أيضًا استكشاف نماذج مثل RT-DETR للكشف القائم على المحولات، أو YOLO للتتبع والكشف باستخدام مفردات مفتوحة. إن استخدام هذه الأدوات التي تتم صيانتها جيدًا والمحسّنة للغاية يضمن بقاء خطوط إنتاج الرؤية الحاسوبية الخاصة بك فعالة وقابلة للتطوير ومتقدمة على منافسيها.