YOLOv5 YOLOv10: مقارنة تقنية شاملة
شهد مجال الرؤية الحاسوبية في الوقت الحقيقي نمواً هائلاً خلال السنوات القليلة الماضية، حيث دفعت العديد من البنى الهندسية حدود الإمكانيات المتاحة على الأجهزة الحديثة. عند تقييم أحدث البنى الهندسية، فإن المقارنة بين YOLOv5 و YOLOv10 تسلط الضوء على خطوة تطورية مهمة في مجال اكتشاف الأجسام. يستكشف هذا التحليل التقني المتعمق نماذج هندستها المعمارية، ومفاضلات الأداء، وكيف يمكن للمطورين الاستفادة من هذه الأدوات في بيئات الإنتاج.
نظرة معمارية متعمقة
فهم الاختلافات الهيكلية بين هذه النماذج أمر بالغ الأهمية لتطبيقها بكفاءة في العالم الواقعي.
Ultralytics YOLOv5: معيار الصناعة
قدمت Ultralytics YOLOv5 منذ فترة طويلة بتوازنها الفريد بين السرعة والدقة وسهولة الوصول.
- المؤلف: غلين جوشر
- المنظمة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: YOLOv5
- الوثائق: YOLOv5
YOLOv5 على آلية كشف قائمة على المراسي مقترنة ببنية أساسية CSPDarknet محسّنة بشكل عميق. تعتمد هذه البنية بشكل كبير على العمليات القياسية المدعومة عبر جميع محركات الاستدلال تقريبًا، مما يجعلها متعددة الاستخدامات بشكل لا يصدق. تكمن قوتها الرئيسية في Python الذي يوفر تجربة مستخدم مبسطة وواجهة برمجة تطبيقات بسيطة ووثائق شاملة. بالإضافة إلى ذلك، فإن متطلبات الذاكرة المنخفضة YOLOv5 مقارنة بالنماذج القائمة على المحولات تعني أنه يتم تدريبه بسرعة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين دون الحاجة إلى ذاكرة VRAM باهظة الثمن.
YOLOv10: تطوير النموذج
تم تطوير YOLOv10 من قبل باحثين في جامعة تسينغهوا، YOLOv10 معالجة مشاكل التأخير المحددة التي كانت موجودة في البنى السابقة.
- المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
- المنظمة: جامعة Tsinghua
- التاريخ: 2024-05-23
- ArXiv: 2405.14458
- GitHub: YOLOv10
- الوثائق: YOLOv10
السمة المميزة لـ YOLOv10 تصميمها الأصلي NMS(Non-Maximum Suppression). من خلال استخدام التعيينات المزدوجة المتسقة أثناء التدريب، يلغي النموذج الحاجة إلى NMS أثناء الاستدلال. هذا التخفيض النظري في زمن الاستجابة مفيد للغاية لعمليات النشر التي تعمل على أجهزة متطورة مزودة بـ NVIDIA TensorRT ، على الرغم من أنه قد يؤدي إلى تعقيدات هيكلية للأجهزة الطرفية.
ميزة النظام البيئي
بينما YOLOv10 ابتكارات معمارية مثيرة للاهتمام، فإن Ultralytics مثل YOLOv5 YOLO26 الأحدث مدعومة أصلاً ضمن Ultralytics مما يوفر كفاءة تدريب فائقة وتطور تلقائي للمعلمات الفائقة وخيارات تصدير واسعة النطاق جاهزة للاستخدام.
تحليل الأداء
عند مقارنة هذه النماذج، فإن التوازن بين الدقة (mAP) والتكلفة الحسابية (الكمون والمعلمات) هو الذي يحدد أفضل حالة استخدام. فيما يلي مقارنة الأداء الفني على COCO .
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
يحقق YOLOv10 أعلى mAP50-95 على نطاقات أحجام متكافئة، مستفيدًا من تصميم نموذجه الحديث القائم على الكفاءة والدقة. ومع ذلك، يحافظ YOLOv5 على زمن انتقال تنافسي بشكل لا يصدق، خاصة في المستويات النانو والصغيرة، مما يجعله موثوقًا للغاية للبيئات المضمنة المحدودة مثل الـ NVIDIA Jetson خط أو وحدات المعالجة المركزية القياسية عبر OpenVINO.
منهجيات التدريب والنظام البيئي
ترتبط قيمة النموذج ارتباطًا وثيقًا بالنظام البيئي المحيط به. تحافظ Ultralytics على نظام بيئي يتم صيانته بشكل استثنائي يدعم مجموعة واسعة بشكل لا يصدق من المهام. فبينما يركز YOLOv10 بشكل صارم على اكتشاف الكائنات ثنائي الأبعاد، تدعم Ultralytics بشكل أصلي تجزئة الكائنات (instance segmentation)، وتصنيف الصور، وتقدير الوضعيات، والصناديق المحيطة الموجهة (OBB).
علاوة على ذلك، يتطلب تدريب Ultralytics ذاكرة أقل بكثير من الطرق المنافسة القائمة على المحولات، مما يحافظ على سرعة دورة التطوير وفعاليتها من حيث التكلفة.
تنفيذ الكود السلس
يتم توحيد تدريب النماذج والتحقق من صحتها وتصديرها تحت واجهة برمجة تطبيقات واحدة. يمكنك التبديل بين النماذج بمجرد تغيير سلسلة أحرف.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model for baseline testing
model_v5 = YOLO("yolov5s.pt")
# Load a YOLOv10 model for comparison
model_v10 = YOLO("yolov10s.pt")
# Train the model on the COCO8 dataset efficiently
results = model_v5.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Automatically utilizes PyTorch CUDA acceleration
batch=16,
)
# Export to ONNX for CPU inference deployment
model_v5.export(format="onnx", simplify=True)
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLOv5 و YOLOv10 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار YOLOv5
YOLOv5 خيار قوي لـ:
- أنظمة الإنتاج المثبتة: العمليات المنشورة الحالية حيث تُقدر سجل YOLOv5 الطويل في الاستقرار، والتوثيق الشامل، والدعم المجتمعي الهائل.
- التدريب محدود الموارد: البيئات ذات موارد GPU المحدودة حيث تكون خطة تدريب YOLOv5 الفعالة ومتطلبات الذاكرة الأقل مفيدة.
- دعم واسع لتنسيقات التصدير: المشاريع التي تتطلب النشر عبر العديد من التنسيقات بما في ذلك ONNX وTensorRT وCoreML وTFLite.
متى تختار YOLOv10
يوصى YOLOv10 في الحالات التالية:
- detect في الوقت الفعلي خالٍ من NMS: التطبيقات التي تستفيد من detect الشامل دون التثبيط غير الأقصى، مما يقلل من تعقيد النشر.
- مقايضات متوازنة بين السرعة والدقة: المشاريع التي تتطلب توازنًا قويًا بين سرعة الاستدلال ودقة الكشف عبر مقاييس النماذج المختلفة.
- تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال المتوقعة حاسمة، مثل الروبوتات أو الأنظمة المستقلة.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
- بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.
المستقبل: Ultralytics
بينما YOLOv5 إمكانية الوصول، YOLOv10 حدود الهندسة المعمارية NMS فإن أحدث التقنيات تستمر في التطور. بالنسبة للمشاريع الجديدة، نوصي بشدة باستخدام Ultralytics المتطورة، التي تم إصدارها في يناير 2026.
يجمع YOLO26 بين موثوقية Ultralytics والتطورات الرائدة:
- تصميم خالٍ من NMS وشامل: من خلال دمج نموذج خالٍ من NMS مباشرة في إطار عمل Ultralytics، يبسط YOLO26 النشر ويضمن زمن انتقال أقل.
- استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): مع إزالة Distribution Focal Loss (DFL)، يعد YOLO26 أسرع بشكل ملحوظ على الأجهزة الطرفية التي لا تحتوي على وحدات GPU.
- مُحسِّن MuSGD: مستوحى من ابتكارات تدريب نماذج اللغة الكبيرة (LLM) من Moonshot AI، يوفر مُحسِّن MuSGD استقرارًا غير مسبوق وتقاربًا سريعًا.
- ProgLoss + STAL: تعمل دوال الخسارة الجديدة هذه على تحسين التعرف على الأجسام الصغيرة بشكل كبير، وهو أمر حيوي لمجالات مثل صور الطائرات بدون طيار والروبوتات.
يمكنك إدارة YOLO26 وتدريبه ونشره مباشرة عبر Ultralytics .
الخلاصة
غالبًا ما يعود الاختيار بين YOLOv5 و YOLOv10 إلى قيود المشروع المحددة. يقدم YOLOv10 قيمة mAP ممتازة للباحثين والتطبيقات التي تستفيد من الإنتاجية الخام لوحدة معالجة الرسوميات (GPU). على النقيض، يظل YOLOv5 أداة عمل موثوقة ومتوافقة للغاية لعمليات النشر القياسية.
ومع ذلك، فإن مجال الرؤية الحاسوبية مجال ديناميكي. وللاستفادة من أفضل توازن في الأداء، وتعدد الاستخدامات، وسهولة الاستخدام، يجب على المطورين اللجوء إلى Ultralytics . فهو يجمع بين سرعة الاستدلال NMS Ultralytics القوي والموثق جيدًا، مما يضمن أن حلول الرؤية الحاسوبية الخاصة بك ستكون جاهزة للمستقبل. بالنسبة لحالات الاستخدام المتخصصة، يمكن للمطورين أيضًا استكشاف YOLO11 للحصول على متانة عامة، أو RT-DETR للحصول على دقة قائمة على المحولات.