YOLOv10 مقابل YOLOv5: البنية والأداء المتعمق
في مجال الرؤية الحاسوبية سريع التطور، يعد اختيار النموذج الصحيح لاكتشاف الأجسام أمرًا بالغ الأهمية لنجاح المشروع. تستكشف هذه المقارنة الاختلافات التقنية بين YOLOv10، وهو إصدار أكاديمي حديث يركز على التدريب NMS و YOLOv5وهو النموذج الأسطوري من Ultralytics المعروف بقوته واعتماده على مستوى الصناعة. وعلى الرغم من أن كلا النموذجين ينبعان من سلالة You Only Look Once، إلا أنهما يلبيان أولويات هندسية وبيئات نشر مختلفة.
نظرة عامة على الطرازات
YOLOv10: أخصائي الكفاءة
تم إصدار YOLOv10 في مايو 2024 من قبل باحثين في جامعة تسينغهوا، ويقدم YOLOv10 آليات معمارية مصممة للتخلص من الحاجة إلى الكبح غير الأقصى (NMS) أثناء الاستدلال. من خلال استخدام التعيينات المزدوجة المتسقة أثناء التدريب، يهدف YOLOv10 إلى تقليل زمن الاستجابة من طرف إلى طرف، مما يجعله مرشحًا قويًا للتطبيقات المتطورة حيث يكون كل جزء من الثانية من زمن الاستجابة للاستدلال مهمًا.
- المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
- المنظمة: جامعة تسينغ هوا
- التاريخ: 2024-05-23
- Arxiv:YOLOv10: الكشف عن الأجسام من النهاية إلى النهاية في الوقت الحقيقي
- جيثب:THU-MIG/yolov10
Ultralytics YOLOv5: معيار الصناعة
منذ إصداره في عام 2020 من قبل Ultralytics، حدد YOLOv5 سهولة الاستخدام في مجتمع الذكاء الاصطناعي. فهو يعطي الأولوية للتوازن بين السرعة والدقة والمنفعة الهندسية. بالإضافة إلى المقاييس الأولية، يوفر YOLOv5 نظامًا بيئيًا ناضجًا، حيث يتكامل بسلاسة مع أدوات النشر المتنقلة ومنصات تتبع التجارب وسير عمل إدارة مجموعات البيانات. ويمتد تعدد استخداماته إلى ما هو أبعد من الاكتشاف ليشمل تصنيف الصور وتجزئة النماذج.
- المؤلف: جلين جوتشر
- المنظمة: Ultralytics
- التاريخ: 2020-06-26
- جيثب:yolov5
الاختلافات المعمارية
يكمن الاختلاف الأساسي في كيفية معالجة التنبؤات. يستخدم YOLOv5 بنية محسّنة للغاية قائمة على الارتكاز تعتمد على NMS لتصفية المربعات المحدودة المتداخلة. هذه الطريقة مجربة وقوية عبر مجموعات بيانات متنوعة.
في المقابل، يستخدم YOLOv10 استراتيجية تعيين ثنائية متسقة. يسمح ذلك للنموذج بالتنبؤ بأفضل مربع واحد لكل كائن أثناء الاستدلال، مما يؤدي نظريًا إلى إزالة خطوة NMS بالكامل. هذا التخفيض في النفقات العامة بعد المعالجة هو أهم ما يميز YOLOv10 حيث يوفر زمن استجابة أقل على الأجهزة المتطورة مثل NVIDIA Jetson Orin Nano. بالإضافة إلى ذلك، يشتمل YOLOv10 على تصميمات ذات كفاءة شاملة في عموده الفقري ورأسه لتقليل المعلمات (البارامترات) وعمليات الفاصلة العائمة (FLOPs).
كفاءة الذاكرة
إحدى السمات المميزة لنماذج Ultralytics مثل YOLOv5 (و YOLO11) هي بصمة الذاكرة المحسّنة. على عكس بعض الكاشفات القائمة على المحولات التي تستهلك كميات هائلة من ذاكرة CUDA تم تصميم نماذج Ultralytics للتدريب بكفاءة على أجهزة من فئة المستهلك، مما يجعل الوصول إلى أحدث ما توصل إليه الذكاء الاصطناعي أمرًا ديمقراطيًا.
مقاييس الأداء
يسلط الجدول أدناه الضوء على مفاضلات الأداء. يُحقّق YOLOv10 عمومًا متوسط دقة أعلى في المتوسط (mAP) مع عدد أقل من المعلمات مقارنةً ببنية YOLOv5 الأقدم. ومع ذلك، لا يزال YOLOv5 منافسًا في سرعة الاستدلال الخام على تكوينات أجهزة معينة، خاصةً عند استخدام تنسيقات تصدير محسّنة مثل TensorRT أو ONNX.
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
نقاط القوة والضعف
تحليل YOLOv10
نقاط القوة:
- NMS: تعمل إزالة خطوة الإلغاء غير القصوى على تبسيط خط أنابيب النشر وتثبيت زمن انتقال الاستدلال.
- كفاءة المعلمة: يحقق دقة عالية مع أوزان نموذجية أصغر، وهو أمر مفيد للأجهزة ذات التخزين المحدود.
- دقة فائقة: يتفوق في الأداء على إصدارات YOLO الأقدم في مقاييس mAP البحتة على معيار COCO .
نقاط الضعف:
- براعة محدودة: يركز في المقام الأول على اكتشاف الأجسام، ويفتقر إلى الدعم الأصلي للمهام المعقدة مثل تقدير الوضعية أو اكتشاف الصندوق المحدد الموجه (OBB) الموجود في نماذج Ultralytics الأحدث.
- تطوير النظام البيئي: كنموذج يركز على البحث، قد يفتقر إلى المكونات الإضافية المجتمعية الواسعة والتكاملات التي تم اختبارها في المعارك والدعم المؤسسي المتاح لنماذج Ultralytics.
تحليل YOLOv5
نقاط القوة:
- براعة لا مثيل لها: يدعم الكشف والتجزئة والتصنيف خارج الصندوق.
- نظام بيئي قوي: مدعومة بـ Ultralyticsيتكامل بسهولة مع أدوات مثل Ultralytics HUB و Roboflow و Comet ML.
- جاهز للنشر: توجد وثائق مستفيضة للتصدير إلى CoreML TFLite TensorRT OpenVINO مما يضمن سلاسة نشر الإنتاج.
- كفاءة التدريب: يُعرف بديناميكيات التدريب المستقرة والاستخدام المنخفض للذاكرة، مما يجعله في متناول المطورين الذين لديهم إعدادات وحدة معالجة معالجة GPU واحدة.
نقاط الضعف:
- بنية متقادمة: على الرغم من أنها لا تزال قوية، إلا أن نسبة mAP النقية قد تجاوزتها الإصدارات الأحدث مثل YOLOv8 و YOLO11.
- تبعية المرساة: يعتمد على مربعات الارتكاز التي قد تتطلب ضبطًا يدويًا لمجموعات البيانات ذات نسب أبعاد الكائنات القصوى.
حالات الاستخدام المثالية
غالبًا ما يعود الاختيار بين هذين الخيارين إلى القيود المحددة لبيئة النشر الخاصة بك.
- اختر YOLOv10 إذا: كنت تقوم ببناء نظام مخصص لاكتشاف الكائنات لجهاز مدمج حيث يوفر التخلص من النفقات الحسابية الزائدة NMS ميزة سرعة حاسمة، أو إذا كنت تحتاج إلى أعلى مستوى مطلق من mAP من بصمة نموذج صغير.
- اختر YOLOv5 إذا: إذا كنت بحاجة إلى نموذج موثوق ومتعدد المهام لخط إنتاج. إن قدرتها على التعامل مع تجزئة النماذج وتصنيفها تجعلها "سكين الجيش السويسري" للذكاء الاصطناعي للرؤية. وعلاوةً على ذلك، إذا كان فريقك يعتمد على تدفقات عمل MLOps القياسية، فإن التكامل السلس ل YOLOv5 في نظام Ultralytics البيئي يقلل بشكل كبير من وقت التطوير.
تجربة المستخدم والنظام البيئي
إحدى السمات المميزة لنماذج Ultralytics هي التركيز على تجربة المطورين. وضع YOLOv5 معيار "إنه يعمل فقط"، وتستمر هذه الفلسفة. يمكن للمستخدمين تدريب نموذج YOLOv5 على بيانات مخصصة ببضعة أسطر من التعليمات البرمجية، والاستفادة من الأوزان المدربة مسبقًا لتسريع التقارب.
في المقابل، بينما يوفر YOLOv10 نتائج أكاديمية ممتازة، فإن دمجه في خطوط الإنتاج المعقدة قد يتطلب المزيد من الهندسة المخصصة. يحافظ Ultralytics على مجتمع مفتوح المصدر نابض بالحياة، مما يضمن سحق الأخطاء بسرعة وإضافة الميزات بناءً على ملاحظات المستخدمين في العالم الحقيقي.
مقارنة الرموز
تشغيل هذه النماذج بسيط ومباشر. فيما يلي أمثلة على كيفية التحميل والتنبؤ بكل منها باستخدام Python.
باستخدام YOLOv10:
from ultralytics import YOLO
# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")
# Perform inference on an image
results = model("path/to/image.jpg")
results[0].show()
باستخدام YOLOv5 (عبر PyTorch Hub):
import torch
# Load YOLOv5s from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Perform inference
results = model("path/to/image.jpg")
results.show()
الخلاصة
يمثل كلا النموذجين إنجازات كبيرة في مجال الرؤية الحاسوبية. YOLOv10 يتخطى حدود تحسين زمن الاستجابة من خلال تصميمه NMS مما يجعله خيارًا مثيرًا لمهام الكشف المتخصصة عالية السرعة.
ومع ذلك، بالنسبة لمعظم المطورين والمؤسسات، فإن نظامUltralytics البيئي - المتمثلهنا في الموثوقية الدائمة لـ YOLOv5 والأداء المتطور ل YOLO11-يقدم حلاً أكثر شمولاً. يضمن لك الجمع بين سهولة الاستخدام والتوثيق الشامل والقدرات متعددة المهام قضاء وقت أقل في تصحيح الأخطاء ووقت أطول في نشر القيمة.
بالنسبة لأولئك الذين يتطلعون إلى الترقية من YOLOv5 مع الاحتفاظ بمزايا النظام البيئي، نوصي بشدة باستكشاف YOLO11الذي يوفر أداءً متطورًا، واكتشافًا خاليًا من الارتكاز، ودعمًا لمجموعة كاملة من مهام الرؤية بما في ذلك OBB وتقدير الوضعية.