YOLOv6.0 مقابل YOLOv5: مقارنة تقنية لاكتشاف الأجسام
يعد اختيار البنية المناسبة لمشروع الرؤية الحاسوبية الخاص بك قرارًا محوريًا يؤثر على الأداء وسهولة النشر والصيانة على المدى الطويل. اثنان من المتنافسين البارزين في مجال الكشف عن الأجسام في الوقت الحقيقي هما YOLOv6.0 من Meituan و UltralyticsYOLOv5. يوفر هذا الدليل مقارنة تقنية مفصلة لمساعدة المطورين والباحثين على اختيار النموذج الذي يتوافق بشكل أفضل مع متطلباتهم المحددة، سواء كانت الأولوية لإنتاجية GPU الخام أو نظام بيئي متعدد الاستخدامات وسهل الاستخدام.
تحليل مقاييس الأداء
يعرض الجدول أدناه مقارنة مباشرة لمقاييس الأداء على مجموعة بياناتCOCO . بينما يتخطى YOLOv6.0 حدود ذروة الدقة على أجهزة GPU , Ultralytics YOLOv5 يحتفظ بسمعةٍ طيبة من حيث الكفاءة الاستثنائية، خاصةً على CPU وتعقيد النموذج (المعلمات وعمليات التشغيل FLOP) الأقل بكثير لمتغيراته خفيفة الوزن.
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0 م | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0L | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
التحليل: تسلط البيانات الضوء على أن نموذج YOLOv5n (Nano) هو نموذج متميز للبيئات محدودة الموارد، حيث يتميز بأقل عدد معلمات (2.6 مليون) وفلوب (7.7 مليار)، وهو ما يُترجم إلى سرعات استدلال فائقة CPU . وهذا يجعلها مناسبة للغاية لتطبيقات الذكاء الاصطناعي المتطورة حيث تكون الذاكرة والطاقة شحيحة. وعلى العكس من ذلك، يستهدف YOLOv6.0 mAPMAPval أعلى على حساب زيادة حجم النموذج، مما يجعله مرشحًا قويًا للإعدادات الصناعية المزودة بأجهزة GPU مخصصة.
Meituan YOLOv6.0: الدقة الصناعية
المؤلفون: تشوي لي، ولولو لي، ويفي قنغ، وهونغليانغ جيانغ، ومنغ تشنغ، وبو تشانغ، وبو تشانغ، وزيدان كي، وشياومينغ شو، وشيانغ شيانغ تشو
المنظمة: Meituan
التاريخ: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586https://arxiv.org/abs/2301.05586
GitHub: YOLOv6
Docs: https:ultralytics
تم تطويره بواسطة Meituan، YOLOv6.0 هو إطار عمل للكشف عن الكائنات مصمم خصيصًا للتطبيقات الصناعية. وهو يركز على تحقيق مفاضلة مواتية بين سرعة الاستدلال والدقة، وتحديدًا تحسين الأداء المدرك للأجهزة على وحدات معالجة الرسومات.
البنية والميزات الرئيسية
يتضمن YOLOv6 تصميمًا فعالاً للعمود الفقري وبنية قابلة لإعادة المعلمات (على غرار RepVGG) التي تبسط النموذج أثناء الاستدلال مع الحفاظ على قدرات استخراج السمات المعقدة أثناء التدريب. قدم الإصدار 3.0 تقنيات مثل التقطير الذاتي واستراتيجية التدريب بمساعدة المرساة لتعزيز الأداء بشكل أكبر.
نقاط القوة والضعف
- دقة عالية GPU : توفر نتائج تنافسية mAP مجموعة بياناتCOCO مما يجعلها مناسبة لمهام مراقبة الجودة في التصنيع.
- دعم التكميم الكمي: يوفر دعمًا محددًا لتكميم النماذج لتسريع عملية النشر.
- براعة محدودة: تم تصميمه في المقام الأول لاكتشاف الأجسام، ويفتقر إلى الدعم الأصلي للمهام الأوسع نطاقًا مثل تجزئة النماذج أو تقدير الوضعيات الموجودة في أطر عمل أخرى.
- عبء موارد أعلى: تتطلب المتغيرات الأكبر حجمًا المزيد من الذاكرة والقدرة الحاسوبية مقارنةً بنماذج YOLOv5 خفيفة الوزن المكافئة.
Ultralytics YOLOv5: معيار النظام الإيكولوجي
المؤلفون: جلين جوشر
المنظمة: Ultralytics
التاريخ: 2020-06-26
GitHub: yolov5
المستندات: https:yolov5
Ultralytics YOLOv5 نموذجًا أسطوريًا في مجال الرؤية الحاسوبية، ويُشتهر بتصميمه الذي يركز على المستخدم وموثوقيته والنظام البيئي الشامل الذي يحيط به. ولا يزال أحد أكثر النماذج انتشارًا على مستوى العالم نظرًا لتوازنه بين السرعة والدقة وسهولة الاستخدام.
البنية والميزات الرئيسية
يستخدم YOLOv5 العمود الفقري لشبكة CSPDarknet مقترنًا برقبة PANet لدمج الميزات القوية. ويستخدم آلية كشف قائمة على الارتكاز، والتي أثبتت استقرارًا كبيرًا عبر مجموعات بيانات مختلفة. تتميز البنية بأنها معيارية للغاية، حيث تقدم خمسة مقاييس (n، s، m، l، x) لتناسب كل شيء بدءًا من الأجهزة المدمجة إلى الخوادم السحابية.
لماذا تختار YOLOv5
- سهولة الاستخدام: تعطي Ultralytics الأولوية لتجربة المطورين من خلال واجهة برمجة تطبيقات Python البسيطة، والإعداد التلقائي للبيئة، والتوثيق الشامل.
- تعدد الاستخدامات: على عكس العديد من المنافسين، يدعم YOLOv5 تصنيف الصور وتجزئة المثيل خارج الصندوق.
- كفاءة التدريب: معروف بالتقارب السريع والاستخدام المنخفض للذاكرة أثناء التدريب، مما يوفر التكاليف على موارد الحوسبة.
- مرونة النشر: التصدير بسلاسة إلى تنسيقات مثل ONNX, TensorRTو CoreML و TFLite لتكامل الأجهزة المتنوعة.
النظام البيئي المتكامل
أحد أعظم مزايا استخدام YOLOv5 هو نظام Ultralytics البيئي. يسمح التكامل مع أدوات مثل Ultralytics HUB بالتدريب على النماذج ومعاينتها دون الحاجة إلى برمجة، بينما يتيح الدعم المدمج لتتبع التجارب عبر Comet و MLflow تبسيط سير عمل MLOps.
مقارنة تفصيلية
فلسفة العمارة والتصميم
يعتمد YOLOv6.0 بشكل كبير على البحث في البنية العصبية المدركة للأجهزة وإعادة تحديد المعلمات لزيادة الإنتاجية إلى أقصى حد على بنيات GPU محددة (مثل Tesla T4). على النقيض من ذلك, YOLOv5 على تصميم عالمي يعمل بشكل موثوق عبر وحدات المعالجة المركزية ووحدات معالجة الرسومات ووحدات المعالجة العصبية. غالبًا ما يكون من الأسهل ضبط كاشف YOLOv5 القائم على الارتكاز لمجموعات البيانات المخصصة ذات الكائنات الصغيرة مقارنةً ببعض الأساليب الخالية من الارتكاز.
منهجية الاستخدام والتدريب
تم تصميم نماذج Ultralytics لتكون "جاهزة للتدريب". مع YOLOv5 تساعد ميزات مثل AutoAnchor على ضبط مربعات الارتكاز تلقائيًا على تسميات مجموعة البيانات الخاصة بك، ويساعد التطور الذكي للمعامل الفائق في العثور على إعدادات التدريب المثلى. يتطلّب YOLOv6 إعدادًا يدويًا أكثر من خصائص مستودعات البحث التقليدية، مما قد يمثل منحنى تعليمي أكثر حدة للمستخدمين الجدد.
حالات الاستخدام في العالم الحقيقي
- Ultralytics YOLOv5: مثالي للنماذج الأولية السريعة وعمليات النشر المتنوعة. نموذج "النانو" خفيف الوزن مثالي للمراقبة القائمة على الطائرات بدون طيار أو تطبيقات الأجهزة المحمولة التي تتطلب الاستدلال في الوقت الفعلي على CPU. كما أن دعمها للتجزئة يجعلها ذات قيمة لمهام التصوير الطبي مثل تجزئة الخلايا.
- YOLOv6.0: الأنسب للبيئات الصناعية الثابتة التي تتوفر فيها وحدات معالجة الرسومات المتطورة، ويكون المقياس الأساسي هو mAP. ومن الأمثلة على ذلك الفحص البصري الآلي (AOI) في تصنيع الإلكترونيات.
مثال على الكود: تشغيل YOLOv5
تتجلى بساطة YOLOv5 على أفضل وجه من خلال قدرته على تشغيل الاستدلال ببضعة أسطر من التعليمات البرمجية باستخدام PyTorch Hub. وهذا يلغي خطوات التثبيت المعقدة ويسمح للمطورين باختبار النموذج على الفور.
import torch
# Load the YOLOv5s model from the official Ultralytics Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)
# Define an image URL (or local path)
img = "https://ultralytics.com/images/zidane.jpg"
# Perform inference
results = model(img)
# Display results
results.show()
# Print detailed results regarding detected objects
results.print()
هذه السهولة في الوصول هي السمة المميزة لفلسفة Ultralytics مما يمكّن ممارسي الرؤية الحاسوبية من التركيز على حل المشاكل بدلاً من تصحيح مشاكل البيئة.
الخلاصة
تخدم كلتا البنيتين أدوارًا مهمة في مشهد الرؤية الحديثة. يوفر Meituan YOLOv6.0 خيارًا مقنعًا للمستخدمين الذين يركزون بشكل صارم على زيادة دقة الكشف على أجهزة GPU .
ومع ذلك, Ultralytics YOLOv5 يظل الخيار الأفضل لمعظم المطورين نظرًا لتعدد استخداماته التي لا مثيل لها، وكفاءة التدريب، ونظامه البيئي القوي. إن القدرة على النشر بسهولة على الأجهزة المتطورة، إلى جانب دعم التجزئة والتصنيف، يجعل من YOLOv5 حلاً شاملاً لتحديات الذكاء الاصطناعي في العالم الحقيقي.
لأولئك الذين يبحثون عن أحدث ما توصلت إليه التكنولوجيا الحديثة في الأداء، نوصي باستكشاف Ultralytics YOLO11. يعتمد YOLO11 على إرث YOLOv5 مع دقة وسرعة أكبر وقدرات غنية بالميزات، مما يمثل مستقبل الذكاء الاصطناعي البصري. نماذج متخصصة أخرى مثل RT-DETR متاحة أيضًا للتطبيقات القائمة على المحولات.
استكشف المجموعة الكاملة من الأدوات والنماذج في وثائق نماذجUltralytics .