تخطي إلى المحتوى

YOLOv6-3.0 ضد YOLOv5: مقارنة فنية للكشف عن الكائنات

يعد اختيار البنية المناسبة لمشروع رؤية الحاسوب الخاص بك قرارًا محوريًا يؤثر على الأداء وسهولة النشر والصيانة على المدى الطويل. اثنان من المتنافسين البارزين في مجال الكشف عن الكائنات في الوقت الفعلي هما YOLOv6-3.0 من Meituan و YOLOv5 من Ultralytics. يقدم هذا الدليل مقارنة فنية مفصلة لمساعدة المطورين والباحثين على اختيار النموذج الذي يتوافق بشكل أفضل مع متطلباتهم المحددة، سواء كانوا يعطون الأولوية لإنتاجية GPU الأولية أو نظام بيئي متعدد الاستخدامات وسهل الاستخدام.

تحليل مقاييس الأداء

يعرض الجدول أدناه مقارنة مباشرة لمقاييس الأداء على مجموعة بيانات COCO. في حين أن YOLOv6-3.0 يدفع حدود الدقة القصوى على أجهزة GPU، تحافظ Ultralytics YOLOv5 على سمعة الكفاءة الاستثنائية، خاصة على CPU، وتعقيد أقل بكثير للنموذج (المعلمات وعمليات FLOPs) لمتغيراتها خفيفة الوزن.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

التحليل: تسلط البيانات الضوء على أن نموذج YOLOv5n (Nano) هو نموذج متميز للبيئات ذات الموارد المحدودة، حيث يتباهى بأقل عدد من المعلمات (2.6 مليون) وعمليات الفاصلة العائمة في الثانية (7.7 مليار)، مما يترجم إلى سرعات استدلال فائقة لوحدة المعالجة المركزية CPU. وهذا يجعله مناسبًا جدًا لتطبيقات الذكاء الاصطناعي الطرفي حيث الذاكرة والطاقة نادرتان. وعلى العكس من ذلك، يستهدف YOLOv6-3.0 mAPval أعلى على حساب زيادة حجم النموذج، مما يجعله مرشحًا قويًا للإعدادات الصناعية مع أجهزة GPU مخصصة.

Meituan YOLOv6.0: الدقة الصناعية

المؤلفون: تشوي لي، لولو لي، ييفي قنغ، هونغ ليانغ جيانغ، منغ تشنغ، بو تشانغ، زيدان كه، شياو مينغ شو، و شيانغ شيانغ تشو
المنظمة: ميتوان
التاريخ: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
المستندات: https://docs.ultralytics.com/models/yolov6/

YOLOv6-3.0 الذي تم تطويره بواسطة Meituan، هو إطار عمل لاكتشاف الكائنات مصمم خصيصًا للتطبيقات الصناعية. وهو يركز على تحقيق مقايضة مواتية بين سرعة الاستدلال والدقة، وتحديدًا التحسين للأداء المدرك للأجهزة على وحدات معالجة الرسومات GPUs.

البنية والميزات الرئيسية

تتضمن YOLOv6 تصميم عمود فقري فعال وهيكل قابل لإعادة المعلمات (نمط RepVGG) يبسط النموذج أثناء الاستدلال مع الحفاظ على قدرات استخلاص الميزات المعقدة أثناء التدريب. قدم الإصدار 3.0 تقنيات مثل التقطير الذاتي واستراتيجية التدريب المدعومة بالمرساة لزيادة الأداء.

نقاط القوة والضعف

  • دقة GPU عالية: يقدم درجات mAP تنافسية على مجموعة بيانات COCO، مما يجعله مناسبًا لمهام مراقبة الجودة في التصنيع.
  • Quantization Support: يوفر دعمًا خاصًا لتكميم النموذج لتسريع النشر.
  • تنوع محدود: مصمم بشكل أساسي لـ اكتشاف الكائنات detect، ويفتقر إلى الدعم الأصلي للمهام الأوسع مثل تقسيم المثيل أو تقدير الوضع الموجود في الأطر الأخرى.
  • نفقات عامة أعلى للموارد: تتطلب المتغيرات الأكبر حجمًا مزيدًا من الذاكرة وقوة الحوسبة مقارنة بنماذج YOLOv5 خفيفة الوزن المكافئة.

تعرف على المزيد حول YOLOv6

Ultralytics YOLOv5: معيار النظام البيئي

المؤلفون: Glenn Jocher
المنظمة: Ultralytics
التاريخ: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
المستندات: https://docs.ultralytics.com/models/yolov5/

Ultralytics YOLOv5 هو نموذج أسطوري في مجال رؤية الكمبيوتر، ويشتهر بتصميمه الذي يركز على المستخدم، وموثوقيته، والنظام البيئي الشامل الذي يحيط به. لا يزال أحد أكثر النماذج انتشارًا على مستوى العالم نظرًا لتوازنه بين السرعة والدقة وسهولة الاستخدام.

البنية والميزات الرئيسية

يستخدم YOLOv5 عمودًا فقريًا CSPDarknet مقترنًا بعنق PANet لدمج الميزات القوي. إنه يستخدم آلية الكشف المستندة إلى المرساة، والتي أثبتت أنها مستقرة للغاية عبر مجموعات البيانات المختلفة. البنية معيارية للغاية، حيث تقدم خمسة مقاييس (n, s, m, l, x) لتناسب كل شيء بدءًا من الأجهزة المدمجة وحتى الخوادم السحابية.

لماذا تختار YOLOv5؟

  • سهولة الاستخدام: تعطي Ultralytics الأولوية لتجربة المطور من خلال Python API بسيط وإعداد بيئة تلقائي وتوثيق شامل.
  • تنوع الاستخدامات: على عكس العديد من المنافسين، يدعم YOLOv5 تصنيف الصور و تقسيم المثيلات خارج الصندوق.
  • كفاءة التدريب: معروفة بسرعة التقارب وانخفاض استخدام الذاكرة أثناء التدريب، مما يوفر التكاليف على موارد الحوسبة.
  • مرونة النشر: يتم التصدير بسلاسة إلى تنسيقات مثل ONNX و TensorRT و CoreML و TFLite لتكامل الأجهزة المتنوعة.

النظام البيئي المتكامل

تتمثل إحدى أعظم مزايا استخدام YOLOv5 في نظام Ultralytics البيئي. يتيح التكامل مع أدوات مثل Ultralytics HUB تدريب النماذج ومعاينتها بدون تعليمات برمجية، بينما يتيح الدعم المدمج لتتبع التجارب عبر Comet و MLflow تبسيط سير عمل MLOps.

تعرف على المزيد حول YOLOv5

مقارنة تفصيلية

الهندسة المعمارية وفلسفة التصميم

يعتمد YOLOv6-3.0 بشكل كبير على البحث عن البنية العصبية المدركة للأجهزة وإعادة التهيئة لزيادة الإنتاجية إلى أقصى حد على بنيات GPU محددة (مثل Tesla T4). في المقابل، يركز YOLOv5 على تصميم عالمي يعمل بشكل موثوق عبر وحدات المعالجة المركزية CPUs ووحدات معالجة الرسوميات GPUs ووحدات المعالجة العصبية NPUs. غالبًا ما يكون الكاشف القائم على المرساة الخاص بـ YOLOv5 أسهل في الضبط لمجموعات البيانات المخصصة ذات الكائنات الصغيرة مقارنة ببعض الأساليب الخالية من المرساة.

سهولة الاستخدام ومنهجية التدريب

تم تصميم نماذج Ultralytics لتكون "جاهزة للتدريب". باستخدام YOLOv5، تعمل ميزات مثل AutoAnchor على ضبط مربعات الارتساء تلقائيًا لملصقات مجموعة البيانات الخاصة بك، ويساعد تطور المعلمات الفائقة الذكي في العثور على إعدادات التدريب المثالية. يتطلب YOLOv6 إعدادًا يدويًا أكثر تميزًا لمستودعات الأبحاث التقليدية، مما قد يمثل منحنى تعليمي أكثر حدة للمستخدمين الجدد.

حالات الاستخدام في العالم الحقيقي

  • Ultralytics YOLOv5: مثالي للنماذج الأولية السريعة وعمليات النشر المتنوعة. نموذج 'Nano' خفيف الوزن مثالي للمراقبة القائمة على الطائرات بدون طيار أو تطبيقات الهاتف المحمول التي تتطلب الاستدلال في الوقت الفعلي على CPU. كما أن دعمه لـ segmentation يجعله ذا قيمة لمهام التصوير الطبي مثل segmentation الخلايا.
  • YOLOv6-3.0: الأنسب للبيئات الصناعية الثابتة حيث تتوفر وحدات معالجة الرسوميات (GPU) المتطورة، والمقياس الأساسي هو mAP. تتضمن الأمثلة الفحص البصري الآلي (AOI) في تصنيع الإلكترونيات.

مثال على التعليمات البرمجية: تشغيل YOLOv5

تتجلى بساطة YOLOv5 بشكل أفضل من خلال قدرتها على تشغيل الاستدلال ببضعة أسطر فقط من التعليمات البرمجية باستخدام PyTorch Hub. وهذا يلغي خطوات التثبيت المعقدة ويسمح للمطورين باختبار النموذج على الفور.

import torch

# Load the YOLOv5s model from the official Ultralytics Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image URL (or local path)
img = "https://ultralytics.com/images/zidane.jpg"

# Perform inference
results = model(img)

# Display results
results.show()

# Print detailed results regarding detected objects
results.print()

تعد سهولة الوصول هذه علامة مميزة لفلسفة Ultralytics، مما يُمكّن ممارسي رؤية الحاسوب من التركيز على حل المشكلات بدلاً من تصحيح مشكلات البيئة.

الخلاصة

يخدم كلا التصميمين المعماريين أدوارًا مهمة في مشهد الرؤية الحديث. يقدم Meituan YOLOv6-3.0 خيارًا مقنعًا للمستخدمين الذين يركزون بشكل صارم على زيادة دقة الاكتشاف على أجهزة GPU.

ومع ذلك، يظل Ultralytics YOLOv5 الخيار الأفضل لمعظم المطورين نظرًا لتعدد استخداماته التي لا مثيل لها، وكفاءة التدريب، ونظامه البيئي القوي. إن القدرة على النشر بسهولة على الأجهزة الطرفية، إلى جانب دعم التقسيم والتصنيف، تجعل YOLOv5 حلاً شاملاً لتحديات الذكاء الاصطناعي في العالم الحقيقي.

بالنسبة لأولئك الذين يبحثون عن أحدث ما توصلت إليه الأداء المتطور، نوصي باستكشاف Ultralytics YOLO11. يعتمد YOLO11 على إرث YOLOv5 بدقة وسرعة وقدرات غنية بالميزات أكبر، مما يمثل مستقبل رؤية الذكاء الاصطناعي. تتوفر أيضًا نماذج متخصصة أخرى مثل RT-DETR لتطبيقات تعتمد على المحولات.

استكشف المجموعة الكاملة من الأدوات والنماذج في وثائق نماذج Ultralytics.


تعليقات