تخطي إلى المحتوى

YOLOv5 مقابل YOLOv6.0: الموازنة بين نضج النظام البيئي والدقة الصناعية

في المشهد سريع التطور في مجال الرؤية الحاسوبية، يعد اختيار البنية الصحيحة لاكتشاف الأجسام قرارًا محوريًا للمطورين والباحثين. تتعمق هذه المقارنة في الفروق التقنية بين Ultralytics YOLOv5وهو نموذج أسطوري يشتهر بإمكانية الوصول إليه ونظامه البيئي القوي، ونموذج Meituan YOLOv6.0، وهو إطار عمل مصمم خصيصًا للتطبيقات الصناعية. في حين أن كلا النموذجين يتفوقان في اكتشاف الأشياء، إلا أنهما يلبيان احتياجات النشر وتفضيلات سير العمل المختلفة.

Ultralytics YOLOv5

المؤلفون: جلين جوشر
المنظمة: Ultralytics
التاريخ: 2020-06-26
GitHub: yolov5
المستندات: https:yolov5

منذ إطلاقه في عام 2020، أثبت YOLOv5 نفسه كواحد من أكثر نماذج الذكاء الاصطناعي شهرة وموثوقية في العالم. بُنيت على PyTorch PyTorch، وأعطى الأولوية لقابلية الاستخدام والتصدير والأداء "الجاهز"، مما جعل الوصول إلى أحدث تقنيات الذكاء الاصطناعي للرؤية أمرًا ديمقراطيًا.

الهندسة المعمارية والنظام البيئي

يستخدم YOLOv5 عمودًا فقريًا لشبكة CSPDarknet مدمجًا مع عنق PANet ورأس على غرار YOLOv3. وتعتمد بنيته على المرساة باستخدام صناديق الارتكاز للتنبؤ بمواقع الكائنات. ومن أهم ما يميزها هو اندماجها في نظام بيئي ناضج. على عكس العديد من قواعد البرمجة البحثية، صُمم YOLOv5 كمنتج للمهندسين، ويتميز بتصدير سلس إلى تنسيقات مثل ONNXCoreML TFLite مما يجعله متعدد الاستخدامات بشكل استثنائي للنشر على الأجهزة المحمولة والحافة.

نقاط القوة الرئيسية

  • سهولة الاستخدام: تتسمYOLOv5 تجربةYOLOv5 " بالبساطة. بدءًا من تدريب مجموعات البيانات المخصصة إلى تشغيل الاستدلال، فإن سير العمل مبسط وموثق جيدًا.
  • نظام بيئي جيد الصيانة: يستفيد المستخدمون من الصيانة النشطة، والتحديثات المتكررة، والمجتمع الضخم. التكامل مع أدوات MLOPS مثل Weights & Biases و Comet هي أدوات أصلية.
  • تعدد الاستخدامات: بالإضافة إلى الاكتشاف القياسي، يدعم المستودع تجزئة النماذج وتصنيف الصور، مما يوفر حلاً متعدد المهام في قاعدة رموز واحدة.
  • كفاءة الذاكرة: تشتهر YOLOv5 ببصمة الذاكرة المنخفضة نسبيًا أثناء التدريب مقارنةً بالنماذج القائمة على المحولات، مما يجعلها متاحة على وحدات معالجة الرسومات من فئة المستهلك.

النشر السلس

يتيح تركيز YOLOv5 على قابلية التصدير للمطورين نشر النماذج بسهولة في بيئات متنوعة، من الخوادم السحابية إلى الأجهزة المتطورة مثل Raspberry Pi أو NVIDIA Jetson.

تعرف على المزيد حول YOLOv5

Meituan YOLOv6.0

المؤلفون: تشوي لي، ولولو لي، ويفي قنغ، وهونغليانغ جيانغ، ومنغ تشنغ، وبو تشانغ، وبو تشانغ، وزيدان كي، وشياومينغ شو، وشيانغ شيانغ تشو
المنظمة: Meituan
التاريخ: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586https://arxiv.org/abs/2301.05586
GitHub: YOLOv6
Docs: https:ultralytics

يضع YOLOv6.0، الذي طوره فريق الذكاء الاصطناعي للرؤية في Meituan، نفسه كمنافس صناعي يركز على تحقيق التوازن بين السرعة والدقة، خاصةً للتطبيقات التي تعتمد على الأجهزة. تم تصميمه لزيادة الإنتاجية إلى أقصى حد على وحدات معالجة الرسومات باستخدام TensorRT التحسين.

التركيز على الهندسة المعمارية والصناعية

يستخدم YOLOv6 العمود الفقري EfficientRR العمود الفقري لنموذج YOLOv6 وعنق Rep-PAN، مستفيدًا من تقنيات إعادة المعلمات (أسلوب RepVGG) لتحسين سرعة الاستدلال دون التضحية بالدقة. أثناء التدريب، يستخدم النموذج بنية متعددة الفروع، والتي تنهار إلى بنية أحادية الفرع أثناء الاستدلال. وقد أدخل الإصدار 3.0 استراتيجيات مثل التقطير الذاتي لتعزيز متوسط الدقة المتوسطة (mAP).

نقاط القوة والضعف

  • تحسينGPU : تم ضبط البنية بشكل كبير لاستدلال GPU القياسية، وغالبًا ما تحقق معايير FPS عالية على بطاقات NVIDIA T4 عند استخدام TensorRT.
  • صديقة للتقدير الكمي: يوفر Meituan دعمًا محددًا للتكميم الكمي بعد التدريب (PTQ) والتدريب الواعي بالتكميم الكمي (QAT)، وهو أمر بالغ الأهمية لبعض سيناريوهات النشر الصناعي.
  • براعة محدودة: على الرغم من أن YOLOv6 ممتاز في الاكتشاف، إلا أنه يفتقر إلى الدعم الواسع والمتعدد المهام الأصلي (مثل تقدير الوضعية أو OBB) الموجود في مجموعة Ultralytics الشاملة.
  • التعقيد: يمكن أن تؤدي خطوات إعادة الضبط وخطوط أنابيب التدريب المحددة إلى التعقيد مقارنةً بطبيعة نماذج Ultralytics التي تعمل بنظام التوصيل والتشغيل.

اعرف المزيد عن YOLOv6

مقارنة أداء مباشرة

تسلط المقارنة أدناه الضوء على مقايضات الأداء. يهدف YOLOv6.0 إلى تحقيق أقصى درجات الدقة على الأجهزة القوية، وغالبًا ما يقايض على كفاءة المعلمات. في المقابل، يحافظ Ultralytics YOLOv5 على توازن ملحوظ، حيث يقدم نماذج خفيفة الوزن تتفوق في البيئات CPU والاستدلال في الوقت الفعلي على الأجهزة المتطورة.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0 م64050.0-5.2834.985.8
YOLOv6.0L64052.8-8.9559.6150.7

التحليل

يبرز YOLOv5n كحل فعال للغاية للتطبيقات المحمولة، حيث يتطلب معلمات أقل بكثير (2.6 مليون) مقارنةً بأصغر متغير YOLOv6 (4.7 مليون). في حين أن YOLOv6.0 يحقق ذروة mAP أعلى في الأحجام الأكبر، إلا أنه يفعل ذلك على حساب زيادة حجم النموذج (FLOPs والمعلمات). بالنسبة للمطوّرين الذين يستهدفون نشر CPU (شائع في الروبوتات أو المراقبة منخفضة الطاقة)، فإن سرعات YOLOv5 CPU يتم قياسها وتحسينها بشكل صريح، بينما يركز YOLOv6 بشكل كبير على تسريع GPU .

منهجيات التدريب والخبرة

تختلف تجربة التدريب بشكل كبير بين النظامين البيئيين. تعطي Ultralytics الأولوية لنهج منخفض الكود وعالي المرونة.

سير عمل Ultralytics

يمكن دمج YOLOv5 مباشرةً عبر PyTorch Hub، مما يسمح للمستخدمين بتحميل النماذج وتشغيلها بأقل قدر من التعليمات البرمجية. يتعامل البرنامج النصي للتدريب مع كل شيء بدءًا من زيادة البيانات إلى التسجيل تلقائيًا.

import torch

# Load YOLOv5s from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Perform inference
img = "https://ultralytics.com/images/zidane.jpg"
results = model(img)
results.print()

سير العمل الصناعي

يتطلب YOLOv6 بشكل عام إعدادًا يدويًا أكثر يتضمن استنساخ المستودع، وإعداد ملفات تكوين محددة للعمود الفقري لإعادة المعلمات وتشغيل البرامج النصية الأقل تكاملاً مع أدوات MLOps الخارجية خارج الصندوق. وعلى الرغم من قوتها، إلا أنها تتطلب فهماً أعمق للقيود المعمارية المحددة (مثل معلمات التقطير الذاتي) لتحقيق المعايير المبلغ عنها.

حالات الاستخدام المثالية

يعتمد الاختيار بين هذه النماذج على القيود الخاصة بك فيما يتعلق بالأجهزة والدقة وسرعة التطوير.

  • Ultralytics YOLOv5: الخيار المفضل للنماذج الأولية السريعة والنشر على الحافة والدعم المجتمعي. إذا كنت بحاجة إلى النشر على جهاز Raspberry Pi أو هاتف محمول أو خادم CPU فإن طبيعة YOLOv5 خفيفة الوزن ودعم التصدير لا مثيل لهما. كما أنه مثالي للباحثين الذين يحتاجون إلى قاعدة رموز متعددة الاستخدامات تدعم التجزئة والتصنيف إلى جانب الكشف.
  • Meituan YOLOv6.0: الأنسب للبيئات الصناعية الثابتة حيث تتوفر وحدات معالجة الرسومات المتطورة، ويكون تعظيم mAP هو الأولوية الوحيدة. إذا كنت تقوم ببناء نظام ضمان جودة مصنع يعمل على خوادم NVIDIA T4/A10 ولديك الموارد الهندسية اللازمة لضبط النماذج المعاد ضبطها، فإن YOLOv6 مرشح قوي.

الخلاصة

لا يزالYOLOv5 Ultralytics YOLOv5 حجر الزاوية في مجتمع الرؤية الحاسوبية، حيث يشتهر بتوازن أدائه وسهولة استخدامه ونظامه البيئي المزدهر. كما أن قدرته على تقديم نتائج موثوقة عبر مجموعة واسعة من الأجهزة - من الحافة إلى السحابة - تجعله خياراً متفوقاً لمعظم المطورين الذين يعطون الأولوية لتعدد الاستخدامات ووقت الوصول إلى السوق.

على الرغم من أن YOLOv6.0 يقدم ابتكارات معمارية رائعة لاستدلال GPU الصناعية، إلا أنه يفتقر إلى النظام البيئي الشامل والقدرة على التكيف متعدد المنصات لنماذج Ultralytics . بالنسبة لأولئك الذين يبحثون عن أحدث ما في الأداء والكفاءة، نوصي باستكشاف Ultralytics YOLO11الذي يتفوق على كلٍ من YOLOv5 و YOLOv6 من حيث الدقة والسرعة مع الاحتفاظ بواجهة برمجة تطبيقات Ultralytics سهلة الاستخدام.

بالنسبة للمهام المتخصصة، قد يفكر المطورون أيضًا في نماذج أخرى في وثائق Ultralytics مثل YOLOv8, YOLOv9, YOLOv10أو المحول القائم على RT-DETR.

استكشف الإمكانات الكاملة للذكاء الاصطناعي للرؤية في وثائق نماذجUltralytics .


تعليقات