YOLOv6-3.0 مقابل YOLO: مقارنة تقنية لاكتشاف الأجسام
يعد اختيار النموذج الأمثل للكشف عن الأجسام قرارًا حاسمًا في مشاريع الرؤية الحاسوبية. تقدم هذه الصفحة مقارنة فنية مفصلة بين YOLOv6-3.0 و YOLO وهما نموذجان بارزان معروفان بكفاءتهما ودقتهما في مهام اكتشاف الأجسام. سنستكشف الفروق المعمارية الدقيقة ومعايير الأداء وملاءمتهما للتطبيقات المختلفة لتوجيه اختيارك.
نظرة عامة على YOLOv6-3.0
يركز YOLOv6-3.0 من Meituan على التطبيقات الصناعية، ويوازن بين الكفاءة والدقة العالية. يعمل الإصدار 3.0 من YOLOv6، الذي تم تفصيله في ورقة بحثية صدرت في 2023-01-13(YOLOv6 v3.0: إعادة تحميل كاملة)، على تحسين بنيته لتحسين الأداء والمتانة. تم تصميمه ليكون مدركًا للأجهزة، مما يضمن التشغيل الفعال عبر منصات متنوعة.
البنية والمميزات الرئيسية
يركّز YOLOv6-3.0، الذي ألّفه تشوي لي، ولولو لي، ويفي قنغ، وهونغليانغ جيانغ، ومنغ تشنغ، وبو تشانغ، وبو تشانغ، وزيدان كي، وشياومينغ شو، وشيانغشيانغ تشو من Meituan، على بنية مبسطة للسرعة والكفاءة. تشمل الميزات الرئيسية ما يلي:
- العمود الفقري الفعال لإعادة التعريف: تمكين الاستدلال بشكل أسرع.
- الكتلة الهجينة: يحقق التوازن بين الدقة والكفاءة الحسابية.
- استراتيجية التدريب الأمثل: تحسين تقارب النموذج والأداء العام.
الأداء وحالات الاستخدام
يعد YOLOv6-3.0 مناسبًا بشكل خاص للسيناريوهات الصناعية التي تتطلب مزيجًا من السرعة والدقة. تصميمه المحسّن يجعله فعالاً في:
- الأتمتة الصناعية: مراقبة الجودة ومراقبة العمليات في التصنيع.
- البيع بالتجزئة الذكي: إدارة المخزون وأنظمة الدفع الآلي.
- نشر الحافة: التطبيقات على الأجهزة ذات الموارد المحدودة مثل الكاميرات الذكية.
نقاط القوة:
- تركيز صناعي: مصممة خصيصًا لمواجهة تحديات النشر الصناعي في العالم الحقيقي.
- أداء متوازن: يوفر مفاضلة قوية بين السرعة والدقة.
- تحسين الأجهزة: أداء فعال على منصات الأجهزة المختلفة.
نقاط الضعف:
- مقايضة الدقة: قد تعطي الأولوية للسرعة والكفاءة على تحقيق أعلى دقة مطلقة مقارنةً ببعض النماذج المتخصصة.
- حجم المجتمع: مجتمع يحتمل أن يكون أصغر وموارد أقل مقارنة بالنماذج الأكثر انتشارًا مثل YOLOv8.
نظرة عامة على YOLO
تم تصميم YOLO الذي طورته مجموعة علي بابا وتم تفصيله في ورقة بحثية من 2022-11-23(YOLO: إعادة التفكير في انحدار الصندوق المحدود مع التطور المنفصل)، لتحقيق أداء عالٍ مع التركيز على كل من الكفاءة وقابلية التوسع. يستخدم YOLO الذي أنشأه كل من شيانزي شو، وييكي جيانغ، وويهوا تشن، ويليون هوانغ، ويوان تشانغ، وشيويو صن، هيكل رأس منفصل لفصل مهام التصنيف والانحدار، مما يعزز سرعته.
البنية والمميزات الرئيسية
صُمم YOLO لتحقيق قابلية التوسع والدقة العالية. وتشمل جوانبه المعمارية الرئيسية ما يلي:
- هيكل الرأس المنفصل: يفصل بين التصنيف والانحدار لتحسين السرعة.
- العمود الفقري القائم على NAS: تستخدم البنية العصبية للبحث عن البنية العصبية لتحسين الأداء.
- تعيين التسمية AlignedOTA: تحسين عملية التدريب للحصول على دقة أفضل.
الأداء وحالات الاستخدام
تُعد YOLO مثالية للتطبيقات التي تتطلب دقة عالية وقابلة للتكيف مع قيود الموارد المختلفة بسبب أحجام نماذجها القابلة للتطوير. تتفوق في:
- سيناريوهات عالية الدقة: القيادة الذاتية وأنظمة الأمان المتقدمة.
- بيئات محدودة الموارد: قابلة للنشر على الأجهزة الطرفية بسبب متغيرات الطراز الأصغر حجماً.
- الفحص الصناعي: مراقبة الجودة حيث تكون الدقة في غاية الأهمية.
نقاط القوة:
- دقة عالية: يحقق نتائج مبهرة في MAP للكشف الدقيق.
- قابلية التوسع: تقدم مجموعة من أحجام النماذج لتناسب الاحتياجات الحسابية المختلفة.
- استدلال فعال: مُحسَّن للاستدلال السريع، ومناسب لمهام الوقت الحقيقي.
نقاط الضعف:
- التعقيد: يمكن أن يجعل الرأس المنفصل والتقنيات المتقدمة البنية أكثر تعقيداً.
- التوثيق داخل Ultralytics: نظرًا لكونه نموذجًا Ultralytics أولتراليتيكس، فإن التوثيق المباشر داخل نظام Ultralytics محدود.
جدول مقارنة النماذج
الطراز | الحجم (بكسل) |
مافال 50-95 |
السرعة CPU ONNX (مللي ثانية) |
السرعة T4 T4TensorRT10 (مللي ثانية) |
بارامز (م) |
(ب) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOV6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOV6-3.0 م | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOV6-3.0L | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
دامو يولوت | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
دامو يولو | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
دامو يولوم | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
دامو يولول | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
ملاحظة: يمكن أن تختلف معايير السرعة بناءً على الأجهزة وتكوينات البرامج وتقنيات التحسين المحددة المستخدمة. سرعة CPU ONNX غير متوفرة في هذا الجدول.
الخاتمة
يُعد كل من YOLOv6-3.0 و YOLO نموذجين قويين لاكتشاف الأجسام، ويقدم كل منهما مزايا فريدة. يتفوق YOLOv6-3.0 في التطبيقات الصناعية التي تتطلب توازنًا بين السرعة والأداء الفعال عبر الأجهزة المختلفة. صُمم YOLO لسيناريوهات تعطي الأولوية للدقة العالية وقابلية التوسع، وتستوعب موارد حسابية متنوعة.
بالنسبة للمستخدمين داخل نظام Ultralytics فإن نماذج مثل Ultralytics YOLOv8 والنموذج المتطور YOLO11 المتطورة أداءً متطورًا مع توثيق شامل ودعم مجتمعي. ضع في اعتبارك استكشاف YOLO و RT-DETR للحصول على مناهج معمارية بديلة لاكتشاف الأجسام، كما هو مفصل في مستنداتYOLO الخاصة Ultralytics .