مقارنة فنية تفصيلية بين PP-YOLOE+ و YOLOv6-3.0
يُعد اختيار نموذج الكشف عن الأجسام المناسب أمرًا بالغ الأهمية لتحقيق التوازن بين الدقة والسرعة وحجم النموذج، اعتمادًا على تطبيق رؤية الكمبيوتر المحدد. تقدم هذه الصفحة مقارنة فنية بين PP-YOLOE+ و YOLOv6-3.0، وهما نموذجان شائعان، لمساعدة المطورين في اتخاذ قرارات مستنيرة. سنقوم بتحليل تصميماتهما المعمارية ومقاييس الأداء وحالات الاستخدام المثالية.
PP-YOLOE+
PP-YOLOE+، نسخة محسنة من PP-YOLOE (تحسين YOLOv3 الاحتمالي والنقطي)، تم تطويرها بواسطة مؤلفي PaddlePaddle في Baidu وتم إصدارها في 2 أبريل 2022. يعمل هذا النموذج على تحسين بنية YOLO من خلال دمج الكشف الخالي من المرساة، ورأس منفصل، وتقليم القنوات الهجينة لتحقيق توازن مثالي بين الدقة والكفاءة. يتوفر PP-YOLOE+ بأحجام مختلفة (t, s, m, l, x)، مما يسمح للمستخدمين بتحديد التكوين الذي يتوافق مع مواردهم الحسابية واحتياجات الأداء.
تفاصيل فنية:
- المؤلفون: مؤلفو PaddlePaddle
- المنظمة: بايدو
- التاريخ: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- الوثائق: توثيق PP-YOLOE+
البنية والميزات الرئيسية
يتميز التصميم المعماري لـ PP-YOLOE+ بـ CSPRepResNet backbone، و PAFPN neck، و Dynamic Head. يتمثل الابتكار الرئيسي في تصميمه الخالي من نقاط الارتكاز، والذي يبسط مسار الكشف عن طريق إزالة الحاجة إلى مربعات الارتكاز المحددة مسبقًا وتقليل ضبط المعلمات الفائقة. كما أنه يستخدم Task Alignment Learning (TAL)، وهي دالة خسارة متخصصة تعمل على تحسين التوافق بين مهام التصنيف والموقع، مما يؤدي إلى عمليات كشف أكثر دقة.
نقاط القوة والضعف
-
نقاط القوة: يُعرف PP-YOLOE+ بتصميمه الفعال وأدائه القوي، لا سيما في تحقيق دقة عالية. إنه موثق جيدًا ومدمج بعمق داخل نظام PaddlePaddle البيئي، مما يجعله خيارًا قويًا للمطورين الذين يستخدمون هذا الإطار بالفعل.
-
نقاط الضعف: القيد الأساسي للنموذج هو اعتماده على النظام البيئي. بالنسبة للمطورين الذين يعملون خارج PaddlePaddle، يمكن أن يكون التكامل معقدًا ويستغرق وقتًا طويلاً. بالمقارنة مع النماذج الموجودة داخل نظام Ultralytics البيئي، قد يكون لديه مجتمع أصغر، مما يؤدي إلى عدد أقل من موارد الطرف الثالث ودعم أبطأ لاستكشاف الأخطاء وإصلاحها.
حالات الاستخدام المثالية
يُعد PP-YOLOE+ مناسبًا تمامًا للتطبيقات التي تكون فيها الدقة العالية ذات أهمية قصوى وتعتمد بيئة التطوير على PaddlePaddle. تتضمن حالات الاستخدام الشائعة ما يلي:
- فحص الجودة الصناعية: للكشف الدقيق عن العيوب ومراقبة الجودة في التصنيع.
- أتمتة إعادة التدوير: تحسين كفاءة إعادة التدوير من خلال التحديد الدقيق لأنواع مختلفة من المواد القابلة لإعادة التدوير.
- البيع بالتجزئة الذكي: تشغيل تطبيقات مثل الذكاء الاصطناعي لإدارة مخزون البيع بالتجزئة بشكل أكثر ذكاءً وتحليل سلوك العملاء.
YOLOv6-3.0
تم تطوير YOLOv6-3.0 بواسطة فريق في Meituan وتم إصداره في 13 يناير 2023. وهو إطار عمل للكشف عن الكائنات مصمم مع تركيز قوي على التطبيقات الصناعية، بهدف تحقيق توازن مثالي بين سرعة الاستدلال والدقة. خضع النموذج لعدة مراجعات، حيث قدم الإصدار 3.0 تحسينات كبيرة مقارنة بالإصدارات السابقة.
تفاصيل فنية:
- المؤلفون: تشوي لي، لولو لي، ييفي قنغ، هونغليانغ جيانغ، منغ تشنغ، بو تشانغ، زيدان كه، شياومينغ شو، وشيانغشيانغ تشو
- المنظمة: Meituan
- التاريخ: 2023-01-13
- رابط Arxiv: https://arxiv.org/abs/2301.05586
- رابط GitHub: https://github.com/meituan/YOLOv6
- رابط الوثائق: توثيق YOLOv6
البنية والميزات الرئيسية
يتميز YOLOv6-3.0 بعمود فقري فعال لإعادة التهيئة وتصميم عنق هجين القنوات لتسريع الاستدلال. كما أنه يتضمن التقطير الذاتي أثناء التدريب لتعزيز الأداء دون إضافة تكلفة حسابية في وقت الاستدلال. إحدى ميزاته البارزة هي توفر نماذج YOLOv6Lite، والتي تم تحسينها خصيصًا للنشر المستند إلى الأجهزة المحمولة أو وحدات المعالجة المركزية CPUs، مما يجعلها خيارًا متعدد الاستخدامات لتطبيقات الذكاء الاصطناعي الطرفي.
نقاط القوة والضعف
-
نقاط القوة: يتفوق YOLOv6-3.0 في سرعة الاستدلال في الوقت الفعلي، مما يجعله منافسًا قويًا للتطبيقات التي يكون فيها الكمون عاملاً حاسمًا. إن دعمه الممتاز لـ التكميم والمتغيرات المحسّنة للأجهزة المحمولة يعزز بشكل أكبر ملاءمته للنشر على أجهزة ذات موارد محدودة مثل NVIDIA Jetson.
-
نقاط الضعف: العيب الأساسي في YOLOv6-3.0 هو تعدد استخداماته المحدودة في المهام. إنه مصمم حصريًا لـ اكتشاف الكائنات، ويفتقر إلى الدعم الأصلي لمهام رؤية الكمبيوتر الأخرى مثل تجزئة المثيل أو التصنيف أو تقدير الوضع. علاوة على ذلك، فإن نظامه البيئي ليس شاملاً أو يتم صيانته بنشاط مثل منصة Ultralytics، مما قد يؤدي إلى تحديثات أبطأ ودعم مجتمعي أقل.
حالات الاستخدام المثالية
يعد YOLOv6-3.0 خيارًا ممتازًا للمشاريع التي تتطلب كشفًا سريعًا وفعالًا عن الأجسام، خاصة في البيئات الصناعية. تشمل تطبيقاته المثالية:
- تحليلات الفيديو في الوقت الفعلي: مناسبة لـ مراقبة حركة المرور وأنظمة المراقبة الأمنية.
- الأتمتة الصناعية: مفيدة لمراقبة الجودة ومراقبة العمليات على خطوط الإنتاج حيث السرعة ضرورية.
- الروبوتات: تمكين الكشف عن الأجسام في الوقت الفعلي للملاحة والتفاعل في تطبيقات الروبوتات.
مقارنة الأداء
عند مقارنة PP-YOLOE+ و YOLOv6-3.0، يظهر توازن واضح بين الدقة والسرعة. تحقق نماذج PP-YOLOE+ عمومًا درجات mAP أعلى، حيث يصل أكبر نموذج، PP-YOLOE+x، إلى mAP بنسبة 54.7. ومع ذلك، تأتي هذه الدقة على حساب سرعات استدلال أبطأ.
في المقابل، يعطي YOLOv6-3.0 الأولوية للسرعة. يتميز أصغر نموذج، YOLOv6-3.0n، بوقت استدلال مثير للإعجاب يبلغ 1.17 مللي ثانية فقط على وحدة معالجة الرسومات T4، مما يجعله أحد أسرع الخيارات المتاحة. في حين أن دقته أقل من دقة نماذج PP-YOLOE+، إلا أنه يوفر توازنًا مقنعًا للتطبيقات التي يكون فيها الأداء في الوقت الفعلي أمرًا غير قابل للتفاوض. تميل نماذج YOLOv6-3.0 أيضًا إلى الحصول على عدد أقل من المعلمات و FLOPs أقل، مما يجعلها أكثر كفاءة من الناحية الحسابية.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT (مللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
الخلاصة والتوصية
يعتبر كل من PP-YOLOE+ و YOLOv6-3.0 من نماذج الكشف عن الأجسام القوية، لكنهما يلبيان أولويات مختلفة. يعتبر PP-YOLOE+ هو الخيار الأمثل للمستخدمين الذين يحتاجون إلى أقصى قدر من الدقة ويعملون داخل إطار عمل PaddlePaddle. يعتبر YOLOv6-3.0 مثاليًا للتطبيقات التي تتطلب استدلالًا عالي السرعة، خاصة في سيناريوهات الحوسبة الصناعية والحافة.
ومع ذلك، بالنسبة للمطورين الذين يبحثون عن حل أكثر شمولية وسهولة في الاستخدام، نوصي بالنظر في نماذج من سلسلة Ultralytics YOLO، مثل YOLOv8 أو أحدث Ultralytics YOLO11. تقدم هذه النماذج العديد من المزايا المتميزة:
- سهولة الاستخدام: تأتي نماذج Ultralytics مع واجهة برمجة تطبيقات Python مبسطة و وثائق شاملة وتجربة مستخدم مباشرة، مما يقلل بشكل كبير من وقت التطوير.
- نظام بيئي مُدار بشكل جيد: يوفر النظام البيئي لـ Ultralytics، بما في ذلك Ultralytics HUB، منصة متكاملة للتدريب والتحقق من الصحة والنشر. وهو يستفيد من التطوير النشط والتحديثات المتكررة ودعم المجتمع القوي.
- تنوع الاستخدامات: على عكس النماذج ذات المهمة الواحدة، تدعم نماذج Ultralytics YOLO مجموعة واسعة من المهام، بما في ذلك الاكتشاف، والتقسيم، والتصنيف، وتقدير الوضعيات، وكل ذلك ضمن إطار عمل واحد وموحد.
- الأداء والكفاءة: تم تحسين نماذج Ultralytics بشكل كبير لتوفير توازن ممتاز بين السرعة والدقة. وهي مصممة أيضًا للتدريب الفعال، وغالبًا ما تتطلب استخدامًا أقل للذاكرة وتستفيد من الأوزان المدربة مسبقًا المتاحة بسهولة.
للحصول على حل شامل يجمع بين أحدث أداء مع سهولة استخدام وتنوع لا مثيل لهما، تمثل نماذج Ultralytics YOLO الخيار الأفضل لمعظم مشاريع رؤية الكمبيوتر.
مقارنات النماذج الأخرى
إذا كنت تستكشف نماذج أخرى، فقد تجد هذه المقارنات مفيدة: